[Mllab] Probleme beim Abschlussprojekt
Guten Tag, Wir haben einige Probleme bei unserem Abschluss Projekt und sind uns nicht sicher, wie wir weiter vorgehen sollen. Wir sind uns bewusst, dass wir damit sehr spät kommen, aber unser derzeitiger Stand ist unserer Meinung nach nicht zufriedenstellend. Wir haben uns für das 20 newsgroup dataset entschieden und wollten damit einen Textgenerator bauen. Dafür haben wir die Daten als word2vec gespeichert und dann sowohl einen Autoencoder, als auch LSTM ausprobiert. Anschließend wollten wir den generierten Text dann von einem classifier einordnen lassen. Leider geben die Generatoren nur unsinn aus, auch nach langem Trainieren. Wir sind also an einem Punkt, wo wir nicht wissen, worauf wir uns konzentrieren sollten. Wir hätten an der Stelle gerne Ihre Meinung. Es tut uns leid, dass wir damit so kurzfristig ankommen. Wir werden uns aber in jedem Fall bemühen, das beste aus unserer Situation rauszuholen. Mit freundlichen Grüßen Luca, Benedikt und Espen aus Gruppe 6
Hallo, vermutlich ist der newsgroup Datensatz zu klein, um ein vernünftiges generatives Modell darauf zu trainieren, außerdem trainieren die entsprechenden LSTM Netzwerke selbst auf GPUs oder größeren Clustern sehr lange bis sie halbwegs gute Ergebnisse erzielen. Ich würde euch vorschlagen stattdessen einfach Klassifikatoren für die newsgroup Daten zu bauen. On-Top könntet ihr z.B. auch einen bereits bestehenden Text-Generator irgendwoher nehmen und schauen, wie eure gelernten Klassifikatoren diese Texte einordnen. Für den finalen Vortrag nehmt aber ruhig euren nicht funktionierenden Ansatz mit auf und erläutert kurz was ihr vorhattet, was rauskam und woran es vielleicht gescheitert ist. Viele Grüße, Bastian Bohn Am 26.01.2019 um 12:58 schrieb Espen Xylander:
Guten Tag,
Wir haben einige Probleme bei unserem Abschluss Projekt und sind uns nicht sicher, wie wir weiter vorgehen sollen. Wir sind uns bewusst, dass wir damit sehr spät kommen, aber unser derzeitiger Stand ist unserer Meinung nach nicht zufriedenstellend.
Wir haben uns für das 20 newsgroup dataset entschieden und wollten damit einen Textgenerator bauen. Dafür haben wir die Daten als word2vec gespeichert und dann sowohl einen Autoencoder, als auch LSTM ausprobiert. Anschließend wollten wir den generierten Text dann von einem classifier einordnen lassen.
Leider geben die Generatoren nur unsinn aus, auch nach langem Trainieren.
Wir sind also an einem Punkt, wo wir nicht wissen, worauf wir uns konzentrieren sollten. Wir hätten an der Stelle gerne Ihre Meinung.
Es tut uns leid, dass wir damit so kurzfristig ankommen. Wir werden uns aber in jedem Fall bemühen, das beste aus unserer Situation rauszuholen.
Mit freundlichen Grüßen Luca, Benedikt und Espen aus Gruppe 6 _______________________________________________ Mllab mailing list Mllab@ins.uni-bonn.de https://mail.ins.uni-bonn.de/mailman/listinfo/mllab
participants (2)
-
Bastian Bohn -
Espen Xylander