Hi, alles klar, danke. Ja, das mit dem 6. Zettel können wir ja im März nochmal mit Michael besprechen, wenn du wieder da bist - hat er ohnehin vorgeschlagen. Ist ja nicht so zeitkritisch wie die Anfangszettel. Noch was: Heute hat ein Student von der Uni Siegen angefragt, ob er auch in den Kurs kann. Gesetzt den Fall, dass am Ende noch Kapazität frei ist: Ist das überhaupt möglich? Mit wem kann er das am besten klären? Prüfungsamt dort, Prüfungsamt hier? Gibt es da Präzedenzfälle? Wollen wir das überhaupt? @Jannik: Hattest du dem ersten Kandidaten schon eine kurze Rückmeldung geschrieben (nur zur Bestätigung, dass seine Anfrage eingegangen ist und wir dann nach der Auslosung nochmal Bescheid geben)? Viele Grüße, Bastian On 02/23/2018 01:09 PM, Jochen Garcke wrote:
Hallo,
ich habe dich und Jannik Lese-Zugang zu dem ML-Workshop-Repo von Sebastian gegeben.
@Jannik, inzwischen gibt es zwei Accounts in gitlab von dir ?
Der Diffusion Maps Zettel ist ja fokussiert auf Anwendung, da haben wir also schon was.
Vielleicht ist eher so, dass man Zettel 5 und 6 kombiniert ?
Meine Bedenken zu auf 'realen' Daten loslassen sind a) erstmal wirklich reale Daten haben (und nicht nur akademische Benchmarks) und b) wissen was da eigentlich rauskommen soll. Bei letzteren kann man aber auch einfach die agieren lassen, und dann sehen was passiert.
Grüße, Jochen
Am 21.02.2018 um 21:57 schrieb Bastian Bohn:
Hallo,
das stimmt. Kann mir die Sachen von Sebastian noch Jemand zukommen lassen, bzw. die im Repository einstellen?
Konkret - auch selbst ausprogrammiert - sind wir jetzt noch nicht so weit, da ich bisher noch nicht viel getan habe. Aktuell klaut mir die Vorarbeit für die frühe HCM Begutachtung und den SFB Retreat im März ein wenig Zeit, aber ich hoffe mal jetzt etwas voran zu kommen.
Nichtsdestotrotz wäre der Plan: 1. Linear least squares und k-Means auf dem 1. Zettel, die SMO Klassifikation auf dem zweiten und Diffusion Maps + Spectral Clustering auf dem 4., evtl. dann auch ein 2-Layer Netzwerk mit backprop von Hand auf Zettel 5 (da müssen wir aber erst ausprobieren, ob das vertretbar ist).
Das sind zwar alles keine numerik-lastigen Programmierarbeiten, aber ich denke das ist vertretbar. Zumal man auf Zettel 1 und 2 auch gut Konvergenzplots vom RMSE machen kann oder Ähnliches.
Michael Sorge war tatsächlich, dass es aktuell zu "akademisch" wird - hätte ich auch nicht erwartet ;). Daher sein Wunsch nach dem 6. Zettel, wo man die Leute etwas "spielen" lässt und auf reale Daten aus verschiedenen Anwendungsbereichen loslässt.
Also wenn wir die Zettel grob so lassen wollen, ist unser Zeitplan recht strikt:
1. Woche: Zettel 1 - LLS (2 Wochen Zeit) 3. Woche: Zettel 2 - SVM (2 Wochen Zeit) 5. Woche: Zettel 3 - PCA (3 wochen Zeit - Pfingsten dazwischen) 8. Woche: Zettel 4 - Diffusion Maps (2 Wochen Zeit) 10. Woche: Zettel 5 - DL (2 Wochen Zeit) 12. Woche: Zettel 6 - DL-Projekt (2-3 Wochen Zeit)
Das kann klappen, da die Zettel nicht wirklich aufeinander aufbauen. Sprich: Wenn Jemand Zettel 1 verhaut und wir das erst in Woche 3 oder 4 beim Korrigieren merken, ist es nicht so schlimm und Derjenige kann trotzdem Zettel 2 bearbeiten.
Das ist dann etwas anders als bei andern Praktika, wo wir die Zettel mit den einzelnen Gruppen 'nachbesprochen' haben und die ihre Sachen auch nachiterieren konnten, aber ich denke nur mit strikter Abgabedeadline geht das dann mit dem strikten Zeitplan.
Wir sollten uns dann ggf. nochmal Gedanken über die wöchentlichen Termine machen, also wie wir den 'Vorlesungsteil' und den Aufgabenbesprechungsteil gestalten wollen. Vielleicht brauchen wir dann wirklich zwei feste Termine pro Woche. Einen für die VL und einen für Programmierfragen/Aufgabennachbesprechung.
Viele Grüße, Bastian
On 02/21/2018 03:11 AM, Jochen Garcke wrote:
Hallo,
Für pca haben wir ja die Vorarbeit von Sebastian. Wenn wir die beiden zusammen tun würden, müssten wir das neu konzipiert haben? Wieviel Programmierung haben wir denn inzwischen? Wir wollten ja nicht zu viel Fokus auf das anwenden legen, ohne dass da Programmierung passiert. Das vorgeschlagene 6. Blatt ist ja wiederum anwenden?
Grüße, Jochen
Am 21. Februar 2018 03:00:14 GMT+11:00 schrieb Bastian Bohn <bohn@ins.uni-bonn.de>:
Hallo,
ich habe mich eben wegen des HCMs mit Michael getroffen, wir haben aber dann auch kurz noch das Praktikum besprochen:
Er ist soweit einverstanden mit unserer groben Idee, die sei auch didaktisch ok:
1. Lineare Verfahren (Least Squares, k-means), 2. SVM, 3. PCA, 4. Diffusion Maps 5. Deep Learning
Aber er hätte gerne, dass wir noch einen 6. Zettel machen. Nachdem auf Zettel 5 die DNNs erklärt wurden und die Studenten genug Zeit hatten Anwendungserfahrung zu sammeln, soll dann auf Zettel 6 ein Projektteil zum Deep learning kommen, der individualisiert ist. Also z.B. 5 verschiedene Datensätze aus 5 verschiedenen Anwendungsbereichen (Finanz, Bilderkennung, etc.) und die Studentengruppen bekommen die Aufgabe einen Datensatz möglichst gut zu analysieren und mit einem DNN zu lernen. Wichtig ist ihm auch, dass dieses Blatt nicht zu kurz kommt (rein zeitlich).
Wenn ich richtig gezählt habe, hat das Sommersemester 15 Wochen. Abzüglich der Pfingstwoche und der letzten Woche also 13 Wochen, in denen die Studenten arbeiten können. Die Frage ist, ob wir versuchen 6 Zettel unterzubringen und zwar so, dass der letzte Zettel spätestens 3 Wochen vor Semesterende rauskommt, oder ob wir zwei andere Zettel zusammenlegen, bzw. etwas streichen.
Michael meinte, dass ein ganzer Zettel für Diffusion Maps vielleicht auch etwas viel sei, ginge aber wohl noch. Vielleicht macht es Sinn, PCA und Diffusion Maps auf einen Zettel "Dimension reduction" zu reduzieren?
Viele Grüße, Bastian
-- Diese Nachricht wurde von meinem Android-Mobiltelefon mit K-9 Mail gesendet.
_______________________________________________ Mllab mailing list Mllab@ins.uni-bonn.de https://mail.ins.uni-bonn.de/mailman/listinfo/mllab
-- Dr. Bastian Bohn Institut für Numerische Simulation Rheinische Friedrich-Wilhelms-Universität Bonn Wegelerstr. 6 D-53115 Bonn Germany Tel.: +49 228 73-60452 Fax: +49 228 73-7527 URL: http://wissrech.ins.uni-bonn.de/people/bohn.html