Hallo zusammen, gitlab-Zugang ist jetzt vorhanden zu https://gitlab.scai.fraunhofer.de/jochen.garcke/teaching-ml-lab Für das ausschecken von der Uni aus muss man noch was machen, Jannik weiß das aber genauer. Grüße, Jochen (Garcke) Am 23.02.2018 um 13:13 schrieb Jochen Garcke:
Hallo zusammen,
ist vermutlich sinnvoll, wenn alles im Repository landet.
Frau Beer, Sie müssten sich hier einmal registrieren, https://gitlab.scai.fraunhofer.de/ die Admins am SCAI schalten Sie dann frei, und ich kann dann den Zugriff auf das Repo geben:
Auf dem gitlab-Server können Sie dann auch eigene Repositories anlegen für die Masterarbeit (sei es code, sei es Tex).
Grüße, Jochen (Garcke)
Am 23.02.2018 um 05:37 schrieb Bastian Bohn:
Hallo Lisa,
alles klar, das macht dann natürlich mehr Sinn. Bezüglich einer Vorlage für die erste Seite:
Ich versuche gerade den 1. Zettel in das ClassicThesis Framework zu setzen, das Jannik in unserem git Repository hochgeladen hat. Ich weiß nicht, ob du da drankommst, aber am sinnvollsten wäre es sicherlich, wenn du da einfach Zugang bekämst und das Blatt als extra Tex-File unter "chapter" anlegst.
@Jochen: Ist das möglich/sinnvoll? Dann bräuchte Lisa ggf. noch Zugang zu dem Repo.
Viele Grüße, Bastian
On 02/20/2018 08:32 AM, Lisa Beer wrote:
Hallo,
danke für die vielen Anmerkungen. Stimmt, scipy.sparse.linalg macht hier nicht so viel Sinn. Das macht erst bei g**rößeren Datensätzen Sinn, wenn man knn-Graphen betrachtet, um die Berechnungszeit zu verringern. Da sind dann die Matrizen dünnbesetzt.
Viele Grüße,
Lisa Beer
Am 19. Februar 2018 um 16:40 schrieb Bastian Bohn <bohn@ins.uni-bonn.de <mailto:bohn@ins.uni-bonn.de>>:
Achso: Wegen Vorlage zur ersten Seite, melde ich mich die Tage nochmal.
Viele Grüße, Bastian
On 02/19/2018 04:39 PM, Bastian Bohn wrote: > Hallo Lisa, > > danke vielmals für die Ausarbeitung. Das ist schon ein guter Start. > > Jannik und ich haben eben noch diskutiert und kamen auf folgende > ergänzenden Punkte. Nicht erschrecken, dass es so viel ist. Die > Ausarbeitung dient trotzdem als gute Basis, denke ich: > > In Kapitel 1: > > * Hier wäre es gut, noch etwas mehr Hintergrundmotivation für den > Diffusion Maps Algorithmus zu haben. Also: Warum schaue ich mir die EVs > der normalisierten Kernmatrix an? Also ein bisschen die RandomWalk Idee > und Diffusion Distance Idee erklären. > (Zumindest die Idee ohne Beweise) > > * Am Ende von Kapitel 1 fehlt eine kurze Anmerkung, dass die k-te > Koordinate des (i+1)-ten EVs gerade die i-te Koordinate des k-ten > Datenpunkts im Embedding Space ist. > > * Was genau ist mit \cdot \mathbb{I} in Algorithmus 1 gemeint? Ist das > das Hadamard Produkt und \mathbb{I} = (1 1 ... 1) * (1 1 ... 1)^T ? > > In Kapitel 2: > > * Anstatt beide Zelldatensätze zu nehmen, wäre es evtl. sinnvoller den > Moignard Datensatz wegzulassen und stattdessen noch einen synthetischen, > einfachen, kleinen Datensatz zu nehmen, auf den man Algorithmus 1 zuerst > anwendet. Zum Beispiel irgendwas, was mit PCA nicht so gut geht, wo man > aber ein schönes 3D Embedding mit Diffusion Maps hinbekommt. Falls du da > eine Idee hast, was gut passen könnte, gerne einfach reinpacken. > > * In der Beschreibung am Anfang von Kapitel 2 wäre es wichtig, etwas > ausführlicher zu sein, z.B. was sind Beispiele für "Cell groups" und was > ist für die Biologen/Mediziner hier interessant? Also z.B. > Sichtbarmachung der einzelnen Entwicklungsstadien als Cluster in einer > niedrigdim. Einbettung. > > * Die Beschreibung des Preprocessings ist recht schwer zu verstehen ohne > die Daten gesehen zu haben, bzw. den Code zu kennen. Hier wäre es > hilfreich vorher ein wenig mehr über die Struktur der Daten zu sagen > (also wie sieht die Excel Tabelle konkret aus, vielleicht auch mit > kleinem Bildausschnitt, wo z.B. die ACTB und GAPDH Genspalten/-zeilen > gekennzeichnet sind). Hier müsste auch noch genauer beschrieben werden > wie das Mitteln und Subtrahieren über ACTB und Gapdh gemeint ist. Am > besten per Formeln. > > Vielleicht macht es hierbei auch Sinn die Formulierung in der Aufgabe > etwas abzuändern, sodass es weniger ein Rezept ist "Tue Schritte A und > B", sondern mehr Motivation, warum man die einzelnen Schritte tun muss, > z.B.: > > Über den Datensatz ist Folgendes bekannt: > Data Cleaning: > 1. Datenpunkte/-attribute zu 1-cell stage embryos sind unbrauchbar. > 2. Der Wert 28 dient als Baseline Referenz. Werte über 28 deuten auf > data corruption hin. > Date Normalization: > 3. Normieren Sie die Daten, indem sie die als endogene Kontrollgene > geltenden Actb und Gapdh zur Mittelwertberechnung heranziehen. (Dann > aber trotzdem noch mit Formel dazu, weil es sonst zu schwer verständlich > ist) > > > > Danke auch für den tollen Referenzcode! > Eine Kleinigkeit noch zum Code, die Jannik aufgefallen ist: > Du verwendest zur Eigenwertberechnung scipy.sparse.linalg, was auf den > ersten Blick komisch ist, da die Kernmatrizen ja üblicherweise voll > besetzt sind. Hat das einen besonderen Grund? > > > @ Jochen und Jannik: Falls ich etwas vergessen haben sollte oder ihr > etwas anders seht als hier geschildert, bitte ergänzen! > > > Vielen Dank und viele Grüße, > Bastian > > > > On 02/17/2018 09:06 PM, Lisa Beer wrote: >> Hallo zusammen, >> >> ich habe jetzt eine vorläufige Version des Arbeitsblattes über Diffusion >> Maps und des dazugehörigen Notebooks erstellt (das Notebook >> sheet_solution ist die "Musterlösung"). Kann ich ein Feedback bekommen, >> ob ich an der einen oder anderen Stelle etwas weglassen, hinzufügen, >> bearbeiten soll usw.? Haben wir eine Vorlage für die Arbeitsblätter? >> Also für die erste Seite vor allem? >> >> Viele Grüße, >> >> Lisa Beer > >
-- Dr. Bastian Bohn
Institut für Numerische Simulation Rheinische Friedrich-Wilhelms-Universität Bonn Wegelerstr. 6 D-53115 Bonn Germany
Tel.: +49 228 73-60452 Fax: +49 228 73-7527 URL: http://wissrech.ins.uni-bonn.de/people/bohn.html <http://wissrech.ins.uni-bonn.de/people/bohn.html>
-- Prof. Dr. Jochen Garcke garcke@ins.uni-bonn.de jochen.garcke@scai.fraunhofer.de phone: +49-228 73 60451 phone: +49-2241 14 2286 http://garcke.ins.uni-bonn.de http://scai.fraunhofer.de Universität Bonn Fraunhofer-Institut SCAI Institut für Numerische Simulation Schloss Birlinghoven Wegelerstr. 6 53754 Sankt Augustin 53115 Bonn, Germany