[Mllab] Diffusion Maps Zettel
Hi, danke an Lisa für das Überarbeiten des Diffusion Maps Zettels. Finde ihn jetzt gut gelungen. Einzig die Vorverarbeitungssachen fallen noch ein bisschen vom Himmel, aber ich wüsste jetzt auch nicht, wie man das besser machen könnte. Ist auf jeden Fall jetzt sehr rund und verständlich alles. Ich werde die Tage noch Kleinigkeiten editieren (Nomenklatur ein bisschen an die vorherigen Zettel anpassen, etc.) und hab' nur noch 2 kleine Fragen: 1.) Beim single-cell qPCR Datensatz steht, dass die Zahlen CT-Werte sind. Was sind die einzelnen Matrix Einträge denn genau? Kann man das in 1-2 Sätzen für Laien erklären oder ist das zu kompliziert? 2.) Beim De-Meaning, wo der Mean von Actb und Gapdh abgezogen wird: Was ist konkret mit mean(x_{ig_{Actb}}, x_{ig_{Gapdh}}) gemeint? Ist das einfach 0.5 * (x_{ig_{Actb}} + x_{ig_{Gapdh}})? Vielen Dank schonmal und ein schönes Wochenende. Viele Grüße, Bastian -- Dr. Bastian Bohn Institut für Numerische Simulation Rheinische Friedrich-Wilhelms-Universität Bonn Wegelerstr. 6 D-53115 Bonn Germany Tel.: +49 228 73-60452 Fax: +49 228 73-7527 URL: http://wissrech.ins.uni-bonn.de/people/bohn.html
Hallo, 1.) man könnte Ct-werte folgendermaßen erklären: Ein Ct-wert (abgekürzt für "threshold cycle") ist eine Größe, mit der man die Menge/Konzentration gewonner DNA oder bestimmter Gene messen kann. Eine qPCR (quantitative Echtzeit Polymerase-Kettenreaktion) besteht aus mehreren Zyklen, in denen jeweils die Fluoreszenz gemessen wird. Der Ct-wert gibt den Zyklus bzw. den Zeitpunkt an, an dem die Fluoreszenz erstmals signifikant eine Hintergrund-Fluoreszenz (also einen bestimmten Schwellenwert) übersteigt, d.h. erstmals ein eindeutiges Fluoreszenzsignal erfasst wird. Wenn man die Fluoreszenz gegen die Zyklusnummer aufträgt, beschreibt der Ct-wert also den Zeitpunkt, wo die Kurve zum ersten Mal einen exponentiellen Anstieg aufweist. Dabei bedeutet ein höherer Ct-wert eine geringere DNA-Konzentration. Zu den Vorverarbeitungsschritten: 2.) Die Normalisierung, die vorgenommen wird, heißt in der Biologie auch relative Quantifizierung. Die relative Quantifizierung ist in der Biologie eine gängige Methode, um genauere und weniger störanfällige Ergebnisse zu bekommen. Die Gene Actb und Gapdh eignen sich deswegen so gut für die Normalisierung, weil sie Haushaltsgene sind. Das sind Gene, die für die Zelle lebensnotwendig sind und nicht durch äußere Einflüsse reguliert werden. Mit mean meine ich tatsächlich einfach nur den Durchschnitt der beiden Gene. Ich glaube, ich habe die mean-Funktion von numpy dafür verwendet. 3.) Der Baseline-Wert 28 hat was mit der qPCR zu tun. Die qPCR-Messung wurde bei dem Guo-Datensatz nur bis zum Zyklus 28 vorgenommen und alle Gene, die eine zu geringe Konzentration haben, werden auf diesen Wert gesetzt. Deswegen werden diese Matrix-Einträge bei der Vorverarbeitung extra behandelt. Soll ich diese Informationen noch in das Blatt einfügen? Ich hatte bisher eher Abstand genommen von der Biologie, weil ich kein Biologie-Experte bin und selber die Sachen nur sehr oberflächlich verstehe. Viele Grüße, Lisa Am 27. April 2018 um 14:21 schrieb Bastian Bohn <bohn@ins.uni-bonn.de>:
Hi,
danke an Lisa für das Überarbeiten des Diffusion Maps Zettels. Finde ihn jetzt gut gelungen. Einzig die Vorverarbeitungssachen fallen noch ein bisschen vom Himmel, aber ich wüsste jetzt auch nicht, wie man das besser machen könnte. Ist auf jeden Fall jetzt sehr rund und verständlich alles.
Ich werde die Tage noch Kleinigkeiten editieren (Nomenklatur ein bisschen an die vorherigen Zettel anpassen, etc.) und hab' nur noch 2 kleine Fragen:
1.) Beim single-cell qPCR Datensatz steht, dass die Zahlen CT-Werte sind. Was sind die einzelnen Matrix Einträge denn genau? Kann man das in 1-2 Sätzen für Laien erklären oder ist das zu kompliziert?
2.) Beim De-Meaning, wo der Mean von Actb und Gapdh abgezogen wird: Was ist konkret mit mean(x_{ig_{Actb}}, x_{ig_{Gapdh}}) gemeint? Ist das einfach 0.5 * (x_{ig_{Actb}} + x_{ig_{Gapdh}})?
Vielen Dank schonmal und ein schönes Wochenende. Viele Grüße, Bastian
-- Dr. Bastian Bohn
Institut für Numerische Simulation Rheinische Friedrich-Wilhelms-Universität Bonn Wegelerstr. 6 D-53115 Bonn Germany
Tel.: +49 228 73-60452 Fax: +49 228 73-7527 URL: http://wissrech.ins.uni-bonn.de/people/bohn.html
Hallo Lisa, vielen Dank für die Zusatzinfo. Das wäre prima, wenn du die Sachen (vor Allem zu 1.) noch - auch ruhig so kurz wie hier - einfügst. Ich würde danach dann noch einmal ein paar Kleinigkeiten ändern - aber wie gesagt nur Nomenklatur oder Ähnliches und dann sollte das passen. Danke dir. Viele Grüße, Bastian On 05/03/2018 04:24 PM, Lisa Beer wrote:
Hallo,
1.) man könnte Ct-werte folgendermaßen erklären: Ein Ct-wert (abgekürzt für "threshold cycle") ist eine Größe, mit der man die Menge/Konzentration gewonner DNA oder bestimmter Gene messen kann. Eine qPCR (quantitative Echtzeit Polymerase-Kettenreaktion) besteht aus mehreren Zyklen, in denen jeweils die Fluoreszenz gemessen wird. Der Ct-wert gibt den Zyklus bzw. den Zeitpunkt an, an dem die Fluoreszenz erstmals signifikant eine Hintergrund-Fluoreszenz (also einen bestimmten Schwellenwert) übersteigt, d.h. erstmals ein eindeutiges Fluoreszenzsignal erfasst wird. Wenn man die Fluoreszenz gegen die Zyklusnummer aufträgt, beschreibt der Ct-wert also den Zeitpunkt, wo die Kurve zum ersten Mal einen exponentiellen Anstieg aufweist. Dabei bedeutet ein höherer Ct-wert eine geringere DNA-Konzentration.
Zu den Vorverarbeitungsschritten:
2.) Die Normalisierung, die vorgenommen wird, heißt in der Biologie auch relative Quantifizierung. Die relative Quantifizierung ist in der Biologie eine gängige Methode, um genauere und weniger störanfällige Ergebnisse zu bekommen. Die Gene Actb und Gapdh eignen sich deswegen so gut für die Normalisierung, weil sie Haushaltsgene sind. Das sind Gene, die für die Zelle lebensnotwendig sind und nicht durch äußere Einflüsse reguliert werden. Mit mean meine ich tatsächlich einfach nur den Durchschnitt der beiden Gene. Ich glaube, ich habe die mean-Funktion von numpy dafür verwendet.
3.) Der Baseline-Wert 28 hat was mit der qPCR zu tun. Die qPCR-Messung wurde bei dem Guo-Datensatz nur bis zum Zyklus 28 vorgenommen und alle Gene, die eine zu geringe Konzentration haben, werden auf diesen Wert gesetzt. Deswegen werden diese Matrix-Einträge bei der Vorverarbeitung extra behandelt.
Soll ich diese Informationen noch in das Blatt einfügen? Ich hatte bisher eher Abstand genommen von der Biologie, weil ich kein Biologie-Experte bin und selber die Sachen nur sehr oberflächlich verstehe.
Viele Grüße,
Lisa
Am 27. April 2018 um 14:21 schrieb Bastian Bohn <bohn@ins.uni-bonn.de <mailto:bohn@ins.uni-bonn.de>>:
Hi,
danke an Lisa für das Überarbeiten des Diffusion Maps Zettels. Finde ihn jetzt gut gelungen. Einzig die Vorverarbeitungssachen fallen noch ein bisschen vom Himmel, aber ich wüsste jetzt auch nicht, wie man das besser machen könnte. Ist auf jeden Fall jetzt sehr rund und verständlich alles.
Ich werde die Tage noch Kleinigkeiten editieren (Nomenklatur ein bisschen an die vorherigen Zettel anpassen, etc.) und hab' nur noch 2 kleine Fragen:
1.) Beim single-cell qPCR Datensatz steht, dass die Zahlen CT-Werte sind. Was sind die einzelnen Matrix Einträge denn genau? Kann man das in 1-2 Sätzen für Laien erklären oder ist das zu kompliziert?
2.) Beim De-Meaning, wo der Mean von Actb und Gapdh abgezogen wird: Was ist konkret mit mean(x_{ig_{Actb}}, x_{ig_{Gapdh}}) gemeint? Ist das einfach 0.5 * (x_{ig_{Actb}} + x_{ig_{Gapdh}})?
Vielen Dank schonmal und ein schönes Wochenende. Viele Grüße, Bastian
-- Dr. Bastian Bohn
Institut für Numerische Simulation Rheinische Friedrich-Wilhelms-Universität Bonn Wegelerstr. 6 D-53115 Bonn Germany
Tel.: +49 228 73-60452 Fax: +49 228 73-7527 URL: http://wissrech.ins.uni-bonn.de/people/bohn.html <http://wissrech.ins.uni-bonn.de/people/bohn.html>
-- Dr. Bastian Bohn Institut für Numerische Simulation Rheinische Friedrich-Wilhelms-Universität Bonn Wegelerstr. 6 D-53115 Bonn Germany Tel.: +49 228 73-60452 Fax: +49 228 73-7527 URL: http://wissrech.ins.uni-bonn.de/people/bohn.html
participants (2)
-
Bastian Bohn -
Lisa Beer