Hallo,

1.) man könnte Ct-werte folgendermaßen erklären:
Ein Ct-wert (abgekürzt für "threshold cycle") ist eine Größe, mit der man die Menge/Konzentration gewonner DNA oder bestimmter Gene messen kann. Eine qPCR (quantitative Echtzeit Polymerase-Kettenreaktion) besteht aus mehreren Zyklen, in denen jeweils die Fluoreszenz gemessen wird. Der Ct-wert gibt den Zyklus bzw. den Zeitpunkt an, an dem die Fluoreszenz erstmals signifikant eine Hintergrund-Fluoreszenz (also einen bestimmten Schwellenwert) übersteigt, d.h. erstmals ein eindeutiges Fluoreszenzsignal erfasst wird. Wenn man die Fluoreszenz gegen die Zyklusnummer aufträgt, beschreibt der Ct-wert also den Zeitpunkt, wo die Kurve zum ersten Mal einen exponentiellen Anstieg aufweist. Dabei bedeutet ein höherer Ct-wert eine geringere DNA-Konzentration.

Zu den Vorverarbeitungsschritten:

2.) Die Normalisierung, die vorgenommen wird, heißt in der Biologie auch relative Quantifizierung. Die relative Quantifizierung ist in der Biologie eine gängige Methode, um genauere und weniger störanfällige Ergebnisse zu bekommen. Die Gene Actb und Gapdh eignen sich deswegen so gut für die Normalisierung, weil sie Haushaltsgene sind. Das sind Gene, die für die Zelle lebensnotwendig sind und nicht durch äußere Einflüsse reguliert werden.
Mit mean meine ich tatsächlich einfach nur den Durchschnitt der beiden Gene. Ich glaube, ich habe die mean-Funktion von numpy dafür verwendet.  

3.) Der Baseline-Wert 28 hat was mit der qPCR zu tun. Die qPCR-Messung wurde bei dem Guo-Datensatz nur bis zum Zyklus 28 vorgenommen und alle Gene, die eine zu geringe Konzentration haben, werden auf diesen Wert gesetzt. Deswegen werden diese Matrix-Einträge bei der Vorverarbeitung extra behandelt.

Soll ich diese Informationen noch in das Blatt einfügen? Ich hatte bisher eher Abstand genommen von der Biologie, weil ich kein Biologie-Experte bin und selber die Sachen nur sehr oberflächlich verstehe.

Viele Grüße,

Lisa


Am 27. April 2018 um 14:21 schrieb Bastian Bohn <bohn@ins.uni-bonn.de>:
Hi,

danke an Lisa für das Überarbeiten des Diffusion Maps Zettels. Finde ihn
jetzt gut gelungen. Einzig die Vorverarbeitungssachen fallen noch ein
bisschen vom Himmel, aber ich wüsste jetzt auch nicht, wie man das
besser machen könnte. Ist auf jeden Fall jetzt sehr rund und
verständlich alles.

Ich werde die Tage noch Kleinigkeiten editieren (Nomenklatur ein
bisschen an die vorherigen Zettel anpassen, etc.) und hab' nur noch 2
kleine Fragen:

1.) Beim single-cell qPCR Datensatz steht, dass die Zahlen CT-Werte
sind. Was sind die einzelnen Matrix Einträge denn genau? Kann man das in
1-2 Sätzen für Laien erklären oder ist das zu kompliziert?

2.) Beim De-Meaning, wo der Mean von Actb und Gapdh abgezogen wird: Was
ist konkret mit mean(x_{ig_{Actb}}, x_{ig_{Gapdh}}) gemeint? Ist das
einfach 0.5 * (x_{ig_{Actb}} + x_{ig_{Gapdh}})?

Vielen Dank schonmal und ein schönes Wochenende.
Viele Grüße,
Bastian

--
Dr. Bastian Bohn

Institut für Numerische Simulation
Rheinische Friedrich-Wilhelms-Universität Bonn
Wegelerstr. 6
D-53115 Bonn
Germany

Tel.: +49 228 73-60452
Fax: +49 228 73-7527
URL: http://wissrech.ins.uni-bonn.de/people/bohn.html