[Mllab-23] Dataset Choice Marc Anne-Sophie
Hallo, Gerne würden wir den folgenden Datensatz untersuchen: https://archive-beta.ics.uci.edu/dataset/697/predict+students+dropout+and+academic+success Unser Interesse liegt dabei auf einem Classifier der best möglich einordnet, ob Studierende abbrechen werden oder nicht. Mit freundlichen Grüßen Marc Sowa und Anne-Sophie Fleck
Hallo zusammen, das scheint aus meiner Perspektive ein sinnvolles Projekt zu sein. Versucht euch gerne mal an dem Datensatz. Die Hauptherausforderung dürfte hier in der sinnvollen Feature-Generierung liegen, da viele Eingangsgrößen nur kategorisch/diskret vorliegen. Schaut euch dazu z.B. mal one-hot-encoding Techniken in scikit-learn oder pandas an. Das anschließende Klassifikationsproblem ist dann evtl. zu hochdimensional, sodass man da weitere Techniken verwenden kann, um bessere Resultate für die anschließende Klassifikation zu erzielen :). Beste Grüße, Bastian Bohn Am 24.06.23 um 14:35 schrieb Marc Sowa:
Hallo,
Gerne würden wir den folgenden Datensatz untersuchen:
UCI Machine Learning Repository <https://archive-beta.ics.uci.edu/dataset/697/predict+students+dropout+and+academic+success> ics.uci.edu <https://archive-beta.ics.uci.edu/dataset/697/predict+students+dropout+and+academic+success> apple-touch-icon.png <https://archive-beta.ics.uci.edu/dataset/697/predict+students+dropout+and+academic+success>
<https://archive-beta.ics.uci.edu/dataset/697/predict+students+dropout+and+academic+success>
Unser Interesse liegt dabei auf einem Classifier der best möglich einordnet, ob Studierende abbrechen werden oder nicht.
Mit freundlichen Grüßen Marc Sowa und Anne-Sophie Fleck
-- Dr. Bastian Bohn Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen SCAI Abteilung Numerische Datenbasierte Vorhersage (NDV) Schloss Birlinghoven 53757 Sankt Augustin Tel.: +49 2241 14 4225 https://www.scai.fraunhofer.de/de/geschaeftsfelder/numerische-datenbasierte-...
participants (2)
-
Bastian Bohn -
Marc Sowa