Hallo zusammen,

das scheint aus meiner Perspektive ein sinnvolles Projekt zu sein. Versucht euch gerne mal an dem Datensatz. Die Hauptherausforderung dürfte hier in der sinnvollen Feature-Generierung liegen, da viele Eingangsgrößen nur kategorisch/diskret vorliegen. Schaut euch dazu z.B. mal one-hot-encoding Techniken in scikit-learn oder pandas an. Das anschließende Klassifikationsproblem ist dann evtl. zu hochdimensional, sodass man da weitere Techniken verwenden kann, um bessere Resultate für die anschließende Klassifikation zu erzielen :).

Beste Grüße,
Bastian Bohn

Am 24.06.23 um 14:35 schrieb Marc Sowa:
Hallo,

Gerne würden wir den folgenden Datensatz untersuchen:


Unser Interesse liegt dabei auf einem Classifier der best möglich einordnet, ob Studierende abbrechen werden oder nicht.

Mit freundlichen Grüßen
Marc Sowa und Anne-Sophie Fleck

-- 
Dr. Bastian Bohn
Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen SCAI
Abteilung Numerische Datenbasierte Vorhersage (NDV)

Schloss Birlinghoven
53757 Sankt Augustin

Tel.: +49 2241 14 4225
https://www.scai.fraunhofer.de/de/geschaeftsfelder/numerische-datenbasierte-vorhersage.html