Hallo zusammen,
das scheint aus meiner Perspektive ein sinnvolles Projekt zu sein. Versucht euch gerne mal an dem Datensatz. Die Hauptherausforderung dürfte hier in der sinnvollen Feature-Generierung liegen, da viele Eingangsgrößen nur kategorisch/diskret vorliegen. Schaut euch dazu z.B. mal one-hot-encoding Techniken in scikit-learn oder pandas an. Das anschließende Klassifikationsproblem ist dann evtl. zu hochdimensional, sodass man da weitere Techniken verwenden kann, um bessere Resultate für die anschließende Klassifikation zu erzielen :).
Beste Grüße,
Bastian Bohn
Hallo,
Gerne würden wir den folgenden Datensatz untersuchen:
Unser Interesse liegt dabei auf einem Classifier der best möglich einordnet, ob Studierende abbrechen werden oder nicht.
Mit freundlichen GrüßenMarc Sowa und Anne-Sophie Fleck
-- Dr. Bastian Bohn Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen SCAI Abteilung Numerische Datenbasierte Vorhersage (NDV) Schloss Birlinghoven 53757 Sankt Augustin Tel.: +49 2241 14 4225 https://www.scai.fraunhofer.de/de/geschaeftsfelder/numerische-datenbasierte-vorhersage.html