Diese Vorlesung ist ein Vertiefungsfach im Studiengang Künstliche Intelligenz & Data Science. Sie kann auch im Studiengang Mathematik als Modulfach belegt werden. Vorlesungsbeginn: 1.10.25

Ziel der Vorlesung ist es, aufbauend auf der einführenden Statistik-Vorlesung einige weitergehende statistische Verfahren kennenzulernen. "Multivariate" Statistik meint, dass man Verfahren betrachtet, in denen mehr als nur eine einzige Variable betrachtet wird. KI-Studierende haben bereits multivariate Verfahren in der Vorlesung Machine Learning kennengelernt (Entscheidungsbäume, Regressionsmodelle, Support-Vector-Machines, neuronale Netze...); wir werden in dieser Vorlesung einige Verfahren aus statistischer Sicht erneut betrachten (Regressionsmodelle, Diskriminanzanalysen) und zusätzliche statistische Verfahren behandeln, die im Kontext "Data Science" nützlich sein können. 

Mögliche Themen sind:

Wiederholung und Vertiefung der Schätz- und Testtheorie
Lineare Modelle
Verallgemeinerte lineare Modelle
Hauptkomponentenanalyse
Diskriminanzanalyse
Clusteranalyse
Hochrechnung für Stichproben aus endlichen Grundgesamtheiten
Missing Data, geeigneter Umfang mit fehlenden Daten
Resampling-Verfahren (Jackknife, Bootstrap)

Vermutlich werden wir nicht alles schaffen, die Zeit ist begrenzt. Die Vorlesung wird erst zum dritten Mal angeboten, sie ist daher immer noch work in progress.