Diese Vorlesung ist ein Vertiefungsfach im Studiengang Künstliche Intelligenz & Data Science. Sie kann auch im Studiengang Mathematik als Modulfach belegt werden.

Ziel der Vorlesung ist es, aufbauend auf der einführenden Statistik-Vorlesung einige weitergehende statistische Verfahren kennenzulernen. "Multivariate" Statistik meint, dass man Verfahren betrachtet, in denen mehr als nur eine einzige Variable betrachtet wird. KI-Studierende haben bereits multivariate Verfahren in der Vorlesung Machine Learning kennengelernt (Entscheidungsbäume, Regressionsmodelle, Support-Vector-Machines, neuronale Netze...); wir werden in dieser Vorlesung einige Verfahren aus statistischer Sicht erneut betrachten (Regressionsmodelle, Diskriminanzanalysen) und zusätzliche statistische Verfahren behandeln, die im Kontext "Data Science" nützlich sein können. 

Mögliche Themen sind:

Wiederholung und Vertiefung der Schätz- und Testtheorie
Lineare Modelle
Verallgemeinerte lineare Modelle
Hauptkomponentenanalyse
Diskriminanzanalyse
Clusteranalyse
Hochrechnung für Stichproben aus endlichen Grundgesamtheiten
Missing Data, geeigneter Umfang mit fehlenden Daten
Resampling-Verfahren (Jackknife, Bootstrap)
Zeitreihenanalyse (klassisch, ARIMA)

Vermutlich werden wir nicht alles schaffen, die Zeit ist begrenzt. Die Vorlesung wird erst zum zweiten Mal angeboten, sie ist daher immer noch work in progress.