Diese Vorlesung ist ein Vertiefungsfach im Studiengang Künstliche Intelligenz & Data Science. Sie kann auch im Studiengang Mathematik als Modulfach belegt werden.
Ziel der Vorlesung ist es, aufbauend auf der einführenden Statistik-Vorlesung einige weitergehende statistische Verfahren kennenzulernen. "Multivariate" Statistik meint, dass man Verfahren betrachtet, in denen mehr als nur eine einzige Variable betrachtet wird. KI-Studierende haben bereits multivariate Verfahren in der Vorlesung Machine Learning kennengelernt (Entscheidungsbäume, Regressionsmodelle, Support-Vector-Machines, neuronale Netze...); wir werden in dieser Vorlesung einige Verfahren aus statistischer Sicht erneut betrachten (Regressionsmodelle, Diskriminanzanalysen) und zusätzliche statistische Verfahren behandeln, die im Kontext "Data Science" nützlich sein können.
Mögliche Themen sind:
• Wiederholung und Vertiefung der Schätz- und Testtheorie
• Lineare Modelle
• Verallgemeinerte lineare Modelle
• Hauptkomponentenanalyse
• Diskriminanzanalyse
• Clusteranalyse
• Hochrechnung für Stichproben aus endlichen Grundgesamtheiten
• Missing Data, geeigneter Umfang mit fehlenden Daten
• Resampling-Verfahren (Jackknife, Bootstrap)
• Zeitreihenanalyse (klassisch, ARIMA)
Vermutlich werden wir nicht alles schaffen, die Zeit ist begrenzt. Die Vorlesung wird erst zum zweiten Mal angeboten, sie ist daher immer noch work in progress.