Einführung in die multivariate lineare und logistische Regression
Der Kurs „Einführung in die multivariate Datenanalyse: Hauptkomponenten-, Faktoren- und Clusteranalyse“ richtet sich an Wissenschaftler, welche bereits grundlegende statistische Vorkenntnisse (z.B. Deskriptive Statistik, Korrelation, lineare Regression) haben und ein Minimum an Vorkenntnissen in der Arbeit mit R aufweisen. Die Schulung findet online statt und umfasst drei separate Veranstaltungstermine mit je drei Stunden. Jeder der drei Blöcke ist in sich abgeschlossen, baut aber konzeptionell aufeinander auf. Die Teilnehmer benötigen Ihre eigenen Rechner, auf denen die Statistik Software „R“ und „RStudio“ bereits installiert sein sollte. Eine Kurzanleitung dazu findet sich bspw. hier:https://www.statistik.rw.fau.de/files/2019/09/Anleitung_R-Installation.pdf . In dem Kurs werden die theoretischen Grundlagen der Verfahren vermittelt, anhand von konkreten Beispielen die Durchführung in R dargestellt, sowie in Form von kleinen Übungsaufgaben die praktische Anwendung erprobt.
Kursinhalte
Verfahren:
Hauptkomponentenanalyse (PCA): Datenreduktion und Dimensionsreduktion
Faktorenanalyse (FA): Identifikation latenter Konstrukte
Clusteranalyse (CA): Entdeckung von Gruppierungen in den Daten
Inhalte:
Block 1 PCA
Ziel: Reduktion vieler korrelierender Variablen auf wenige Hauptkomponenten
mathematische Grundidee: Linearkombinationen, maximierte Varianz
Bestimmung der Komponentenzahl
Bedeutung von Landungen, Komponentenwerten, Eigenwerte
Block 2 FA
Abgrenzung zur PCA (gemeinsame vs. Gesamtvarianz)
Extraktions- & Rotationsmethoden
Bedeutung von Kommunalitäten, Faktorladungen, Modellgütekriterien
Block 3 CA
Ziel: Gruppenstrukturen identifizieren
Ähnlichkeits- & Distanzmaße, Cluster-Algorithmen
Clustervalidierung
Kursaufbau:
Einführende theoretische Modellbeschreibungen
mathematische Grundlagen der Verfahren (soweit notwendig/hilfreich für das Verständnis)
einführende Praxisbeispiele in R
Interpretation / Visualisierung / Ergebnisbericht
gemeinsame praktische Durchführungen mit R ("Workshop-Ansatz")
Kurszeitraum
Freitag, 06.11., 11°° – 14°° Uhr: PCA
Freitag, 20.11., 11°° – 14°° Uhr: FA
Freitag, 04.12., 11°° – 14°° Uhr: CA
Organisatorisches
Die Schulung findet Online statt. Zugangsdaten werden nach bestätigter Anmeldung mitgeteilt.