Kursinhalt

Einführung in die multivariate lineare und logistische Regression

Der Kurs „Einführung in die multivariate Datenanalyse: Hauptkomponenten-, Faktoren- und Clusteranalyse“ richtet sich an Wissenschaftler, welche bereits grundlegende statistische Vorkenntnisse (z.B. Deskriptive Statistik, Korrelation, lineare Regression) haben und ein Minimum an Vorkenntnissen in der Arbeit mit R aufweisen. Die Schulung findet online statt und umfasst drei separate Veranstaltungstermine mit je drei Stunden. Jeder der drei Blöcke ist in sich abgeschlossen, baut aber konzeptionell aufeinander auf. Die Teilnehmer benötigen Ihre eigenen Rechner, auf denen die Statistik Software „R“ und „RStudio“ bereits installiert sein sollte. Eine Kurzanleitung dazu findet sich bspw. hier:https://www.statistik.rw.fau.de/files/2019/09/Anleitung_R-Installation.pdf . In dem Kurs werden die theoretischen Grundlagen der Verfahren vermittelt, anhand von konkreten Beispielen die Durchführung in R dargestellt, sowie in Form von kleinen Übungsaufgaben die praktische Anwendung erprobt.

Kursinhalte

Verfahren:

  • Hauptkomponentenanalyse (PCA): Datenreduktion und Dimensionsreduktion
  • Faktorenanalyse (FA): Identifikation latenter Konstrukte
  • Clusteranalyse (CA): Entdeckung von Gruppierungen in den Daten
  • Inhalte:

    Block 1 PCA

  • Ziel: Reduktion vieler korrelierender Variablen auf wenige Hauptkomponenten
  • mathematische Grundidee: Linearkombinationen, maximierte Varianz
  • Bestimmung der Komponentenzahl
  • Bedeutung von Landungen, Komponentenwerten, Eigenwerte
  • Block 2 FA

  • Abgrenzung zur PCA (gemeinsame vs. Gesamtvarianz)
  • Extraktions- & Rotationsmethoden
  • Bedeutung von Kommunalitäten, Faktorladungen, Modellgütekriterien
  • Block 3 CA

  • Ziel: Gruppenstrukturen identifizieren
  • Ähnlichkeits- & Distanzmaße, Cluster-Algorithmen
  • Clustervalidierung
  • Kursaufbau:

  • Einführende theoretische Modellbeschreibungen
  • mathematische Grundlagen der Verfahren (soweit notwendig/hilfreich für das Verständnis)
  • einführende Praxisbeispiele in R
  • Interpretation / Visualisierung / Ergebnisbericht
  • gemeinsame praktische Durchführungen mit R ("Workshop-Ansatz")
  • Kurszeitraum

  • Freitag, 06.11., 11°° – 14°° Uhr: PCA
  • Freitag, 20.11., 11°° – 14°° Uhr: FA
  • Freitag, 04.12., 11°° – 14°° Uhr: CA

  • Organisatorisches

    Die Schulung findet Online statt. Zugangsdaten werden nach bestätigter Anmeldung mitgeteilt.