Kursinhalt

Vom einfachen gemischten Modell bis zum komplexen gemischten Modell mit Kovarianzstrukturen

Dieser Kurs ist an Naturwissenschaftler gerichtet, die bereits Erfahrung mit der statistischen Auswertung in R (z.B. Regression, Varianzanalyse) haben, jedoch mehr über die Anwendungsmöglichkeiten von vor allem komplexen gemischten Modellen oder der strukturierten und effizienten Nutzung von R generell erfahren wollen. Wie der Name sagt ist dieser Kurs der zweite Teil einer Kursreihe und baut auf dem Kurs „Data Science in den experimentellen Naturwissenschaften mit R (Teil 1) – vom professionellen Graphen bis zum einfachen gemischten Modell“ auf. Die Teilnahme hier setzt keine Teilnahme am ersten Kurs voraus, jedoch sollte das dort vermittelte Wissen vorhanden sein. Ziel ist es speziell das Statistik-Wissen auf eine intuitive und praktikable Art zu vermitteln. Der Fokus liegt dabei vor allem auf der praktischen Anwendung, sodass die unten genannten Methoden und deren zugrundeliegende Theorie mithilfe von anschaulichen Beispielen erklärt werden. Die Beispiele des Kurses kommen vor allem aus den Agrarwissenschaften bzw. der experimentellen Biologie/Ökologie. Inhalte des Kurses sind:

Statistik:
  • Kritische Diskussion zu p-Werten und Signifikanz
  • Kritische Diskussion zu t-Test oder Tukey-Test (usw.)
  • Mehrfaktorielle Varianzanalyse (ANOVA)
  • Modellselektion (R2, AIC)
  • Gemischte Modelle mit Kovarianzstrukturen
  • R-packages: {lme4}, {nlme}, {glmmTMB}
  • Kurzer Ausblick: Generalisierte Modelle (Zähldaten, Presence/Absence, Proportionen)
  • Versuchsdesigns (zzgl. derer aus Teil 1)
    • Split-plot design (=Spaltanlage)
    • Messwiederholungen
    • Versuche an mehreren Orten und/oder Jahren
    Datenverarbeitung und -aufbereitung:
    • Alternative Im- und Exportfunktionen, sowie Datenstrukturen
    • Effizientes und dennoch kontrolliertes Analysieren von mehreren Datensätzen
    • Professionelle Erstellung verschiedener Graphen; packages: {ggplot2}, {desplot}
    • Reproduzierbare Analysen (inkl. Einführung in R Markdown)

    Statistische Grundkenntnisse sind von Vorteil. Falls der erste Teil dieses Kurses nicht besucht wurde, wäre es nützlich zumindest die ersten fünf "Auswertungen" hier durchgearbeitet werden. R und RStudio müssen vor Kursbeginn installiert sein. Hier gibt's ein paar Tipps zur Vorbereitung auf Online-Kurse. Skripte zu all meinen Workshops sind jederzeit online verfügbar (siehe hier die Links zu den 3 GitHub Pages "CrashcouRse", "DSFAIR" und "MMFAIR") und werden kontinuierlich verbessert und erweitert.