9 @Home2: Multiple Regression

📢 Zielsetzung

Ziel dieser Aufgabe ist es, selbständig a) ein univariates sowie ein multiples Regressionsmodell zu erstellen, b) deren Modellgüten und c) Konformitäten zu Modellannahmen linearer Regression zu beurteilen und d) die Modelle inhaltlich zu interpretieren.


9.1 Ausgangslage

Die Datei 🔽 atHome2_salaries.rds 🔽 beinhaltet Daten zu den Einkommen von ProfessorInnen an amerikanischen Colleges:

rank discipline yrs.since.phd yrs.service sex salary
Prof B 19 18 Male 139750
Prof B 20 16 Male 173200
AsstProf B 4 3 Male 79750
Prof B 45 39 Male 115000
Prof B 40 41 Male 141500
AssocProf B 6 6 Male 97000
Prof B 30 23 Male 175000

Eine kurze Dokumentation dieser Daten findet sich 👉 hier.

👉 Ein Recap zum Thema Datenimport findet sich ::hier::

9.2 Aufgabenstellung

Arbeiten Sie folgende zwei Aufgabenstellungen ab:

  1. Erstellen Sie anhand dieser Daten ein Regressionsmodell, das die Einkommen der ProfessorInnen erklärt. Vergleichen Sie dazu ein selbst gewähltes multivariates Modell mit einer univariaten Modellvariante.
    • Welches der beiden Modelle erklärt das Einkommen der ProfessorInnen besser - und warum?
  2. Nutzen Sie ein Regressionsmodell, um herauszufinden, ob und ggf. wie das Geschlecht Einfluß (= Gender-Bias) auf die Gehälter nimmt.

👉 Nicht vergessen:
Führen Sie bei jedem Ihrer Modelle aus, ob diese die Modellannahmen linearer Regression erfüllen.

9.3 Formelles

  • je 2-er Team 1 A4 Bericht als PDF
    • Rekapitulation Aufgabenstellung (= Untersuchungsfragen)
    • Datenaufbereitung
    • Dokumentation der Analyse
    • Ergebnisse
    • Interpretation & Beantwortung der Untersuchungsfragen
  • Benennung: Gruppe_XY_@Home2.pdf
  • Abgabe via OLAT - Ordner “@Home2: Regression”
  • Deadline: 19.01.22 // 23.59 Uhr

9.4 Empfehlung

Nutzen Sie für diese Aufgabe folgende Verzeichnisstruktur:

Projektfolder
| Skript_1.R
| ...
| Skript_n.R    
|
+-- Data
    | Datensatz_1.csv
    | ...
    | Datensatz_n.csv

🤔 Challange accepted?