R-Quadrat ist ein statistisches Maß, das den Anteil der Varianz einer abhängigen Variablen darstellt, der durch eine unabhängige Variable oder Variablen in einem Regressionsmodell erklärt wird. Es reicht von 0 bis 1 und zeigt die Güte der Anpassung des Modells an.
Verständnis von R-Quadrat
Definition und Interpretation
- Wertbereich: R-Quadrat-Werte reichen von 0 bis 1.
- Interpretation:
- Ein R-Quadrat von 0 bedeutet, dass das Modell keine der Variabilität der Antwortdaten um ihren Mittelwert erklärt.
- Ein R-Quadrat von 1 zeigt an, dass das Modell die gesamte Variabilität der Antwortdaten um ihren Mittelwert erklärt.
- Ein Wert näher an 1 impliziert eine bessere Anpassung, während ein Wert näher an 0 auf eine schlechte Anpassung hinweist.
Berechnung von R-Quadrat
R-Quadrat kann mit der folgenden Formel berechnet werden:
R² = 1 – (SSres / SStot)
- SSres: Die Summe der Quadrate der Residuen (die Differenzen zwischen beobachteten und vorhergesagten Werten).
- SStot: Die gesamte Summe der Quadrate (die Varianz der beobachteten Daten).
Beispiel für R-Quadrat
Betrachten Sie eine einfache lineare Regressionsanalyse, bei der wir die Beziehung zwischen der Anzahl der Studienstunden und den in einer Prüfung erzielten Punkten analysieren möchten.
- Angenommen, wir haben die folgenden Daten:
- Studienstunden: [1, 2, 3, 4, 5]
- Erzielte Punkte: [50, 55, 65, 70, 80]
- Angenommen, das lineare Regressionsmodell gibt uns die vorhergesagten Punkte, die mit dem Modell ausgestattet sind.
- Die Summe der Quadrate der Residuen (SSres) könnte wie folgt berechnet werden:
– Vorhergesagte Punkte: [52, 57, 62, 67, 72] – Residuen: [50-52, 55-57, 65-62, 70-67, 80-72] = [-2, -2, 3, 3, 8] – SSres = (-2)² + (-2)² + (3)² + (3)² + (8)² = 4 + 4 + 9 + 9 + 64 = 90 - Die gesamte Summe der Quadrate (SStot) wird wie folgt berechnet:
– Durchschnittspunktzahl = (50 + 55 + 65 + 70 + 80) / 5 = 62
– SStot = (50-62)² + (55-62)² + (65-62)² + (70-62)² + (80-62)² = 144 + 49 + 9 + 64 + 324 = 590 - Einsetzen der Werte in die R-Quadrat-Formel:
R² = 1 – (90 / 590) ≈ 0.846
Das bedeutet, dass etwa 84,6 % der Variabilität in den Prüfungspunkten durch die Anzahl der Studienstunden erklärt werden kann, was auf eine starke Beziehung zwischen den beiden Variablen hinweist.