R-Quadrat

« Back to Glossary Index

R-Quadrat ist ein statistisches Maß, das den Anteil der Varianz einer abhängigen Variablen darstellt, der durch eine unabhängige Variable oder Variablen in einem Regressionsmodell erklärt wird. Es reicht von 0 bis 1 und zeigt die Güte der Anpassung des Modells an.

Verständnis von R-Quadrat

Definition und Interpretation

  • Wertbereich: R-Quadrat-Werte reichen von 0 bis 1.
  • Interpretation:
    • Ein R-Quadrat von 0 bedeutet, dass das Modell keine der Variabilität der Antwortdaten um ihren Mittelwert erklärt.
    • Ein R-Quadrat von 1 zeigt an, dass das Modell die gesamte Variabilität der Antwortdaten um ihren Mittelwert erklärt.
    • Ein Wert näher an 1 impliziert eine bessere Anpassung, während ein Wert näher an 0 auf eine schlechte Anpassung hinweist.

Berechnung von R-Quadrat

R-Quadrat kann mit der folgenden Formel berechnet werden:

R² = 1 – (SSres / SStot)

  • SSres: Die Summe der Quadrate der Residuen (die Differenzen zwischen beobachteten und vorhergesagten Werten).
  • SStot: Die gesamte Summe der Quadrate (die Varianz der beobachteten Daten).

Beispiel für R-Quadrat

Betrachten Sie eine einfache lineare Regressionsanalyse, bei der wir die Beziehung zwischen der Anzahl der Studienstunden und den in einer Prüfung erzielten Punkten analysieren möchten.

  • Angenommen, wir haben die folgenden Daten:
    • Studienstunden: [1, 2, 3, 4, 5]
    • Erzielte Punkte: [50, 55, 65, 70, 80]
  • Angenommen, das lineare Regressionsmodell gibt uns die vorhergesagten Punkte, die mit dem Modell ausgestattet sind.
  • Die Summe der Quadrate der Residuen (SSres) könnte wie folgt berechnet werden:
    – Vorhergesagte Punkte: [52, 57, 62, 67, 72] – Residuen: [50-52, 55-57, 65-62, 70-67, 80-72] = [-2, -2, 3, 3, 8] – SSres = (-2)² + (-2)² + (3)² + (3)² + (8)² = 4 + 4 + 9 + 9 + 64 = 90
  • Die gesamte Summe der Quadrate (SStot) wird wie folgt berechnet:
    – Durchschnittspunktzahl = (50 + 55 + 65 + 70 + 80) / 5 = 62
    – SStot = (50-62)² + (55-62)² + (65-62)² + (70-62)² + (80-62)² = 144 + 49 + 9 + 64 + 324 = 590
  • Einsetzen der Werte in die R-Quadrat-Formel:
    R² = 1 – (90 / 590) ≈ 0.846

Das bedeutet, dass etwa 84,6 % der Variabilität in den Prüfungspunkten durch die Anzahl der Studienstunden erklärt werden kann, was auf eine starke Beziehung zwischen den beiden Variablen hinweist.