2-SP-Test und ANOVA < Stochastik < Hochschule < Mathe < Vorhilfe
|
Hi,
angenommen ich habe eine zufällige Stichprobe, und einen unabhängigen kategorialen Faktoren mit zwei Ausprägungen. Also z.B. eine Stichprobe Einkommen und den Faktor Geschlecht.
Nun möchte ich prüfen, ob die beiden Gruppen denselben Mittelwert besitzen. Dabei gehe ich davon aus, dass beide Gruppen dieselbe Grundvarianz besitzen.
H0: [mm] \mu_x=\mu_y
[/mm]
Dann kann ich ja zum einen einen 2-Stichproben-Test mithilfe einer t-Statistik durchführen.
m sei die Anzahl der Männer, n die Anzahl der Frauen
X die ZV für das Einkommen der Männer, und Y die ZV für das Einkommen der Frauen.
Die Statistik ist dann definiert durch
[mm] T_{m,n}=\bruch{\wurzel{\bruch{m-n}{m+n}}(\overline{X_m}-\overline{Y_n})}{\wurzel{\bruch{1}{m+n-2}(ms_x^2+ns_y^2)}}\sim t_{m+n-2}
[/mm]
Dann ein [mm] \alpha-Quantil [/mm] auswählen, und prüfen ob [mm] |T_{m,n}|>t_{m+n-2,1-\bruch{\alpha}{2}} [/mm] gilt, um dann die Nullhypothese zu verwerfen.
Ich kann aber auch eine einfaktorielle ANOVA durchführen. Diese erstellt einen F-Test auf einem zugrundeliegenden linearen Modell mit einer Dummy-Designmatrix.
Kann mir jemand sagen, welchen Vorteil die ANOVA gegenüber dem 2-Stichproben-Test besitzt? Und wann ist es genau andersrum; bzw. wann sollte man einen ANOVA-Test bevorzugen, und wann den 2-Stichproben-Test?
In meinem Beispiel lieferte SPSS in beiden Fällen identische Ergebnisse.
Grüße und danke schon mal
|
|
|
|
Hi,
ohne jetzt alle meine Hände ins Feuer zu legen, würde ich mal sagen, dass in deinem Fall ANOVA und t-Test identische Ergebnisse liefern. Das liegt wohl daran, dass in Deinem Fall die H0-Hypothesen von ANOVA und t-Test identisch sind. Sollte Dein kategorialer Faktor mehr als zwei Ausprägungen haben, wäre das wohl komplizierter, weil dann die Hypothesen von ANOVA (alle Mittelwerte sind identisch) und t-Test (die Mittelwerte sind paarweise identisch) abweichen. In diesem Fall wäre das Verfahren vorzuziehen, dass Deinem Untersuchungsziel gerecht wird.
Eine Sache ist mir allerdings aufgefallen: Du berechnest die Testgröße wie folgt
[mm]T_{m,n}=\bruch{\wurzel{\bruch{m-n}{m+n}}(\overline{X_m}-\overline{Y_n})}{\wurzel{\bruch{1}{m+n-2}(ms_x^2+ns_y^2)}}\sim t_{m+n-2}[/mm]
Müsste der Nenner nicht lauten
[mm]\wurzel{\bruch{(m-1)s_x^2+(n-1)s_y^2}{m+n-2}}[/mm]
Viele Grüße,
Sebastian
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 00:48 Sa 29.03.2008 | Autor: | BertanARG |
Hi,
erstmal danke für den Hinweis. Da könntest du recht haben, da die ANOVA speziell bei kategorialen Variablen definiert wurde. Ich werde mal ein Beispiel auf Unterschiede prüfen, in dem quantitative Variablen verwendet werden. Wenn ich mich richtig erinnere, werde ich das mit SPSS gar nicht prüfen können. Bei einem ANOVA-Test wird entweder eine Gruppenvariable gefordert (also mit verschiedenen qualitativen Werten wie 0, 1, etc.), oder man muss eine Grenze eingeben, für die die quantitativen Werte in Gruppen aufgeteilt werden können.
Außerdem habe ich auch ein Skript gefunden, in dem die ANOVA beschrieben wird in zwei Schritten...
1. Teste die Abweichungen von den Mittelwerten in den einzelnen Gruppen auf signifikante Unterschiede mit den Abweichungen vom Gesamtmittelwert. Hier wird ein F-Test verwendet.
2. Abweichungen zwischen einzelnen Gruppen kann man dann mit einem t-Test durchführen
Daher vermute ich, dass der t-Test für den Vergleich zweier Gruppen verwendet werden kann. Mit der ANOVA kann man aber zudem mithilfe des F-Tests eine größere Anzahl an Gruppen mit einem Test auf Unterschiede testen. Wenn ein signifikanter Unterschied vorhanden ist, folgen t-Tests zwischen den einzelnen Gruppen.
Beim Nenner hast du auch recht. Eigentlich müsste das so sein, da ja die Standardabweichung mit dem Faktor [mm] \bruch{1}{m-1} [/mm] gewichtet wird. In der Formel meines Skripts steht auf jeden Fall m statt m-1. Allerdings steht dort im Nenner auch [mm] \sigma_{x}^{*} [/mm] statt [mm] s_x. [/mm] Und der Wert soll der Schätzwert sein, der die quadratischen Abweichungen der beobachteten Werte vom Mittelwert mit Faktor [mm] \bruch{1}{m} [/mm] gewichtet.
Auf jeden Fall muss da der Faktor stehen, mit dem der zugehörige Wert [mm] s_i [/mm] gewichtet wurde. Da hast du Recht, das habe ich nicht explizit angegeben.
Auf jeden Fall mal danke.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 14:20 Sa 29.03.2008 | Autor: | DominoTC |
Hi,
> Daher vermute ich, dass der t-Test für den Vergleich zweier
> Gruppen verwendet werden kann. Mit der ANOVA kann man aber
> zudem mithilfe des F-Tests eine größere Anzahl an Gruppen
> mit einem Test auf Unterschiede testen.
Dem würde ich zustimmen. Daher sollten ANOVA und t-Test im Fall nur einer kategorialen Variable, die nur die Ausprägungen 0 und 1 annehmen kann, auch identische Ergebnisse liefern. Anders verhält es sich, wenn mehr als zwei Ausprägungen der Kategorialen und/oder mehrere kategorialen Variablen vorliegen.
> Wenn ein
> signifikanter Unterschied vorhanden ist, folgen t-Tests
> zwischen den einzelnen Gruppen.
Mmh... da würde ich schätzen, dass hängt von der untersuchten Fragestellung ab. Eine allgemeine Antwort würde mir da schwer fallen. Im Fall der binären kategorialen Variable sollte aufgrund der identischen Aussage von ANOVA und t-Test eines der beiden Verfahren jedoch ausreichen.
> Auf jeden Fall mal danke.
Keine Ursache - ein schönes Wochenende noch!
|
|
|
|