Stichprobenvarianz < Statistik (Anwend.) < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 21:42 Sa 28.05.2016 | Autor: | Hejo |
Ich versuche gerade den mean square error der Stichprobenvarianz zu berechnen. Dabei möchte ich ausnutzen, dass [mm] \summe_{i=1}^{n}(\bruch{x_{i}-\overline x}{\sigma})^2\sim\chi^2_{n-1}. [/mm] Was ich verstehe ist: [mm] \summe_{i=1}^{n}(\bruch{x_{i}-\mu}{\sigma})^2\sim\chi^2_{n}. [/mm] Das ist ja gerade die Definition der [mm] \chi^2 [/mm] Verteilung.
Ich würde gerne verstehen warum sich durch das Subtrahieren von [mm] \overline{x} [/mm] anstatt von [mm] \mu [/mm] der Freiheitsgrad der [mm] \chi^2 [/mm] Verteilung um 1 reduziert.
|
|
|
|
[mm] \mu [/mm] ist ein (theoretischer) Erwartungswert, von dem alle n Messwerte beliebig abweichen können.
[mm]\overline x [/mm] ist der tatsächliche Durchschnittswert. Von ihm können n-1 Werte beliebig abweichen, aber der n-te ist dann dadurch festgelegt, dass er nun mit den anderen zusammen den Durchschnittswert hervorbringen muss.
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 22:13 Sa 28.05.2016 | Autor: | Hejo |
Danke für die schnelle Antwort. Wie würde man das mathematisch herleiten?
|
|
|
|
|
Statt Herleiten sollte man hier lieber von definieren oder überlegen sprechen. Am Beispiel für den [mm] \chi^2-Test [/mm] will ich das mal erläutern.
Es soll untersucht werden, ob die Lieblingsfarbe eines Menschen vom Geschlecht abhängt. Es wurden 400 Männer und 750 Frauen befragt. Dabei kam die folgende Verteilung heraus:
------------------------------------------------------
| rot | gelb | orange | grün | blau | gesamt |
--------+-----+------+--------+------+------+---------
Männer | 150 | 20 | 30 | 100 | | 400 |
--------+-----+------+--------+------+------+---------
Frauen | | | | | | 750 |
--------+-----+------+--------+------+------+---------
gesamt | 350 | 150 | 150 | 200 | 300 | 1150 |
------------------------------------------------------
Da die Frage nach dem Zusammenhang zwischen Farbe und Geschlecht untersucht werden soll, wird nun NICHT gefragt, warum man gerade 400 Männer und 750 Frauen befragt (oder am Befragungsort angetroffen) hat und auch nicht, warum von denen 350 rot und 150 blau und nicht umgekehrt gewählt haben. Das ist halt so. Die Frage ist nur die, ob das Geschlecht eine Rolle spielt.
Deshalb werden in der obigen Tabelle die Randwerte in der unteren Zeile und der rechten Spalte als "gottgegeben" hingenommen. Die Frage ist nun, wie sich diese auf die inneren Kästchen verteilen.
Nachdem ich fünf Zahlen eingetragen habe, habe ich für die von mir leer gelassenen Felder keine Wahl mehr, da sich die Summe aus Zeilen und Spalten zu den Randwerten ergänzen müssen. Ich habe also nur 4 Freiheitsgrade, der Rest ergibt sich von selber.
Allgemein ist die Anzahl der Freiheitsgrade (n-1)*(m-1), wenn es sich um ein n*m-Feld (ohne die Randwerte und Überschriften) handelt, hier also um ein 2(Geschlecht)*5(Farbe)-Feld mit 1*4=4 Freiheitsgraden.
Genauso verhält es sich bei deinen Messwerten. Nehmen wir an, der Schätzwert [mm] \mu [/mm] beträgt 47, und du hast die Werte 50, 53, 49 und 48. Jeder Wert hält sich in der Nähe von [mm] \mu [/mm] auf, aber alle können z.B. etwas größer als [mm] \mu [/mm] sein, keiner hat mit dem anderen zu tun, da [mm] \mu [/mm] nur ein Schätzwert ist. Der Freiheitsgrad ist somit 4.
Gehst du aber vom Durchschnittswert [mm] \overline{x}=50 [/mm] aus, so hast du nach 50, 53, und 49 für den letzten Wert keine Wahl mehr; wenn du nicht 48 nimmst, kommt nicht 50 als Durchschnittswert heraus. Jetzt ist der Freiheitsgrad nur 3.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 21:52 Mo 30.05.2016 | Autor: | Hejo |
Ok ich glaube das habe ich verstanden. Beim Benutzen von [mm] {\overline x} [/mm] wird immer ein [mm] x_i [/mm] Wert aus [mm] {\overline x}, [/mm] dem gerade verwendetem x wert ( von dem man [mm] {\overline x} [/mm] subtrahiert) entsprechen. Deshalb haben die aufummierten [mm] Z_i^2 [/mm] nur n-1 Freiheitsgrade.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 07:54 So 29.05.2016 | Autor: | chrisno |
Das ist ein Stück Weg, den ich sicher nicht hier aufschreibe. Stichwort:
maximum likelihood estimator
|
|
|
|
|
Status: |
(Frage) überfällig | Datum: | 21:53 Mo 30.05.2016 | Autor: | Hejo |
von was muss ich die likelihood funktion bilden?
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 22:21 Mi 01.06.2016 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|