Zufallsvariable Def. < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 10:51 Do 17.03.2011 | Autor: | Pille456 |
Hi,
Ich habe momentan ein Problem den Begriff der Zufallsvariable und mehrerer Zufallsvariable zu verstehen:
Eine ZVe ist eine Abbildung [mm] X:\Omega \to \IR, [/mm] sodass den Werten aus [mm] \Omega [/mm] einen Wert aus [mm] \IR [/mm] zugewiesen wird. Damit hat man den Zusammenhang zwischen dem Grundraum [mm] \Omega [/mm] und [mm] \IR, [/mm] wobei man dann mit den Werten aus [mm] \IR [/mm] konkret rechnen kann: [mm] X(\Omega)=\{X(\omega)|\omega \in \Omega \}
[/mm]
Gilt nun X~Bin(n,p) so ist X Binominalverteilt mit W'keit p und Umfang n.
Das heißt doch nun erstmal nicht anderes, dass für alle k aus [mm] X(\Omega) [/mm] für die W'keit gilt: [mm] \vektor{n \\ k}*p^k*(1-p)^{n-k}. [/mm] Oder etwas mathematischer formuliert: [mm] \forall [/mm] k [mm] \in \{X(\omega)|\omega \in \Omega \} [/mm] gilt: [mm] P(k)=\vektor{n \\ k}*p^k*(1-p)^{n-k}
[/mm]
Habe ich das soweit korrekt verstanden?
Nun habe ich mehrere ZVe [mm] X_1,X_2,..,X_m, [/mm] d.h. nach der obrigen Def. sind das alles verschiedene Mengen oder nicht?
Nun ist häufig jedoch die Rede von der Summe der ZVe: [mm] S_m=\summe_{i=1}^{m}X_i
[/mm]
Die Summe einer Menge ist als Vereinigungsmenge definiert, jedoch wird im folgenden immer mit [mm] S_m [/mm] wie mit einer konkreten Zahl gerechnet.
Was ist denn nun mit [mm] X_1,...,X_m [/mm] und [mm] S_m [/mm] gemeint?
Gruß
Pille
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 11:17 Do 17.03.2011 | Autor: | fred97 |
> Hi,
>
> Ich habe momentan ein Problem den Begriff der
> Zufallsvariable und mehrerer Zufallsvariable zu verstehen:
> Eine ZVe ist eine Abbildung [mm]X:\Omega \to \IR,[/mm] sodass den
> Werten aus [mm]\Omega[/mm] einen Wert aus [mm]\IR[/mm] zugewiesen wird. Damit
> hat man den Zusammenhang zwischen dem Grundraum [mm]\Omega[/mm] und
> [mm]\IR,[/mm] wobei man dann mit den Werten aus [mm]\IR[/mm] konkret rechnen
> kann: [mm]X(\Omega)=\{X(\omega)|\omega \in \Omega \}[/mm]
> Gilt nun
> X~Bin(n,p) so ist X Binominalverteilt mit W'keit p und
> Umfang n.
> Das heißt doch nun erstmal nicht anderes, dass für alle
> k aus [mm]X(\Omega)[/mm] für die W'keit gilt: [mm]\vektor{n \\ k}*p^k*(1-p)^{n-k}.[/mm]
> Oder etwas mathematischer formuliert: [mm]\forall[/mm] k [mm]\in \{X(\omega)|\omega \in \Omega \}[/mm]
> gilt: [mm]P(k)=\vektor{n \\ k}*p^k*(1-p)^{n-k}[/mm]
> Habe ich das
> soweit korrekt verstanden?
Na ja, korrekt ist
[mm]P(X=k)=\vektor{n \\ k}*p^k*(1-p)^{n-k}[/mm] für 0 [mm] \le [/mm] k [mm] \le [/mm] n
>
> Nun habe ich mehrere ZVe [mm]X_1,X_2,..,X_m,[/mm] d.h. nach der
> obrigen Def. sind das alles verschiedene Mengen oder
> nicht?
Nein. Zufallsvariablen sind keine Mengen ! Es sind Abbildungen (Funktionen)
> Nun ist häufig jedoch die Rede von der Summe der ZVe:
> [mm]S_m=\summe_{i=1}^{m}X_i[/mm]
> Die Summe einer Menge ist als Vereinigungsmenge definiert,
> jedoch wird im folgenden immer mit [mm]S_m[/mm] wie mit einer
> konkreten Zahl gerechnet.
Nochmal: Zufallsvariablen sind keine Mengen ! Es sind Abbildungen (Funktionen)
> Was ist denn nun mit [mm]X_1,...,X_m[/mm] und [mm]S_m[/mm] gemeint?
Abbildungen
FRED
>
> Gruß
> Pille
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 12:05 Do 17.03.2011 | Autor: | Pille456 |
Hi,
Ich habe mich falsch ausgedrückt, natürlich ist eine ZVe keine Menge, aber sie ist durch eine Menge vollständig bestimmt, siehe Def.
Dennoch sagt mir das noch nichts darüber aus, wie ich $ [mm] S_n=\summe_{i=1}^{n}X_i [/mm] $ genau verstehen kann.
Demnach wäre [mm] S_m [/mm] auch eine Abbildung. Der zentrale Grenzwertsatz sagt dann nun aus:
[mm] \limes_{n\rightarrow\infty}P(a\le \bruch{S_n-ES_n}{\wurzel{Var S_n}}\le b)=\Phi(b)-\Phi(a)
[/mm]
Da [mm] S_n [/mm] sich durch die Summe zusammensetzt ist [mm] S_n [/mm] damit auch eine ZVe, somit macht es durchaus Sinn [mm] ES_n [/mm] bzw. Var [mm] S_n [/mm] zu bestimmen, aber was ist hier mit [mm] S_n [/mm] gemeint?
Ist das eine Kurzschreibweise für [mm] S_n(\Omega)=\{S_n(\omega)|\omega \in \Omega\} [/mm] ?
Hierbei ist dann auch genau der Knackpunkt: Der zentrale Grenzwertsatz sagt aus, dass wenn ich einen hinreichend großen Stichprobenumfang habe und die Stichprobe einer bestimmten Verteilung genügt (unabhängig, identisch..), dass man diese dann durch die Normalverteilung annähern kann.
Ich weiß jetzt nicht ob sowas einfach oft unscharf formuliert ist oder ob meine Intuition da total falsch ist, aber häufig macht es für mich den Eindruck als sei der Begriff der Zufallsvariable gleichbedeutend mit einem konkreten Wert verwendet - was ja offensichtlich falsch ist.
Bsp: Aus Wikipedia zum Zentralen Grenzwertsatz (Link)
"Sei [mm] X_1, X_2, X_3,\dots [/mm] eine Folge von Zufallsvariablen, die auf demselben Wahrscheinlichkeitsraum alle dieselbe Verteilung D aufweisen und unabhängig sind (u.i.v. = unabhängig und identisch verteilt, engl. i.i.d. = independent and identically distributed)"
Nun stelle ich mir eine Stichprobe vor, zum Beispiel betrachte ich 10.000 Glühbirnen die mit einer Wahrscheinlichkeit p=0.01 kaputt sind. Dann wird die Verteilung der Glühbirnen sich nach dem zentralen Grenzwertsatz der Normalverteilung annähern.
Das heißt konkret, wenn ich die Wahrscheinlichkeit wissen möchte, dass 100-200 Glühbirnen kaputt sind, dann kann ich doch einfach schreiben:
[mm] \limes_{n\rightarrow\infty}P(100\le \bruch{S_n-ES_n}{\wurzel{Var S_n}}\le 200)=\Phi(200)-\Phi(100), [/mm] wobei ich natürlich hier implizit sagte, dass n=10.000 groß genug ist, um eine hinreichend gute Näherung zu erhalten.
Aber wo habe ich in diesem Beispiel mehrere ZVe verwendet?
|
|
|
|
|
Hallo!
> Ich habe mich falsch ausgedrückt, natürlich ist eine ZVe
> keine Menge, aber sie ist durch eine Menge vollständig
> bestimmt, siehe Def.
Durch welche Menge?
> Dennoch sagt mir das noch nichts darüber aus, wie ich
> [mm]S_n=\summe_{i=1}^{n}X_i[/mm] genau verstehen kann.
> Demnach wäre [mm]S_m[/mm] auch eine Abbildung.
Richtig.
> Der zentrale
> Grenzwertsatz sagt dann nun aus:
> [mm]\limes_{n\rightarrow\infty}P(a\le \bruch{S_n-ES_n}{\wurzel{Var S_n}}\le b)=\Phi(b)-\Phi(a)[/mm]
Das ist nicht ganz richtig. Die Aussage ist
[mm] $\frac{S_n - n*\IE[S_n]}{\sigma*\sqrt{n}} \to [/mm] N(0,1)$
(Da stimmte irgendwas mit den n's nicht bei dir).
> Da [mm]S_n[/mm] sich durch die Summe zusammensetzt ist [mm]S_n[/mm] damit
> auch eine ZVe, somit macht es durchaus Sinn [mm]ES_n[/mm] bzw. Var
> [mm]S_n[/mm] zu bestimmen, aber was ist hier mit [mm]S_n[/mm] gemeint?
> Ist das eine Kurzschreibweise für
> [mm]S_n(\Omega)=\{S_n(\omega)|\omega \in \Omega\}[/mm] ?
Nein. Machen wir ein ganz konkretes Beispiel.
Sei n = 2, und [mm] $\Omega [/mm] = [mm] \{A,B,C\}$. [/mm] Nun definiere
[mm] $X_1:\Omega \to \IR:\begin{cases}X_1(A) = 1\\ X_1(B) = 2\\ X_1(C) = 3\end{cases}$.
[/mm]
[mm] $X_2:\Omega \to \IR:\begin{cases}X_2(A) = -1\\ X_2(B) = -2\\ X_2(C) = -3\end{cases}$.
[/mm]
Dann ist [mm] $S_2 [/mm] = [mm] X_1 [/mm] + [mm] X_2:\Omega \to \IR$ [/mm] ebenfalls eine Zufallsvariable, und zwar definiert durch:
[mm] $S_2(\omega) [/mm] = [mm] X_1(\omega) [/mm] + [mm] X_2(\omega)$ [/mm] für alle [mm] $\omega \in \Omega$,
[/mm]
also [mm] $S_2(A) [/mm] = [mm] X_1(A) [/mm] + [mm] X_2(A)$ [/mm] usw.
Wichtig: Das Wahrscheinlichkeitsmaß ist auf dem Raum [mm] $\Omega$ [/mm] definiert. Die Zufallsvariable ist bloß dazu da, den Raum [mm] $\Omega$ [/mm] "berechenbar" zu machen, indem sie den Elementen Zahlen zuordnet.
Das Wahrscheinlichkeitsmaß auf [mm] \Omega [/mm] lautet zum Beispiel
[mm] $\IP:\Omega \to [/mm] [0,1]$,
[mm] $\IP(A) [/mm] = 0.2, [mm] \IP(B) [/mm] = 0.1, [mm] \IP(C) [/mm] = 0.7$
Man kann dann so etwas schreiben: [mm] $\IP(X_1 [/mm] = 2)$, man meint damit aber eigentlich genauer:
[mm] $\IP(X_1 [/mm] = 2) = [mm] \IP(\{\omega \in \Omega:X_1(\omega) = 2\}) [/mm] = [mm] \IP(B) [/mm] = 0.1$
Das heißt man sucht die Wahrscheinlichkeit, dass [mm] $X_1 [/mm] = 2$ eintritt, basierend auf dem Wahrscheinlichkeitsmaß von [mm] \Omega.
[/mm]
Ist das alles klar?
-----
Für spätere Anwendungen ignoriert man meistens den Raum [mm] \Omega. [/mm] Wenn du dir das Beispiel oben mal konzentriert ansiehst, wirst du feststellen dass [mm] \Omega [/mm] keine Rolle spielt, wichtig ist bloß dass man die Werte [mm] $\IP(X_1 [/mm] = x)$ kennt. Dann kann man auch [mm] $\IP(X_1 \in \{x,y\}) [/mm] = [mm] \IP(X_1 [/mm] = x) + [mm] \IP(X_1 [/mm] = y)$ berechnen.
------
> Hierbei ist dann auch genau der Knackpunkt: Der zentrale
> Grenzwertsatz sagt aus, dass wenn ich einen hinreichend
> großen Stichprobenumfang habe und die Stichprobe einer
> bestimmten Verteilung genügt (unabhängig, identisch..),
> dass man diese dann durch die Normalverteilung annähern
> kann.
Genau.
> Ich weiß jetzt nicht ob sowas einfach oft unscharf
> formuliert ist oder ob meine Intuition da total falsch ist,
> aber häufig macht es für mich den Eindruck als sei der
> Begriff der Zufallsvariable gleichbedeutend mit einem
> konkreten Wert verwendet - was ja offensichtlich falsch
> ist.
s.o. Es geht dabei um die Urbildmenge. Wenn man von [mm] X_1 [/mm] = 2 spricht, meint man damit eigentlich die Menge der [mm] \omega\in \Omega, [/mm] für die [mm] $X_1(\omega) [/mm] = 2$ ist.
> Nun stelle ich mir eine Stichprobe vor, zum Beispiel
> betrachte ich 10.000 Glühbirnen die mit einer
> Wahrscheinlichkeit p=0.01 kaputt sind.
> Dann wird die
> Verteilung der Glühbirnen sich nach dem zentralen
> Grenzwertsatz der Normalverteilung annähern.
> Das heißt konkret, wenn ich die Wahrscheinlichkeit wissen
> möchte, dass 100-200 Glühbirnen kaputt sind, dann kann
> ich doch einfach schreiben:
> [mm]\limes_{n\rightarrow\infty}P(100\le \bruch{S_n-ES_n}{\wurzel{Var S_n}}\le 200)=\Phi(200)-\Phi(100),[/mm]
> wobei ich natürlich hier implizit sagte, dass n=10.000
> groß genug ist, um eine hinreichend gute Näherung zu
> erhalten.
> Aber wo habe ich in diesem Beispiel mehrere ZVe verwendet?
Was ist denn [mm] S_n [/mm] bei dir? Wie konntest du [mm] S_n [/mm] berechnen?
Du hast n = 10000 gewählt. Wir wollen mit [mm] $S_n$ [/mm] die Anzahl der kaputten Glühbirnen zählen. Wir schreiben deshalb:
[mm] $S_n [/mm] = [mm] \sum_{k=1}^{n}X_k$,
[/mm]
wobei [mm] $X_k$ [/mm] eine Zufallsvariable, die Bernoulli-verteilt ist. D.h.
[mm] $\IP(X_k [/mm] = 0) = 0.99, [mm] \IP(X_k [/mm] = 1) = 0.01$
Damit sind alle [mm] $X_k$ [/mm] identisch verteilt, weil die Wahrscheinlichkeitswerte nicht von k abhängen. Ich betone hier nochmal: Wenn ich [mm] X_k [/mm] = 0 schreibe, meine ich damit eigentlich eine Menge, nämlich die Menge der [mm] \omega\in\Omega, [/mm] für die [mm] $X_k(\omega) [/mm] =0$ ist. Aber du siehst schon hier, dass [mm] \Omega [/mm] völlig egal ist weil es ausreicht [mm] $\IP(X_k [/mm] = 0)$ zu kennen.
----
Mit obiger Konfiguration ist [mm] $S_n [/mm] = [mm] \sum_{k=1}^{n}X_k$ [/mm] die Anzahl der kaputten Glühbirnen. Das klingt jetzt etwas komisch, weil wir ja die Anzahl der kaputten Glühbirnen gar nicht kennen.
Beachte aber, dass wir bis jetzt auch keine konkreten Werte angeben. Nach dieser Modellierung berechnen wir mit [mm] $\IP(S_n [/mm] = 200)$ auch nur eine Wahrscheinlichkeit, nämlich die Wahrscheinlichkeit:
[mm] $\IP(S_n [/mm] = 200) = [mm] \IP(\{\omega\in \Omega:S_n(\omega) = X_1(\omega) + ... + X_n(\omega) = 200\})$.
[/mm]
Der ZWGS sagt nun:
[mm] $\frac{S_n - n*\IE[S_n]}{\sigma*\sqrt{n}} \to [/mm] N(0,1)$,
d.h. im Limes folgt die Verteilung des linken Terms nicht mehr einer Summe von Bernoulli-Verteilungen, sondern einer Normalverteilung.
Viele Grüße,
Stefan
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 12:57 Do 17.03.2011 | Autor: | Pille456 |
Hi,
Danke erstmal für deine ausführliche Antwort, die macht schonmal einiges klarer, jedoch habe ich noch eine Frage:
Wie sehen denn die einzelnen [mm] X_k [/mm] bei dem Beispiel mit den Glühbirnen aus?
Bedeutet [mm] X_k=0, [/mm] dass die k-te Birne nicht ausgefallen ist und [mm] X_k=1, [/mm] dass die k-te Birne ausgefallen ist? Demnach würde der Grundraum [mm] \Omega [/mm] doch nur aus einem Element bestehen, nämlich irgendeiner Birne und erst durch die ZVe [mm] X_k [/mm] wird die k-te Birne modelliert.
Ich ging bisher davon aus, dass man einen Grundraum [mm] \Omega=\{B_1,B_2,...,B_k\} [/mm] hat und dann nur eine ZVe hat, wobei dann z.B. [mm] X(B_k)=1 [/mm] bedeutet, dass die k-te Birne ausgefallen ist.
Nun sagst Du, dass man häufig den Grundraum ignorieren kann, wenn man P(X=x) kennt. Das leuchtet mir mehr oder weniger ein, nur wie soll ich denn die ZVe interpretieren ohne [mm] \Omega [/mm] zu kennen? Ich habe oben 2 Beispiele gemacht, die (hoffentlich) dasselbe Problem modellieren, aber ja total anders arbeiten. Wie soll ich denn da verstehen, wie das z.B. im zentralen Grenzwertsatz mit den [mm] X_1,..,X_k [/mm] gemeint ist?
|
|
|
|
|
Hallo!
> Danke erstmal für deine ausführliche Antwort, die macht
> schonmal einiges klarer, jedoch habe ich noch eine Frage:
> Wie sehen denn die einzelnen [mm]X_k[/mm] bei dem Beispiel mit den
> Glühbirnen aus?
>
> Bedeutet [mm]X_k=0,[/mm] dass die k-te Birne nicht ausgefallen ist
> und [mm]X_k=1,[/mm] dass die k-te Birne ausgefallen ist?
Ja. Denn wir wollen mit der Summe der [mm] X_k [/mm] ja die ausgefallenen Glühbirnen zählen.
> Demnach
> würde der Grundraum [mm]\Omega[/mm] doch nur aus einem Element
> bestehen, nämlich irgendeiner Birne und erst durch die ZVe
> [mm]X_k[/mm] wird die k-te Birne modelliert.
Nein!
Der Grundraum hat erstmal überhaupt nichts mit Anschaulichkeit zu tun! Ganz im Gegenteil: Man ist hier froh, überhaupt nichts mit dem Grundraum [mm] \Omega [/mm] zu tun haben zu müssen. Stellen wir uns mal den Grundraum vor, wenn wir nur eine bernoulli-verteilte ZV [mm] X_1 [/mm] hätten. Dann muss der mindestens aus zwei Elementen bestehen:
[mm] $\Omega [/mm] = [mm] \{A,B\}, \IP(A) [/mm] = 0.99, [mm] \IP(B) [/mm] = 0.01$
[mm] $X_1(A) [/mm] = 0$
[mm] $X_1(B) [/mm] = 1$
Dann ist [mm] $\IP(X_1 [/mm] = 1) = [mm] \IP(B) [/mm] = 0.01$.
Bei obigem Beispiel müssen aber alle 10000 Zufallsvariablen [mm] X_1, [/mm] ..., [mm] X_{10000} [/mm] auf demselbem Wahrscheinlichkeitsraum definiert sein (weil ja am Ende die Summe von allen gebildet wird)! Das heißt, die beiden A's und B's reichen nicht aus, denn die [mm] X_k [/mm] sollen ja auch unabhängig voneinander sein.
D.h. es soll u.a. [mm] $\IP(X_1 [/mm] = 0, [mm] X_2 [/mm] = 1) = [mm] \IP(X_1 [/mm] = [mm] 0)*\IP(X_2 [/mm] = 1)$ sein. Das ist gar nicht mehr so einfach. Solch ein Wahrscheinlichkeitsraum [mm] \Omega [/mm] muss aus mindestens 20000 Elementen bestehen, damit das funktioniert. Deswegen ist man froh, sich nicht über dessen Aussehen und Existenz Gedanken machen zu müssen (die Existenz regelt ein toller Satz).
> Ich ging bisher davon aus, dass man einen Grundraum
> [mm]\Omega=\{B_1,B_2,...,B_k\}[/mm] hat und dann nur eine ZVe hat,
> wobei dann z.B. [mm]X(B_k)=1[/mm] bedeutet, dass die k-te Birne
> ausgefallen ist.
Wie gesagt, Grundraum und Bedeutung der ZV klaffen weit auseinander.
Viele Grüße,
Stefan
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 20:45 Do 17.03.2011 | Autor: | Pille456 |
Hi, Danke nochmal für deine ausführlichen Antworten. Ich denke ich habs jetzt fast komplett verstanden und den Rest werde ich mir versuchen selber bei zu bringen.
Danke!
|
|
|
|