Statistiksoftware R, Ausgabe < Statistik (Anwend.) < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 17:38 Di 02.02.2010 | Autor: | Marcel08 |
Hallo Matheraum!
Mit diesem Beitrag würde ich gerne etwas über die Herkunft, bzw. Bedeutung diverser Einträge einer R- Ausgabe lernen.
[Dateianhang nicht öffentlich]
Es geht mir darum herauszufinden, wie man die Werte der R- Ausgabe ermittelt und was genau sie zu bedeuten haben.
1.) In der letzten Spalte "Pr(>|t|)" der Tabelle stehen zwei Zahlenwerte.
1.1) Was genau bedeuten diese beiden Werte?
1.2) Wie kann man sie unter Zuhilfenahme der gegebenen Werte ermitteln?
Meine Vermutung:
Da in der Benennung der Spalte ein |t| steht, vermute ich eine Art Konfidenzintervall. Möglicherweise einen Wert aus der t-Statistik, der sowohl für den negativen als auch für den positiven Bereich gilt.
Der Punkt, bzw. der Stern neben den Zahlenwerten deuten wohl auf das Signifikanzniveau des Intervalls hin, welches man in der Zeile darunter ablesen kann.
2.) In der letzten Zeile der R- Ausgabe steht der p- Wert, die sogenannte Irrtumswahrscheinlichkeit.
2.1) Wie ermittelt man rechnerisch diesen Wert?
2.2) Was genau sagt mir dieser Wert?
Meine Vermutung:
Dieser Wert kommt möglicherweise aus der bereits oben angesprochenen Spalte "Pr(>|t|)". Unklar ist mir nur, nach welchen Kriterien man sich für den einen oder den anderen Wert entscheidet. Ich würde sagen, dass dieser Wert mir sagt, zu welcher Wahrscheinlichkeit das errechnete Intervall doch nicht zutrifft.
3.) Die Zeile der Signifikanzniveaus: Drei Sterne bedeuten ein Niveau von 0, 2 Sterne bedeuten ein Niveau von 0.001, ..., ein Leerzeichen soll wohl ein Niveau von 0.1 bedeuten.
3.1) Was bedeutet dann die 1 ganz am Ende (eine Wahrscheinlichkeit von 100%?), bzw. welches Zeichen repräsentiert ein Niveau von 1?
Die Herkunft und Ermittlung aller anderen Werte in dieser R- Ausgabe sind soweit bekannt. Über eine baldige Hilfe würde ich mich freue.
Gruß, Marcel
Dateianhänge: Anhang Nr. 1 (Typ: jpg) [nicht öffentlich]
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 18:03 Di 02.02.2010 | Autor: | luis52 |
Moin Marcel
> Die Herkunft und Ermittlung aller anderen Werte in dieser
> R- Ausgabe sind soweit bekannt.
Es wird einfacher, wenn du erklaeren wuerdest, was du ueber
die bekannten Werte weisst. (Insbesondere was hier ueberhaupt gemacht wurde.)
vg Luis
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 18:17 Di 02.02.2010 | Autor: | Marcel08 |
Hallo Luis!
In der Aufgabe sollen die Parameter einer linearen Einfachregression gemäß [mm] y_{i}=\beta_{0}+\beta_{1}x_{i}+u_{i} [/mm] mit der Kleinst- Quadrate- Methode berechnet werden. Dabei gibt es eine erklärende Variable x und eine zu erklärende Variable y mit
[mm] x=\vektor{1 \\ 2 \\ 3 \\ 4 \\5 } [/mm] und [mm] y=\vektor{4 \\ 4 \\ 6 \\ 8 \\ 8}
[/mm]
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 19:00 Di 02.02.2010 | Autor: | luis52 |
Hier noch einmal der Originaloutput.
[Dateianhang nicht öffentlich]
Du kannst ihn dir klarmachen, wenn du hier, Seite 37ff, anschaust. Der Wert [mm] \fbox{1} [/mm] (t value) dient zur Ueberprufung von [mm] H$_0:\beta_2=0$ [/mm] und heisst dort auf Seite 39:
[mm] $\frac{\hat\beta_2-\beta_2}{\hat\sigma_{\hat \beta_2}}$
[/mm]
Diese Pruefgroesse ist hier t(3)-verteilt, und du lehnst H$_0$ ab, wenn der t value hinreichend klein oder gross ist. Was das heisst, besagt der p-Wert [mm] \fbox{3} [/mm] (in der Quelle auf Seite 42 beschrieben). Hier ist es [mm] $2P(t(3)\ge5.196)=0.0138$ [/mm] (probier's in R aus: 2*(1-pt(5.196,3))). Demnach wuerdest du beim Signifikanzniveau 5% ablehnen, nicht jedoch bei 1%.
Die Signifikanznotation '***' ,'**' usw. zeigt, bei welchen Signifikanzniveau du ablehnen kannst. Z.B. '**': Bei 0.01, nicht aber bei 0.001, z.B. '.': Bei 0.1, nicht aber bei 0.05 usw.
Die Bedeutung von [mm] \fbox{2} [/mm] wird ab Seite 46 in der Quelle beschrieben. In dem Kommentar B. 1-19 wird beschrieben, warum [mm] $27=5.196^2$ [/mm] gilt und du denselben p-Wert [mm] \fbox{3} [/mm] erhaeltst.
vg Luis
Dateianhänge: Anhang Nr. 1 (Typ: jpg) [nicht öffentlich]
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 20:50 Di 02.02.2010 | Autor: | Marcel08 |
> Hier noch einmal der Originaloutput.
>
> [Dateianhang nicht öffentlich]
Kann man denn den p-Wert, bzw. die rechte Spalte der Tabelle "per Hand" berechnen, also ohne Verwendung einer speziellen Software? Könnte man beispielsweise mit einem Integral die graue Fläche auf der Seite 54 der Quelle berechnen?
Außerdem würde ich noch gern wissen, wofür das "Pr" im Spaltennamen der Tabelle steht. Vielen Dank schon mal für deine Antwort.
> Du kannst ihn dir klarmachen, wenn du
> hier,
> Seite 37ff, anschaust. Der Wert [mm]\fbox{1}[/mm] (t value) dient
> zur Ueberprufung von H[mm]_0:\beta_2=0[/mm] und heisst dort auf
> Seite 39:
>
> [mm]\frac{\hat\beta_2-\beta_2}{\hat\sigma_{\hat \beta_2}}[/mm]
>
> Diese Pruefgroesse ist hier t(3)-verteilt, und du lehnst
> H[mm]_0[/mm] ab, wenn der t value hinreichend klein oder gross ist.
> Was das heisst, besagt der p-Wert [mm]\fbox{3}[/mm] (in der Quelle
> auf Seite 42 beschrieben). Hier ist es
> [mm]2P(t(3)\ge5.196)=0.0138[/mm] (probier's in R aus:
> 2*(1-pt(5.196,3))). Demnach wuerdest du beim
> Signifikanzniveau 5% ablehnen, nicht jedoch bei 1%.
>
> Die Signifikanznotation '***' ,'**' usw. zeigt, bei welchen
> Signifikanzniveau du ablehnen kannst. Z.B. '**': Bei 0.01,
> nicht aber bei 0.001, z.B. '.': Bei 0.1, nicht aber bei
> 0.05 usw.
>
> Die Bedeutung von [mm]\fbox{2}[/mm] wird ab Seite 46 in der Quelle
> beschrieben. In dem Kommentar B. 1-19 wird beschrieben,
> warum [mm]27=5.196^2[/mm] gilt und du denselben p-Wert [mm]\fbox{3}[/mm]
> erhaeltst.
>
> vg Luis
>
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 21:05 Di 02.02.2010 | Autor: | luis52 |
> Kann man denn den p-Wert, bzw. die rechte Spalte der
> Tabelle "per Hand" berechnen, also ohne Verwendung einer
> speziellen Software? Könnte man beispielsweise mit einem
> Integral die graue Fläche auf der Seite 54 der Quelle
> berechnen?
Nicht per Hand, da das Integral der t(3)-Verteilungsdichte [mm] $f_3$ [/mm] im allgemeinen nicht elementar ausgerechnet werden kann. Mit Hilfe von Tabellen der Verteilung kann man aber manchmal interpolieren.
>
>
> Außerdem würde ich noch gern wissen, wofür das "Pr" im
> Spaltennamen der Tabelle steht. Vielen Dank schon mal für
> deine Antwort.
Pr(>|t|) ist ein Symbol beispielsweise fuer [mm] $P(|t(3)|\ge 5.196)=1-\int_{-5.196}^{+5.196}f_3(t)\,dt=0.0138$.
[/mm]
vg Luis
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 21:26 Di 02.02.2010 | Autor: | Marcel08 |
Danke schön.
|
|
|
|