Regressionsmodell < Wahrscheinlichkeit < Stochastik < Oberstufe < Schule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 15:43 Mi 26.08.2015 | Autor: | petrus |
Hallo zusammen
In meinem Statistikkurs wird die Methode der kleinsten Quadrate besprochen. Ausgangspunkt ist das Regressionsmodell:
[mm] y_i [/mm] = [mm] x_i^T\beta [/mm] + [mm] \epsilon_i
[/mm]
(im Lehrbuch auch geschrieben als [mm] y_i [/mm] = [mm] \beta_1 [/mm] + [mm] \beta_2x_{i2} [/mm] + [mm] \ldots [/mm] + [mm] \beta_Kx_{iK} [/mm] + [mm] \epsilon_i [/mm] oder y = [mm] X\beta [/mm] + [mm] \epsilon)
[/mm]
Ich interpretiere das folgerndermassen: Das Regressionsmodell beschreibt den Datenbeschaffungsprozess ("sampling") / die Datengenerierung. Die Bevölkerung wird nur indirekt beschrieben (obwohl die [mm] \beta [/mm] im Lehrbuch als Bevölkerungseigenschaften ("population parameters") bezeichnet werden).
Ist diese Interpretation richtig / gut?
Vielen Dank für Eure Hilfe
Michael
Ich habe diese Frage in keinem Forum auf anderen Internetseiten gestellt.
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 18:22 Mi 26.08.2015 | Autor: | Infinit |
Hallo michael,
willkommen hier im Forum.
Mit der Übersetzung des Begriffs "population" musst Du hier vorsichtig sein. Der hat zwar durchaus was mit einer Bevölkerung zu tun und zwar in diesem Sinne, dass die die Gesamtheit eines Volkes duch die Bevölkerung gebildet wird, hier ist aber die mathematische Bedeutung dieses Wortes gemeint. In der Statistik meint man damit die Grundgesamtheit der Werte, die ein Modell beschreiben bzw. die Untersuchungsgesamtheit an Werten bei der Durchführung von Tests. Hierfür setzt man Parameter ein, dies sind die "population parameters". Diese Parameter werden aus den vorhandenen Daten geschätzt, bei Dir sind dies [mm] \beta [/mm] und [mm] \epsilon [/mm].
Viele Grüße,
Infinit
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 13:34 Sa 05.09.2015 | Autor: | petrus |
Vielen Dank für Deine Antwort.
Ich habe darüber nachgedacht, und wäre froh, wenn Du mir sagen könntest, ob ich Dich richtig verstanden habe.
Du sagst
> In der Statistik meint man damit die Grundgesamtheit der Werte, die ein Modell beschreiben bzw. die Untersuchungsgesamtheit an Werten bei der Durchführung von Tests.
Ich versuch, das z.B. auf dieses Experiment anzuwenden: ich frage zufällige Leute aus meiner Gemeinde nach ihrem Schokoladenkonsum (-> Zufallsvariablen [mm] x_i) [/mm] und ihrem Gewicht (-> Zufallsvariablen [mm] y_i) [/mm] und versuche dann den Zusammenhang mittels OLS zu schätzen. Die Zufälligkeit der Variablen [mm] x_i [/mm] und [mm] y_i [/mm] rührt von der Auswahl der Probanden. Ich benütze ein Auswahlverfahren, das jeden Einwohner mit gleicher Wahrscheinlichkeit auswählt (z.B. mittels fairer Münze und Einwohnerregister).
In diesem Beispiel wäre die "Bevölkerung", wenn ich Dich richtig verstanden haben, alle möglichen Mengenwerte [mm] (\IR_{+}), [/mm] alle möglichen Gewichtswerte [mm] (\IR_{+}) [/mm] und alle möglichen Abweichungswerte [mm] (\IR). [/mm] Die "Bevölkerungsparamter" [mm] (\alpha, \beta) [/mm] charakterisieren eine angenommene Struktur in meinem Experiment: zur Analyse wird angenommen, dass für ein Experiment wie das Beschriebene stets gilt: [mm] y_i [/mm] = [mm] \alpha [/mm] + [mm] \beta x_i [/mm] + [mm] \epsilon_i [/mm] (mit zusätzlichen Anforderungen, wie bspw. Gauss-Markow-Annahmen). Die Parameter beschreiben die Einwohner meiner Gemeinde nur indirekt: würde ich ein anderes Probandenauswahlverfahren einsetzen, wären die Parameter andere (das triviale, unsinnige Verfahren, immer den gleichen Probanden auszuwählen, würde z.B. [mm] \beta [/mm] = 0 bedeuten).
Im Falle einer (grossen) endlichen Anzahl an Untersuchungsgegenständen (wie beispielsweise Einwohnern/Probanden) könnte man (würde ich als Anfänger) wie folgt argumentieren, dass das statistische Modell tatsächlich angebracht sein kann: der Prozess, der den Untersuchungsgegenständen bei ihrer Erstellung (z.B. Produktion oder Zeugung/Heranwachsen/Ausbildung/...) die betrachteten Eigenschaften zuweist, könnte seinerseits durch ein statistisches Modell beschrieben werden. Wenn dieses Modell angebracht ist (was der Forscher/Student/Schüler entscheiden muss) und das Modell mit dem bei der Untersuchung verwendeten Model verträglich ist, wird die Untersuchung relevante Resultate liefern (sofern die Probandenauswahl nur "zufällig genug" ist).
Vielen Dank für Eure Hilfe
Michael
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 17:24 So 06.09.2015 | Autor: | Infinit |
Hallo Michael,
ja, Deine "Bevölkerungsparameter" charakterisieren die Gesamtheit der Bevölkerung mit Hilfe der im Modell gewählten Parameter. Mathematisch betrachtet werden solche Parameter immer bestimmbar sein, z.B. nach der Methode der kleinsten quadratischen Fehlerabweichung, es kann aber natürlich sein, dass eine andere Modellbildung Dir noch besser passende Werte geliefert hätte. Das wirst Du aber natürlich nur rausfinden können, wenn Du mehrere Modelle einmal durchrechnest und ihre Ergebnisse miteinander vergleichst. Was Du aber auf jeden Fall weißt, ist, dass für das von Dir gewählte Modell die Parameterwerte, Die Du berechnest hast, die bestmöglichen sind.
Viele Grüße,
Infinit
|
|
|
|