unterschiedliche Stichproben < Statistik (Anwend.) < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) überfällig | Datum: | 21:03 Mo 21.07.2014 | Autor: | murmel |
Aufgabe | Hallo ihr lieben Helfer,
ich habe ein Verständnisproblem bezüglich der Auswertung von Stichprobenumfängen unterschiedlicher Anzahl. Vorweg: ich bin in Statistik nicht gut und bitte daher um etwas Nachsicht, wenn ich nicht auf Anhieb eure Erklärungsversuche verstehe. Also Folgendes:
Ich habe zwei Stichproben [mm] n_1 = 37 [/mm] und [mm] n_2 = 25 [/mm], beide Stichproben bilden je eine Teilmenge der Grundgesamtheit [mm] N = 62 [/mm] (62 Schüler).
Ich möchte insgesamt drei Eigenschaften untersuchen -allgemein [mm] X_{ij},{}{}i = 1,2,3[/mm]. Dabei sind
[mm] X_{1j} = richtige \quad Antworten [/mm]
[mm] X_{2j} = falsche \quad Antworten [/mm]
[mm] X_{3j} = keine \quad Antworten [/mm] des j-ten Schülers.
Diese drei Eigenschaften oder Ereignisse(?) möchte ich zum Einen an der Grundgesamtheit [mm]N = 62[/mm] untersuchen und zum Anderen möchte ich zwischen [mm]n_1,n_2[/mm] vergleichen. |
Der Stichprobenumfang (Grundgesamtheit [mm]N = n_1 + n_2[/mm] ist nicht besonders groß. Für mich ist es durchaus sinnvoll N in separate Stichproben aufzutrennen, da es sich dabei um verschiedene Gruppen handelt.
Ich könnte ja nun die relative Häufigkeit deskriptiv ermitteln:
[mm]h_N \left(X_{1j}\right) = \frac{\summe_{j=1}^{N}X_{1j}}{N}[/mm]
Daraus die entsprechend anteilig "richtige Antworten" prozentual ermitteln, ist, denke ich sinnvoll.
Allerdings wird es schwierig, wenn ich nun
[mm]h_{n_1} \left(X_{1j}\right) = \frac{\summe_{j=1}^{n_1}X_{1j}}{n_1}[/mm] mit [mm]h_{n_2} \left(X_{1j}\right) = \frac{\summe_{j=1}^{n_2}X_{1j}}{n_2}[/mm]
vergleichen möchte. Muss ich nun eine Stichprobe gewichten, da [mm] n_1[/mm] ja wesentlich größer ist, oder würde durch das Gewichten von [mm]n_2[/mm] die Vergleichbarkeit ad absurdum geführt?
Also in etwa so, g ist der Gewichtungsfaktor:
[mm]h_{n_2} \left(X_{1j}\right) = \frac{\summe_{j=1}^{n_2}X_{1j}}{n_2} \cdot g; g = \frac{n_1}{n_2}[/mm]
Ist das sinnvoll oder ist das Blödsinn? Es gibt verschiedene Tests, mit denen ich mich schon seit Tagen befasst habe. Wenn beispielsweise die Standardabweichungen zweier Stichproben un/gleich sind, oder wenn diese unabhängig oder abhängig gezogen wurden, müssen t-Test oder Fischer-Test, Welch-Test etc. durchgeführt werden.
Es sind insgesamt vier Datensätze aus zwei verschiedenen Schulen (jeder Schule können je zwei Datensätze zugeordnet werden), aus denen dann die Datenerhebung durchgeführt wurde.
Meine Argumentation wäre für diese Gewichtung, wenn dadurch für den Stichprobenumfang von 37 mehr Schüler mehr richtige Antworten geben als die Schüler mit einem Stichprobenumfang von 25, würde das doch das Ergebnis natürlich zu Gunsten von [mm]n_1[/mm] beeinflussen.
Das würde aber auch bedeuten, dass weniger Schüler aus [mm]n_2[/mm] eine genauso gute oder höhere prozentuale Anteilnahme erhalten könnten als Schüler mit richtigen Aussagen aus [mm]n_1[/mm]. Ich hasse Statistik... .
Vielen Dank für eure Tipps und Hilfe.
Murmel
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 18:59 Mi 23.07.2014 | Autor: | meili |
Hallo Murmel,
> Hallo ihr lieben Helfer,
>
> ich habe ein Verständnisproblem bezüglich der Auswertung
> von Stichprobenumfängen unterschiedlicher Anzahl. Vorweg:
> ich bin in Statistik nicht gut und bitte daher um etwas
> Nachsicht, wenn ich nicht auf Anhieb eure
> Erklärungsversuche verstehe. Also Folgendes:
>
> Ich habe zwei Stichproben [mm]n_1 = 37[/mm] und [mm]n_2 = 25 [/mm], beide
> Stichproben bilden je eine Teilmenge der Grundgesamtheit [mm]N = 62 [/mm]
> (62 Schüler).
>
> Ich möchte insgesamt drei Eigenschaften untersuchen
> -allgemein [mm]X_{ij},{}{}i = 1,2,3[/mm]. Dabei sind
>
> [mm]X_{1j} = richtige \quad Antworten[/mm]
>
> [mm]X_{2j} = falsche \quad Antworten[/mm]
>
> [mm]X_{3j} = keine \quad Antworten[/mm] des j-ten Schülers.
>
> Diese drei Eigenschaften oder Ereignisse(?) möchte ich zum
> Einen an der Grundgesamtheit [mm]N = 62[/mm] untersuchen und zum
> Anderen möchte ich zwischen [mm]n_1,n_2[/mm] vergleichen.
> Der Stichprobenumfang (Grundgesamtheit [mm]N = n_1 + n_2[/mm] ist
> nicht besonders groß. Für mich ist es durchaus sinnvoll N
> in separate Stichproben aufzutrennen, da es sich dabei um
> verschiedene Gruppen handelt.
Was mir jetzt noch fehlt: Wurde nur eine Frage gestellt, die richtig, falsch
oder gar nicht beantwortet werden konnte, oder willst du die Antworten
zu mehreren Fragen (wenn ja wie viele, und stehen sie in einem
inhaltlichen Zusammenhang) auswerten?
>
> Ich könnte ja nun die relative Häufigkeit deskriptiv
> ermitteln:
>
> [mm]h_N \left(X_{1j}\right) = \frac{\summe_{j=1}^{N}X_{1j}}{N}[/mm]
>
> Daraus die entsprechend anteilig "richtige Antworten"
> prozentual ermitteln, ist, denke ich sinnvoll.
Relative Häufigkeit ist noch recht sinnvoll zu bestimmen. Damit hast du auch
das Problem unterschiedlicher Größe von [mm] $n_1$ [/mm] und [mm] $n_2$ [/mm] erschlagen.
Von allen anderen statistischen Tricks und Kniffs würde ich dir abraten.
Wichtiger ist, dir darüber klar zu werden, was du untersuchen, beweisen,
wissen (oder vielleicht auch prognostizieren) willst mit deinen Stichproben.
Nur wenn du Hypothesen hast, die du stützen oder widerlegen willst,
sind statistische Tests sinnvoll, aber wahrscheinlich sind die Stichproben
zu klein für sinnvolle Aussagen.
>
> Allerdings wird es schwierig, wenn ich nun
>
> [mm]h_{n_1} \left(X_{1j}\right) = \frac{\summe_{j=1}^{n_1}X_{1j}}{n_1}[/mm]
> mit [mm]h_{n_2} \left(X_{1j}\right) = \frac{\summe_{j=1}^{n_2}X_{1j}}{n_2}[/mm]
>
> vergleichen möchte. Muss ich nun eine Stichprobe
> gewichten, da [mm]n_1[/mm] ja wesentlich größer ist, oder würde
> durch das Gewichten von [mm]n_2[/mm] die Vergleichbarkeit ad
> absurdum geführt?
>
> Also in etwa so, g ist der Gewichtungsfaktor:
>
> [mm]h_{n_2} \left(X_{1j}\right) = \frac{\summe_{j=1}^{n_2}X_{1j}}{n_2} \cdot g; g = \frac{n_1}{n_2}[/mm]
>
> Ist das sinnvoll oder ist das Blödsinn? Es gibt
> verschiedene Tests, mit denen ich mich schon seit Tagen
> befasst habe. Wenn beispielsweise die Standardabweichungen
> zweier Stichproben un/gleich sind, oder wenn diese
> unabhängig oder abhängig gezogen wurden, müssen t-Test
> oder Fischer-Test, Welch-Test etc. durchgeführt werden.
>
> Es sind insgesamt vier Datensätze aus zwei verschiedenen
> Schulen (jeder Schule können je zwei Datensätze
> zugeordnet werden), aus denen dann die Datenerhebung
> durchgeführt wurde.
>
> Meine Argumentation wäre für diese Gewichtung, wenn
> dadurch für den Stichprobenumfang von 37 mehr Schüler
> mehr richtige Antworten geben als die Schüler mit einem
> Stichprobenumfang von 25, würde das doch das Ergebnis
> natürlich zu Gunsten von [mm]n_1[/mm] beeinflussen.
>
> Das würde aber auch bedeuten, dass weniger Schüler aus
> [mm]n_2[/mm] eine genauso gute oder höhere prozentuale Anteilnahme
> erhalten könnten als Schüler mit richtigen Aussagen aus
> [mm]n_1[/mm]. Ich hasse Statistik... .
>
> Vielen Dank für eure Tipps und Hilfe.
> Murmel
Ich lass mal die Frage nur teilweise beantwortet. Vielleicht hat ja noch jemand
die ultimativ erhellende Antwort.
Gruß
meili
|
|
|
|
|
Status: |
(Frage) überfällig | Datum: | 17:41 Fr 25.07.2014 | Autor: | murmel |
@meili: Danke für deine Tipps. Ich habe eine (unnötige) Studie für ein (unnötiges) Seminar durchzuführen, für dessen Aufwand sich die ganze Arbeit nicht lohnt -unangemessenes LP/ Aufwands-Verhältnis, ein Freund benannte dies mit dem Stichwort 'Wohlfühldidaktik'.
Es existieren 2 Fragebögen, einer hat 10 Fragen (Fachwissen) und der andere hat lediglich 5 Fragen (Beurteilen).
Ich muss mir noch überlegen wie genau ich die 10 Fragen mit den Fragen des Beurteilungsbogens vergleichen möchte -welche Items ich da noch ersinnen muss- (beide Bögen sollen zum Schluss korreliert werden), ich möchte (ich muss) herausfinden, ob ein Zusammenhang zwischen durch Schüler erworbenem Fachwissen und ihrer Urteilsfindung besteht(?)
Gruß
murmel
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 18:20 So 27.07.2014 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 21:20 Mi 23.07.2014 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|