Histogramm < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 10:54 Do 18.09.2014 | Autor: | GeMir |
Aufgabe | Welche Maßzahlen lassen sich aus einem Histogramm (direkt) ablesen? |
Was mir bis jetzt eingefallen ist: Spannweite (Obere Klassengrenze der letzten minus untere Klassengrenze der ersten Klasse), arithmetisches Mittel der Klassen (Summe über Klassenmitten mal Klassenhäufigkeiten), Quantile (p-Quantil: Stelle finden so, dass die Fläche zwischen dem Histogramm und der x-Achse bis da gleich p ist) und damit auch Median und Quartilsabstand.
Was sich dabei noch, insbesondere "direkt" ablesen lässt, wüsste ich sehr gern.
|
|
|
|
Hallo!
wenn es "direkt" heißt, würde ich doch behaupten, es geht darum, direkt aus einer Grafik mit einem Histogramm Werte abzulesen.
und da kann man doch nur Spannweite und Häufigkeiten ablesen.
Alles andere kann man mit etwas Übung ggf. schätzen, es muß aber normalerweise berechnet werden.
Wenn diese berechnete Werte in die Grafik geschrieben werden, kann man die natürlich auch "direkt ablesen". Das zeigt schon, daß es darum nicht geht.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 12:27 Do 18.09.2014 | Autor: | GeMir |
So habe ich es mir auch gedacht. Die Frage kommt aus einer mündlichen Prüfung und deswegen lässt sich nicht wirklich präzisieren.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 13:23 Do 18.09.2014 | Autor: | Herby |
Hallo GeMir,
ich habe deine ursprüngliche Frage [wie besprochen] auf halb-beantwortet umgestellt.
LG
Herby
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 14:18 Do 18.09.2014 | Autor: | luis52 |
> Welche Maßzahlen lassen sich aus einem Histogramm (direkt)
> ablesen?
>
> Was mir bis jetzt eingefallen ist: Spannweite (Obere
> Klassengrenze der letzten minus untere Klassengrenze der
> ersten Klasse),
Die kann man i.a. nicht direkt ablesen, da die (hauefig willkuerlich gewaehlte) Ober- und Untergrenze der Klassen nicht mit dem Maximum und Minimum der Daten uebereinstimmen muss.
> arithmetisches Mittel der Klassen (Summe über Klassenmitten mal Klassenhäufigkeiten),
Interessiert i.a. nicht.
Quantile
> (p-Quantil: Stelle finden so, dass die Fläche zwischen dem
> Histogramm und der x-Achse bis da gleich p ist) und damit
> auch Median und Quartilsabstand.
Okay, ist aber fummelig (Genau wo ist die Flaeche $p$?)
>
> Was sich dabei noch, insbesondere "direkt" ablesen lässt,
> wüsste ich sehr gern.
Deiner Antwort zum Quantil entnehme ich, dass bei euch die Flaeche unter dem Histogramm Eins ist. (Ist nicht selbstverstaendlich.) Dann kann man die Flaechen ueber den Klassen wie bei einem Kreissektorendiagramm als Prozentzahlen (relative Klassenhaeufigkeiten) interpretieren. Auch gibt es Auskunft ueber Lage und Variabilitaet der Daten.
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 15:21 Do 18.09.2014 | Autor: | GeMir |
Ja, es geht dabei um ein Histogramm mit dem Proportionalitätsfaktor $c = 1$.
Das mit Minimum und Maximum habe ich mir auch gedacht, genauso wie mit Quantilen, die man, natürlich nicht direkt "abliest" sondern eigentlich erst ausrechnen muss. Weitere Möglichkeiten, irgendwelche Maßzahlen "direkt abzulesen" habe ich auch nicht gefunden (deswegen ja auch hier gepostet).
Na ja, die Modalklasse (bei äquidistanten Klassen) lässt sich natürlich noch bestimmen.
Der nicht so sehr interessante Klassenmittelwert könnte ja mit dem Mittelwert der (nicht klassierten) Daten übereinstimmen, vorausgesetzt, man hat eine Gleichverteilung auf dem Wertebereich, oder?
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 15:40 Do 18.09.2014 | Autor: | luis52 |
> Weitere
> möglichkeiten, irgendwelche Maßzahlen "direkt abzulesen"
> habe ich auch nicht gefunden (deswegen ja auch hier
> gepostet).
Eine habe ich genannt: Die relative Klassenhaeufigkeit.
>
> Na ja, die Modalklasse (bei äquidistanten Klassen) lässt
> sich natürlich noch bestimmen.
>
> Der nicht so sehr interessante Klassenmittelwert könnte ja
> mit dem Mittelwert der (nicht klassierten) Daten
> übereinstimmen, vorausgesetzt, man hat eine
> Gleichverteilung auf dem Wertebereich, oder?
Leuchtet mir nicht ein. Nimm an, du zeichnest die Histogramme von Koerpergroessen von 20-Jaehrigen, getrennt nach Frauen und Maennern. Eine Klasse ist [170,180]. Was besagt dann die Klassenmitte 175?
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 15:45 Do 18.09.2014 | Autor: | GeMir |
Relative Klassenhäufigkeit lässt sich natürlich ablesen, aber es ist weder ein Lage- noch ein Streuungsmaß.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 16:03 Do 18.09.2014 | Autor: | luis52 |
> Relative Klassenhäufigkeit lässt sich natürlich ablesen,
> aber es ist weder ein Lage- noch ein Streuungsmaß.
Das habe ich auch nicht behauptet.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 08:10 Fr 19.09.2014 | Autor: | GeMir |
Apropos "Klassenmitten interessieren i.a. nicht" habe ich gefunden: "Als weitere graphische Veranschaulichung klassierter Häufigkeitsverteilung wird gelegentlich das Häufigkeitspolygon benutzt. Es besteht aus dem Streckenzug der die Mitten aller oberen Rechteckseiten des Histogramms verbindet" (Bamberg/Baur (2002): Statistik, 12. Auflage, S. 15).
|
|
|
|
|
Naja, deshalb stand da ja auch das i.a..
Andererseits ist das Polygon nur ein Weichzeichner, der "die Kanten des Histogramms glättet".
Damit erweckt man den Eindruck, man könnte aus dem Histogramm ein neues mit sehr viel feinerer Klassenbreite erzeugen. Für ein Histogramm mit sehr vielen Einträgen kann das die Realität ja noch ganz gut widerspiegeln, aber sobald es nur noch wenige sind, geht das nicht mehr gut.
Meiner Meinung nach ist so ein Polygon eher ein Gimmik, mit dem ein Manager seine Powerpoint präsentation aufpeppen will.
Zumindest für meinen Bereich geht es eher darum, welcher Funktion die Häufigkeitsverteilung folgt. Und dann fittet man eben diese Funktion in das Histogramm, dabei bedient man sich je nach Methode auch der Klassenmitten.
Ab da versucht man eben, eine konkrete Funktion, anstatt eines recht unmotivierten Polygons in das Histogramm zu zeichnen.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 11:51 Fr 19.09.2014 | Autor: | luis52 |
>
> Meiner Meinung nach ist so ein Polygon eher ein Gimmik, mit
> dem ein Manager seine Powerpoint präsentation aufpeppen
> will.
Amen!
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 17:05 Sa 20.09.2014 | Autor: | GeMir |
Nun ja, inzwischen habe ich die Mitschrift aus der Vorlesung, in der das Histogramm ausführlich besprochen wurde, gefunden und stelle fest: Klassenmitten werden verwendet um (ungefähr) den Mittelwert für klassierte Daten auszurechnen, wenn die Urliste nicht mehr vorhanden ist.
[mm] $\bar{x}_{Klass.} [/mm] = [mm] \sum_{i=1}^{M}{f(K_i)\cdot\bar{v}_i}$
[/mm]
wobei $M$ für die Anzahl der Klassen, [mm] $f(K_i)$ [/mm] für Klassenhäufigkeit und [mm] $\bar{v}_i [/mm] = [mm] \frac{v_{i-1}+v_i}{2}$ [/mm] für Klassenmitte der Klasse [mm] $K_i$ [/mm] steht.
Ist die Urliste [mm] $x_1,\ldots, x_n$ [/mm] vorhanden, so kann man dazu noch die Streuungszerlegung anschauen:
[mm] $S^2 [/mm] = [mm] \frac{1}{n}\sum_{i=1}^{n}{(x_i-\bar{x})^2} [/mm] = [mm] \sum_{i=1}^{M}{f(K_i)\cdot s^2_i} [/mm] + [mm] \sum_{i=1}^{M}{f(K_i)(\bar{x_i}-\bar {x})^2}$
[/mm]
Mit [mm] $s^2_i [/mm] = [mm] \frac{1}{n(K_i)}\sum_{x_i\in K_i}{(x_i-\bar{x_i})^2}$. [/mm]
[mm] $n(K_i)$ [/mm] steht dabei für die absolute Häufigkeit und [mm] $\bar{x_i}$ [/mm] für den Mittelwert der Klasse [mm] $K_i$. [/mm]
[mm] $\sum_{i=1}^{M}{f(K_i)\cdot s^2_i}$ [/mm] beschreibt die Streuung innerhalb der Klasse und [mm] $\sum_{i=1}^{M}{f(K_i)(\bar{x_i}-\bar {x})^2}$ [/mm] die Streuung zwischen den Klassen.
Der ursprüngliche Datensatz [mm] $x_1,\ldots, x_n$ [/mm] wird bei der Streuung zwischen den Klassen durch Datensatz [mm] $\underbrace{\bar{x}_1,\ldots, \bar{x}_1}_{n(K_1) \text{ Stück}}, \bar{x}_2, \ldots, \bar{x}_2, \ldots, \bar{x}_n, \ldots, \bar{x}_n$ [/mm] ersetzt.
Man befasst sich dabei mit der Frage: Wodurch wird die Streuung erzeugt - durch Streuung innerhalb von Klassen, oder durch Streuung zwischen den Klassen?
|
|
|
|