Forum "Mathe Klassen 8-10" - Normalisierung - Vorhilfe.de - Vorhilfe

Vorhilfe Kostenlose Kommunikationsplattform für gegenseitige Hilfestellungen.
	Hallo Gast! [ einloggen \| registrieren ]
	Startseite · Forum · Wissen · Kurse · Mitglieder · Team · Impressum

Forenbaum

Sonstiges (Englisch)

Gezeigt werden alle Foren bis zur Tiefe 2

Navigation

Startseite...
Neuerdings beta neu
Forum...
vorwissen...
vorkurse...
Werkzeuge...
Nachhilfevermittlung beta...
Online-Spiele beta
Suchen
Verein...
Impressum

Das Projekt

Server und Internetanbindung werden durch Spenden finanziert.

Organisiert wird das Projekt von unserem Koordinatorenteam.

Hunderte Mitglieder helfen ehrenamtlich in unseren moderierten Foren.

Anbieter der Seite ist der gemeinnützige Verein "Vorhilfe.de e.V.".

Partnerseiten

Weitere Fächer:

Vorhilfe.de

FunkyPlot: Kostenloser und quelloffener Funktionenplotter für Linux und andere Betriebssysteme

Forum "Mathe Klassen 8-10" - Normalisierung

Normalisierung < Klassen 8-10 < Schule < Mathe < Vorhilfe

Ansicht:

[ geschachtelt ]

|

Forum "Mathe Klassen 8-10" |

Forenbaum | Materialien

Normalisierung: Frage (beantwortet)

Status:	(Frage) beantwortet
Datum:	18:04 Do 15.07.2004
Autor:	jopeku

Hallo,

ich habe mich in diesem Forum registriert, weil ich
hoffe das ich hier auf kompetente Nutzer treffe die auch
mal eine - wahrscheinlich - etwas dümmliche Frage
beantworten ohne gleich Wein- oder Lachkrämpfe zu
bekommen.

Also hier mein winziges Problem:

Nehmen wir an, ich hätte einige Stichproben vorgenommen
und möchte die daraus gewonnen Werte miteinander vergleichen.

Die Stichproben haben z.B. folgenden Umfang:

768
2457
1534
12378
968

Um die gewonnen Werte miteinander vergleich zu können, möchte
ich die Stichproben "Normalisieren".....

Kann mir jemand, wenn bitte möglich, den Rechenweg hierzu
detailliert erklären?

danke für jede Hilfe

Ich habe diese Frage in keinem weiteren Forum gestellt.

Normalisierung: - Antwortungsversuch

Status:	(Antwort) fertig
Datum:	22:55 Do 15.07.2004
Autor:	baerchen

Hallo Jopeku,

ich weiß nicht, ob ich deine Frage richtig verstehe und lasse sie deshalb unbeantwortet, denn ich habe vom Normalisieren noch nie etwas gehört und auch mein Suchen im Internet half mir dabei nicht weiter.
Jedoch kann ich mir vielleicht dein Problem vorstellen.

Du hast fünf Stichproben genommen, von was auch immer. Du hast die folgenden Werte heraus:

768
2457
1534
12378
968

Um diese Werte besser miteinander vergleichen zu können, kannst du den Durschschnitt ausrechnen in dem du die fünf Werte addierst und die Summe dann durch 5 teilst.

Die fünf einzelnen Werte kannst du nun mit dem Durschschnitt vergleichen und du siehst leicht, welche Stichprobe z.B. stark vom Durschschnitt abweicht.

Ich hoffe, ich konnte dir damit helfen oder du findest jemanden, der wirklich die Lösung kennt.

Liebe Grüße

Normalisierung: - Antwortungsversuch

Status:	(Mitteilung) Reaktion unnötig
Datum:	23:47 Do 15.07.2004
Autor:	Marc

Hallo baerchen!

> ich weiß nicht, ob ich deine Frage richtig verstehe und
> lasse sie deshalb unbeantwortet, denn ich habe vom
> Normalisieren noch nie etwas gehört und auch mein Suchen im
> Internet half mir dabei nicht weiter.
> Jedoch kann ich mir vielleicht dein Problem vorstellen.
>
> Du hast fünf Stichproben genommen, von was auch immer. Du
> hast die folgenden Werte heraus:
>
> 768
>  2457
>  1534
>  12378
>  968

Ich denke, jopeku meinte mit diesen 5 Werten nicht die beobachteten Werte (selbst), sondern 5 verschiedene Stichprobenerhebungen, die erste bestehend aus 768 Stichproben, die zweite aus 2457 Stichproben etc.

Nun kenne ich mich mit dem Thema auch nicht aus, aber magisters Antwort hört sich für mich richtig an, jedenfalls hatte ich auch daran gedacht.

Viele Grüße,
Marc

Normalisierung: - Antwortungsversuch

Status:	(Mitteilung) Reaktion unnötig
Datum:	02:37 Fr 16.07.2004
Autor:	jopeku

Hallo und danke für die Antworten

Ich denke ich muß mich präziesieren:

bei den Stichproben handelte es sich um Texte
der Stichprobenumfang gibt die Anzahl der Worte im Text wieder
ich erhalte natürlich nach meiner Formel verschiedene Werte je Text
z.B. 0,3873
0,04021
0,37387

usw.
Bei den ermittelten Werten ist natürlich die Anzahl der Worte
entscheiden, der die Werte beeinflußt. Ich möchte also, die Werte
so miteinander vergleichen, als wenn die Stichprobe der unterschidelichen
Texte gleich groß wäre.....

oh je, habe ich das was ich will, rüber gebracht????

Also, wie verhält sich Wert 1 zu Wert 2 wenn der Umfangb der Stichprobe
unterschiedlich groß ist???

Ich bin kein Mathematiker, sonder schreibe ein Programm
zur Auswertung von Texten.... nicht kommerziell sondern aus Lust and
der Feude....

danke für jeden der mir geholfen hat

Normalisierung: Antwort

Status:	(Antwort) fertig
Datum:	22:57 Do 15.07.2004
Autor:	magister

hallo

also du hast geschrieben, du hast 5 Stichproben mit folgendem Umfang:

768
2457
1534
12378
968

stichproben werden standardisiert, indem man vom jeweils aktuellen wert der stichprobe den mittelwert der stichprobe subtrahiert und durch die Stichprobenstandarabweichung dividiert.

beispiel

vektor (4,5,6) ........also 3 stichprobenwerte
mittelwert ist 5
standarabweichung ist 2

also sind die normierten werte -0.5 , 0 , 0.5

das machst du mit allen 5 stichproben und dann kannst du die werte miteinander vergleichen

Normalisierung: Antwort

Status:	(Antwort) fertig
Datum:	10:57 Fr 16.07.2004
Autor:	magister

hi jopeku

ich versuche deinen wunsch mal zu deuten:

5 texte, mit je folgender wortanzahl

768
2457
1534
12378
968

<Bei den ermittelten Werten ist natürlich die Anzahl der
<Worte
<entscheiden, der die Werte beeinflußt. Ich möchte also, die Werte
<so miteinander vergleichen, als wenn die Stichprobe der
<unterschidelichen Texte gleich groß wäre.....

<oh je, habe ich das was ich will, rüber gebracht????

<Also, wie verhält sich Wert 1 zu Wert 2 wenn der Umfang der
<Stichprobe unterschiedlich groß ist???

also wenn ich dich richtig verstehe, handelt es sich hier um einen normalen schlußrechnungsvergleich, oder nicht ?dann kannst du zwei werte, egal welcher größe miteinander vergleichen
bsp 2457 : 768 verhält sich so wie 3,2 :1

hilft dir das weiter ??

falls nicht, schreibs und wir überlegen uns was neues..

lg magister

Normalisierung: Mitteilung

Status:	(Mitteilung) Reaktion unnötig
Datum:	12:10 Fr 16.07.2004
Autor:	jopeku

Hallo,

auf was habe ich mich da blos eingelassen??

Doch zuerst danke für die umfangreiche Hilfe.

Es geht bei meinem Problem um statitische Vergleiche.
In der Literatur und auch im Internet wird durch Mathematiker
- der ich nun mal nicht bin - darauf hingewiesen, das unterschidliche
Stichprobenumfänge und die daraus gewonnenen Werte dadurch
vergleichbar gemacht werden können, das man die Werte durch
Transformation "normalisieren" kann.

So gut, so schön.

Ich habe hier einen Link, verstehe aber nur Bahnhof :-)

:-)

http://www.unibw-hamburg.de/WWEB/math/uebe/Intranet/Vorlesungen/Kap-16-Konfidenz.pdf

Mein Programm erzeugt einige hundert Ergebnisse aus den untersuchten Texten. Da alle Texte jedoch unterschiedlich groß sind, sollen die
Ergebnisse der Untersuchungen vergleichbar gemacht werden....

Ich glaube, ich gebe besser auf....

Normalisierung: Antwort

Status:	(Antwort) fertig
Datum:	12:26 Fr 16.07.2004
Autor:	taenzer

Ich versuche es mal mit einem konkreten Beispiel:

Du willst z.B. wissen, in welchem Text die meisten A auftauchen. Nun sind aber die Texte unterschiedlich lang und daher macht der einfache Vergleich der gezählten A aus den verschiedenen Texten keinen Sinn. Soweit richtig?

Wenn Du nun die A-Häufigkeit der verschiedenen Texte vergleichen willst, musst Du die Zahl der gezählten A durch die Gesamtzahl der Buchstaben des jeweiligen Textes teilen. Damit hast Du die A-Häufigkeit normalisiert. (Anmerkung: die gezählten A heissen absolute Häufigkeit, die durch die Gesamtzahl der Buchstaben dividierten A heissen relative Häufigkeit).

Ist das das, was Du meinst?

Gruß

Christian

Normalisierung: Mitteilung

Status:	(Mitteilung) Reaktion unnötig
Datum:	12:49 Fr 16.07.2004
Autor:	jopeku

Hallo,

das mit der relativen Häufigkeit hört sich logisch an.

Die Werte die ich ermittle sind aber Mittelwerte aus diesem Text,
gilt dieses Verfashren dann auch??

Ich denke eher nicht oder??

Normalisierung: Mitteilung

Status:	(Mitteilung) Reaktion unnötig
Datum:	12:58 Fr 16.07.2004
Autor:	taenzer

> Hallo,
>
> das mit der relativen Häufigkeit hört sich logisch an.
>
> Die Werte die ich ermittle sind aber Mittelwerte aus diesem
> Text,
>  gilt dieses Verfashren dann auch??

Was sind denn das für Werte. Mittelwerte von welcher Messung?
Gib mal ein Beispiel an.

> Ich denke eher nicht oder??

Gruß

Christian

Normalisierung: Mitteilung

Status:	(Mitteilung) Reaktion unnötig
Datum:	13:18 Fr 16.07.2004
Autor:	jopeku

Genau genommen handelt es sich um die Entropie des Wortes im Text,
als die durchschnittliche Entropie des Textes, eine Erläuterung findet man hier:

http://www.cl.uni-heidelberg.de/kurs/ws03/statistik/html/page032.html

Ich ermittle für jedes Wort die Entropie und summiere diese auf.
Anschließend dividiere ich das Ergebnis durch die Anzahl der Worte

Normalisierung: Mitteilung

Status:	(Mitteilung) Reaktion unnötig
Datum:	13:44 Fr 16.07.2004
Autor:	taenzer

Eigentlich ist die Entropie schon eine Größe, die man zwische verschiedenen Systemen vergleichen kann. Aber ich mag mich irren.

Aber welche Größe ist der Mittelwert der Entropien aller Wörter in einem System. Welche Aussage hat das?

Normalisierung: Mitteilung

Status:	(Mitteilung) Reaktion unnötig
Datum:	14:00 Fr 16.07.2004
Autor:	jopeku

In der Computerlinguistik kennzeichnet die Entropie den Informationsgehalt einer NachrichtTextes.

Man versucht über verschiedene Methoden, - quantitative Computerlinguistik - Aussagen über verschiedene Texte zu
erhalten.

Normalisierung: Mitteilung

Status:	(Mitteilung) Reaktion unnötig
Datum:	14:16 Fr 16.07.2004
Autor:	taenzer

Dann gibt aber der Mittelwert der Entropie der Wörter nicht den Informationsgehalt des Textes wider, denn die Definition der Entropie ist, wie aus dem Text hervorgeht, vom Logarithmus der Wahrscheinlichkeit abhängig.

Ich glaube, Du hast die Frage im falsche Forum gestellt. Versuche es doch mal im Forum Uni-Stochastik.

Gruß

Christian

Normalisierung: Mitteilung

Status:	(Mitteilung) Reaktion unnötig
Datum:	15:02 Fr 16.07.2004
Autor:	jopeku

ja, ein sehr häufig auftrendes Wort wie z.B. der, die, und es usw.
besitz ein Informationsgehalt von fast 0. Ein Wort wie besipielsweise
"Chrommittelstange" ein sehr viel höeren Informationsgehalt, weil
seine Häufigkeit in einem Text eher gering ist.

Danke für die Unterstützung

Ansicht:

[ geschachtelt ]

|

Forum "Mathe Klassen 8-10" |

Forenbaum | Materialien

www.englischraum.de[ Startseite | Forum | Wissen | Kurse | Mitglieder | Team | Impressum ]