www.vorhilfe.de
Vorhilfe

Kostenlose Kommunikationsplattform für gegenseitige Hilfestellungen.
Hallo Gast!einloggen | registrieren ]
Startseite · Forum · Wissen · Kurse · Mitglieder · Team · Impressum
Forenbaum
^ Forenbaum
Status Englisch
  Status Grammatik
  Status Lektüre
  Status Korrekturlesen
  Status Übersetzung
  Status Sonstiges (Englisch)

Gezeigt werden alle Foren bis zur Tiefe 2

Navigation
 Startseite...
 Neuerdings beta neu
 Forum...
 vorwissen...
 vorkurse...
 Werkzeuge...
 Nachhilfevermittlung beta...
 Online-Spiele beta
 Suchen
 Verein...
 Impressum
Das Projekt
Server und Internetanbindung werden durch Spenden finanziert.
Organisiert wird das Projekt von unserem Koordinatorenteam.
Hunderte Mitglieder helfen ehrenamtlich in unseren moderierten Foren.
Anbieter der Seite ist der gemeinnützige Verein "Vorhilfe.de e.V.".
Partnerseiten
Weitere Fächer:

Open Source FunktionenplotterFunkyPlot: Kostenloser und quelloffener Funktionenplotter für Linux und andere Betriebssysteme
Forum "Statistik (Anwendungen)" - Korrelation zw. Krank und C°
Korrelation zw. Krank und C° < Statistik (Anwend.) < Stochastik < Hochschule < Mathe < Vorhilfe
Ansicht: [ geschachtelt ] | ^ Forum "Statistik (Anwendungen)"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien

Korrelation zw. Krank und C°: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 16:54 Di 06.01.2015
Autor: Gooly

Hallo,
ich habe mir selbst mal eine Frage gestellt nach dem Zusammenhang zwischen krank (39°-45°) oder gesund (36°-38°) sein und der messbaren Körpertemperatur.
Es gäbe also eigentlich zwei waagerechte 'Regressions'-Geraden: y=0(gesund) oder y=1(krank).

Jetzt wollte ich mal in Excel mir diese Korrelation für krank berechnen.
Ich erstelle mir eine Datentabelle aus Zufallsvariablen in zwei Zeilen:
Zeile 1) C°:     = ZUFALLSBEREICH(39;42)
Zeile 2) Krank:  = 1
und dann die Korrelation:
Feld A3: =KORREL(B1:P1;B2:P2)
Und erhalte eine #Div0-Fehler?

Ich erhalte eine Zahl, eine Korrelation, wenn ich gesund und krank mische - aber das Ergebnis ist ja uninteressant! Ich will doch etwas erfahren, wie ich aus der Körpertemperatur auf den Zustand krank oder gesund schließen kann.

Was mach ich da falsch, wie könnte ich das lösen?
Vielen Dank schon mal und allen ein Gutes neues Jahr"!
Gooly
PS: Ich habe diese Frage in keinem Forum auf anderen Internetseiten gestellt.

        
Bezug
Korrelation zw. Krank und C°: Antwort
Status: (Antwort) fertig Status 
Datum: 20:27 Di 06.01.2015
Autor: hanspeter.schmid

Hallo!

der Korrelationskoeffizient von $X$ und $Y$ ist [mm] $\varrho(X,Y) =\frac{\operatorname{Cov}(X,Y)}{\sigma(X)\sigma(Y)}$, [/mm] wobei [mm] $\sigma(.)$ [/mm] die Standardabweichung ist.

Falls, wie bei Dir, eine der Datenserien die Standardabweichung $0$ hat, dann existiert er nicht. Deshab schreit Excel auch "Division durch 0".

Zu Deinem Vorhaben: Beschreibe mal genauer, was Du willst. Deine Definitionsintervalle für "Gesund" und "Krank" überschneiden sich ja gar nicht, also musst Du auch keine Statistik machen, um Entscheidungen zu treffen.

Gruss,
Hanspeter

Bezug
                
Bezug
Korrelation zw. Krank und C°: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 23:19 Di 06.01.2015
Autor: Gooly

ok, ich formuliere meine Problem-Idee etwas anders.
Frage:
1) Taugt die Körpertemperatur zur Feststellung krank oder gesund?
2) Gibt es eine Temperatur, ab dem ich mit hoher Wahrscheinlichkeit krank bin?
3) Gemessen wird nur wenn ich krank bin. (Geht das?)

a) Wenn die Körpertemperatur als Indikator nicht taugen würde, wäre [mm] \sigma^2 [/mm] groß und die Verteilungskurve wäre eher symmetrisch (Schiefe ~0).

b) Ist die Temperatur eine guter Indikator, sollten [mm] \sigma^2 [/mm] klein sein und die Verteilungskurve rechtsschief also >0

Jetzt habe ich keine Vergleichswerte, die mir sagen [mm] \sigma^2 [/mm] ist zu groß oder klein. Es gäbe nur die die 'Range' 36-45 für krank und gesund. Auch bei der Schiefe könnte ich nicht sagen, was wäre eine aussagekräftige Schiefe und was nicht. :(

Und was ist, wenn ich das gleiche Verfahren auch auf die Menge Nachtschweiß oder Glasigkeit der Augen anwenden möchte - wie auch immer man das misst.

Calli

Bezug
                        
Bezug
Korrelation zw. Krank und C°: Antwort
Status: (Antwort) fertig Status 
Datum: 10:47 Mi 07.01.2015
Autor: hanspeter.schmid


> ok, ich formuliere meine Problem-Idee etwas anders. Frage:
> 1) Taugt die Körpertemperatur zur Feststellung krank oder gesund?
> 2) Gibt es eine Temperatur, ab dem ich mit hoher Wahrscheinlichkeit krank bin?

> 3) Gemessen wird nur wenn ich krank bin. (Geht das?)

Nein, das kann nicht gehen. Wenn Du gar keine Messungen von "Gesund"-Temperaturen hast, kannst Du gar nicht eine Entscheidungsschwelle [mm] $T_k$ [/mm] bestimmen, so dass [mm] $T>T_k$ [/mm] krank und [mm] $T\leq T_k$ [/mm] gesund ist.

Aber vielleicht verstehe ich 3) falsch. Es gibt zwei Schritte:

a) Messung zur Datenerhebung, so dass Du daraus eine Entscheidungsschwelle bestimmen kannst.

b) Messung am einzelnen Patient, mit dem Ziel, eine W'keit "krank" anzugeben.

Kannst Du mir für beide Fälle näher beschreiben, was Du messen würdest?

> Jetzt habe ich keine Vergleichswerte, die mir sagen
> [mm]\sigma^2[/mm] ist zu groß oder klein. Es gäbe nur die die
> 'Range' 36-45 für krank und gesund. Auch bei der Schiefe
> könnte ich nicht sagen, was wäre eine aussagekräftige
> Schiefe und was nicht. :(

Genau. Das kannst Du nicht sagen! Das geht gar nicht ohne gesund-krank-Vergeich.

Gruss,
Hanspeter



Bezug
                                
Bezug
Korrelation zw. Krank und C°: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 12:26 Mi 07.01.2015
Autor: Gooly

Seufz,

1) Ich möchte nicht messen, wenn ich gesund bin (zu faul, zu viel)
2) Könnte ich als Vergleich dann (aus externer Literatur zB) annehmen gesund bedeutet ~36,7° als Vergleichsmittelwert und eine mögliche Gesamt-Temperatur-Range von 36°-45°. Beide wären rechtsschief, also beide keine ideale Verteilung.
Ist dann der []Einstichproben-t-Test  - richtig?

3) Komme ich damit dann zu einer Zahl, die ich mit einer genauso berechneten Zahl eines anderen Messsystems (Glasigkeit der Augen, Nachtschweißmenge) vergleichen kann, so dass ich sagen kann, weil die Zahl der Temperaturmessung die Kleinste (Größte) ist, bevorzuge ich die Temperaturmessung für die Krankbestimmung?

Vielen Dank, Deine Fragen (und dann Google) machen mir selbst immer klarer, was ich will!
Gooly




Bezug
                                        
Bezug
Korrelation zw. Krank und C°: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 15:18 Mi 07.01.2015
Autor: Gooly

Oh je?
Ich habe weiter gegoogelt und experimentiert und mir jetzt ein Excel-Sheet erzeugt, das hätte ich gerne hochgeladen - finde aber nix, um das zu tun :(
Ok, also []hier wäre es.

Es sind nicht mehr Temperaturen (38-42) sondern diese zwei Fälle (Indikatoren):
- uneindeutiger Indikator =  gleichverteilt zwischen 0-100, MW = ~50
- eindeutiger (guter) Indikator = gleichverteilt zw. 75 - 100, MW = ~85

1) Der schlechte Indidikator unterscheidet sich fast nicht vom 'idealen' ohne Information: 0-100, angen.MW=50.

Statt die Werte des 'schlechten' Indikators zu berechnen - mit MW, Summe der Fehler-Quadrate, Anzahl in der Stichprobe - wie müsste ich vorgehen, diese Werte nicht zu berechnen (bzw. aus einer Stichprobe ziehen) sondern zu setzen. Beim angen.MW=50 ist das kein Problem, aber wie soll ich die Summe der Fehler-Quadtrate und die Anzahl annehmen?

2) Wenn ich jetzt berechne
- S = WURZEL( Quadratsumme()/(Anzahl-1) ) und
- T = WURZEL(Anzahl)*(MW-50)/S

sehe ich, anscheinend gilt:
je größer S und je kleiner T desto schlechter der Indikator
ergo der Indikator ist schlechter um so größer x=Absolut(S/T) ist und umgekehrt wähle den Indikator mit dem kleinsten x=Absolut(S/T)?

Habe ich da einen Denkfehler oder gilt das?
Oder muss ich überhaupt einen anderes Test-Verfahren anwenden?
Vielen Dank,
Calli



Bezug
                                                
Bezug
Korrelation zw. Krank und C°: Antwort
Status: (Antwort) fertig Status 
Datum: 20:29 Mi 07.01.2015
Autor: hanspeter.schmid

Du machst entweder einen groben Denkfehler, oder Du beschreibst nicht alles.

Beschreibe mir erst einmal, auf welche Weise die zwei Indikatoren in der Praxis verwendet werden.

Zum Beispiel: ein Pfleger geht zum Patienten, bestimmt dann beide Indikatoren genau einmal, hat dann zwei Zahlen im Bereich 0-100, und muss dann entscheiden "krank: ja/nein?"

Gruss,
Hanspeter

Bezug
                                                        
Bezug
Korrelation zw. Krank und C°: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 21:09 Mi 07.01.2015
Autor: Gooly


>  
> Zum Beispiel: ein Pfleger geht zum Patienten, bestimmt dann
> beide Indikatoren genau einmal, hat dann zwei Zahlen im
> Bereich 0-100, und muss dann entscheiden "krank: ja/nein?"
>  

Nein - vorher! Bevor der Pfleger messen und melden darf krank oder nicht!
Ich will die Indikatoren (noch) nicht anwenden, sondern erst einmal herausfinden, welcher von denen ist denn der beste!

Das hat mich immer am T-Test gestört, dem man ja ein Intervall vorgeben muss! Was aber wäre, wenn die Dinge so heterogen sind, dass man, um zu brauchbaren Ergebnissen zu kommen, das Intervall immer wieder verändert? Dann könnte man nichts mehr ausschließen..

Also, wenn ich zwei, drei,.. Messmöglichkeiten habe (Fieber, Schweiß, Augen,...), dann suche ich jetzt die Methode von diesem Möglichkeiten, die Beste zu bestimmen. Nicht absolut, sonder (nur) die Beste aus diesen drei!

Ich habe inzwischen ergoogelt, dass bei der Normalverteilung [mm] 3*\sigma [/mm] 99,7% der 'Range' ist oder bei der Temperatur mit einer 'Range' 36°-42° ergäbe [mm] 3*\sigma [/mm] 18. (Allerdings ist es schief?)
Ist jemand krank, hat er Fieber mit 39°-42° hier wäre - [mm] \pi*Daumen, [/mm] angenommen -   [mm] 3*\sigma [/mm] = 9.

Das zeigt erstens (hoffe ich) dass die Temperatur ein signifikanter Indikator ist (weil kleiner als alle mögliche Temperaturen mit 18) und ich hoffe auch, dass dieser Wert hilft, die unterschiedlichen Messmöglichkeiten zu werten: welche ist die eindeutigste!
Angenommen
'Grundgesamtheit':  [mm] 3*\sigma [/mm]  = 18
Fieber:  [mm] 3*\sigma [/mm] = 9
Schweiß: [mm] 3*\sigma [/mm]  = 12 (Hausnummer)
Glasigkeit:  [mm] 3*\sigma [/mm]  = 15 (Hausnummer)
Dann wäre Fieber die beste Methode aus diesen 3 Methoden den Zustand krank zu bestimmen - oder?

Das sind nicht die üblichen Statistik-Aufgaben, die man findet und ist auch nicht die Art, nach der man den T-Test einsetzt.

Daher brauchte ich auch eine Zeitlang das zu klären und daher auch meine Frage - geht das oder trügen die Ergebnisse? Es scheint doch zu funktionieren?

Gruß, Calli
PS: Vielen Dank für die Geduld!

Bezug
                                                                
Bezug
Korrelation zw. Krank und C°: Antwort
Status: (Antwort) fertig Status 
Datum: 07:46 Do 08.01.2015
Autor: hanspeter.schmid


> >  

> > Zum Beispiel: ein Pfleger geht zum Patienten, bestimmt dann
> > beide Indikatoren genau einmal, hat dann zwei Zahlen im
> > Bereich 0-100, und muss dann entscheiden "krank: ja/nein?"
>  >  
> Nein - vorher! Bevor der Pfleger messen und melden darf
> krank oder nicht!
>  Ich will die Indikatoren (noch) nicht anwenden, sondern
> erst einmal herausfinden, welcher von denen ist denn der
> beste!

Du missverstehst mich: Du sagst immer "welcher Indikator ist
der beste?" Aber Du beantwortest hartnäckig meine Frage nicht,
die darauf hinzielt, zu beantworten: welcher Indikator ist der
beste WOFÜR?

Nachdem Du einen auswählst, WOFÜR soll der dann verwendet
werden? Wird er so verwendet werden:
"ein Pfleger geht zum Patienten, bestimmt dann nur einen
Indikator genau einmal, hat dann eine einzige Zahl im
Bereich a-b, und muss dann entscheiden "krank: ja/nein" ?"
  

> Ich habe inzwischen ergoogelt, dass bei der
> Normalverteilung [mm]3*\sigma[/mm] 99,7% der 'Range' ist oder bei
> der Temperatur mit einer 'Range' 36°-42° ergäbe [mm]3*\sigma[/mm]
> 18. (Allerdings ist es schief?)

Eine Temperatur im 'Range' 36°-42° ist ganz sicher nicht normalverteilt,
also kannst Du alle solchen aus der Normalverteilung abgeleiteten
Wahrscheinlichkeiten, T-Tests, etc., sofort wewerfen.

>  Ist jemand krank, hat er Fieber mit 39°-42° hier wäre -
> [mm]\pi*Daumen,[/mm] angenommen -   [mm]3*\sigma[/mm] = 9.
>  
> Das zeigt erstens (hoffe ich) dass die Temperatur ein
> signifikanter Indikator ist (weil kleiner als alle
> mögliche Temperaturen mit 18) und ich hoffe auch, dass
> dieser Wert hilft, die unterschiedlichen Messmöglichkeiten
> zu werten: welche ist die eindeutigste!
>  Angenommen
>  'Grundgesamtheit':  [mm]3*\sigma[/mm]  = 18
>  Fieber:  [mm]3*\sigma[/mm] = 9
>  Schweiß: [mm]3*\sigma[/mm]  = 12 (Hausnummer)
>  Glasigkeit:  [mm]3*\sigma[/mm]  = 15 (Hausnummer)
>  Dann wäre Fieber die beste Methode aus diesen 3 Methoden
> den Zustand krank zu bestimmen - oder?

Nein, das wäre ein Fehlschluss! Du kannst nicht nur den Fall
"krank" anschauen. Du musst die ZWEI Fälle gesund und krank
anschauen, und dann wäre jener Indikator der beste, bei welchem
sich die Zufalsverteilungen am wenigsten überschneiden.

Das Stichwort hier ist Klassifizierung bzw. Klassifikator.

Siehe z.B. S.6 von []http://cvpr.uni-muenster.de/teaching/ws06/mustererkennungWS06/script/ME05.pdf für ein graphisches Beispiel von zwei Wahrscheinlichkeitsverteilungen in zwei Fällen, und wie man dann die Entscheidungsgrenze bestimmt.

Gruss,
Hanspeter

Gruss,
Hanspeter

Bezug
                                                                        
Bezug
Korrelation zw. Krank und C°: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 09:35 Do 08.01.2015
Autor: Gooly


>  >  Ich will die Indikatoren (noch) nicht anwenden, sondern
> > erst einmal herausfinden, welcher von denen ist denn der
> > beste!
>  
> Du missverstehst mich: Du sagst immer "welcher Indikator
> ist
>  der beste?" Aber Du beantwortest hartnäckig meine Frage
> nicht,
>  die darauf hinzielt, zu beantworten: welcher Indikator ist
> der
>  beste WOFÜR?
>  
> Nachdem Du einen auswählst, WOFÜR soll der dann verwendet
> werden? Wird er so verwendet werden:
> "ein Pfleger geht zum Patienten, bestimmt dann nur einen
>  Indikator genau einmal, hat dann eine einzige Zahl im
> Bereich a-b, und muss dann entscheiden "krank: ja/nein" ?"
>

Mein Gedanke war/ist ich suche unter verschiedenen Möglichkeiten, die Beste aus, mit der ein Pfleger dann den Zustand krank von unterscheiden kann.

> > Ich habe inzwischen ergoogelt, dass bei der
> > Normalverteilung [mm]3*\sigma[/mm] 99,7% der 'Range' ist oder bei
> > der Temperatur mit einer 'Range' 36°-42° ergäbe [mm]3*\sigma[/mm]
> > 18. (Allerdings ist es schief?)
>  
> Eine Temperatur im 'Range' 36°-42° ist ganz sicher nicht
> normalverteilt,
>  also kannst Du alle solchen aus der Normalverteilung
> abgeleiteten
> Wahrscheinlichkeiten, T-Tests, etc., sofort wewerfen.
>  

OK! Schade. Kennst Du einen Beweis, ein Beispiel, der zeigt, dass und wie die Anwendung der Normalverteilung(en) auf nicht normalverteilte Stichproben oder Gesamtheiten zu falschen Ergebnissen führt?

> >  Ist jemand krank, hat er Fieber mit 39°-42° hier wäre -

> > [mm]\pi*Daumen,[/mm] angenommen -   [mm]3*\sigma[/mm] = 9.
>  >  
> > Das zeigt erstens (hoffe ich) dass die Temperatur ein
> > signifikanter Indikator ist (weil kleiner als alle
> > mögliche Temperaturen mit 18) und ich hoffe auch, dass
> > dieser Wert hilft, die unterschiedlichen Messmöglichkeiten
> > zu werten: welche ist die eindeutigste!
>  >  Angenommen
>  >  'Grundgesamtheit':  [mm]3*\sigma[/mm]  = 18
>  >  Fieber:  [mm]3*\sigma[/mm] = 9
>  >  Schweiß: [mm]3*\sigma[/mm]  = 12 (Hausnummer)
>  >  Glasigkeit:  [mm]3*\sigma[/mm]  = 15 (Hausnummer)
>  >  Dann wäre Fieber die beste Methode aus diesen 3
> Methoden
> > den Zustand krank zu bestimmen - oder?
>  
> Nein, das wäre ein Fehlschluss! Du kannst nicht nur den
> Fall
>  "krank" anschauen. Du musst die ZWEI Fälle gesund und
> krank
> anschauen, und dann wäre jener Indikator der beste, bei
> welchem
>  sich die Zufalsverteilungen am wenigsten überschneiden.
>  
> Das Stichwort hier ist Klassifizierung bzw. Klassifikator.
>  
> Siehe z.B. S.6 von
> []http://cvpr.uni-muenster.de/teaching/ws06/mustererkennungWS06/script/ME05.pdf
> für ein graphisches Beispiel von zwei
> Wahrscheinlichkeitsverteilungen in zwei Fällen, und wie
> man dann die Entscheidungsgrenze bestimmt.
>  

OK, vielen Dank!
Aber eigentlich will ich die Indikator-Messergebnisse ja nur mit denen  einer anderen Vergleichen auf Basis immer derselben (angenommenen) Grundgesamtheit mit einen angenommenen [mm] \mu [/mm] und einem [mm] \sigma [/mm] = 'Range'/3.

Ist das nicht ähnlich einem Beispiel aus der Prozentrechnung:
1 Sack Kartoffeln ist 50% voll einer mit Reis zu 70% also ziehe ich den Reissack vor ohne auf weitere Informationen angewiesen zu sein?

Aber ich schau mir den Bayes-Klassifikator heute an und uU. stelle ich neue Fragen.

Ganz herzlichen Dank für Deinen Link und Deine Geduld, Du hast mir sehr geholfen!
Calli


> Gruss,
>  Hanspeter
>  
> Gruss,
>  Hanspeter


Bezug
                                                                                
Bezug
Korrelation zw. Krank und C°: Antwort
Status: (Antwort) fertig Status 
Datum: 10:16 Do 08.01.2015
Autor: hanspeter.schmid


> OK! Schade. Kennst Du einen Beweis, ein Beispiel, der
> zeigt, dass und wie die Anwendung der Normalverteilung(en)
> auf nicht normalverteilte Stichproben oder Gesamtheiten zu
> falschen Ergebnissen führt?

Wie wärs mit: Gleichverteilung 39-42 Grad. Standardabweichung [mm] $\sigma=\sqrt{\frac1{12}(42-39)^2}=0.866$. [/mm] Dann ist [mm] $2\sigma=1.732$, [/mm] also der Bereich [mm] Mittelwert$\pm2\sigma$ [/mm] geht von [mm] $38.77\ldots42.23$ [/mm] Grad.

Annahme Normalverteilung: [mm] $4.55\,\%$ [/mm] aller Werte liegen ausserhalb des Bereichs [mm]38.77\ldots42.23[/mm] Grad.

Wirklichkeit: nichts liegt ausserhalb des Bereichs [mm] $38.77\ldots42.23$ [/mm] Grad, wir haben ja nur Werte im Bereich 39-42 Grad.

Fehlerfaktor: [mm] $\infty$. [/mm]

> OK, vielen Dank!
>  Aber eigentlich will ich die Indikator-Messergebnisse ja
> nur mit denen  einer anderen Vergleichen auf Basis immer
> derselben (angenommenen) Grundgesamtheit mit einen
> angenommenen [mm]\mu[/mm] und einem [mm]\sigma[/mm] = 'Range'/3.
>  
> Ist das nicht ähnlich einem Beispiel aus der
> Prozentrechnung:
>  1 Sack Kartoffeln ist 50% voll einer mit Reis zu 70% also
> ziehe ich den Reissack vor ohne auf weitere Informationen
> angewiesen zu sein?

Nein, ist es nicht, weil hier schaust Du ein relatives Mass an (50%, 70%), während die Standardabweichung ein absolutes Mass ist. Heisst: ein voller Kartoffelsack enthalte 250kg Kartoffeln. Ein voller Reissack 100kg Reis. Nimmst Du immer noch den Reis?

Gruss,
Hanspeter

Bezug
                                        
Bezug
Korrelation zw. Krank und C°: Antwort
Status: (Antwort) fertig Status 
Datum: 20:30 Mi 07.01.2015
Autor: hanspeter.schmid

Wir machen zuerst Deine andere Frage, dann wird diese wahrscheinlich auch klar, OK?

Bezug
Ansicht: [ geschachtelt ] | ^ Forum "Statistik (Anwendungen)"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien


^ Seitenanfang ^
www.englischraum.de
[ Startseite | Forum | Wissen | Kurse | Mitglieder | Team | Impressum ]