www.vorhilfe.de
Vorhilfe

Kostenlose Kommunikationsplattform für gegenseitige Hilfestellungen.
Hallo Gast!einloggen | registrieren ]
Startseite · Forum · Wissen · Kurse · Mitglieder · Team · Impressum
Forenbaum
^ Forenbaum
Status Englisch
  Status Grammatik
  Status Lektüre
  Status Korrekturlesen
  Status Übersetzung
  Status Sonstiges (Englisch)

Gezeigt werden alle Foren bis zur Tiefe 2

Navigation
 Startseite...
 Neuerdings beta neu
 Forum...
 vorwissen...
 vorkurse...
 Werkzeuge...
 Nachhilfevermittlung beta...
 Online-Spiele beta
 Suchen
 Verein...
 Impressum
Das Projekt
Server und Internetanbindung werden durch Spenden finanziert.
Organisiert wird das Projekt von unserem Koordinatorenteam.
Hunderte Mitglieder helfen ehrenamtlich in unseren moderierten Foren.
Anbieter der Seite ist der gemeinnützige Verein "Vorhilfe.de e.V.".
Partnerseiten
Weitere Fächer:

Open Source FunktionenplotterFunkyPlot: Kostenloser und quelloffener Funktionenplotter für Linux und andere Betriebssysteme
Forum "mathematische Statistik" - least abs deviation
least abs deviation < math. Statistik < Stochastik < Hochschule < Mathe < Vorhilfe
Ansicht: [ geschachtelt ] | ^ Forum "mathematische Statistik"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien

least abs deviation: Idee
Status: (Frage) beantwortet Status 
Datum: 13:36 Fr 08.04.2011
Autor: Druss

Hallo,

unzwar möchte ich gern folgendes berechnen:

ich habe einen Datenvektor x vorliegen und möchte gerne auf die Konstante a regressieren. Wie ich das Problmen mit OLS löse ist klar aber wie mit LAD?

Was ist also lösen muss ist:

min [mm] \sum\limits^n_{i=1} |u_i| [/mm] = min [mm] \sum\limits^n_{i=1} |x_i [/mm] - a|

Ich habe leider keine Idee wie ich das mit den Beträgen und der Summe machen soll. Bei Integralen konnten wir einfach die Beträge durch geschicktes umformen auflösen. Aber wie gehe ich hier vor?

Gruesse

        
Bezug
least abs deviation: Umschreiben
Status: (Antwort) fertig Status 
Datum: 16:13 Fr 08.04.2011
Autor: Infinit

Hallo Druss,
an der Summe brauchst Du Dich nicht zu stören und für die Minimierung kannst Du ohne Probleme den Betrag durch das Fehlerquadrat ersetzen. Da eine quadratische Funktion, genauso wie der Betrag immer positiv ist, kannst Du ohne Beschränkung Deiner Lösung auch eine quadratische Funktion minimieren, das ist dann der klassische Ansatz über das Gausssche Fehlerquadrat. Zu minimieren ist also der Ausdruck
[mm] Q(a) = \sum_{i=1}^{n} (x_i - a)^2 [/mm]
Hiervon die erste Ableitung gebildet und Null gesetzt ergibt ein Gleichungssystem
[mm] \bruch{dQ}{da} = 0 = \sum_{i=1}^n 2(x_i-a) \cdot (-1) [/mm]
Das ist nun zu lösen.
Viele Grüße,
Infinit


Bezug
                
Bezug
least abs deviation: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 17:29 Fr 08.04.2011
Autor: Druss

Hallo,

danke für deine Antwort. Aber die Schätzer auf Grundlage der klassischen OLS-Methode haben meines Wissens andere Eigenschaften als die der LAD-Methode.

Spontan einfallen würde mir, dass die Schätzer auf Grundlage der LAD-Methode resistenter gegen Ausreißer sind. Gerade diese Eigenschaft beruht doch auf den Beträgen d.h. ich kann das dann doch nicht einfach ersetzen ansonsten hätte ich doch genau den OLS-Schätzer für a?

Gruesse

Bezug
                        
Bezug
least abs deviation: Antwort
Status: (Antwort) fertig Status 
Datum: 15:07 Mo 11.04.2011
Autor: luis52

Moin,

zeichne mal [mm] $\psi(a)=\sum|x_i-a|$ [/mm] fuer [mm] $x_i=1,2,4$ [/mm] und fuer [mm] $x_i=1,2,4,7$. [/mm] Was faellt dir auf?

vg Luis

Bezug
                                
Bezug
least abs deviation: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 16:19 Di 12.04.2011
Autor: Druss

Hallo!

ich habe mittlerweile einiges raus gefunden:

für eine gerade Anzahl an Beobachtung gibt es keine eindeutige Lösung für [mm] \psi(a) [/mm] sondern gleich eine ganze raus gefunden Kandidaten. Für eine ungerade Anzahl an Beobachtungen gibt es eine eindeutige Lösung.

Ich habe folgende Lösung für das Problem jedoch meinte mein Dozent, dass meine Lösung von der Definition der Signum-Funktion abhängig ist und ich damit keine eindeutige Lösung gefunden habe.

Hier meine Lösung:

oBdA nehme ich an, dass [mm] x=(x_1,...,x_n) [/mm] sortiert ist, sodass [mm] x_1 \le x_2 \le [/mm] ... [mm] \le x_n. [/mm]

um [mm] \psi(a) [/mm] zu minimieren mache ich mir folgendes zunutze. Da

[mm] \frac{\partial}{\partial a}|x-a| \text{ fuer } [/mm] x>a [mm] \rightarrow [/mm] -1
[mm] \frac{\partial}{\partial a}|x-a| \text{ fuer } [/mm] x<a [mm] \rightarrow [/mm] +1

kann [mm] \psi(a) [/mm] wie folgt minimiert werden. Ich kann [mm] \psi(a) [/mm] auch schreiben als

[mm] \sum\limits_{i=1}^n \text{sgn}\left(x_i - b\right) [/mm]

wobei [mm] \text{sgn}(x) [/mm] der Signum-Funktion entspricht welche wie folgt defniert ist:

[mm] \text{sgn}(x) [/mm] = [mm] \begin{cases} -1 & x < 0, \\ 0 & x = 0, \\ 1 & x > 0. \end{cases} [/mm]

Da wir [mm] \psi(a) [/mm] minimieren wollen suchen wir für eine ungerade Anzahl von Beobachtungen ein a welches

[mm] \sum\limits_{i=1}^{k-1} [/mm] 1 = [mm] \sum\limits_{i=k+1}^n [/mm] -1

erfüllt. Wir wählen nun a so, dass die Hälfte unserer Beobachtungen kleiner als a sind d.h. [mm] (x_ia \hspace{1ex}\forall [/mm]  i=k-1,...,n).

Die Lösung welche unser Problem für eine ungerade Anzahl von Beobachtungen minimiert ist somit [mm] \hat{a}=k, [/mm] da [mm] \sum\limits_{i=1}^n \text{sgn}\left(x_i - b\right) [/mm] = 0

Für eine gerade Anzahl folgt:

[mm] \sum\limits_{i=1}^{k} [/mm] 1 = [mm] \sum\limits_{i=k+1}^n [/mm] -1

Wir wählen somit [mm] \hat{a}\in [/mm] [k,k+1] als Lösung.


Ich verfolge zur Zeit noch einen weiteren Lösungsansatz aber komme nicht so recht weiter...

Wenn wir uns das Problem aufmalen (wie du schon angemerkt hast) fällt auf, dass die Abstände für eine Wahl von a größer sind wenn a nicht mittig liegt.

Somit nenne wir die Veränderung (abhängig von der Wahl von a) [mm] \delta [/mm] und schreiben:

[mm] $\sum\limits_{t=1}^T |x_i [/mm] - a - [mm] \delta|$ \\ [/mm]

[mm] $=\sum\limits_{t|x_i>a+\delta}(x_i-a-\delta) [/mm] + [mm] \sum\limits_{t|x_i\le a+\delta}(a+\delta-x_i)$\\ [/mm]

[mm] $=\sum\limits_{t|x_i>a+\delta}(x_i-a) [/mm] - [mm] \sum\limits_{t|x_i>a+\delta}\delta [/mm] + [mm] \sum\limits_{t|x_i\le a+\delta}(a-x_i) [/mm] + [mm] \sum\limits_{t|x_i\le a+\delta}\delta$\\ [/mm]

[mm] $=\sum\limits_{t|x_i>a}(x_i-a) [/mm] - [mm] \sum\limits_{t|x_i>a+\delta}\delta -\sum\limits_{t|a
[mm] $\le \sum\limits_{t|x_i>a}(x_i-a) [/mm] - [mm] \sum\limits_{t|x_i>a+\delta}\delta -\sum\limits_{t|a
[mm] $\le \sum\limits_{t|x_i>a}(x_i-a) [/mm] + [mm] \sum\limits_{t|x_i\le a}(a-x_i) [/mm] + [mm] \sum\limits_{t|x_i\le a+\delta}\delta [/mm] - [mm] \sum\limits_{t|x_i>a+\delta}\delta$ \\ [/mm]

[mm] $\sum\limits_{t=1}^T |x_i [/mm] - a - [mm] \delta| [/mm] - [mm] \sum\limits_{t=1}^T |x_i [/mm] - a | [mm] \le \sum\limits_{t|x_i\le a+\delta}\delta [/mm] - [mm] \sum\limits_{t|x_i>a+\delta}\delta\\$ [/mm]

Nun könnte ich ab dieser Stelle [mm] schreiben:\\ [/mm]

[mm] $\sum\limits_{t=1}^T |x_i [/mm] - a - [mm] \delta| [/mm] - [mm] \sum\limits_{t=1}^T |x_i [/mm] - a | [mm] \le \sum\limits_{t=1}^T\delta$\\ [/mm]

[mm] $\sum\limits_{t=1}^T |x_i [/mm] - a - [mm] \delta| [/mm] - [mm] \sum\limits_{t=1}^T |x_i [/mm] - a | [mm] \le T\cdot\delta$\\ [/mm]

[mm] $\frac{\sum\limits_{t=1}^T |x_i - a - \delta| - \sum\limits_{t=1}^T |x_i - a |}{\delta} \le T$\\ [/mm]

Nun hätte ich auf der linken Seite sowas wie [mm] $\frac{f(x_o+\triangle x) - f(x_o)}{x_0+\triangle x)-x_o}$ [/mm] stehen was fast so aussieht wie eine Ableitung. Da aber doch kein Grenzwert exsistiert kann ich ja nicht einfach [mm] schreiben:\\ [/mm]

[mm] $\lim_{\delta \to 0} \frac{\sum\limits_{t=1}^T |x_i - a - \delta| - \sum\limits_{t=1}^T |x_i - a |}{\delta}$\\ [/mm]

Ab dieser Stelle weiß ich nicht weiter >_<

Vielen Dank


Bezug
                                        
Bezug
least abs deviation: Antwort
Status: (Antwort) fertig Status 
Datum: 17:44 Do 14.04.2011
Autor: luis52

Moin,

betrachte [mm] $S(a)=\sum_{i=1}^n|x_i-a|$, [/mm] wobei du o.E.d.A. annehmen kannst, dass die Zahlen [mm] $x_1,\dots,x_n$ [/mm] aufsteigend sortiert sind.

Es kann Folgendes gesagt werden:

(i) $S(a)_$ ist eine Polygonzug mit Knickstellen bei [mm] $x_1,\dots,x_n$ [/mm] .  

(ii)  Ist $n=2m+1$ eine ungerade Zahl, so ist $S(a)_$ streng monoton fallend in [mm] $(-\infty,x_{m+1}]$ [/mm]  und streng monoton steigend in [mm] $[x_{m+1},+\infty)$. [/mm] Mithin minimiert der Median [mm] $\tilde x=x_{m+1} [/mm] $ die Funktion $S(a)_$ in eindeutiger Weise.

(iii) Ist $n=2m_$ eine gerade Zahl, so ist $S(a)_$ streng monoton fallend in [mm] $(-\infty,x_{m}]$ [/mm] und streng monoton steigend in [mm] $[x_{m+1},+\infty)$. [/mm] Da $S(a)$ im Intervall [mm] $(x_{m},x_{m+1})$ [/mm] konstant ist, minimiert jeder Wert aus diesem Intervall die Funktion, also auch der Median [mm] $\tilde x=(x_{m}+x_{m+1})/2$. [/mm]

vg Luis






Bezug
Ansicht: [ geschachtelt ] | ^ Forum "mathematische Statistik"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien


^ Seitenanfang ^
www.englischraum.de
[ Startseite | Forum | Wissen | Kurse | Mitglieder | Team | Impressum ]