www.vorhilfe.de
Vorhilfe

Kostenlose Kommunikationsplattform für gegenseitige Hilfestellungen.
Hallo Gast!einloggen | registrieren ]
Startseite · Forum · Wissen · Kurse · Mitglieder · Team · Impressum
Forenbaum
^ Forenbaum
Status Englisch
  Status Grammatik
  Status Lektüre
  Status Korrekturlesen
  Status Übersetzung
  Status Sonstiges (Englisch)

Gezeigt werden alle Foren bis zur Tiefe 2

Navigation
 Startseite...
 Neuerdings beta neu
 Forum...
 vorwissen...
 vorkurse...
 Werkzeuge...
 Nachhilfevermittlung beta...
 Online-Spiele beta
 Suchen
 Verein...
 Impressum
Das Projekt
Server und Internetanbindung werden durch Spenden finanziert.
Organisiert wird das Projekt von unserem Koordinatorenteam.
Hunderte Mitglieder helfen ehrenamtlich in unseren moderierten Foren.
Anbieter der Seite ist der gemeinnützige Verein "Vorhilfe.de e.V.".
Partnerseiten
Weitere Fächer:

Open Source FunktionenplotterFunkyPlot: Kostenloser und quelloffener Funktionenplotter für Linux und andere Betriebssysteme
Forum "Uni-Stochastik" - Gauß-Verteilung
Gauß-Verteilung < Stochastik < Hochschule < Mathe < Vorhilfe
Ansicht: [ geschachtelt ] | ^ Forum "Uni-Stochastik"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien

Gauß-Verteilung: Frage
Status: (Frage) beantwortet Status 
Datum: 21:49 Sa 25.06.2005
Autor: edy

Hallo zusammen,
ich habe folgendes Problem aus dem Reinforcement Leaning.
Gegeben eine Normalverteilung:  N(K*x;sigma)
x, K = Vektor von 4 Elementen
sigma = 0.1 + 1 / (1+exp(eta))

Nun gibt es eine Policy theta, die wiederrum ein Vektor von 5 Elementen ist.
theta = (K, eta)

Aufgabe ist es die Normalverteilung nach der Policy theta abzuleiten.
Die Ableitung nach K für jede seiner Komponenten ist soweit kein Problem.
Aber die Ableitung nach eta kriege ich nicht hin. Erwartungswert und Varianz sind klar. Der offene Parameter x aber macht mir Probleme.
x ist ja ein Vektor von 4 Elementen. Da ich ja nicht danach ableite bleibt er so bestehen.
Das Ergebniss der Ableitung nach eta sollte ein Skalar sein.

Ich würde mich um jeden Tipp freuen ;-) ...

Ich habe diese Frage in keinem Forum auf anderen Internetseiten gestellt.







        
Bezug
Gauß-Verteilung: Antwort?
Status: (Antwort) fertig Status 
Datum: 21:55 So 26.06.2005
Autor: Brigitte

Hallo Eduard!

>  ich habe folgendes Problem aus dem Reinforcement Leaning.
> Gegeben eine Normalverteilung:  N(K*x;sigma)
>  x, K = Vektor von 4 Elementen
>  sigma = 0.1 + 1 / (1+exp(eta))
>  
> Nun gibt es eine Policy theta, die wiederrum ein Vektor von
> 5 Elementen ist.
>  theta = (K, eta)
>  
> Aufgabe ist es die Normalverteilung nach der Policy theta
> abzuleiten.

Nur, damit wir nicht aneinander vorbeireden: Ich vermute, Du meinst damit, die Dichte der Normalverteilung nach theta abzuleiten, richtig?

>  Die Ableitung nach K für jede seiner Komponenten ist
> soweit kein Problem.
> Aber die Ableitung nach eta kriege ich nicht hin.
> Erwartungswert und Varianz sind klar.

Mir ist nicht klar, was Du damit meinst.

> Der offene Parameter
> x aber macht mir Probleme.
>  x ist ja ein Vektor von 4 Elementen. Da ich ja nicht
> danach ableite bleibt er so bestehen.
>  Das Ergebniss der Ableitung nach eta sollte ein Skalar
> sein.

Da x ja nur in Zusammenhang mit K auftaucht, nämlich als Skalarprodukt - so interpretiere ich zumindest Deine Schreibweise - ist mir nicht ganz klar, wo Dein Problem liegt. Am besten schreibst Du mal mit Hilfe des Formeleditors auf, welche Funktion Du ableiten möchtest.
Ansonsten würde ich zunächst die Funktion nach [mm] $\sigma$ [/mm] ableiten (das ist wohl etwas übersichtlicher als direkt nach [mm] $\eta$ [/mm] abzuleiten) und anschließend die innere Ableitung von [mm] $\sigma$ [/mm] nach [mm] $\eta$ [/mm] multiplizieren.

Ich verstehe das, was Du geschrieben hast, nicht als mehrdimensionale Normalverteilung, denn K*x ist ja kein Vektor, sondern ein Skalar, und $sigma$ auch keine Matrix, insofern ist die Dichte eine Funktion von [mm] $\IR$ [/mm] nach [mm] $\IR$, [/mm] sagen wir $f(t)$ (hier solltest Du als Argument nicht x verwenden, da dies ja schon für den o.g. vierdim. Vektor verwendet wird - vielleicht liegt hier das Problem).

Sag bitte Bescheid, wenn ich was falsch verstehe.

Viele Grüße
Brigitte

Bezug
Ansicht: [ geschachtelt ] | ^ Forum "Uni-Stochastik"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien


^ Seitenanfang ^
www.englischraum.de
[ Startseite | Forum | Wissen | Kurse | Mitglieder | Team | Impressum ]