Gauß-Verteilung < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 21:49 Sa 25.06.2005 | Autor: | edy |
Hallo zusammen,
ich habe folgendes Problem aus dem Reinforcement Leaning.
Gegeben eine Normalverteilung: N(K*x;sigma)
x, K = Vektor von 4 Elementen
sigma = 0.1 + 1 / (1+exp(eta))
Nun gibt es eine Policy theta, die wiederrum ein Vektor von 5 Elementen ist.
theta = (K, eta)
Aufgabe ist es die Normalverteilung nach der Policy theta abzuleiten.
Die Ableitung nach K für jede seiner Komponenten ist soweit kein Problem.
Aber die Ableitung nach eta kriege ich nicht hin. Erwartungswert und Varianz sind klar. Der offene Parameter x aber macht mir Probleme.
x ist ja ein Vektor von 4 Elementen. Da ich ja nicht danach ableite bleibt er so bestehen.
Das Ergebniss der Ableitung nach eta sollte ein Skalar sein.
Ich würde mich um jeden Tipp freuen ...
Ich habe diese Frage in keinem Forum auf anderen Internetseiten gestellt.
|
|
|
|
Hallo Eduard!
> ich habe folgendes Problem aus dem Reinforcement Leaning.
> Gegeben eine Normalverteilung: N(K*x;sigma)
> x, K = Vektor von 4 Elementen
> sigma = 0.1 + 1 / (1+exp(eta))
>
> Nun gibt es eine Policy theta, die wiederrum ein Vektor von
> 5 Elementen ist.
> theta = (K, eta)
>
> Aufgabe ist es die Normalverteilung nach der Policy theta
> abzuleiten.
Nur, damit wir nicht aneinander vorbeireden: Ich vermute, Du meinst damit, die Dichte der Normalverteilung nach theta abzuleiten, richtig?
> Die Ableitung nach K für jede seiner Komponenten ist
> soweit kein Problem.
> Aber die Ableitung nach eta kriege ich nicht hin.
> Erwartungswert und Varianz sind klar.
Mir ist nicht klar, was Du damit meinst.
> Der offene Parameter
> x aber macht mir Probleme.
> x ist ja ein Vektor von 4 Elementen. Da ich ja nicht
> danach ableite bleibt er so bestehen.
> Das Ergebniss der Ableitung nach eta sollte ein Skalar
> sein.
Da x ja nur in Zusammenhang mit K auftaucht, nämlich als Skalarprodukt - so interpretiere ich zumindest Deine Schreibweise - ist mir nicht ganz klar, wo Dein Problem liegt. Am besten schreibst Du mal mit Hilfe des Formeleditors auf, welche Funktion Du ableiten möchtest.
Ansonsten würde ich zunächst die Funktion nach [mm] $\sigma$ [/mm] ableiten (das ist wohl etwas übersichtlicher als direkt nach [mm] $\eta$ [/mm] abzuleiten) und anschließend die innere Ableitung von [mm] $\sigma$ [/mm] nach [mm] $\eta$ [/mm] multiplizieren.
Ich verstehe das, was Du geschrieben hast, nicht als mehrdimensionale Normalverteilung, denn K*x ist ja kein Vektor, sondern ein Skalar, und $sigma$ auch keine Matrix, insofern ist die Dichte eine Funktion von [mm] $\IR$ [/mm] nach [mm] $\IR$, [/mm] sagen wir $f(t)$ (hier solltest Du als Argument nicht x verwenden, da dies ja schon für den o.g. vierdim. Vektor verwendet wird - vielleicht liegt hier das Problem).
Sag bitte Bescheid, wenn ich was falsch verstehe.
Viele Grüße
Brigitte
|
|
|
|