Ableitung nach einer Matrix < Matrizen < Lineare Algebra < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 12:03 Mo 08.06.2009 | Autor: | Woltan |
Hallo zusammen,
ich habe ein Problem bezüglich der Ableitung eines Skalaren nach einer Matrix, wobei ich mir gar nicht sicher bin, ob es sowas überhaupt gibt, jedoch funktioniert der Algorithmus, also kann ich nicht so weit von der Lösung entfernt sein, oder anders gesagt, es muss zumindest eine geben^^.
Hier mein Problem:
Ich habe folgendes Gütefunktional:
$I = [mm] \vec{y}^T\vec{y} [/mm] - [mm] \vec{y}^T\Psi\vec{\theta} [/mm] - [mm] \vec{\theta}^T\Psi\vec{\theta} [/mm] + [mm] \vec{\theta}^T\Psi^T\Psi\vec{\theta}$
[/mm]
Wenn ich diesen Ausdruck nach
[mm] $\frac{dI}{d\vec{\theta}} [/mm] = [mm] \vec{0}^T$ [/mm]
ableite und null setze und nach [mm] $\vec{\theta}$ [/mm] umforme kommt das raus:
[mm] $\vec{\theta} [/mm] = [mm] \left(\Psi^T\Psi\right)^{-1}\Psi^T\vec{y}$
[/mm]
Soweit sollte alles richtig sein. Was da oben passiert ist ein Least Squares Verfahren, wobei [mm] $\Psi$ [/mm] eine Matrix ist.
Was ich jetzt machen möchte:
Ich will, dass von nun an [mm] $\vec{y}$ [/mm] und [mm] $\vec{\theta}$ [/mm] auch Matrizen werden. Jedoch komme ich dann, wenn es um die Ableitung geht in die Bredullie, da das Ableiten nach einer Matrix mir nicht bekannt ist. Jedoch kommt bei meinen Berechnungen aus der Formel
[mm] $\Theta [/mm] = [mm] \left(\Psi^T\Psi\right)^{-1}\Psi^TY$
[/mm]
die richtigen Parameter heraus.
Kann mir jemand zeigen, wie man auf letzte Gleichung herleiten kann und warum sie scheinbar gültig ist?
Jeder Kommentar, Link, Anmerkung etc. ist auch willkommen!!
Danke schonmal dafür im Vorraus
cherio Woltan
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 10:47 Mo 22.06.2009 | Autor: | zetamy |
Hallo Woltan,
wenn ich dich recht verstehe, geht es dir nur um die Ableitung einer Matrix-wertigen Funktion? Dann hast du kein Problem, denn der Raum der [mm] $m\times [/mm] n$-Matrizen ist isomorph zum Raum [mm] $\IR^{m\cdot n}$.
[/mm]
Für deine Art "Matrix-Funktion" $F: [mm] M(m,n)\rightarrow [/mm] M(p,q)$ ist das Differential ein 4-Tensor, falls dir das etwas sagt, das heißt mit [mm] $X\in [/mm] M(m,n)$:
[mm] $\frac{\partial F}{\partial X} [/mm] = [mm] \begin{bmatrix} \frac{\partial F}{\partial X_{1,1}} & \cdots & \frac{\partial F}{\partial X_{m,1}} \\ \vdots & & \vdots \\ \frac{\partial F}{\partial X_{1,n}} & \cdots & \frac{\partial F}{\partial X_{m,n}} \end{bmatrix}$
[/mm]
wobei jedes [mm] $\frac{\partial F}{\partial X_{i,j}} [/mm] = [mm] \begin{bmatrix} \frac{\partial F_{1,1}}{\partial X_{i,j}} & \cdots & \frac{\partial F_{1,q}}{\partial X_{i,j}}\\ \vdots & \ddots & \vdots\\ \frac{\partial F_{p,1}}{\partial X_{i,j}} & \cdots & \frac{\partial F_{p,q}}{\partial X_{i,j}}\\ \end{bmatrix}$ [/mm] eine [mm] $p\times [/mm] q$-Matrix ist.
Ich hoffe, das kann dir weiterhelfen.
Gruß, zetamy
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 17:26 Di 23.06.2009 | Autor: | Woltan |
Hi zetamy,
vielen Dank für deine Antwort. Ich habe derweil die Lösung zu meinem Problem gefunden. Das wichtige für mich war, dass meine Ableitung eine skalare Größe wird, und das kann ich erreichen indem ich die Spur meiner Matrix ableite. Dafür gibt es auch schöne Ableitungsvorschriften und wenn man die Einhält komme ich genau auf meine Gleichung die ich haben wollte. Genau diese Tensoren waren es, die ich nicht haben wollte, und die bei einer Ableitung unweigerlich entstehen, wäre da nicht die Spur^^. Was es genau mit dieser Spur auf sich hat, frage ich jedoch in einem anderen Thread den ich jetzt erstellen werde.
cherio Woltan
|
|
|
|