Wieso funktioniert Lagrange? < mehrere Veränderl. < reell < Analysis < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 15:23 So 19.01.2014 | Autor: | Pille456 |
Hio!
Ich beschäftige mich momentan mit der Lagrange-Funktion. Die Anwendung bzw. den Umgang mit dem Formalismus habe ich soweit eigentlich verstanden. Leider verstehe ich aber nicht, wieso der Formalismus funktioniert!
Sei $f$ die zu optimierende Funktion und $g = c$ eine Nebenbedingung, dann gilt im Optimum von $f$, welches die Nebenbedingung $g$ einhält:
$ [mm] \nabla [/mm] f = [mm] -\lambda \nabla [/mm] g$
Gibt es dafür eine anschauliche Erklärung? (Formaler Beweis muss nicht sein)
Der Wikipedia-Eintrag zum Lagrange-Multiplikator versucht anhand von Tangentialbewegungen (http://de.wikipedia.org/wiki/Lagrange-Multiplikator#Beschreibung) zu erklären wieso die obrige Gleichung gelten muss, aber da ist mir der Übergang zu den Ableitungeb nicht klar.
|
|
|
|
Moin,
Wir haben eine beliebige (konkave) Funktion [mm]f:\IR^2\to\IR[/mm]. Du kannst dir diese als umgedrehte 3d-Parabel vorstellen, etwa:
[Dateianhang nicht öffentlich]
Nun wissen wir, dass der Gradient [mm] $\nabla [/mm] f$ von [mm]f[/mm] in einem Punkt immer in die Richtung (als Vektor) des höchsten Anstiegs zeigt (hier blau). Er steht also senkrecht auf den Höhenlinien (rot)
[Dateianhang nicht öffentlich]
Wenn du auf einer Höhenlinie stehst und die Spitze der Funktion erreichen möchtest, so ist der kürzeste Wege zur Spitze in Richtung des Gradientens [mm] $\nabla [/mm] f$.
Wir können sagen, dass die Punkte der Höhenlinie zum Level $t$ in der Menge
[mm] $H_t:=\{x\in\IR^2\;|\; f(x)=t\}$
[/mm]
und der Gradient in den Punkten steht senkrecht auf diesen.
Nebenbedingung
Nun soll auch noch zusätzlich die Nebenbedingung
$g(x)=c$
erfüllt sein. Das kann eine Ebene sein.
[Dateianhang nicht öffentlich]
Wir dürfen nun den höchsten Punkt in unserer Zielfunktion suchen, sodass wir jedoch auch noch gleichzeitig auf der Ebene bleiben. Unser Suchraum ist somit die Schnittkante beider Objekte (die Schnittkante zwischen der Ebene (als Nebenbedingung) und der Zielfunktion (als Hügel) ).
Wenn man jetzt gedanklich diese Schnittkante von links nach rechts entlang läuft, so durchläuft man eben verschiedene Höhenlinien der Zielfunktion. Stell dir die Schnittkante einfach als Bergpfad vor.
Geht man dem Bergpfad (Schnittkante) entlang, und ist der Anstieg auf dem Weg größer als der der Höhenlinie, so gehen wir weiter.
Ist der Anstieg jedoch kleiner als die der Höhenlinie, so sind sind wir zu weit gegangen. Die Intuition sagt, sobald der Bergpfad eine Höhenlinie nur berührt, sind wir im Optimum (höchste Punkt auf der Schnittkante).
Falls der Bergpfad eine Höhenlinie schneidet, so stimmen die Tangenten (der Höhenlinie und dem Bergpfad) nicht überein und wir können noch etwas an Höhe gewinnen. (Projiziere einfach nur den Gradienten entlang der Schnittkante auf den Gradienten der Zielfunktion. Solange beide nicht orthogonal auf einander stehen, gibt es einen höheren Punkt.)
Im Optimum ist die Normale einer Höhenlinie (Gradient auf dieser) parallel zum Gradienten der Schnittkante. Vermutlich sind beide unterschiedlich skaliert. Es gilt also
[mm] $\lambda \nabla g=\nabla [/mm] f$
Eine notwendige Bedingung für das Optimum ist demnach
[mm] $\nabla [/mm] f- [mm] \lambda \nabla [/mm] g=0$.
Wir haben für das Optimum in $x$:
- [mm] $\nabla [/mm] f- [mm] \lambda \nabla [/mm] g=0$ nach dem Gedanken mit dem Bergpfad
- $g(x)=c$, da dies unseren Bergpfad beschreibt.
Jetzt betrachten wir eben die Funktion
[mm] $\mathcal{L}(x_1,x_2,\lambda)=f(x_1,x_2)+\lambda (g(x_1,x_2)-c)$
[/mm]
Nach dem üblichen Weg setzt man doch die partiellen Ableitung = 0. Doch damit erhalten wir genau die Bedingungen, die wir vorher hergeleitet haben.
Suche nun im folgendem Bild den Punkt, indem der Gradient der Schnittkante in die gleiche Richtung zeigt, wie der Gradient der eingezeichneten Höhenlinien. Das ist das Optimum:
[Dateianhang nicht öffentlich]
Im letzten Bild (Draufsicht) dürfen wir uns nur auf der schwarzen Geraden bwegen (unsere Nebenbedingung). Angenommen wir befinden uns auf der zweiten Höhenlinie von innen. Dann können wir doch einfach entlang der schwarzen Geraden in die richtige Richtung weiter laufen (sind noch im zulässigen Bereich) und erhalten höhere Funktionswerte.
Das geht jedoch nicht mehr, sobald die Grade eine Höhenlinie berührt . Und zwei Sachen berühren sich, sobald die Tangenten parallel verlaufen und beide einen gemeinsamen Punkt haben.
Dateianhänge: Anhang Nr. 1 (Typ: png) [nicht öffentlich] Anhang Nr. 2 (Typ: png) [nicht öffentlich] Anhang Nr. 3 (Typ: png) [nicht öffentlich] Anhang Nr. 4 (Typ: png) [nicht öffentlich]
|
|
|
|