0 Daumen
586 Aufrufe

Aufgabe:

888888.png

Text erkannt:

Betrachten Sie das Minimierungsproblem
minxR3((x321)2+(x12x2)2+(2x1)2)= : minxR3f(x). \min _{x \in \mathbb{R}^{3}}\left(\left(x_{3}^{2}-1\right)^{2}+\left(x_{1}^{2}-x_{2}\right)^{2}+\left(2-x_{1}\right)^{2}\right)=: \min _{x \in \mathbb{R}^{3}} f(x) .

Text erkannt:

c) Untersuchen Sie jeweils, ob es sich bei den Vektoren
d1=[110] und d2=[321] d_{1}=\left[\begin{array}{l} 1 \\ 1 \\ 0 \end{array}\right] \quad \text { und } \quad d_{2}=\left[\begin{array}{c} 3 \\ 2 \\ -1 \end{array}\right]
um valide Abstiegsrichtungen im Punkt
x=[112] x=\left[\begin{array}{l} 1 \\ 1 \\ 2 \end{array}\right]
handelt.
d) Berechnen Sie einen Iterationsschritt der Gradient Descent Methode (Verfahren des steilsten Abstiegs) mit dem Startvektor
x(0)=[242] x^{(0)}=\left[\begin{array}{l} 2 \\ 4 \\ 2 \end{array}\right]
und der optimalen Schrittweite α0 \alpha_{0} , die durch klassische Liniensuche bestimmt wird.

c) Untersuchen sie jeweils ob es sich bei den Vektoren d1 =[1, 1, 0]T  d2 =[3, 2, -1]T

um valide abstiegsrichtugnen im punkt x= [1, 1, 2]


d) Berechnen sie einen iterationsschritt des verfahren des steilsten Abstiegs mit x(0) = [2, 4, 2]T

und der optimalen schrittweite α0 durch klassiche liniensuche.


Problem/Ansatz:
Ich weiß nicht wie ich die c und d machen soll.

Avatar von

1 Antwort

0 Daumen

Beim Gradientenabstiegsverfahren handelt es sich um ein Verfahren, dass in Richtung des steilsten Abstiegs einer Raumkurve ein Minimum sucht. Wenn f(x)R f(x) \in \mathbb{R} mit xR3 x \in \mathbb{R}^3 die Funktion ist, die minimiert werden soll, dann sieht das rekursive Verfahren zum finden des Minimums so aus

(1)x(k+1)=x(k)αkf(x(k)) (1) \quad x^{(k+1)} = x^{(k)} - \alpha_k \nabla f \left( x^{(k)} \right)

mit einer in jedem Iterationsschritt noch zu bestimmenden Schrittweit αk \alpha_k .

In Deinem Fall soll αk \alpha_k wie folgt bestimmt

Sei (2)Φ(αk)=f[xαkf(x(k))] (2) \quad \Phi(\alpha_k) = f \left[ x - \alpha_k \nabla f \left( x^{(k)} \right) \right] dann sucht man das kleinste αk \alpha_k das die Funktion Φ(αk) \Phi(\alpha_k) minimiert.

Das bedeutet, man sucht das Minimum der Nullstellen von ϕ(αk) \phi'(\alpha_k) für die ϕ(αk)>0 \phi''(\alpha_k) > 0 gilt.

Soweit das Allgemeine.

Nun zu den Aufgaben. Zuerst

Fall c

Zuerst muss man den Gradienten an der Stelle x=[112] x=\left[\begin{array}{l} 1 \\ 1 \\ 2 \end{array}\right] finden und überprüfen ob der Gradient ein Vielfaches der Richtungsvektoren di d_i mit i=1,2 i= 1,2 ist.

Zu d

Hier muss aus (2) α0 \alpha_0 bestimmt werden und dann aus (1)  x(1) x^{(1) }

Avatar von 39 k

vielen dank. genau was ich brauchte.

möge Gott über dich wachen mein freund.

Vielleicht noch ein Hinweis:

Die Lösung des Minimierungsproblem ist ja klar. Weil alle Summanden größer gleich Null sind, wird das Minimum genau da angenommen, wo jeder Summand für sich schon Null wird.

D.h. die Lösung ist (24±1) \begin{pmatrix} 2 \\ 4 \\ \pm1 \end{pmatrix}

Jetzt kann man sich fragen ob es ein α \alpha gibt mit

x(1)=(242)αf(x(0))=(24±1) x^{(1)} = \begin{pmatrix} 2 \\ 4 \\ 2 \end{pmatrix} - \alpha \cdot \nabla f\left( x^{(0)} \right) = \begin{pmatrix} 2 \\ 4 \\ \pm1 \end{pmatrix}

Da f(x(0))=(0024) \nabla f\left( x^{(0)} \right) = \begin{pmatrix} 0 \\ 0 \\ 24 \end{pmatrix} gilt, folgt α=124 \alpha = \frac{1}{24} oder α=18 \alpha = \frac{1}{8} sind mögliche Kandidaten für die Schrittweite.

Das sind auch genau die Werte, die bei der formalen Durchführung des Algortihmus herauskommen. Der zusätzliche Wert α=112 \alpha = \frac{1}{12} der aus dem Algortithmus folgt, entspricht nicht einem Minimum der Funktion Φ(α) \Phi(\alpha)

D.h. für dieses Beispiel hat man in der Tat das Minimum mit einem Schritt gefunden. Denn es folgt für beide zulässigen Werte von α \alpha immer, f(x(1))=0 f(x^{(1)}) = 0

Ein anderes Problem?

Stell deine Frage