+1 Daumen
6,6k Aufrufe

Ich brauche mal eure Hilfe. A seine eine reelle nxn Matrix und <,>das Standardskalarprodukt auf dem ℝn.

Nun soll ich die von den folgenden jeweils Ableitungen bestimmen

<Ax,x>, <x,Ax> und <x,x>

Wir haben nun erhalten, dass <Ax,x> abgeleitet Ax ergibt, doch ich verstehe leider nicht warum. Kann mir jemand sagen wie man das macht und wie ich generell darauf komme?

<Ax,x> ausgeschrieben bedeutet doch Ax*xT und wenn man das ableitet würde ich auf

AxT+xT*AT=(A+AT)xT kommen. Doch wir haben wie gesagt als Lösung Ax erhalten.

Avatar von

Von den beiden Ausdrücken \( Ax^T \) und \( x^T A^T \) ist einer eine Matrix und der andere ein Vektor (sie lassen sich also nicht addieren).

Außerdem ist \( (x^T A^T)^T = A x \). Man kann also nicht \( x^T A^T = A^T x^T \) schreiben, da auch hier wieder einer der beiden Ausdrücke \( x^T A^T \) und \( A^T x^T \) ein Vektor und der andere eine Matrix ist.

1 Antwort

+1 Daumen

es ist zunächst

\( (Ax)_i = \sum_j A_{i, j} x_j \).

Nun berechnet man

\( Ax \circ x  = \sum_i (Ax)_i x_i \)

\( = \sum_{i, j} A_{i, j} x_j x_i \).

Dies ergibt nach \( x_k \) abgeleitet

\( ( \partial_x Ax \circ x )_k = \frac{d}{d x_k} Ax \circ x \)

\( = \frac{d}{d x_k} \sum_{i, j} A_{i, j} x_j x_i = \sum_{i, j} A_{i, j} (\delta_{j, k} x_i + x_j \delta_{i, k} ) \)

\( = \sum_{i} A_{i, k} x_i + \sum_{j} A_{k, j} x_j =  \sum_{i} ( A_{i, k} + A_{k, i}) x_i \).

An dieser Stelle nehmen wir nun an, dass \( A \) gemäß \( A_{i, k} = A_{k, i} \) symmetrisch ist. Folglich vereinfacht sich der Ausdruck

\( ( \partial_x Ax \circ x )_k = 2 \sum_{i} A_{k, i} x_i \).

Insgesamt ist

\( \partial_x Ax \circ x = 2 A x \).

Ohne die zusätzliche Annahme der Symmetrie von \( A \) ist in der Tat

\( \partial_x Ax \circ x = ( A^T + A ) x \).

Mister

Avatar von 8,9 k

Ok danke das hat mir schon mal weitergeholfen. Ich muss vielleicht noch genauer schreiben, dass ich eine erweiterte Lagrangefunktion habe gegeben durch

F(x,λ)=<Ax,x>+λ<x,x>

Und abgeleitet haben wir dann erhalten

Ax-λx=0     (1)

<x,x>=0     (2)

Da verstehe ich allerdings die erste Gleichung nicht. Kann mir das jemand erklären?

Setze für \( A = I \) ein, um \( x \circ x \) zu erhalten, dann ergibt sich auch die erste Gleichung ganz natürlich.

Das verstehe ich leider nicht...

Schade, weil das eigentlich ziemlich interessant ist.

Kannst du es mir vielleicht nochmal irgendwie anders erklären?
Oder mal ein Beispiel zeigen?

Wenn ich für A=I einsetze dann erhalte ich

F(x,λ)=<Ax,x>+λ<x,x>=<Ix,x>+λ<x,x>=<x,x>+λ<x,x>

Aber wenn ich das jetzt nach x ableite wieso erhalte ich dann

Ax-λx=0?

<x,x> abgeleitet müsste doch xT*xT ergeben?

Nein, der Term \( x \circ x \) entsteht aus \( Ax \circ x \) durch \( A = I \).

Ein anderes Problem?

Stell deine Frage

Willkommen bei der Mathelounge! Stell deine Frage einfach und kostenlos

x
Made by a lovely community