+1 Daumen
7,9k Aufrufe

Ich brauche mal eure Hilfe. A seine eine reelle nxn Matrix und <,>das Standardskalarprodukt auf dem ℝn.

Nun soll ich die von den folgenden jeweils Ableitungen bestimmen

<Ax,x>, <x,Ax> und <x,x>

Wir haben nun erhalten, dass <Ax,x> abgeleitet Ax ergibt, doch ich verstehe leider nicht warum. Kann mir jemand sagen wie man das macht und wie ich generell darauf komme?

<Ax,x> ausgeschrieben bedeutet doch Ax*xT und wenn man das ableitet würde ich auf

AxT+xT*AT=(A+AT)xT kommen. Doch wir haben wie gesagt als Lösung Ax erhalten.

Avatar von

Von den beiden Ausdrücken AxT Ax^T und xTAT x^T A^T ist einer eine Matrix und der andere ein Vektor (sie lassen sich also nicht addieren).

Außerdem ist (xTAT)T=Ax (x^T A^T)^T = A x . Man kann also nicht xTAT=ATxT x^T A^T = A^T x^T schreiben, da auch hier wieder einer der beiden Ausdrücke xTAT x^T A^T und ATxT A^T x^T ein Vektor und der andere eine Matrix ist.

1 Antwort

+1 Daumen

es ist zunächst

(Ax)i=jAi,jxj (Ax)_i = \sum_j A_{i, j} x_j .

Nun berechnet man

Axx=i(Ax)ixi Ax \circ x = \sum_i (Ax)_i x_i

=i,jAi,jxjxi = \sum_{i, j} A_{i, j} x_j x_i .

Dies ergibt nach xk x_k abgeleitet

(xAxx)k=ddxkAxx ( \partial_x Ax \circ x )_k = \frac{d}{d x_k} Ax \circ x

=ddxki,jAi,jxjxi=i,jAi,j(δj,kxi+xjδi,k) = \frac{d}{d x_k} \sum_{i, j} A_{i, j} x_j x_i = \sum_{i, j} A_{i, j} (\delta_{j, k} x_i + x_j \delta_{i, k} )

=iAi,kxi+jAk,jxj=i(Ai,k+Ak,i)xi = \sum_{i} A_{i, k} x_i + \sum_{j} A_{k, j} x_j = \sum_{i} ( A_{i, k} + A_{k, i}) x_i .

An dieser Stelle nehmen wir nun an, dass A A gemäß Ai,k=Ak,i A_{i, k} = A_{k, i} symmetrisch ist. Folglich vereinfacht sich der Ausdruck

(xAxx)k=2iAk,ixi ( \partial_x Ax \circ x )_k = 2 \sum_{i} A_{k, i} x_i .

Insgesamt ist

xAxx=2Ax \partial_x Ax \circ x = 2 A x .

Ohne die zusätzliche Annahme der Symmetrie von A A ist in der Tat

xAxx=(AT+A)x \partial_x Ax \circ x = ( A^T + A ) x .

Mister

Avatar von 8,9 k

Ok danke das hat mir schon mal weitergeholfen. Ich muss vielleicht noch genauer schreiben, dass ich eine erweiterte Lagrangefunktion habe gegeben durch

F(x,λ)=<Ax,x>+λ<x,x>

Und abgeleitet haben wir dann erhalten

Ax-λx=0     (1)

<x,x>=0     (2)

Da verstehe ich allerdings die erste Gleichung nicht. Kann mir das jemand erklären?

Setze für A=I A = I ein, um xx x \circ x zu erhalten, dann ergibt sich auch die erste Gleichung ganz natürlich.

Das verstehe ich leider nicht...

Schade, weil das eigentlich ziemlich interessant ist.

Kannst du es mir vielleicht nochmal irgendwie anders erklären?
Oder mal ein Beispiel zeigen?

Wenn ich für A=I einsetze dann erhalte ich

F(x,λ)=<Ax,x>+λ<x,x>=<Ix,x>+λ<x,x>=<x,x>+λ<x,x>

Aber wenn ich das jetzt nach x ableite wieso erhalte ich dann

Ax-λx=0?

<x,x> abgeleitet müsste doch xT*xT ergeben?

Nein, der Term xx x \circ x entsteht aus Axx Ax \circ x durch A=I A = I .

Ein anderes Problem?

Stell deine Frage