+1 Daumen
633 Aufrufe

irgendwie werden mir die zwei Zeilen leider nicht klar. Scheinbar sind mir einfach zu wenig Rechenregeln für das Ausmultiplizieren und Ableiten von Matrizen bekannt. Vielleicht kann mir ja jemand helfen. Soweit ich richtig verstanden habe, handelt es sich bei allen Variablen um Vektoren der gleichen Länge. Lieben Dank. Ich bin sehr gespannt.

$$F_{HV}(N)=\frac{1}{2} \sum_{i=1}^{N}\left(y(i)-\theta^{T} \varphi(i)\right) \xi(i)^{T} \xi(i)\left(y(i)-\theta^{T} \varphi(i)\right)$$

$$=\frac{1}{2} \sum_{i=1}^{N}  y(i)^{2} \xi(i)^{T} \xi(i)-2y(i) \xi(i)^{T} \xi(i)\theta^{T} \varphi(i)+\theta^{T} \varphi(i)\xi(i)^{T} \xi(i)\theta^{T} \varphi(i) $$

$$\frac{d F_{H V}}{d \theta}  = \frac{1}{2} \sum_{i=1}^{N}   - \varphi(i)\xi(i)^{T} \xi(i)y(i)  +\varphi(i)\xi(i)^{T} \xi(i)\theta$$

*Edit: $$y(i)$$ ist kein Vektor sondern ein skalar.

Avatar von

Und ich habe gerade noch ein Tippfehler von mir gesehen: in der letzten Zeile verschwindet das 1/2.

1 Antwort

+2 Daumen
 
Beste Antwort

Hallo Peter,

Im Prinzip gaht das so. Da steht sowas wie \((a-b) \cdot x \cdot (a-b)\). Wären \(a,\,b\) und \(x\) Skalare, dann könntest Du die Reihenfolge tauschen - es gilt dann das Kommutativgesetz - und man könnte schreiben$$(a-b) \cdot x \cdot (a-b) = (a-b)^2x = a^2x - 2abx + b^2x$$Da stehen aber Vektoren und da gilt das Kommutativgesetz bei der Multiplikation nicht! Es ist $$a \cdot b \ne b \cdot a$$wobei es genauer wäre zu schreiben$$a ^T \cdot b \ne b \cdot a^T$$Sind \(a\) und \(b\) Spaltenvektoren (das wäre üblich!), dann stände links das Skalarprodukt (i.A. eine Zahl) und rechts das dyadische Produkt - also eine Matrix.

Demnach muss man \((a-b) \cdot x \cdot (a-b)\) wie folgt schreiben:$$(a-b) \cdot x \cdot (a-b) = axa - axb - bxa + bxb$$Jetzt schreibst Du aber, dass zumindes das \(a = y(i)\) ein Skalar ist, und den darf man auch bei der Multiplikation mit einem Vektor vertauschen. Daraus folgt dann \(axa = a^2x\) und das steht da ja auch.

Bei den mittleren Termen steht dort immer ein Skalarprodukt, was mit einem anderen Skalarprodukt multipliziert wird:$$- axb - bxa = -y(i) \left( \xi(i)^{T} \xi(i) \right) \left( \theta^{T} \varphi(i)\right) - \left( \theta^{T} \varphi(i)\right)\left( \xi(i)^{T} \xi(i) \right) y(i)$$die Ausdrücke in Klammern sind wieder Skalare, die man wieder vertauschen kann, d.h. da steht zweimal der gleiche Ausdruck und das darf man zusammen fassen. Und da das Assoziativgesetz auch bei der Vektor(Matrix)multiplikation gilt, kann man die Klammern anschließend auch wieder weg lassen.

Der letzte Ausdruck erklärt sich ebenso.

Zu den Ableitungen: Was nicht von \(\Theta\) abhängig ist, fällt raus. Damit bleibt nur der mittlere und der rechte Term übrig. Der rechte Term ist von der Form $$a \cdot \Theta^T \varphi(i) = a \cdot \begin{pmatrix} x_1 &\dots& x_n\end{pmatrix} \cdot \begin{pmatrix} \varphi_1 \\ \vdots \\ \varphi_n\end{pmatrix}$$ \(a\)ist ein Skalar. Wird dies nach \(\Theta\) abgeleitet, so wird daraus $$\to a \cdot \begin{pmatrix} \varphi_1 \\ \vdots \\ \varphi_n\end{pmatrix}$$Also wird daraus: $$2y(i) \xi(i)^{T} \xi(i)\theta^{T} \varphi(i) \to \left( 2y(i) \xi(i)^{T} \xi(i) \right) \cdot \varphi(i)$$ Die Klamer darf man jetzt aber nicht einfach weg lassen, da hinten die Multiplikation zweier Spaltenvektoren steht (nicht transponiert). Und deshalb stellt mandas \(\varphi(i)\) einfach an den Anfang (Kommutativgesetzt Skalar Vektor ist ok) und dann lässt man die Klammer weg.

Den letzten Ausdruck kannst Du jetzt selbst mal versuchen. Falls noch was unklar ist, so frage bitte nach.

Gruß Werner

Avatar von 48 k

Werner, haben vielen Dank. Du hast Absolut recht. Jetzt wo du es erklärt hast, ist es für absolut klar geworden. DANKE!

Gern geschehen.Ich habe die Antwort noch mal erweitert.

Mit deiner Antwort konnte ich die Ableitung des linken und mitleren Term bilden. Deine Ergänzung zu deiner Antwort haben mich dann auch bestätigt. Den rechten Term kann ich leider nicht ableiten.

Ich hätte gesagt, dass hier eine Matrixproduktregel greifen muss. D.h. ich betrachte jeweils ein$$\theta^{T}$$ als konstant während ich das andere ableite. Somit $$\frac{d}{d\theta} \theta^{T}  \varphi(i)\xi(i)^{T}  \xi(i)\theta^{T}  \varphi(i)$$  $$   = \varphi(i) \xi(i)^{T} \xi(i)  \theta^{T} \varphi(i)+ \theta^{T}\varphi(i) \xi(i)^{T} \xi(i)   \varphi(i)$$ $$ = 2\cdot \xi(i)^{T} \xi(i) \cdot  \theta^{T}\varphi(i)\cdot\varphi(i)$$

Ist es eigentlich an eionen Beispiel wie hier egal ob ich von links oder von rechts ableite? Gilt also $$\frac{d}{d\theta}\varphi(i)^{T}\theta=\frac{d}{d\theta}\theta^{T}\varphi(i)=\varphi(i)$$

Hallo Peter, ich melde mich morgen noch mal ... muss jetzt weg!

Gilt also $$\frac{d}{d\theta}\varphi(i)^{T}\theta=\frac{d}{d\theta}\theta^{T}\varphi(i)=\varphi(i)$$

Ja das ist richtig. Schreibe es Dir im Zweifel als Vektoren im Detail auf. Genauso ist $$a^T \cdot b = b^T \cdot a$$ und damit auch $$\frac{d}{d\theta} \varphi(i)^{T}\theta = \frac{d}{d\theta}\theta^T \varphi(i)$$Wenn man es sich vektoriell herleiten möchte, was die Ableitung von \(\theta^{T} \varphi(i)\xi(i)^{T} \xi(i)\theta^{T} \varphi(i)\) ist, so geht man am besten  über die Produktregel. Vorher kann man noch das \(\xi(i)^{T} \xi(i)\) heraus nehmen, was für sich genommen ein Skalar ist, und nicht von \(\theta\) abhängt.

Die Produktregel besagt, dass $$\frac{\partial u \cdot v}{\partial} = u' \cdot v + u \cdot v'$$also ist $$\frac{d}{d\theta} \theta^{T} \varphi(i) \cdot \theta^{T} \varphi(i) \\ \space = \left( \frac{d}{d\theta} \theta^{T} \varphi(i) \right) \cdot \theta^{T} \varphi(i) + \theta^{T} \varphi(i)  \cdot \left(\frac{d}{d\theta} \theta^{T} \varphi(i) \right)$$Diese Ableitung im ersten und zweiten Term ist \(\varphi(i)\)also verbleibt$$= 2 \varphi(i) \theta^T \varphi(i)$$Beim zweiten Term habe ich wieder das Kommutativgesetzt für Skalare angewendet.

Den Term \(\xi(i)^{T} \xi(i)\) solltest Du nun so hinzufügen, dass die Multiplikationen in jeder Reihenfolge ausgeführt werden können.$$= 2\cdot \xi(i)^{T} \xi(i) \cdot  \left( \theta^{T}\varphi(i) \right) \cdot\varphi(i) =2  \varphi(i) \theta^{T}\varphi(i)  \xi(i)^{T} \xi(i)$$.. also immer abwechselnd transponiert und nicht transponiert.

Gruß Werner

Werner du bist der Beste! Hab riesen Dank! Ich würde dir gerne einen Kuchen schicken :)

Ein anderes Problem?

Stell deine Frage

Willkommen bei der Mathelounge! Stell deine Frage einfach und kostenlos

x
Made by a lovely community