Normalengleichung lösen in Lineare Algebra nach ||Ax-b||

Question

Normalengleichung lösen in Lineare Algebra nach ||Ax-b||

Hallo Community,

ich habe Probleme mit dem Verständnis dieses Themas. Leider finde ich auch im Netz keine großartigen Erklärungen die mich in meinem Fall weiterbringen. Kann mir da jemand helfen die Zusammenhänge zu verstehen und mir das Thema etwas näher erläutern. Falls möglich Ansätze zu dieser Aufgabe wären super mit Erklärungen :)

Aufgabe:

Es sei $A=\left(\begin{array}{ccc}{i-1} & {1+i} & {i} \\ {3 i-1} & {0} & {1} \\ {0} & {1} & {1-i} \\ {2} & {i} & {2 i}\end{array}\right) \in \mathbb{C}^{4 \times 3}$ und $b=\left(\begin{array}{c}{4 i} \\ {0} \\ {-4} \\ {4}\end{array}\right) \in \mathbb{C}^{4}$
Bestimmen sie $x \in \mathbb{C}^{3}$ so, dass $\|A x-b\|$ minimal ist. $\quad$ Hinweis: Normalengleichung lösen.

Lieben Gruß

Knax

Gefragt 17 Jan 2020 von KNAX0907

📘 Siehe "Lineare algebra" im Wiki

1 Antwort

Beste Antwort

Aloha :)

Ich versuche mal eine anschauliche Erklärung anhand eines einfachen Beispiels, bevor wir uns deinem konkreten Problem zuwenden. Wir betrachten folgende 3 Gleichungen mit 2 Variablen: $2x-y=2\quad;\quad x+2y=1\quad;\quad x+y=4$ Du hast mehr Gleichungen als Variablen, solche Gleichungssysteme heißen "überbestimmt" und sind in der Regel nicht exakt lösbar. Du könntest $x$ und $y$ so bestimmen, dass 2 Gleichungen exakt gelöst werden, die dritte mit diesen $x$ - und $y$ -Werten aber völlig daneben liegt. Besser wäre es, eine Näherungslösung zu finden, die alle 3 Gleichungen "möglichst gut" erfüllt. Wenn z.B. $x_0=1,4$ und $y_0=0,5$ gewählt werden, erhalten wir folgende Abweichungen $r_i$ : $2x_0-y_0=2\,\underbrace{+\,0,3}_{r_1}\quad;\quad x_0+2y_0=1\,\underbrace{+\,1,4}_{=r_2}\quad;\quad x_0+y_0=4\,\underbrace{-2,1}_{=r_3}$ Um diese Abweichungen $r_i$ zu minimieren, setzen wir das Problem nun auf eine geometrische Ebene. Dazu schreiben wir die 3 Gleichungen in Matrix-Schreibweise auf: $\underbrace{\left(\begin{array}{c}2 & -1\\1 & 2\\1 & 1\end{array}\right)}_{=:A}\cdot\underbrace{\left(\begin{array}{c}x\\y\end{array}\right)}_{=:\vec x}=\underbrace{\left(\begin{array}{c}2\\1\\4\end{array}\right)}_{=:\vec b}\quad\text{nicht lösbar!}$ Nicht lösbar ist das System deswegen, weil sich der Vektor $b$ nicht als Linearkombination der Spaltenvektoren von $A$ schreiben lässt. Mit dem Trick von oben addieren wir auf der rechten Seite einen "Rest-Vektor" $\vec r$ , den wir so wählen können, dass sich die komplette rechte Seite $\vec b+\vec r$ als Linearkombination der Spaltenvektoren von $A$ schreiben lässt: $\underbrace{\left(\begin{array}{c}2 & -1\\1 & 2\\1 & 1\end{array}\right)}_{=A}\cdot\underbrace{\left(\begin{array}{c}x\\y\end{array}\right)}_{=\vec x}=\underbrace{\left(\begin{array}{c}2\\1\\4\end{array}\right)}_{=\vec b}+\underbrace{\left(\begin{array}{c}r_1\\r_2\\r_3\end{array}\right)}_{=:\vec r}$ Geometrisch bedeutet dies Folgendes. Der Vektor $\vec b$ liegt außerhalb der (Hyper-)Ebene, die durch die Spaltenvektoren von $A$ aufgespannt wird. Durch Addition eines geeigneten Vektors $\vec r$ zu $\vec b$ können wir jedoch bewirken, dass der Summenvektor $\vec b+\vec r$ in dieser (Hyper-)Ebene liegt. Für $\vec r$ muss dafür nur $\vec r=A\vec x-\vec b$ gelten, ansonsten können wir ihn noch frei wählen. Die Idee hinter der Normalengleichung ist nun, diesen Vektor $\vec r$ "möglichst kurz" zu wählen. Der Vektor $\vec r$ ist genau dann am kürzesten, wenn er senkrecht auf der (Hyper-)Ebene steht, die durch die Spaltenvektoren von $A$ aufgespannt wird. Aus Sicht des Endpunktes von $\vec b$ geht es dann nämlich direkt senkrecht in Richtung (Hyper-)Ebene. Wenn der Vektor $\vec r$ aber senkrecht auf dieser (Hyper-)Ebene steht, dann steht er auch senkrecht auf allen Spaltenvektoren von $A$ , die diese (Hyper-)Ebene aufspannen. Das Skalarprodukt aus allen Spaltenvektoren von $A$ und $\vec r$ muss also $0$ sein. Bei der Matrix-Multiplikation heißt es "Zeile mal Spalte", daher können wir die Matrix $A$ zu $A^T$ transponieren und die gefundene Bedinung in der Form $A^T\cdot\vec r=\vec 0$ formulieren. Das bedeutet: $A^T\vec r=\vec 0\quad\Leftrightarrow\quad A^T(A\vec x-\vec b)=\vec 0\quad\Leftrightarrow\quad A^TA\vec x=A^T\vec b$ Ich hoffe, diese Beschreibung hat dir beim Verständnis etwas geholfen. Falls nicht, frag bitte einfach noch, was dir unklar ist.

In deinem Problem tauchen komplexe Zahlen auf. Das funktioniert genauso wie oben beschrieben, jedoch mit der adjungierten Matrix anstelle der transponierten Matrix (weil das Skalarprodukt im Komplexen entsprechend definiert ist): $A\vec x=\vec b\quad;\quad A=\left(\begin{array}{c}{i-1} & {1+i} & {i} \\ {3 i-1} & {0} & {1} \\ {0} & {1} & {1-i} \\ {2} & {i} & {2 i}\end{array}\right)\quad;\quad\vec b=\left(\begin{array}{c}{4 i} \\ {0} \\ {-4} \\ {4}\end{array}\right)$ $A^+A=\left(\begin{array}{c}{-i-1} & {-3i-1} & {0} & {2} \\ {1-i} & {0} & {1} & {-i}\\ {-i} & {1} & {1+i} & {-2i}\end{array}\right)\left(\begin{array}{c}{i-1} & {1+i} & {i} \\ {3 i-1} & {0} & {1} \\ {0} & {1} & {1-i} \\ {2} & {i} & {2 i}\end{array}\right)$ $\phantom{A^+A}=\left(\begin{array}{c}16 & 0 & 0\\0 & 4 & 4\\0 & 4 & 8\end{array}\right)$ $A^+\vec b=\left(\begin{array}{c}{-i-1} & {-3i-1} & {0} & {2} \\ {1-i} & {0} & {1} & {-i}\\ {-i} & {1} & {1+i} & {-2i}\end{array}\right)\left(\begin{array}{c}{4 i} \\ {0} \\ {-4} \\ {4}\end{array}\right)=\left(\begin{array}{c}12-4i\\0\\-12i\end{array}\right)$ Wir haben also zu lösen: $\left(\begin{array}{c}16 & 0 & 0\\0 & 4 & 4\\0 & 4 & 8\end{array}\right)\cdot\vec x=\left(\begin{array}{c}12-4i\\0\\-12i\end{array}\right)$ $\vec x=\left(\begin{array}{c}16 & 0 & 0\\0 & 4 & 4\\0 & 4 & 8\end{array}\right)^{-1}\left(\begin{array}{c}12-4i\\0\\-12i\end{array}\right)=\left(\begin{array}{c}\frac{1}{16} & 0 & 0\\0 & \frac{1}{2} & -\frac{1}{4}\\0 & -\frac{1}{4} & \frac{1}{4}\end{array}\right)\left(\begin{array}{c}12-4i\\0\\-12i\end{array}\right)$ $\phantom{\vec x}=\left(\begin{array}{c}\frac{3}{4}-\frac{1}{4}i\\3i\\-3i\end{array}\right)$

Beantwortet 17 Jan 2020 von Tschakabumba

Hallo Knax :)

Bei den reellen Zahlen ist das Skalarprodukt zwischen zwei Vektoren definiert als: $\langle \vec x|\vec y\rangle=\vec x^T\cdot \vec y$ Streng genommen ist der erste Vektor eine $1\times n$ -Matrix und der zweite Vektor eine $n\times1$ -Matrix, sonst wäre die Matrix-Multiplikation nicht definiert. Wir "schlampen" das nur meistens, weil in vielen Schulbüchern das Skalarprodukt als Produkt von 2 Spaltenvektoren eingeführt wird.

Im Komplexen muss man beim Skalarprodukt den ersten Vektor transponieren und komplex konjugieren, also adjungieren: $\langle \vec x|\vec y\rangle=\vec x^+\cdot \vec y$

Sonst brauchst du eigentlich nichts weiter zu beachten und kannst direkt die Normalengleichung aufstellen.

Stefan (aka Tschakabumba)

Kommentiert 17 Jan 2020 von Tschakabumba

Ein anderes Problem?

Stell deine Frage

Normalengleichung lösen in Lineare Algebra nach ||Ax-b||

1 Antwort

Ähnliche Fragen

Eingabetools:

Beliebte Fragen:

Heiße Lounge-Fragen: