Aloha :)
Ich versuche mal eine anschauliche Erklärung anhand eines einfachen Beispiels, das du aber auf beliebig komplizierte Anwendungen erweitern kannst. Wir betrachten folgende 3 Gleichungen mit 2 Variablen: 2x−y=2;x+2y=1;x+y=4Du hast mehr Gleichungen als Variablen, solche Gleichungssysteme heißen "überbestimmt" und sind in der Regel nicht exakt lösbar. Du könntest x und y so bestimmen, dass 2 Gleichungen exakt gelöst werden, die dritte mit diesen x- und y-Werten aber völlig daneben liegt. Besser wäre es, eine Näherungslösung zu finden, die alle 3 Gleichungen "möglichst gut" erfüllt. Wenn z.B. x0=1,4 und y0=0,5 gewählt werden, erhalten wir folgende Abweichungen ri:2x0−y0=2r1+0,3;x0+2y0=1=r2+1,4;x0+y0=4=r3−2,1Um diese Abweichungen ri geschickt zu wählen, setzen wir das Problem nun auf eine geometrische Ebene. Dazu schreiben wir die 3 Gleichungen in Matrix-Schreibweise auf:= : A⎝⎛211−121⎠⎞⋅= : x(xy)== : b⎝⎛214⎠⎞nicht lo¨sbar!Nicht lösbar ist das System deswegen, weil sich der Vektor b nicht als Linearkombination der Spaltenvektoren vom A schreiben lässt. Mit dem Trick von oben addieren wir auf der rechten Seite einen "Rest-Vektor" r, den wir so wählen können, dass sich die komplette rechte Seite b+r als Linearkombination der Spaltenvektoren von A schreiben lässt:=A⎝⎛211−121⎠⎞⋅=x(xy)==b⎝⎛214⎠⎞+= : r⎝⎛r1r2r3⎠⎞Geometrisch bedeutet dies Folgendes. Der Vektor b liegt außerhalb der (Hyper-)Ebene, die durch die Spaltenvektoren von A aufgespannt wird. Durch Addition eines geeigneten Vektors r zu b können wir jedoch bewirken, dass der Summenvektor b+r in dieser (Hyper-)Ebene liegt. Für r muss bisher nurr=Ax−bgelten, ansonsten können wir ihn noch frei wählen. Die Idee hinter dem Satz aus deiner Vorlesung ist nun, diesen Vektor r "möglichst kurz" zu wählen. Der Vektor r ist genau dann am kürzesten, wenn er senkrecht auf der (Hyper-)Ebene steht, die durch die Spaltenvektoren von A aufgespannt wird. Aus Sicht des Endpunktes von b geht es dann nämlich direkt senkrecht in Richtung (Hyper-)Ebene. Wenn der Vektor r aber senkrecht auf dieser (Hyper-)Ebene steht, dann steht er auch senkrecht auf allen Spaltenvektoren von A, die diese (Hyper-)Ebene aufspannen. Das Skalarprodukt aus allen Spaltenvektoren von A und r muss also 0 sein. Bei der Matrix-Multiplikation heißt es "Zeile mal Spalte", daher können wir die Matrix A zu AT transponieren und die gefundene Bedinung in der Form AT⋅r=0 formulieren. Das bedeutet:ATr=0⇔AT(Ax−b)=0⇔ATAx=ATbIch hoffe, diese Beschreibung hat dir beim Verständnis etwas geholfen. Falls nicht, frag bitte einfach noch, was dir unklar ist.