Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Einführung in die Matrixzerlegung | Grundlagen der Linearen Algebra
Mathematik für Data Science

bookEinführung in die Matrixzerlegung

Das Lösen von Gleichungssystemen wie Ax=bA \vec{x} = \vec{b} kann rechnerisch aufwendig sein, insbesondere bei großen Systemen.

Die Matrixzerlegung vereinfacht diesen Prozess, indem sie die Matrix AA in einfachere Teile zerlegt, die dann schrittweise gelöst werden können.

LU vs QR

Die Matrix AA wird in andere strukturierte Matrizen zerlegt.

LU-Zerlegung

Zerlegung von AA in eine untere und eine obere Dreiecksmatrix:

  • Erstellt mittels Gaußscher Eliminierung;
  • Am besten geeignet für quadratische Matrizen.
A=LUA = LU

QR-Zerlegung

Zerlegung von AA in eine orthogonale und eine obere Matrix:

  • Häufig verwendet für nicht-quadratische Matrizen;
  • Ideal für Ausgleichsrechnungen oder wenn LU versagt.
A=QRA = QR

LU-Zerlegung

Ausgangspunkt ist eine quadratische Matrix:

A=[4363]A = \begin{bmatrix} 4 & 3 \\ 6 & 3 \end{bmatrix}

Das Ziel ist, dies wie folgt darzustellen:

A=LUA = LU

Wobei gilt:

L=[10l211],  U=[u11u120u22]L = \begin{bmatrix} 1 & 0 \\ l_{21} & 1 \end{bmatrix},\ \ U = \begin{bmatrix} u_{11} & u_{12} \\ 0 & u_{22} \end{bmatrix}

Diese Zerlegung ist möglich, wenn A quadratisch und invertierbar ist.

Wichtige Punkte:

  • Untere Dreiecksmatrizen haben alle Einträge oberhalb der Diagonalen gleich null, was die Vorwärtssubstitution vereinfacht;
  • Obere Dreiecksmatrizen haben Nullen unterhalb der Diagonalen, wodurch die Rückwärtssubstitution unkompliziert wird;
  • Eine orthogonale Matrix besitzt Spalten, die orthonormale Vektoren sind (Vektoren der Länge 1, die senkrecht zueinander stehen);
  • Diese Eigenschaft erhält Vektorlängen und Winkel, was beim Lösen von Ausgleichsproblemen und zur Verbesserung der numerischen Stabilität nützlich ist.

Gaußsches Eliminationsverfahren

Anwendung des gaußschen Eliminationsverfahrens, um den Eintrag unterhalb des linken oberen Pivotelements zu eliminieren:

R2R264R1R_2 \rarr R_2 - \frac{6}{4}R_1

Dies ergibt:

R2=[0,1.5]R'_2 = [0, -1.5]

Die aktualisierten Matrizen lauten somit:

U=[4301.5]U = \begin{bmatrix} 4 & 3 \\ 0 & -1.5 \end{bmatrix}

Und aus unserer Zeilenoperation ergibt sich:

L=[101.51]L = \begin{bmatrix} 1 & 0 \\ 1.5 & 1 \end{bmatrix}

Wichtige Punkte:

  • Das gaußsche Eliminationsverfahren eliminiert systematisch die Einträge unterhalb des Pivotelements in jeder Spalte, indem skalierte Versionen der Pivotzeile von den darunterliegenden Zeilen subtrahiert werden;
  • Dieser Prozess transformiert A in eine obere Dreiecksmatrix U;
  • Die zum Eliminieren verwendeten Multiplikatoren werden in L gespeichert, sodass A als Produkt LU dargestellt werden kann.

Ergebnis der LU-Zerlegung

Wir überprüfen:

A=LU=[101.51][4301.5]=[4363]A = LU = \begin{bmatrix} 1 & 0 \\ 1.5 & 1 \end{bmatrix} \begin{bmatrix} 4 & 3 \\ 0 & -1.5 \end{bmatrix} = \begin{bmatrix} 4 & 3 \\ 6 & 3 \end{bmatrix}

Nun kann das System Ax=bA \vec{x} = \vec{b} in zwei Schritten gelöst werden:

  1. Lösung von Ly=bL \vec{y} = \vec{b} durch Vorwärtssubstitution;
  2. Lösung von Ux=yU \vec{x} = \vec{y} durch Rückwärtssubstitution.

QR-Zerlegung

Eine Matrix AA soll als Produkt zweier Matrizen dargestellt werden:

A=QRA = QR

Dabei gilt:

  • AA ist die Eingabematrix (z. B. Daten, Koeffizienten usw.);
  • QQ ist eine orthogonale Matrix (ihre Spalten sind orthonormale Vektoren);
  • RR ist eine obere Dreiecksmatrix.

Beispiel für die Zerlegung der Form:

A=[a1a2a3a4]=[q1q2q3q4][r11r120r22]A = \begin{bmatrix} a_1 & a_2 \\ a_3 & a_4 \end{bmatrix} = \begin{bmatrix} q_1 & q_2 \\ q_3 & q_4 \end{bmatrix} \begin{bmatrix} r_{11} & r_{12} \\ 0 & r_{22} \end{bmatrix}

Diese Zerlegung wird häufig verwendet, wenn:

  • Matrix A nicht quadratisch ist;
  • Kleinste-Quadrate-Probleme gelöst werden;
  • Die LU-Zerlegung nicht stabil ist.

Was sind Orthonormalvektoren?

Orthogonale Vektoren

Zwei Vektoren u,vu, v sind orthogonal, wenn ihr Skalarprodukt null ist:

uv=0u \cdot v = 0

Normalisierter Vektor

Ein Vektor uu ist normalisiert, wenn u=1|u| = 1 gilt.

Orthonormale Menge

Eine Menge von Vektoren {q1,q2,...,qk}\{q_1, q_2, ..., q_k\} ist orthonormal, wenn jeder Vektor die Einheitslänge besitzt und sie zueinander orthogonal sind:

qiqj={1, falls  i=j,0, falls  ij.q_i \cdot q_j = \begin{cases} 1,\ \text{falls}\ \ i = j,\\ 0,\ \text{falls}\ \ i \neq j. \end{cases}

Bedeutung: Orthonormale Spalten in QQ erhalten die Geometrie, vereinfachen Projektionen und verbessern die numerische Stabilität.

Definition der Matrix A

Wir beginnen mit folgendem Beispiel:

A=[4363]A = \begin{bmatrix} 4 & 3 \\ 6 & 3 \end{bmatrix}

Wir verwenden das Gram-Schmidt-Verfahren, um Matrizen QQ und RR zu finden, sodass A=QRA=QR gilt. Das Gram-Schmidt-Verfahren erzeugt aus den Spalten von AA eine orthonormale Vektormenge.

Das bedeutet, die Vektoren in QQ sind alle zueinander senkrecht (orthogonal) und besitzen die Einheitslänge (normalisiert). Diese Eigenschaft vereinfacht viele Berechnungen und verbessert die numerische Stabilität beim Lösen von Gleichungssystemen.

Das Ziel ist hier:

  • Die Spalten von QQ orthonormal machen;
  • Die Matrix RR erstellen, die die Projektionen kodiert.

Ermittlung des ersten Basisvektors

Wir entnehmen die erste Spalte von AA:

a1=[46]a_1 = \begin{bmatrix} 4 \\ 6 \end{bmatrix}

Zur Normalisierung berechnen wir die Norm:

a1=42+62=16+36=52|a_1| = \sqrt{4^2 + 6^2} = \sqrt{16 + 36} = \sqrt{52}

Dann:

q1=152[46]=[452652]q_1 = \frac{1}{\sqrt{52}} \begin{bmatrix} 4 \\ 6 \end{bmatrix} = \begin{bmatrix} \frac{4}{\sqrt{52}} \\ \frac{6}{\sqrt{52}} \end{bmatrix}

Dies ist der erste orthonormale Vektor für QQ.

Wie wird ein Vektor normalisiert?

Gegeben sei ein Vektor:

v=[v1v2vn]v = \begin{bmatrix} v_1 \\ v_2 \\ \vdots \\ v_n \end{bmatrix}

Wir berechnen seine Norm:

v=v12+v22+...+vn2|v| = \sqrt{v_1^2 + v_2^2 + ... + v^2_n}

Dann normalisieren wir:

v^=1vv\hat{v} = \frac{1}{|v|}v

Beispiel:

v=[34],  v=32+42=5v = \begin{bmatrix} 3 \\ 4 \end{bmatrix},\ \ |v| = \sqrt{3^2 + 4^2} = 5

Unser normalisierter Vektor ist somit:

v^=15[34]=[0.60.8]\hat{v} = \frac{1}{5}\begin{bmatrix} 3 \\ 4 \end{bmatrix} = \begin{bmatrix} 0.6 \\ 0.8 \end{bmatrix}

Sobald die Normalisierung und Orthogonalisierung von Vektoren bekannt ist, kann das Gram-Schmidt-Verfahren angewendet werden, um die QQ-Matrix zu bilden und damit RR in der QR-Zerlegung zu berechnen.

Berechnung von q₂ mit dem Gram-Schmidt-Verfahren

Um q2q_2 zu berechnen, beginnt man mit der zweiten Spalte von AA:

a2=[33]a_2 = \begin{bmatrix} 3 \\ 3 \end{bmatrix}

Als Nächstes projiziert man a2a_2 auf q1q_1:

r12=q1Ta2=152(43+63)=15230r_{12} = q_1^Ta_2 = \frac{1}{\sqrt{52}}(4 \cdot 3 + 6 \cdot 3) = \frac{1}{\sqrt{52}} \cdot 30

Die Projektion wird von a2a_2 abgezogen:

u2=a2r12q1u_2 = a_2 - r_{12}q_1

Anschließend wird normalisiert (wie oben gezeigt):

q2=u2u2q_2 = \frac{u_2}{|u_2|}

Nun bilden sowohl q1q_1 als auch q2q_2 die orthonormale Basis für QQ. Das Endergebnis wird nun zusammengesetzt:

Q=[q1q2],  R=[r11r120r22]Q = \begin{bmatrix} q_1 & q_2 \end{bmatrix},\ \ R = \begin{bmatrix} r_{11} & r_{12} \\ 0 & r_{22} \end{bmatrix}

Diese erfüllen:

A=QRA = QR
question mark

Was ist der erste Schritt im Gram-Schmidt-Verfahren für die QR-Zerlegung?

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 4. Kapitel 8

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Awesome!

Completion rate improved to 1.96

bookEinführung in die Matrixzerlegung

Swipe um das Menü anzuzeigen

Das Lösen von Gleichungssystemen wie Ax=bA \vec{x} = \vec{b} kann rechnerisch aufwendig sein, insbesondere bei großen Systemen.

Die Matrixzerlegung vereinfacht diesen Prozess, indem sie die Matrix AA in einfachere Teile zerlegt, die dann schrittweise gelöst werden können.

LU vs QR

Die Matrix AA wird in andere strukturierte Matrizen zerlegt.

LU-Zerlegung

Zerlegung von AA in eine untere und eine obere Dreiecksmatrix:

  • Erstellt mittels Gaußscher Eliminierung;
  • Am besten geeignet für quadratische Matrizen.
A=LUA = LU

QR-Zerlegung

Zerlegung von AA in eine orthogonale und eine obere Matrix:

  • Häufig verwendet für nicht-quadratische Matrizen;
  • Ideal für Ausgleichsrechnungen oder wenn LU versagt.
A=QRA = QR

LU-Zerlegung

Ausgangspunkt ist eine quadratische Matrix:

A=[4363]A = \begin{bmatrix} 4 & 3 \\ 6 & 3 \end{bmatrix}

Das Ziel ist, dies wie folgt darzustellen:

A=LUA = LU

Wobei gilt:

L=[10l211],  U=[u11u120u22]L = \begin{bmatrix} 1 & 0 \\ l_{21} & 1 \end{bmatrix},\ \ U = \begin{bmatrix} u_{11} & u_{12} \\ 0 & u_{22} \end{bmatrix}

Diese Zerlegung ist möglich, wenn A quadratisch und invertierbar ist.

Wichtige Punkte:

  • Untere Dreiecksmatrizen haben alle Einträge oberhalb der Diagonalen gleich null, was die Vorwärtssubstitution vereinfacht;
  • Obere Dreiecksmatrizen haben Nullen unterhalb der Diagonalen, wodurch die Rückwärtssubstitution unkompliziert wird;
  • Eine orthogonale Matrix besitzt Spalten, die orthonormale Vektoren sind (Vektoren der Länge 1, die senkrecht zueinander stehen);
  • Diese Eigenschaft erhält Vektorlängen und Winkel, was beim Lösen von Ausgleichsproblemen und zur Verbesserung der numerischen Stabilität nützlich ist.

Gaußsches Eliminationsverfahren

Anwendung des gaußschen Eliminationsverfahrens, um den Eintrag unterhalb des linken oberen Pivotelements zu eliminieren:

R2R264R1R_2 \rarr R_2 - \frac{6}{4}R_1

Dies ergibt:

R2=[0,1.5]R'_2 = [0, -1.5]

Die aktualisierten Matrizen lauten somit:

U=[4301.5]U = \begin{bmatrix} 4 & 3 \\ 0 & -1.5 \end{bmatrix}

Und aus unserer Zeilenoperation ergibt sich:

L=[101.51]L = \begin{bmatrix} 1 & 0 \\ 1.5 & 1 \end{bmatrix}

Wichtige Punkte:

  • Das gaußsche Eliminationsverfahren eliminiert systematisch die Einträge unterhalb des Pivotelements in jeder Spalte, indem skalierte Versionen der Pivotzeile von den darunterliegenden Zeilen subtrahiert werden;
  • Dieser Prozess transformiert A in eine obere Dreiecksmatrix U;
  • Die zum Eliminieren verwendeten Multiplikatoren werden in L gespeichert, sodass A als Produkt LU dargestellt werden kann.

Ergebnis der LU-Zerlegung

Wir überprüfen:

A=LU=[101.51][4301.5]=[4363]A = LU = \begin{bmatrix} 1 & 0 \\ 1.5 & 1 \end{bmatrix} \begin{bmatrix} 4 & 3 \\ 0 & -1.5 \end{bmatrix} = \begin{bmatrix} 4 & 3 \\ 6 & 3 \end{bmatrix}

Nun kann das System Ax=bA \vec{x} = \vec{b} in zwei Schritten gelöst werden:

  1. Lösung von Ly=bL \vec{y} = \vec{b} durch Vorwärtssubstitution;
  2. Lösung von Ux=yU \vec{x} = \vec{y} durch Rückwärtssubstitution.

QR-Zerlegung

Eine Matrix AA soll als Produkt zweier Matrizen dargestellt werden:

A=QRA = QR

Dabei gilt:

  • AA ist die Eingabematrix (z. B. Daten, Koeffizienten usw.);
  • QQ ist eine orthogonale Matrix (ihre Spalten sind orthonormale Vektoren);
  • RR ist eine obere Dreiecksmatrix.

Beispiel für die Zerlegung der Form:

A=[a1a2a3a4]=[q1q2q3q4][r11r120r22]A = \begin{bmatrix} a_1 & a_2 \\ a_3 & a_4 \end{bmatrix} = \begin{bmatrix} q_1 & q_2 \\ q_3 & q_4 \end{bmatrix} \begin{bmatrix} r_{11} & r_{12} \\ 0 & r_{22} \end{bmatrix}

Diese Zerlegung wird häufig verwendet, wenn:

  • Matrix A nicht quadratisch ist;
  • Kleinste-Quadrate-Probleme gelöst werden;
  • Die LU-Zerlegung nicht stabil ist.

Was sind Orthonormalvektoren?

Orthogonale Vektoren

Zwei Vektoren u,vu, v sind orthogonal, wenn ihr Skalarprodukt null ist:

uv=0u \cdot v = 0

Normalisierter Vektor

Ein Vektor uu ist normalisiert, wenn u=1|u| = 1 gilt.

Orthonormale Menge

Eine Menge von Vektoren {q1,q2,...,qk}\{q_1, q_2, ..., q_k\} ist orthonormal, wenn jeder Vektor die Einheitslänge besitzt und sie zueinander orthogonal sind:

qiqj={1, falls  i=j,0, falls  ij.q_i \cdot q_j = \begin{cases} 1,\ \text{falls}\ \ i = j,\\ 0,\ \text{falls}\ \ i \neq j. \end{cases}

Bedeutung: Orthonormale Spalten in QQ erhalten die Geometrie, vereinfachen Projektionen und verbessern die numerische Stabilität.

Definition der Matrix A

Wir beginnen mit folgendem Beispiel:

A=[4363]A = \begin{bmatrix} 4 & 3 \\ 6 & 3 \end{bmatrix}

Wir verwenden das Gram-Schmidt-Verfahren, um Matrizen QQ und RR zu finden, sodass A=QRA=QR gilt. Das Gram-Schmidt-Verfahren erzeugt aus den Spalten von AA eine orthonormale Vektormenge.

Das bedeutet, die Vektoren in QQ sind alle zueinander senkrecht (orthogonal) und besitzen die Einheitslänge (normalisiert). Diese Eigenschaft vereinfacht viele Berechnungen und verbessert die numerische Stabilität beim Lösen von Gleichungssystemen.

Das Ziel ist hier:

  • Die Spalten von QQ orthonormal machen;
  • Die Matrix RR erstellen, die die Projektionen kodiert.

Ermittlung des ersten Basisvektors

Wir entnehmen die erste Spalte von AA:

a1=[46]a_1 = \begin{bmatrix} 4 \\ 6 \end{bmatrix}

Zur Normalisierung berechnen wir die Norm:

a1=42+62=16+36=52|a_1| = \sqrt{4^2 + 6^2} = \sqrt{16 + 36} = \sqrt{52}

Dann:

q1=152[46]=[452652]q_1 = \frac{1}{\sqrt{52}} \begin{bmatrix} 4 \\ 6 \end{bmatrix} = \begin{bmatrix} \frac{4}{\sqrt{52}} \\ \frac{6}{\sqrt{52}} \end{bmatrix}

Dies ist der erste orthonormale Vektor für QQ.

Wie wird ein Vektor normalisiert?

Gegeben sei ein Vektor:

v=[v1v2vn]v = \begin{bmatrix} v_1 \\ v_2 \\ \vdots \\ v_n \end{bmatrix}

Wir berechnen seine Norm:

v=v12+v22+...+vn2|v| = \sqrt{v_1^2 + v_2^2 + ... + v^2_n}

Dann normalisieren wir:

v^=1vv\hat{v} = \frac{1}{|v|}v

Beispiel:

v=[34],  v=32+42=5v = \begin{bmatrix} 3 \\ 4 \end{bmatrix},\ \ |v| = \sqrt{3^2 + 4^2} = 5

Unser normalisierter Vektor ist somit:

v^=15[34]=[0.60.8]\hat{v} = \frac{1}{5}\begin{bmatrix} 3 \\ 4 \end{bmatrix} = \begin{bmatrix} 0.6 \\ 0.8 \end{bmatrix}

Sobald die Normalisierung und Orthogonalisierung von Vektoren bekannt ist, kann das Gram-Schmidt-Verfahren angewendet werden, um die QQ-Matrix zu bilden und damit RR in der QR-Zerlegung zu berechnen.

Berechnung von q₂ mit dem Gram-Schmidt-Verfahren

Um q2q_2 zu berechnen, beginnt man mit der zweiten Spalte von AA:

a2=[33]a_2 = \begin{bmatrix} 3 \\ 3 \end{bmatrix}

Als Nächstes projiziert man a2a_2 auf q1q_1:

r12=q1Ta2=152(43+63)=15230r_{12} = q_1^Ta_2 = \frac{1}{\sqrt{52}}(4 \cdot 3 + 6 \cdot 3) = \frac{1}{\sqrt{52}} \cdot 30

Die Projektion wird von a2a_2 abgezogen:

u2=a2r12q1u_2 = a_2 - r_{12}q_1

Anschließend wird normalisiert (wie oben gezeigt):

q2=u2u2q_2 = \frac{u_2}{|u_2|}

Nun bilden sowohl q1q_1 als auch q2q_2 die orthonormale Basis für QQ. Das Endergebnis wird nun zusammengesetzt:

Q=[q1q2],  R=[r11r120r22]Q = \begin{bmatrix} q_1 & q_2 \end{bmatrix},\ \ R = \begin{bmatrix} r_{11} & r_{12} \\ 0 & r_{22} \end{bmatrix}

Diese erfüllen:

A=QRA = QR
question mark

Was ist der erste Schritt im Gram-Schmidt-Verfahren für die QR-Zerlegung?

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 4. Kapitel 8
some-alt