Математика / Матрицы, определители

Первый вектор в Gram-Schmidt

Нормировка первого столбца задает первый ортонормированный вектор. Эта формула относится к ортогонализации столбцов матрицы и объясняет, как заменить исходный набор векторов ортонормированным базисом с верхнетреугольными коэффициентами перехода.

Опубликовано: Обновлено:

Формула

$$q_1=\frac{a_1}{\|a_1\|}$$
orthonormal-basis-axes Первая ось базиса

После первого шага появляется первая единичная ось.

Все последующие столбцы ортогонализуются относительно неё.

Обозначения

$a_1$
первый исходный столбец, вектор
$q_1$
первый ортонормированный столбец, вектор

Условия применения

  • a_1 \neq 0

Ограничения

  • Неверно для нулевого столбца
  • Может быть неустойчивым при очень малых значениях a_1

Подробное объяснение

Первый ортонормированный вектор задает ось нового базиса; всё дальнейшее строится относительно неё.

QR-разложение превращает столбцы исходной матрицы в ортонормированный базис того же столбцового пространства. Матрица Q хранит направления, а R показывает, как каждый исходный столбец выражается через уже построенные ортонормированные направления. Верхнетреугольная форма R появляется потому, что j-й столбец зависит только от первых j направлений, если процесс идет слева направо. Это делает разложение удобным для решения систем: ортогональное умножение не усиливает длину ошибки, а треугольную систему с R можно решить обратным ходом. Для страницы "Первый вектор в Gram-Schmidt" ключевая польза не в механическом запоминании формулы, а в понимании роли двух частей: Q отвечает за устойчивую геометрию, R - за координаты в этой геометрии.

Дополнительно важно различать теоретическую и вычислительную сторону темы "Первый вектор в Gram-Schmidt". В точной алгебре достаточно записать ортогональность и треугольную структуру, но в численном расчете проверяют потерю ортогональности, масштаб столбцов и устойчивость к почти линейной зависимости. Поэтому корректная страница должна объяснять не только саму формулу, но и то, почему она предпочтительнее прямого обращения матрицы.

Как пользоваться формулой

  1. Найдите длину a1.
  2. Разделите все координаты на длину.
  3. Проверьте, что ||q1||=1.
  4. После вычисления проверьте одновременно два равенства: Q^T Q=I и QR=A с допустимой численной погрешностью.

Историческая справка

Инициализация ортонормированного базиса всегда начинается с первого нормированного столбца.

Ортогонализация как вычислительная идея выросла из работ по векторам, проекциям и методу наименьших квадратов. В современном виде QR-разложение стало особенно важным после появления машинных вычислений, когда стало ясно, что нормальные уравнения могут ухудшать обусловленность. Методы Грама-Шмидта, Хаусхолдера и Гивенса дали разные способы получить ту же структуру Q и R, но с разной численной устойчивостью.

В послевоенной численной математике ортогональные разложения стали одним из ответов на ограниченную точность машинных вычислений. QR-разложение оказалось удобным компромиссом: оно сохраняет геометрию задачи и приводит ее к треугольной системе, которую можно надежно решать.

Историческая линия формулы

Формализация метода принадлежит классической линейной алгебре и методам построения ортогональных базисов. Связь с процессом Грама-Шмидта относится к построению ортонормированного базиса. Современная вычислительная роль QR-разложения сформировалась в численной линейной алгебре XX века и не сводится к одному автору.

Пример

a1=(3,4), ||a1||=5, q1=(3/5,4/5). В вычислительном примере для "Первый вектор в Gram-Schmidt" важно контролировать два свойства одновременно. Во-первых, столбцы Q должны иметь единичную длину и быть попарно ортогональны, то есть Q^T Q близко к единичной матрице. Во-вторых, произведение QR должно восстанавливать исходную матрицу A с допустимой погрешностью. Если первое свойство выполнено, но A не восстанавливается, ошибка вероятна в коэффициентах R. Если A восстанавливается, но Q^T Q заметно отличается от I, разложение может быть непригодным для устойчивых расчетов.

Частая ошибка

Забывают нормировать и оставляют старую длину вектора. Частая ошибка - воспринимать QR как обычное разложение на любые две матрицы. Смысл QR именно в ортонормированности Q и верхнетреугольности R. Также нельзя забывать, что классический процесс Грама-Шмидта может быть численно нестабилен для почти зависимых столбцов; в практических вычислениях часто используют модифицированный вариант, отражения Хаусхолдера или вращения Гивенса.

Практика

Задачи с решением

Нормировка вектора

Условие. a1=(6,8)

Решение. q1=(3/5,4/5)

Ответ. q1=(3/5,4/5)

Нормированный вектор из оси

Условие. a1=(0,5)

Решение. q1=(0,1)

Ответ. q1=(0,1)

Дополнительные источники

  • MIT OCW 18.06SC Orthogonalization
  • Golub & Van Loan, Matrix Computations
  • Trefethen & Bau, Numerical Linear Algebra

Связанные формулы

Математика

k-й шаг алгоритма Gram-Schmidt

$u_k=a_k-\sum_{j=1}^{k-1}(q_j^{\top}a_k)\,q_j,\quad q_k=\frac{u_k}{\|u_k\|}$

Для каждого нового столбца убирают вклад уже построенных ортонормированных направлений, затем нормируют остаток. Эта формула относится к ортогонализации столбцов матрицы и объясняет, как заменить исходный набор векторов ортонормированным базисом с верхнетреугольными коэффициентами перехода.

Математика

Формула QR-разложения

$A = QR,\quad Q^{\top}Q=I_r,\quad R \text{ верхнетреугольная}$

Матрица A раскладывается в произведение ортонормированной матрицы Q и верхнетреугольной R. Эта формула относится к ортогонализации столбцов матрицы и объясняет, как заменить исходный набор векторов ортонормированным базисом с верхнетреугольными коэффициентами перехода.

Математика

Коэффициенты R через скалярные произведения

$R_{ij}=q_i^{\top}a_j,\quad a_j=\sum_{i=1}^{j}R_{ij}q_i,\quad R_{ij}=0\ (i>j)$

После построения Q каждую колонку a_j раскладывают по уже найденным q_i. Эта формула относится к ортогонализации столбцов матрицы и объясняет, как заменить исходный набор векторов ортонормированным базисом с верхнетреугольными коэффициентами перехода.

Математика

Ортогональность векторов через скалярное произведение

$u\cdot v=0$

Два вектора ортогональны, если их скалярное произведение равно нулю. В евклидовом пространстве это означает взаимную перпендикулярность направлений и дает алгебраический способ проверять прямые углы.