Математика / Матрицы, определители

QR-разложение для задачи МНК

QR-разложение решает задачу МНК без формирования A^T A: если A=QR, то параметры находятся из треугольной системы R x = Q^T b.

Опубликовано: Обновлено:

Формула

$$A=QR,\quad Q^\top Q=I,\quad \|Ax-b\|_2^2=\|Rx-Q^\top b\|_2^2+\|Q_\perp^\top b\|_2^2.$$
diagram QR-структура для МНК

Oртогональная часть отделяет осмысленную компоненту решения от ортогонального остатка.

Решение строится из верхнего блока R.

Обозначения

$Q$
ортогональная матрица, m×m матрица
$R$
верхнетреугольная матрица, m×n матрица
$Q_\perp$
дополнение к пространству столбцов Q, m×(m-n) матрица

Условия применения

  • A имеет полный столбцовый ранг n.
  • Используется экономичная форма QR: A=Q_1 R.
  • Q_1^\top Q_1=I_n.

Ограничения

  • Сложнее реализовывать вручную, чем прямую формулу через обратную.
  • Для некоторых задач требуют переформатирования данных (масштабирование).
  • В больших размерностях затраты на хранение могут быть выше, чем у итерационных методов.

Подробное объяснение

QR-разложение заменяет исходные столбцы A ортонормированным базисом Q того же столбцового пространства и верхнетреугольной матрицей R, которая хранит координаты старых столбцов в новом базисе. Поскольку ортогональные преобразования сохраняют длины и углы, минимизация остатка становится численно устойчивой. В отличие от нормальных уравнений, QR не возводит число обусловленности в квадрат. Поэтому метод является стандартом для практического МНК в учебных курсах численной линейной алгебры и инженерных пакетах. Важно видеть эту формулу в общей цепочке: исходные данные задают матрицу наблюдений A и правую часть b, затем выбирается способ приблизить b в пространстве столбцов A. QR-разложение для задачи МНК отвечает за устойчивое ортогональное преобразование, поэтому она не существует отдельно от ранга матрицы, ортогональности остатка и устойчивости вычислений. Если столбцы A хорошо различимы и данные имеют умеренный шум, нормальные уравнения могут дать понятный ручной путь. Если столбцы почти зависимы, лучше пользоваться QR или SVD, потому что они меньше усиливают ошибки округления. После вычисления результата полезно проверить три вещи: размерности всех матриц, величину остатка и связь с соседними формулами раздела. Такой подход превращает формулу из механической записи в рабочий инструмент анализа данных, регрессии, инженерных измерений и численной математики.

Как пользоваться формулой

  1. Выполните QR-разложение A=Q R.
  2. Найдите c=Q^\top b.
  3. Решите треугольную систему R x=c_1.
  4. Оцените невязку как ‖c_2‖_2.

Историческая справка

QR-разложения вошли в численную линейную алгебру в XX веке вместе с систематическим изучением ортогональных преобразований. Методы Хаусхолдера и Гивенса сделали QR особенно удобным для вычислительных машин, а связь с МНК стала одним из главных практических применений разложения. В XX веке эта тема стала частью стандартной численной линейной алгебры: вычислительные машины сделали возможной массовую обработку переопределенных систем, но одновременно показали, что алгебраически эквивалентные формулы могут вести себя по-разному из-за округления. Поэтому учебники начали разделять теоретический вывод МНК, геометрическое объяснение через проекции и практические алгоритмы QR, Холецкого и SVD. Такой исторический сдвиг важен для пользователя: он объясняет, почему на странице рядом стоят не только “красивая формула”, но и условия применимости, ограничения и типичные ошибки.

Историческая линия формулы

Идея опирается на ортогонализацию Грама-Шмидта и более поздние устойчивые алгоритмы Хаусхолдера и Гивенса; современная формула решения МНК через QR является стандартной вычислительной формой. Современная запись является результатом развития метода наименьших квадратов, матричной алгебры и численных методов; поэтому атрибуция здесь распределенная: классические идеи связаны с Гауссом и Лежандром, а устойчивые вычислительные формы — с более поздней численной линейной алгеброй.

Пример

Пусть A имеет полный столбцовый ранг и разложена как A=QR, где Q имеет ортонормированные столбцы, а R верхнетреугольная. Тогда ||Ax-b||=||QRx-b||. Умножение на ортогональную матрицу не меняет длину, поэтому задача сводится к приближению Q^T b в координатах базиса Q. В практическом расчете сначала вычисляют c=Q^T b, затем решают R x=c обратной подстановкой. Например, если R=[[2,1],[0,3]] и c=(5,6)^T, то x2=2, x1=(5-2)/2=1.5. Дополнительная проверка: после получения численного ответа всегда подставь найденный вектор обратно в Ax, вычисли остаток r=b-Ax и сравни его норму с нормой остатка для соседнего пробного решения. Если речь идет о МНК, маленькое изменение параметров не должно уменьшать критерий; если оно уменьшает сумму квадратов, значит нормальные уравнения, QR-шаг или ручное исключение выполнены с ошибкой. Такой контроль особенно полезен в учебных задачах, где итоговое число легко получить, но трудно заметить неверный знак или перепутанный порядок умножения.

Частая ошибка

Не надо строить Q как произвольную обратимую матрицу: устойчивость QR опирается именно на ортонормированность столбцов. При ручном процессе Грама-Шмидта классическая версия может терять ортогональность, поэтому в вычислениях используют модифицированный Грам-Шмидт, отражения Хаусхолдера или вращения Гивенса.

Практика

Задачи с решением

Решение по QR

Условие. R=\begin{bmatrix}4&1\\0&3\end{bmatrix},\ c_1=(9,12)^\top.

Решение. x_2=4, x_1=(9-4)/4=5/4.

Ответ. \hat x=(5/4,4)^\top.

Вторая треугольная система

Условие. R=\begin{bmatrix}2&-1\\0&5\end{bmatrix},\ c_1=(4,5)^\top.

Решение. x_2=1, x_1=(4+1)/2.

Ответ. \hat x=(5/2,1)^\top.

Дополнительные источники

  • Golub, Van Loan, Matrix Computations, Ch. 5
  • Trefethen, Demmel, Numerical Linear Algebra

Связанные формулы

Математика

Наименьшие квадраты через QR

$\hat{x}=R^{-1}Q^{\top}b,\quad A=QR$

После QR-раскладывания задача минимизации сводится к решению треугольной системы. Формула показывает устойчивый способ работать с задачей наименьших квадратов через ортогональную геометрию, а не через прямое обращение матрицы или слепое использование нормальных уравнений.

Математика

Нормальные уравнения в QR-форме

$A^T A x = A^T b,\quad R^T R x = R^T Q^T b$

Из A=QR получаем эквивалентное равенство через R, сохраняя идею нормальных уравнений. Формула показывает устойчивый способ работать с задачей наименьших квадратов через ортогональную геометрию, а не через прямое обращение матрицы или слепое использование нормальных уравнений.

Математика

Формула QR-разложения

$A = QR,\quad Q^{\top}Q=I_r,\quad R \text{ верхнетреугольная}$

Матрица A раскладывается в произведение ортонормированной матрицы Q и верхнетреугольной R. Эта формула относится к ортогонализации столбцов матрицы и объясняет, как заменить исходный набор векторов ортонормированным базисом с верхнетреугольными коэффициентами перехода.