Математика / Матрицы, определители

Дополнение Шура

Дополнение Шура выражает эффективный блок матрицы после исключения другого блока. Оно появляется при блочном обращении матриц, решении систем, вычислении определителей и условных распределениях в статистике.

Опубликовано: Обновлено:

Формула

$$S=D-CA^{-1}B$$
block-matrix Исключение блока A

Показать матрицу 2 на 2 из блоков и стрелку от блока A к поправке CA^{-1}B.

Дополнение Шура показывает, что остается от блока D после исключения A.

Обозначения

$A,B,C,D$
блоки матрицы [[A,B],[C,D]] согласованных размеров, безразмерная
$S$
дополнение Шура блока A, безразмерная
$A^{-1}$
обратная матрица к блоку A, безразмерная

Условия применения

  • Блок A должен быть квадратным и обратимым для записи S=D-CA^{-1}B.
  • Размеры блоков должны быть согласованы для произведения CA^{-1}B.
  • Существует также вариант дополнения по блоку D, если обратим D.

Ограничения

  • Если A вырожден, простая формула с A^{-1} неприменима без обобщений.
  • В численных расчетах явное вычисление A^{-1} часто хуже решения системы Ax=B.
  • Неправильный выбор блока может ухудшить устойчивость вычислений.

Подробное объяснение

Дополнение Шура появляется из блочного исключения, аналогичного обычному методу Гаусса. Если матрица разбита на блоки, блок A можно использовать как ведущий элемент. Тогда влияние связи между двумя группами переменных описывается произведением CA^{-1}B, которое вычитается из D. Полученный блок S показывает, какой оператор остается на второй группе переменных после исключения первой. Поэтому дополнение Шура является естественным языком для блочных систем, условных ковариаций, седловых задач и формул обращения. Оно не просто сокращает запись, а объясняет, как одна часть системы меняет другую. При работе с этой формулой важно сначала проверить размерности матриц и смысл операции. В линейной алгебре многие ошибки выглядят как верные алгебраические преобразования, но ломаются на уровне размеров: нельзя менять порядок множителей, если произведение после перестановки уже не определено, и нельзя считать обратную матрицу существующей без проверки невырожденности. В численных задачах дополнительно смотрят на обусловленность, потому что формально корректная запись может давать нестабильный ответ при округлении. Поэтому формулу полезно читать не только как способ вычисления, но и как способ увидеть структуру задачи: какие подпространства участвуют, где появляется проекция, где требуется ортогональность, а где достаточно рангового обновления.

Как пользоваться формулой

  1. Разбейте матрицу на четыре согласованных блока A, B, C, D.
  2. Проверьте, что блок A квадратный и обратим.
  3. Вычислите действие A^{-1}B через решение системы AX=B.
  4. Вычтите CA^{-1}B из D и используйте полученный блок S в дальнейшей задаче.

Историческая справка

Идея дополнения Шура связана с блочным исключением и теорией матриц. Она стала привычной в линейной алгебре, численном анализе и статистике, потому что многие реальные матрицы имеют блочную структуру: переменные группируются по физическому смыслу, ограничениям или типам данных. Современная запись этой формулы сложилась не сразу. Сначала похожие идеи появлялись в задачах решения систем линейных уравнений, теории квадратичных форм, аналитической механике и статистике, где матрицы использовали как компактный язык для больших наборов коэффициентов. В XX веке развитие численного анализа, вычислительной техники и прикладной статистики сделало такие тождества особенно важными: стало нужно не просто доказать существование решения, а уметь устойчиво считать его на реальных данных. Поэтому историческую атрибуцию здесь лучше понимать как цепочку вкладов: алгебраическая идея, удобная матричная запись, численный алгоритм и прикладная интерпретация часто были оформлены разными авторами и школами.

Историческая линия формулы

Название связано с Иссаи Шуром, но сама техника тесно связана с более общей традицией исключения переменных и блочных матричных преобразований. Название дополнения связано с Иссаи Шуром, но блочные формулы обращения и исключения выросли из более широкой традиции метода Гаусса, теории матриц и численного решения систем. Поэтому атрибуция должна показывать линию метода, а не упрощать ее до одного открытия.

Пример

Пусть блочная система содержит переменные x и y. Если первый блок уравнений позволяет выразить x через y, подстановка во второй блок меняет матрицу при y на D-CA^{-1}B. Это и есть дополнение Шура. В практической задаче такой прием позволяет исключить часть переменных и получить меньшую систему, но с учетом их влияния на оставшиеся переменные. В блочной задаче для "Дополнение Шура" полезно мысленно выполнить исключение переменных. Если первый блок уравнений позволяет выразить одну группу переменных через другую, то во второй группе появляется поправка, учитывающая обратное влияние связи между блоками. На числах это можно проверить даже в скалярном случае, но настоящий смысл виден в больших системах: вместо обращения всей матрицы можно работать с меньшим эффективным блоком и контролировать, какие переменные были исключены.

Частая ошибка

Частая ошибка - писать D-BA^{-1}C вместо D-CA^{-1}B. Порядок блоков нельзя менять: матричное умножение некоммутативно, а размеры могут вообще не совпасть. Еще одна ошибка - фактически находить A^{-1}, хотя для вычислений лучше решить систему с несколькими правыми частями. Также нельзя применять формулу, не проверив обратимость выбранного блока.

Практика

Задачи с решением

Скалярные блоки

Условие. Для блоков A=2, B=3, C=4, D=10 найдите дополнение Шура блока A.

Решение. S=D-CA^{-1}B=10-4*(1/2)*3=10-6=4.

Ответ. S=4.

Проверка применимости

Условие. Можно ли использовать S=D-CA^{-1}B, если det(A)=0?

Решение. Нет, потому что A^{-1} не существует. Нужно выбрать другой обратимый блок или использовать обобщенные методы.

Ответ. Нет, простая формула неприменима.

Дополнительные источники

  • Г. Стрэнг, Введение в линейную алгебру
  • Д. Лэй, Линейная алгебра и ее приложения
  • G. H. Golub, C. F. Van Loan, Matrix Computations
  • MIT OpenCourseWare, Linear Algebra

Связанные формулы

Математика

Обратная блочной матрицы через дополнение Шура

$\begin{pmatrix}A&B\\C&D\end{pmatrix}^{-1}=\begin{pmatrix}A^{-1}+A^{-1}BS^{-1}CA^{-1}&-A^{-1}BS^{-1}\\-S^{-1}CA^{-1}&S^{-1}\end{pmatrix},\quad S=D-CA^{-1}B$

Формула обращает блочную матрицу через обратный блок A и обратное дополнение Шура. Она показывает, как получить обратную матрицу без обращения всей матрицы целиком.

Математика

Лемма об определителе матрицы

$\det(A+uv^T)=\det(A)\left(1+v^TA^{-1}u\right)$

Лемма об определителе показывает, как меняется определитель обратимой матрицы при ранговом обновлении uv^T. Вместо пересчета всего определителя достаточно вычислить один скаляр.

Математика

Обратная матрица 2x2

$A^{-1}=\frac{1}{ad-bc}\begin{pmatrix}d&-b\\-c&a\end{pmatrix}$

Обратная матрица 2x2 существует только при ненулевом определителе. Она обращает действие исходной матрицы: A^{-1}A = I, то есть возвращает исходный вектор.

Математика

Матричное произведение

$(AB)_{ij}=\sum_{k=1}^{m}a_{ik}b_{kj}$

Матричное произведение строит элемент новой матрицы как скалярное произведение строки первой матрицы и столбца второй. Порядок множителей важен.