Математика / Матрицы, определители
Обратная блочной матрицы через дополнение Шура
Формула обращает блочную матрицу через обратный блок A и обратное дополнение Шура. Она показывает, как получить обратную матрицу без обращения всей матрицы целиком.
Формула
Показать исходную блочную матрицу и четыре блока результата, выделив S^{-1}.
Центр формулы - дополнение Шура, которое управляет нижним правым блоком обратной матрицы.
Обозначения
- $A,B,C,D$
- блоки исходной матрицы, безразмерная
- $S$
- дополнение Шура D-CA^{-1}B, безразмерная
- $S^{-1}$
- обратная матрица к дополнению Шура, безразмерная
Условия применения
- Блок A должен быть обратимым.
- Дополнение Шура S должно быть обратимым.
- Размеры блоков должны быть согласованы для всех произведений.
Ограничения
- Формула громоздка и чувствительна к порядку множителей.
- Для вычислений лучше решать системы, а не формировать обратные матрицы явно.
- Если A или S плохо обусловлены, результат может быть численно нестабильным.
Подробное объяснение
Формула получается из блочного гауссова исключения. Сначала исходную блочную матрицу раскладывают на произведение нижнего треугольного, диагонального и верхнего треугольного блочных множителей. Диагональный блок после исключения равен A и S, где S - дополнение Шура. Обратить треугольные блочные множители проще, а после перемножения получается явная формула для всей обратной матрицы. Содержательно это показывает, что обратимость всей матрицы при обратимом A зависит от обратимости дополнения Шура. Поэтому формула полезна не только для вычислений, но и для доказательств о положительной определенности, ранге и условных ковариациях. При работе с этой формулой важно сначала проверить размерности матриц и смысл операции. В линейной алгебре многие ошибки выглядят как верные алгебраические преобразования, но ломаются на уровне размеров: нельзя менять порядок множителей, если произведение после перестановки уже не определено, и нельзя считать обратную матрицу существующей без проверки невырожденности. В численных задачах дополнительно смотрят на обусловленность, потому что формально корректная запись может давать нестабильный ответ при округлении. Поэтому формулу полезно читать не только как способ вычисления, но и как способ увидеть структуру задачи: какие подпространства участвуют, где появляется проекция, где требуется ортогональность, а где достаточно рангового обновления.
Как пользоваться формулой
- Выберите ведущий блок A и проверьте его обратимость.
- Вычислите дополнение Шура S=D-CA^{-1}B.
- Проверьте обратимость S.
- Подставьте A^{-1}, S^{-1} и блоки в четыре позиции обратной матрицы, сохраняя порядок множителей.
Историческая справка
Блочные формулы обращения развивались из метода исключения и стали особенно важны, когда матрицы начали рассматривать как операторы между группами переменных. В статистике и численном анализе такая запись помогает не пересчитывать все заново при добавлении блока данных или условий. Современная запись этой формулы сложилась не сразу. Сначала похожие идеи появлялись в задачах решения систем линейных уравнений, теории квадратичных форм, аналитической механике и статистике, где матрицы использовали как компактный язык для больших наборов коэффициентов. В XX веке развитие численного анализа, вычислительной техники и прикладной статистики сделало такие тождества особенно важными: стало нужно не просто доказать существование решения, а уметь устойчиво считать его на реальных данных. Поэтому историческую атрибуцию здесь лучше понимать как цепочку вкладов: алгебраическая идея, удобная матричная запись, численный алгоритм и прикладная интерпретация часто были оформлены разными авторами и школами.
Историческая линия формулы
Формула связана с дополнением Шура и блочной матричной алгеброй. Ее корректнее описывать как стандартное следствие блочного исключения, а не как открытие одного автора. Название дополнения связано с Иссаи Шуром, но блочные формулы обращения и исключения выросли из более широкой традиции метода Гаусса, теории матриц и численного решения систем. Поэтому атрибуция должна показывать линию метода, а не упрощать ее до одного открытия.
Пример
Если матрица описывает старые переменные и новый блок переменных, формула позволяет увидеть, как обратная матрица меняется после учета связи между блоками. Например, в регрессии добавление группы признаков можно анализировать через дополнение Шура: оно показывает информацию, которая остается в новом блоке после вычитания объясненной части старым блоком. В блочной задаче для "Обратная блочной матрицы через дополнение Шура" полезно мысленно выполнить исключение переменных. Если первый блок уравнений позволяет выразить одну группу переменных через другую, то во второй группе появляется поправка, учитывающая обратное влияние связи между блоками. На числах это можно проверить даже в скалярном случае, но настоящий смысл виден в больших системах: вместо обращения всей матрицы можно работать с меньшим эффективным блоком и контролировать, какие переменные были исключены.
Частая ошибка
Ошибки почти всегда связаны с перестановкой множителей и знаками. В правом верхнем и левом нижнем блоках стоят минусы, а в левом верхнем блоке появляется добавка A^{-1}BS^{-1}CA^{-1}. Нельзя заменять S на D без поправки, если блоки B и C не нулевые. Также нельзя использовать формулу, если обратимость A и S не проверена.
Практика
Задачи с решением
Случай нулевых связей
Условие. Если B=0 и C=0, во что превращается формула для обратной блочной матрицы?
Решение. Тогда S=D, а внедиагональные блоки равны нулю. Обратная матрица становится block diag(A^{-1}, D^{-1}).
Ответ. В блочно-диагональную обратную матрицу с блоками A^{-1} и D^{-1}.
Условие обратимости
Условие. A обратим, но S=D-CA^{-1}B вырожден. Обратима ли вся блочная матрица?
Решение. Нет. При обратимом A обратимость всей блочной матрицы эквивалентна обратимости дополнения Шура S.
Ответ. Нет, не обратима.
Дополнительные источники
- Г. Стрэнг, Введение в линейную алгебру
- Д. Лэй, Линейная алгебра и ее приложения
- G. H. Golub, C. F. Van Loan, Matrix Computations
- MIT OpenCourseWare, Linear Algebra
Связанные формулы
Математика
Дополнение Шура
Дополнение Шура выражает эффективный блок матрицы после исключения другого блока. Оно появляется при блочном обращении матриц, решении систем, вычислении определителей и условных распределениях в статистике.
Математика
Формула Вудбери
Формула Вудбери обобщает обновление обратной матрицы на добавку малого ранга UCV. Она позволяет заменить обращение большой матрицы обращением меньшей матрицы.
Математика
Формула Шермана-Моррисона
Формула Шермана-Моррисона дает обратную матрицу после рангового обновления A+uv^T. Она позволяет обновить уже известную обратную матрицу без полного повторного обращения.
Математика
Обратная матрица 2x2
Обратная матрица 2x2 существует только при ненулевом определителе. Она обращает действие исходной матрицы: A^{-1}A = I, то есть возвращает исходный вектор.