математика, астрономия, геодезия, физика

Карл Фридрих Гаусс

Карл Фридрих Гаусс - немецкий математик, астроном и геодезист, чье имя связано с методом исключения, нормальными уравнениями и практикой точных вычислений. Для линейной алгебры он важен не как единственный автор всех строковых преобразований, а как фигура, через которую удобно объяснять развитие систематического решения линейных систем.

1777-1855Математики Физики Новое время XIX век

Стилизованный портрет Карла Фридриха Гаусса на фоне матриц, строковых преобразований, геодезической сетки и формул метода исключения

Биография

Карл Фридрих Гаусс родился в Брауншвейге в 1777 году и большую часть зрелой научной жизни провел в Геттингене. Его работы охватывали теорию чисел, астрономию, геодезию, вероятность, обработку наблюдений, математическую физику и вычислительные методы. В истории математики Гаусса часто называют одним из центральных ученых XIX века, но для справочника формул особенно важна не общая репутация, а конкретная связь с задачами, где много уравнений и много чисел.

Гаусс занимался практическими вычислениями, в которых измерения неизбежно содержали ошибки. В астрономии и геодезии нужно было по наблюдениям восстановить орбиту, положение точки или параметры модели. Такие задачи приводили к системам линейных уравнений и нормальным уравнениям метода наименьших квадратов. Систематическое исключение неизвестных позволяло сводить большие таблицы коэффициентов к удобному виду и получать численный ответ без угадывания.

Поэтому на страницах метода Гаусса важно сохранять точность атрибуции. Исключение неизвестных существовало в разных формах задолго до Гаусса, но его имя закрепилось за европейским алгоритмом, потому что он применял и развивал его в серьезных вычислительных задачах. Это делает Гаусса полезным автором для страниц о прямом ходе, обратной подстановке, ступенчатом виде и ранге: через его работы видно, что метод не был учебной игрой с таблицами, а вырос из реальных задач измерения и расчета.

Исторический контекст

Конец XVIII и начало XIX века были временем, когда математика все плотнее связывалась с наблюдениями и большими числовыми расчетами. Астрономические данные, геодезические съемки и физические измерения требовали методов, которые могли работать с ошибками и избыточными системами. Именно в этом контексте исключение неизвестных стало не просто школьным приемом, а рабочим инструментом науки. Гаусс важен для сайта тем, что соединяет линейные системы, вычислительную дисциплину и метод наименьших квадратов. Его имя помогает показать пользователю, зачем нужны матрицы, расширенные матрицы и ступенчатые формы за пределами учебного примера 2 x 2.

Вклад в формулы

На сайте Гаусс связан с методом исключения, прямым ходом, обратной подстановкой, ступенчатым видом и дальнейшими темами вроде нормальных уравнений. Его вклад стоит объяснять аккуратно: он не единолично придумал все операции со строками, но его работы и вычислительная практика сделали исключение неизвестных частью устойчивой европейской традиции. Такая атрибуция полезна читателю, потому что показывает происхождение алгоритма и одновременно не искажает историю. Для будущих разделов Гаусс также будет связан с методом наименьших квадратов, распределением ошибок и геодезическими расчетами.

Связь с формулами

С этим именем связано 46 формул: Сумма первых n членов арифметической прогрессии, Поток векторного поля через поверхность, Дивергенция векторного поля и еще 43. Ниже можно открыть каждую формулу, посмотреть обозначения, пример и историческую справку.

Библиография

Britannica. Carl Friedrich Gauss.
Carl Friedrich Gauss. Theoria motus corporum coelestium in sectionibus conicis solem ambientium, 1809.
Althoen and McLaughlin. Gauss-Jordan Reduction: A Brief History, American Mathematical Monthly, 1987.
Grcar. How ordinary elimination became Gaussian elimination.

Связанные формулы

Сумма первых n членов арифметической прогрессии

Сумма первых n членов арифметической прогрессии равна среднему арифметическому первого и n-го членов, умноженному на число членов.

$S_n=\frac{a_1+a_n}{2}\cdot n$

Поток векторного поля через поверхность

Поток показывает, какая часть поля проходит через поверхность со стороны нормали. Это ориентированная величина: положительный вклад дает выход или вход в зависимости от принятой ориентации поверхности.

$\Phi=\iint_S \mathbf F\cdot \mathbf n\,dS=\iint_S (P n_1+Q n_2+R n_3)\,dS$

Дивергенция векторного поля

Дивергенция измеряет локальную плотность источников и стоков поля: насколько в этой точке поле «вытекает» или «втягивается» из окрестности. Она служит точной связкой между локальной производной поля и глобальным потоком через границу.

$\nabla\cdot\mathbf F=\frac{\partial P}{\partial x}+\frac{\partial Q}{\partial y}+\frac{\partial R}{\partial z}$

Теорема Гаусса-Остроградского

Теорема Гаусса-Остроградского переводит объемный интеграл дивергенции в поток через границу замкнутой области. Это ключевая связь локальных источников и глобального выхода поля.

$\iiint_V (\nabla\cdot\mathbf F)\,dV=\iint_{\partial V}\mathbf F\cdot\mathbf n\,dS$

Теорема Стокса

Теорема Стокса связывает поток ротора через поверхность с интегралом 2 рода по ее ориентированному краю. Она обобщает идею Грина на трехмерные поверхности и связывает локальную завихренность с граничной циркуляцией.

$\iint_S (\nabla\times\mathbf F)\cdot \mathbf n\,dS=\oint_{\partial S}\mathbf F\cdot d\mathbf r$

Матричная форма системы линейных уравнений

Матричная форма Ax = b записывает систему линейных уравнений как произведение матрицы коэффициентов на столбец неизвестных. Такая запись позволяет решать систему не как набор отдельных строк, а как единый линейный объект.

$Ax=b$

Расширенная матрица системы

Расширенная матрица [A|b] объединяет коэффициенты системы и правые части в одну таблицу. Она нужна для метода Гаусса, потому что при преобразовании строк меняются и коэффициенты, и правые части.

$\left[A\mid b\right]$

Элементарные преобразования строк

Элементарные преобразования строк - это три допустимые операции, которые заменяют систему на эквивалентную: перестановка строк, умножение строки на ненулевое число и прибавление кратной строки.

$R_i\leftrightarrow R_j,\quad R_i\leftarrow cR_i\ (c\ne0),\quad R_i\leftarrow R_i+cR_j$

Прямой ход метода Гаусса

Прямой ход метода Гаусса зануляет коэффициенты под ведущими элементами. В результате система приводится к ступенчатому виду, из которого решение находят обратной подстановкой.

$R_i\leftarrow R_i-\frac{a_{ik}}{a_{kk}}R_k$

Обратная подстановка в методе Гаусса

Обратная подстановка находит неизвестные после прямого хода метода Гаусса. Она идет снизу вверх по ступенчатой системе: сначала последняя ведущая переменная, затем предыдущие.

$x_i=\frac{b'_i-\sum_{j=i+1}^{n}u_{ij}x_j}{u_{ii}}$

Ступенчатый вид матрицы

Ступенчатый вид матрицы - это форма, где ведущие элементы ненулевых строк смещаются вправо при движении вниз, а под каждым ведущим элементом стоят нули.

$p_1<p_2<\dots<p_r,\quad a_{ij}=0\ \text{ниже ведущих элементов}$

Приведенный ступенчатый вид матрицы

Приведенный ступенчатый вид, или RREF, усиливает обычный ступенчатый вид: каждый ведущий элемент равен 1, а в его столбце все остальные элементы равны 0.

$\operatorname{rref}(A)$

Метод Гаусса-Жордана

Метод Гаусса-Жордана продолжает метод Гаусса до приведенного ступенчатого вида. Если система имеет единственное решение, расширенная матрица превращается в [I|x], и ответ читается сразу.

$\left[A\mid b\right]\sim\left[I\mid x\right]$

Ранг расширенной матрицы системы

Ранг расширенной матрицы показывает, добавляет ли столбец правых частей новое независимое условие к строкам матрицы коэффициентов. Это ключ к проверке совместности системы.

$\operatorname{rank}[A\mid b]$

Теорема Кронекера-Капелли

Теорема Кронекера-Капелли дает точный критерий совместности линейной системы: решение существует тогда и только тогда, когда ранги матрицы коэффициентов и расширенной матрицы равны.

$\operatorname{rank}A=\operatorname{rank}[A\mid b]$

Условие несовместности линейной системы

Линейная система несовместна, если ранг расширенной матрицы больше ранга матрицы коэффициентов. Это означает, что правые части добавляют противоречивое условие, которое нельзя получить из левых частей уравнений.

$\operatorname{rank}A<\operatorname{rank}[A\mid b]$

Условие бесконечного числа решений линейной системы

Совместная линейная система имеет бесконечно много решений, если общий ранг меньше числа неизвестных. Тогда остаются свободные переменные, и все решения описываются параметрами.

$\operatorname{rank}A=\operatorname{rank}[A\mid b]<n$

Число свободных переменных в линейной системе

В совместной линейной системе число свободных переменных равно числу неизвестных минус ранг матрицы коэффициентов. Эти переменные становятся параметрами общего решения.

$k=n-\operatorname{rank}A$

Общее решение линейной системы через параметры

Общее решение совместной линейной системы записывают как одно частное решение плюс линейную комбинацию направлений однородной системы. Параметров столько, сколько свободных переменных.

$x=x_p+t_1v_1+\cdots+t_kv_k$

Размерность пространства решений однородной системы

Размерность пространства решений однородной системы Ax = 0 равна числу неизвестных минус ранг матрицы A. Это частный и особенно важный случай подсчета свободных переменных.

$\dim\ker A=n-\operatorname{rank}A$

Ядро линейного отображения

Ядро линейного отображения - это множество всех векторов, которые переходят в нулевой вектор. По ядру сразу видно, теряет ли отображение информацию и может ли оно быть инъективным.

$\ker T=\{v\in V\mid T(v)=0\}$

Дефект линейного отображения

Дефект линейного отображения равен размерности его ядра. Он показывает, сколько независимых входных направлений отображение переводит в ноль.

$\operatorname{def}T=\dim\ker T$

Теорема о ранге и дефекте

Теорема о ранге и дефекте говорит, что размерность исходного пространства равна сумме размерности образа и размерности ядра линейного отображения.

$\dim V=\operatorname{rank}T+\dim\ker T$

Критерий инъективности линейного отображения через ядро

Линейное отображение инъективно тогда и только тогда, когда его ядро состоит только из нулевого вектора. Ненулевое ядро означает потерю различимости входов.

$T\text{ injective}\iff\ker T=\{0\}$

Размерности ядра и образа матрицы

Если матрица A имеет n столбцов и ранг r, то размерность ее ядра равна n-r, а размерность образа равна r. Это матричная форма теоремы о ранге и дефекте.

$\dim\ker A=n-r,\quad \dim\operatorname{Im}A=r$

Базис векторного пространства

Базис векторного пространства - это набор векторов, который одновременно порождает все пространство и не содержит лишних зависимых направлений. Через базис любой вектор записывается единственным способом.

$B=(e_1,\ldots,e_n),\quad V=\operatorname{span}B,\quad e_1,\ldots,e_n\ \text{линейно независимы}$

Координаты вектора в базисе

Координаты вектора в базисе - это коэффициенты единственного разложения вектора по базисным векторам. Сам вектор не меняется, меняется только числовая запись относительно выбранного базиса.

$v=x_1e_1+\cdots+x_ne_n,\quad [v]_B=(x_1,\ldots,x_n)^T$

Лемма Штейница о замене

Лемма Штейница о замене формализует идею, что независимых направлений не может быть больше, чем в порождающем наборе. Из нее следуют равенство числа векторов в любых базисах и корректность понятия размерности.

$L\text{ независим},\ G\text{ порождает }V\quad\Rightarrow\quad |L|\le |G|$

Обратное линейное отображение и обратная матрица

Если линейное отображение T представлено обратимой квадратной матрицей A, то обратное отображение представлено матрицей A^{-1}. Это верно при согласованных базисах.

$T^{-1}\text{ существует }\Longleftrightarrow A^{-1}\text{ существует},\quad [T^{-1}]=A^{-1}$

Разложение вектора на параллельную и перпендикулярную части

Любой вектор раскладывается на компоненту вдоль u и ортогональную остаточную часть. Эта формула связывает вычисление с геометрическим смыслом ортогонального разложения: она показывает, какая часть вектора идет вдоль выбранного направления, а какая остается поперек него.

$v=\operatorname{proj}_{u}(v)+\left(v-\operatorname{proj}_{u}(v)\right),\quad u^{\top}\left(v-\operatorname{proj}_{u}(v)\right)=0$

Коэффициенты R через скалярные произведения

После построения Q каждую колонку a_j раскладывают по уже найденным q_i. Эта формула относится к ортогонализации столбцов матрицы и объясняет, как заменить исходный набор векторов ортонормированным базисом с верхнетреугольными коэффициентами перехода.

$R_{ij}=q_i^{\top}a_j,\quad a_j=\sum_{i=1}^{j}R_{ij}q_i,\quad R_{ij}=0\ (i>j)$

Наименьшие квадраты через QR

После QR-раскладывания задача минимизации сводится к решению треугольной системы. Формула показывает устойчивый способ работать с задачей наименьших квадратов через ортогональную геометрию, а не через прямое обращение матрицы или слепое использование нормальных уравнений.

$\hat{x}=R^{-1}Q^{\top}b,\quad A=QR$

Нормальные уравнения в QR-форме

Из A=QR получаем эквивалентное равенство через R, сохраняя идею нормальных уравнений. Формула показывает устойчивый способ работать с задачей наименьших квадратов через ортогональную геометрию, а не через прямое обращение матрицы или слепое использование нормальных уравнений.

$A^T A x = A^T b,\quad R^T R x = R^T Q^T b$

Остаток в задаче ЛС и его ортогональность

Оптимальный LS-решение дает остаток, перпендикулярный всем столбцам A (и столбцам Q). Формула показывает устойчивый способ работать с задачей наименьших квадратов через ортогональную геометрию, а не через прямое обращение матрицы или слепое использование нормальных уравнений.

$r=b-A\hat{x},\quad A^T r=0,\quad Q^T r=0$

Критерий наименьших квадратов

Критерий наименьших квадратов измеряет суммарную квадратичную ошибку между наблюдаемым вектором b и моделью Ax, поэтому превращает переопределенную систему в задачу минимизации.

$\hat x_{\mathrm{LS}}=\arg\min_{x\in\mathbb R^n} \|Ax-b\|_2^2 = \arg\min_x (Ax-b)^\top (Ax-b).$

Нормальные уравнения для МНК

Нормальные уравнения A^T A x = A^T b задают стационарное условие задачи МНК и позволяют найти параметры, при которых остаток ортогонален всем столбцам матрицы A.

$A^\top A\,\hat x = A^\top b.$

Ортогональность невязки

Ортогональность невязки означает, что в оптимальном МНК-решении остаток r=b-Ax перпендикулярен каждому столбцу A и не содержит направления, которое можно еще улучшить моделью.

$r=b-A\hat x,\quad A^\top r=0.$

Явная формула решения МНК через обратную матрицу

Если столбцы A линейно независимы, решение МНК можно записать явно как x=(A^T A)^{-1}A^T b, потому что матрица A^T A становится обратимой.

$\hat x=(A^\top A)^{-1}A^\top b,\qquad A^\top A\ \text{невырождена}.$

Холѐцкое разложение нормальных уравнений

Разложение Холецкого применяет положительную определенность A^T A и заменяет решение нормальных уравнений двумя треугольными системами.

$A^\top A = LL^\top,\; L y=A^\top b,\; L^\top \hat x = y.$

Число обусловленности для задачи МНК

При переходе к нормальным уравнениям число обусловленности фактически возводится в квадрат, поэтому ошибки округления и шум в данных могут заметно усилиться.

$\kappa_2(A^\top A)=\frac{\sigma_{\max}^2}{\sigma_{\min}^2}=\kappa_2(A)^2.$

QR-разложение для задачи МНК

QR-разложение решает задачу МНК без формирования A^T A: если A=QR, то параметры находятся из треугольной системы R x = Q^T b.

$A=QR,\quad Q^\top Q=I,\quad \|Ax-b\|_2^2=\|Rx-Q^\top b\|_2^2+\|Q_\perp^\top b\|_2^2.$

Псевдообратная для решения МНК

Псевдообратная матрица A^+ записывает МНК-решение как x=A^+b и обобщает обратную матрицу на прямоугольные и вырожденные системы.

$\hat x=A^+b,\qquad A^+=(A^\top A)^{-1}A^\top\ (\operatorname{rank}(A)=n).$

Проекционный оператор и оценка МНК

Матрица P=A(A^T A)^{-1}A^T проецирует b на пространство столбцов A, а вектор Pb является предсказанием модели МНК. Эта запись важна не как отдельный трюк, а как часть практического языка линейных моделей и обработки измерений.

$\hat b = A\hat x = A A^+ b,\qquad P=AA^+,\ P^\top=P,\ P^2=P.$

2×2 нормальные уравнения без полной инверсии

Малую систему нормальных уравнений 2×2 можно решить вручную через определитель или исключение, не строя полную обратную матрицу.

$\begin{aligned} \begin{bmatrix}c_{11} & c_{12}\\ c_{12} & c_{22}\end{bmatrix}\begin{bmatrix}x_1\\x_2\end{bmatrix}=\begin{bmatrix}d_1\\d_2\end{bmatrix},\;\Delta=c_{11}c_{22}-c_{12}^2,\\ x_1=\frac{c_{22}d_1-c_{12}d_2}{\Delta},\quad x_2=\frac{-c_{12}d_1+c_{11}d_2}{\Delta}. \end{aligned}$

Дополнение Шура

Дополнение Шура выражает эффективный блок матрицы после исключения другого блока. Оно появляется при блочном обращении матриц, решении систем, вычислении определителей и условных распределениях в статистике.

$S=D-CA^{-1}B$

Обратная блочной матрицы через дополнение Шура

Формула обращает блочную матрицу через обратный блок A и обратное дополнение Шура. Она показывает, как получить обратную матрицу без обращения всей матрицы целиком.

$\begin{pmatrix}A&B\\C&D\end{pmatrix}^{-1}=\begin{pmatrix}A^{-1}+A^{-1}BS^{-1}CA^{-1}&-A^{-1}BS^{-1}\\-S^{-1}CA^{-1}&S^{-1}\end{pmatrix},\quad S=D-CA^{-1}B$