Математика / Матрицы, определители

Экстремумы квадратичной формы на сфере

На единичной сфере максимум и минимум квадратичной формы достигаются на собственных векторах, соответствующих λ_max и λ_min.

Опубликовано: Обновлено:

Формула

$$\lambda_{\min} \le \frac{x^T A x}{x^T x} \le \lambda_{\max}, \quad A=A^T.$$
diagram Rayleigh quotient на сфере

Иллюстрация, как квадратичная форма принимает минимальные и максимальные значения на собственных направлениях.

Главные оси определяют экстремальные направления.

Обозначения

$\lambda_{\min}$
минимальное собственное значение, скаляр
$\lambda_{\max}$
максимальное собственное значение, скаляр
$x$
единичный вектор (x^T x=1), вектор
Rayleigh quotient
отношение x^T A x / (x^T x), скаляр

Условия применения

  • A должна быть симметричной.
  • x не равен нулю; часто берут ||x||=1.
  • Для экстремумов используется существование полного ортонормированного базиса собственных векторов.

Ограничения

  • При кратных собственных значениях extrema достигаются на подпространствах.
  • Для несимметричных A критерий в таком виде не работает.
  • Для бесконечных размерностей используются функциональные аналоги.

Подробное объяснение

Переход в главные оси даёт q=Σ λ_i z_i² с Σ z_i²=1. Тогда максимум суммы при ограничении единичной сферы очевиден.

Квадратичная форма переводит полином второй степени на язык матриц. Это полезно потому, что геометрические свойства формы становятся спектральными свойствами симметричной матрицы: собственные векторы задают главные направления, собственные значения показывают растяжение и знак вдоль этих направлений, а определенность отвечает за форму поверхности около начала координат. Для "Экстремумы квадратичной формы на сфере" важно различать три уровня: явный полином, матричную запись и геометрическую интерпретацию. Переход между ними позволяет не только считать значения, но и понимать, является ли форма положительной, отрицательной, вырожденной или неопределенной. В задачах оптимизации это связано с минимумами и максимумами, а в геометрии - с приведением к главным осям и классификацией квадрик.

Как пользоваться формулой

  1. Найди λ_i и соответствующие eigenvectors.
  2. Сделай замену в главные оси.
  3. Определи max as λ_max и min as λ_min.
  4. Интерпретируй направление роста формы как главный растягивающий вектор.

Историческая справка

Результат тесно связан с вариационным определением собственных значений и широко используется в оптимизации и механике.

Квадратичные формы изучали задолго до современной матричной записи: они возникали в теории чисел, аналитической геометрии, механике и исследовании поверхностей второго порядка. В XIX веке развитие матриц, определителей и линейных преобразований сделало возможной компактную запись x^T A x и систематическое приведение форм к каноническому виду. Позже этот аппарат стал основой для оптимизации, статистики, механики и численных методов.

В учебных курсах этот исторический слой важен потому, что квадратичные формы объединяют разные области: классификацию поверхностей, устойчивость равновесий, метод главных осей, статистические ковариации и локальный анализ функций многих переменных.

Историческая линия формулы

Развитие через спектральную теорию самосопряжённых операторов. Тему корректнее связывать с общей историей теории форм, матриц и спектральных методов. Вклад внесли многие математики XIX века; отдельную школьную или вузовскую формулу здесь нельзя честно приписать одному автору.

Пример

A=diag(4,1): при ||x||=1, q минимально 1 и максимально 4. Дополнительная проверка для "Экстремумы квадратичной формы на сфере": после преобразования нужно сравнить исходный полином и матричную запись на нескольких простых векторах, например на базисных e_i и на суммах e_i+e_j. Это быстро выявляет ошибку в коэффициенте при смешанном члене: в матрице симметричной квадратичной формы половина коэффициента стоит в двух зеркальных позициях. Если для тестового вектора значения не совпадают, дальнейшие выводы о собственных значениях, главных осях или определенности будут неверными даже при аккуратной алгебре.

Частая ошибка

Ожидать, что экстремум достигается на случайной оси; его дают ровно собственные направления. Самая частая ошибка - перепутать коэффициент смешанного члена. Если в полиноме стоит 2bxy, то в симметричной матрице стоят b и b; если стоит bxy, то в матрице должны стоять b/2 и b/2. Также нельзя применять критерии положительной определенности к несимметричной матрице без перехода к симметричной части, потому что антисимметричная часть в x^T A x не влияет.

Практика

Задачи с решением

Найти экстремумы на единичной сфере

Условие. A=diag(4,1).

Решение. λ_min=1, λ_max=4.

Ответ. min = 1, max = 4.

Неоднозначность при нуле

Условие. A=diag(3,0,-1), ||x||=1.

Решение. λ_min=-1, λ_max=3, возможны также состояния q=0 для векторов с x_2=1 и остальными 0.

Ответ. Интервал значений: [-1, 3].

Дополнительные источники

  • Golub & Van Loan, Matrix Computations
  • Trefethen & Bau, Numerical Linear Algebra

Связанные формулы

Математика

Ортогональная диагонализация симметричной матрицы квадратичной формы

$A=Q\Lambda Q^T, \quad Q^TQ=I, \quad Q=[q_1\dots q_n], \; q(x)=x^T A x=(Q^Tx)^T \Lambda (Q^Tx).$

Для симметричной A всегда существует ортогональная матрица собственных векторов, которая переводит квадратичную форму в диагональный вид и задаёт главные оси.

Математика

Устранение смешанного члена в 2D

$q(x,y)=ax^2+2bxy+cy^2, \quad \tan 2\theta=\frac{2b}{a-c}, \quad q = \lambda_1 u^2 + \lambda_2 v^2.$

В плоскости поворот координат на θ (u,v) убирает смешанный член q. Главные оси соответствуют направлениям, где кросс-термин исчезает.

Математика

Канонический вид в главных осях

$q(x)=x^T A x = z^T\Lambda z = \sum_{i=1}^{n}\lambda_i z_i^2, \quad x=Qz.$

В координатах главных осей квадратичная форма становится суммой квадратов с весами-коэффициентами λ_i, что упрощает классификацию многообразий.