Матрица А линейного оператора А при замене базиса преобразуется согласно формуле А’ = U -1 AU, где U — матрица перехода (см. теорему 4.6). Если речь идет об евклидовом пространстве и переходе из одного ортонормированного базиса в другой, матрица перехода U является ортогональной (см. теорему 7.5). Согласно свойству 7.2, такая матрица удовлетворяет соотношению U -1 = U T . Поэтому для случая ортонормиро- ванных базисов формулу преобразования матрицы линейного оператора можно записать следующим образом:
Теорема 7.7. Для любой симметрической матрицы М существует такая ортогональная матрица U, что U T MU = Λ, где Λ = diag(λ1, . λn) — диагональная матрица, диагональными элементами которой являются собственные значения матрицы М, повторяющиеся согласно их кратности.
◄ Доказательство теоремы основано на следствии 6.4, теореме 7.5 и свойстве 7.2. Согласно следствию 6.4, для симметрической матрицы М порядка n существует такая невырожденная матрица Р, что Р -1 МР = Λ = diag(λ1, . λn), где в последовательности λ1, . λn указаны все собственные значения матрицы М с учетом их кратностей. Из доказательства того же следствия вытекает, что Р является матрицей перехода между ортонормированными базисами. Поэтому Р — ортогональная матрица (см. теорему 7.5) и Р -1 = Р T (см. свойство 7.2). Следовательно, Р T МР = Р -1 МР = Λ, т.е. в качестве матрицы U в формулировке теоремы можно взять Р. ►
Преобразование (7.5) с ортогональной матрицей U иногда называют ортогональным преобразованием матрицы А. Поэтому теорему 7.7 можно сформулировать так: любая симметрическая матрица ортогональным преобразованием приводится к диагональному виду. Чтобы найти соответствующую матрицу U, о которой говорится в этой теореме, необходимо:
1) найти собственные значения матрицы М;
2) для каждого собственного значения найти набор собственных векторов, соответствующих этому собственному значению, при этом эти собственные векторы должны быть линейно независимыми и их количество должно равняться кратности собственного значения;
3) преобразовать системы собственных векторов, полученные для каждого собственного значения, в ортонормированные при помощи процесса ортогонализации Грама — Шмидта. Объединить ортонормированные системы для каждого собственного значения в единую систему векторов, которая будет ортонормированным базисом евклидова пространства;
4) выписать матрицу U, столбцами которой являются координаты векторов построенной ортонормированной системы.
Пример 7.4. Найдем ортогональное преобразование, приводящее симметрическую матрицу
к диагональному виду.
1. Находим собственные значения матрицы А. Для этого составляем ее характеристическое уравнение
Это уравнение третьей степени. Так как его коэффициенты являются целыми числами, то целое число может быть его корнем лишь в случае, если оно делитель свободного члена. Поэтому мы можем поискать корни среди чисел ±1, ±2, ±5. Подстановкой в уравнение убеждаемся, что одним из корней является λ1 = 1.
Найденный корень позволяет разложить левую часть харак-теристического уравнения на линейный и квадратичный мно-жители, например, при помощи деления характеристического многочлена на х — 1 "в столбик"
(λ — 1)(λ 2 — 11λ + 10) =0,
откуда находим оставшиеся два корня λ2 = 1, λ3 = 10. Таким образом, имеются два собственных значения: 1 кратности 2 и 10 кратности 1.
2-3. Найдем для собственного значения λ1,2 = 1 кратности 2 два линейно независимых собственных вектора. Для этого нужно найти фундаментальную систему решений однородной системы линейных алгебраических уравнений (А — Е)х = 0, т.е. системы
Ранг матрицы этой системы равен единице (все строки матрицы системы пропорциональны), поэтому можно отбросить второе и третье уравнения, оставив первое
В качестве независимых переменных выбираем x2, х3. Фундаментальную систему решений составляют x2 = 1, х3 = 0, х1 = — 2 и x2 = 0, х3 = 1, x1 = 2, т.е. векторы
Найденные собственные векторы, соответствующие собственному значению λ1,2 = 1, линейно независимы, но ортогональными не являются. Построим по ним другую, ортонормированную пару собственных векторов е1, e2 при помощи метода ортогонализации Грама — Шмидта:
Для собственного значения λ3 = 10 система линейных алгебраических уравнений имеет вид (А — 10Е)х = 0, или
В качестве ее фундаментальной системы решений можно взять одно ненулевое решение, например вектор b3 = (1 2 -2) T . Нормируя этот вектор, получаем
Найденные векторы e1, е2, е3 образуют ортонормированный базис из собственных векторов.
4. Составим из найденных векторов еi матрицу
которая и является искомой.
Убедиться в том, что матрица U определена правильно, можно при помощи подстановки матрицы U и заданной матрицы А в следующее тождество:
Замечание 7.4. В случае n = 3 при λ1 = λ2 ≠ λ3 собственные векторы удобнее с точки зрения экономии вычислений находить в следующем порядке. Сначала для собственного значения кратности 1 (λ3 = 10 в рассмотренном примере) найти собственный вектор и нормировать его. Обозначим полученный вектор, например, е3. Затем для собственного значения кратности 2 (λ1,2 = 1 в рассмотренном примере) найти один собственный вектор и нормировать его. Получим вектор e1. Векторы е1 и е3 будут ортогональными согласно теореме 6.4. Недостающий третий вектор ортонормированного базиса может быть найден при помощи векторного произведения: е2 = e1 × е3.
Описанный прием позволяет избежать процесса ортогона- лизации. Точно так же можно не применять процесс ортогона- лизации при n = 2, так как, зная один вектор е1 ортонормированного базиса, мы можем получить второй поворотом первого на 90°. Для этого достаточно поменять две координаты вектора e1 местами, а у первой из них к тому же изменить знак. При n > 3 приемов, аналогичных описанным, нет.
Квадратные матрицы [math]A[/math] и [math]B[/math] n-го порядка называются подобными , если существует такая невырожденная матрица [math]S
Преобразование матрицы [math]A[/math] по формуле [math]S^<-1>AS[/math] называется преобразованием подобия , а матрица [math]S[/math] — преобразующей .
Свойства подобных матриц
1. Каждая квадратная матрица подобна самой себе: [math]A=E^<-1>AE[/math] .
2. Если матрица [math]B[/math] подобна матрице [math]A[/math] , то и [math]A[/math] подобна [math]B:[/math]
A=T^<-1>cdot Bcdot T[/math] при [math]T=S^<-1>[/math] .
3. Если матрица [math]A[/math] подобна матрице [math]B[/math] , а [math]B[/math] подобна [math]C[/math] , то [math]A[/math] подобна [math]C:[/math]
A=P^<-1>cdot Bcdot P[/math] , где [math]P=Tcdot S[/math] .
4. Подобие является частным случаем эквивалентных преобразований.
5. В случае ортогональности преобразующей матрицы подобные матрицы являются конгруэнтными.
Поясним свойства 4, 5. Напомним, что эквивалентные матрицы связаны соотношением [math]B=SAT[/math] , где [math]S[/math] и [math]T[/math] — невырожденные (элементарные) матрицы. Если [math]T=S^<-1>[/math] , то получаем преобразование подобия [math]B=SAS^<-1>Leftrightarrow A=S^<-1>BS[/math] . Если же матрица [math]S[/math] ортогональная [math](S^<-1>=S^T)[/math] , то подобные матрицы, связанные равенством [math]B=S^<-1>AS[/math] , оказываются конгруэнтными, так как [math]B=S^TAS[/math] .
Подобные матрицы возникают во многих алгебраических задачах при замене переменных. Например, при решении системы уравнений [math]Ax=b[/math] с невырожденной квадратной матрицей [math]A[/math] можно сделать линейную замену неизвестных: ввести столбец [math]y[/math] — новых неизвестных [math](x=Sy)[/math] и новый столбец свободных членов с [math](b=Sc)[/math] , для которых система уравнений будет выглядеть так
Матрица [math]S^<-1>AS=Lambda[/math] полученной системы подобна матрице исходной системы. Например, если в результате преобразования подобия полученная матрица [math]Lambda[/math] имеет диагональный вид: [math]Lambda=operatorname
Приведение матрицы к диагональному виду при помощи преобразования подобия
Рассмотрим задачу приведения квадратной матрицы [math]A[/math] к диагональному виду [math]Lambda=operatorname
Теорема 7.5 о приведении матрицы к диагональному виду. Для того чтобы квадратная матрица [math]A[/math] n-го порядка приводилась к диагональному виду [math]Lambda=S^<-1>AS[/math] , необходимо и достаточно, чтобы она имела [math]n[/math] линейно независимых собственных векторов.
Действительно, запишем равенство [math]Lambda=S^<-1>AS[/math] в виде [math]SLambda=AS[/math] , т.е.
или [math]egin
Поэтому, если матрицу [math]A[/math] можно привести преобразованием подобия к диагональному виду [math]Lambda=S^<-1>AS[/math] , то для столбцов матрицы [math]S[/math] выполняются равенства (7.18), т.е. столбцы [math]s_i[/math] являются собственными векторами матрицы [math]A[/math] , причем они линейно независимы, так как матрица [math]S[/math] невырожденная. Необходимость доказана. Пусть, наоборот, матрица [math]A[/math] имеет [math]n[/math] линейно независимых собственных векторов [math]s_i[/math] , удовлетворяющих (7.18). Тогда, составив из них матрицу [math]S[/math] , получим для нее равенство [math]SLambda=AS[/math] , равносильное (7.18). Учитывая, что матрица [math]S[/math] невырожденная (из-за линейной независимости ее столбцов), получаем [math]Lambda=S^<-1>AS[/math] , т.е. матрица [math]A[/math] подобна диагональной. Достаточность доказана.
Следствие 1. Если матрица имеет простой спектр, то она приводится к диагональному виду.
Действительно, в этом случае по свойству 1 собственных векторов все собственные векторы будут линейно независимы.
Следствие 2. Если матрица [math]A[/math] приводится к диагональному виду [math]Lambda=S^<-1>AS=operatorname
Следствие 3. Если [math]s_1,ldots,s_n[/math] — линейно независимые собственные векторы матрицы [math]A[/math] , соответствующие ее собственным значениям [math]lambda_1,lambda_2,ldots,lambda_n[/math] (среди которых могут быть равные), то матрица [math]A[/math] приводится к диагональному виду [math]Lambda=S^<-1>AS= operatorname
Чтобы привести квадратную матрицу [math]A[/math] (n-го порядка) к диагональному виду при помощи преобразования подобия [math]Lambda=S^<-1>AS[/math] и найти преобразующую матрицу [math]S[/math] , нужно выполнить следующие действия.
1. Найти л линейно независимых собственных векторов [math]s_1,ldots,s_n[/math] матрицы [math]A[/math] (при этом использовать алгоритм в разд. 7.2.1 с учетом пункта 2 замечаний 7.5).
2. Из собственных векторов [math]s_1,ldots,s_n[/math] составить преобразующую матрицу [math]S=egin
3. По собственным значениям матрицы [math]A[/math] составить матрицу [math]Lambda= operatorname
Пример 7.9. Привести данные матрицы к диагональному виду и найти соответствующие преобразующие матрицы:
Решение. Матрица [math]A[/math] . 1. Собственные векторы и собственные значения этой матрицы были найдены в примере 7.8. Для собственных значений [math]lambda_1=2[/math] и [math]lambda_2=7[/math] возьмем соответствующие собственные векторы (полагая [math]C_1=1,
s_2=egin
2. Составляем из собственных векторов преобразующую матрицу [math]S=egin
3. Находим диагональный вид [math]Lambda[/math] матрицы [math]A[/math] , выполняя преобразование подобия:
На главной диагонали (согласно следствию 2 теоремы 7.5) стоят собственные значения матрицы [math]A[/math] .
Матрица [math]B[/math] . 1. Собственные векторы и собственные значения этой матрицы были найдены в примере 7.8. Для собственных значений [math]lambda_1=1+2i[/math] и [math]lambda_2=1-2i[/math] возьмем соответствующие собственные векторы (полагая [math]C_1=1,
s_2=egin
2. Составляем из собственных векторов преобразующую матрицу [math]S=egin
На главной диагонали матрицы [math]Lambda[/math] стоят (согласно следствию 2 теоремы 7.5) собственные значения матрицы [math]B[/math] .
Матрица [math]C[/math] . Найдем собственные векторы матрицы [math]C[/math] , используя алгоритм, изложенный в разд.7.2.1.
1. Составляем характеристический многочлен [math]Delta_
2. Решаем характеристическое уравнение [math](lambda-2)^2=0
3. Для собственного значения [math]lambda=2[/math] составляем однородную систему уравнений [math](C-2E)x=o[/math] , которую решаем методом Гаусса. Приводим расширенную матрицу системы к упрощенному виду
Ранг матрицы равен единице [math](r=1)[/math] , количество неизвестных [math]n=2[/math] . Поэтому фундаментальная система решений содержит [math]n-r=1[/math] решение. Выражаем базисную переменную [math]x_1[/math] через свободную: [math]x_1=-2x_2[/math] . Полагая [math]x_2=1[/math] , находим решение [math]varphi_1=egin
4. Все собственные векторы, соответствующие собственному значению [math]lambda=2[/math] , имеют вид [math]s=C_1varphi_1=C_1! egin
Как видим, матрица [math]C[/math] второго порядка имеет только один линейно независимый собственный вектор, поэтому ее нельзя привести к диагональному виду при помощи преобразования подобия.
Пример 7.10. Привести матрицу [math]A=egin
Решение. 1. Собственные векторы и собственные значения этой матрицы были найдены в примере 7.8. Выберем три линейно независимых собственных вектора (см. пример 7.8):
Векторы [math]s_1[/math] и [math]s_2[/math] соответствуют собственному значению [math]lambda=0[/math] , вектор [math]s_3[/math] -собственному значению [math]lambda=3[/math] .
2, 3. Составляем из этих собственных векторов преобразующую матрицу [math]S[/math] , при помощи которой матрица [math]A[/math] приводится к диагональному виду [math]Lambda:[/math]
Найдем m-ю степень матрицы [math]A[/math] , учитывая, что [math]A=SLambda S^<-1>:[/math]
Нетрудно получить степень [math]Lambda^m[/math] диагональной матрицы, так как произведение диагональных матриц является диагональной матрицей:
Связь подобия числовых матриц с эквивалентностью их характеристических матриц
Получим необходимое и достаточное условие подобия числовых квадратных матриц [math]A[/math] и [math]B[/math] n-го порядка. Напомним, что с этими числовыми матрицами связаны λ -матрицы [math](A-lambda E)[/math] и [math](B-lambda E)[/math] , которые называются характеристическими. Две λ -матрицы называются эквивалентными, если одна из них получена из другой при помощи элементарных преобразований. Согласно пункту 6 замечаний 7.4, если λ -матрицы [math]A(lambda)[/math] и [math]B(lambda)[/math] эквивалентны, то существуют такие обратимые λ -матрицы [math]S(lambda)[/math] и [math]T(lambda)[/math] , что [math]B(lambda)= S(lambda)A(lambda)T(lambda)[/math] .
Критерий подобия числовых матриц
Теорема 7.6 (критерий подобия числовых матриц). Для того чтобы числовые матрицы [math]A[/math] и [math]B[/math] были подобными необходимо и достаточно, чтобы их характеристические λ -матрицы [math](A-lambda E)[/math] и [math](B-lambda E)[/math] были эквивалентны.
В самом деле, если числовые матрицы подобны, т.е. [math]B=S^<-1>AS[/math] , то
Значит, характеристические матрицы эквивалентны, так как числовую матрицу [math]S[/math] можно считать частным случаем λ -матрицы, а невырожденная числовая матрица является элементарной (следствие 3 теоремы 3.3). Необходимость доказана.
Для доказательства достаточности запишем условие эквивалентности λ -матриц [math](A-lambda E)[/math] и [math](B-lambda E)[/math] :
Разделим λ -матрицу [math]S^<-1>(lambda)[/math] слева на [math](A-lambda E)[/math] , а λ -матрицу [math]T(lambda)[/math] справа на [math](B-lambda E):[/math]
Здесь остатки [math]S_0[/math] и [math]T_0[/math] — обратимые числовые матрицы, так как [math]S^<-1>(lambda)[/math] и [math]T(lambda)[/math] — обратимые λ -матрицы (см. пункт 3 замечаний 7.3). Подставим выражения (7.20) в (7.19):
Отсюда следует, что [math]S_1(lambda)=T_1(lambda)[/math] , в противном случае равенство ложное, так как степень многочлена в левой части не менее второй, а в правой части — не более первой. При [math]S_1(lambda)=T_1(lambda)[/math] получаем
Сравнивая это равенство с (7.19), делаем вывод, что λ -матрицы [math]S^<-1>(lambda)[/math] и [math]T(lambda)[/math] в (7.19) можно заменить числовыми матрицами [math]S_0[/math] и [math]T_0[/math] . Приравнивая в (7.21) коэффициенты при одинаковых степенях [math]lambda[/math] , находим
Следовательно, [math]B=S_0^<-1>AS_0[/math] , т.е. матрицы [math]A[/math] и [math]B[/math] подобны.
Следствие. Если матрицы [math]A[/math] и [math]B[/math] подобны, т.е. [math]B=S_0^<-1>AS_0[/math] , то в качестве преобразующей матрицы [math]S_0[/math] можно взять матрицу [math]S_0=S_< ext
В самом деле, из доказательства теоремы следует, что λ -матрицы в (7.23) можно заменить числовыми матрицами:
где преобразующая матрица [math]T_0[/math] согласно (7.20) равна правому остатку при делении [math]T(lambda)[/math] на [math](B-lambda E)[/math] , который по теореме Безу равен правому значению [math]T_< ext
Как следует из теоремы 13.1, матрица линейного оператора зависит от базиса пространства. Как подобрать этот базис, чтобы матрица линейного оператора в нем имела наиболее простой вид? На этот вопрос отвечает следующая теорема.
Теоремa 14.1. Для того чтобы матрица линейного оператора A: R n ®R n в некотором базисе была диагональной, необходимо и достаточно, чтобы этот базис состоял из собственных векторов линейного оператора A.
Доказательство. Необходимость. Пусть матрица линейного оператора A в некотором базисе е l , е 2 . е n диагональная, т. е.
.
Тогда, очевидно, справедливы равенства Aе j = Lе j = ljе j , j = 1, 2. n, из которых следует, что lj – собственные значения, а е j – соответствующие им собственные векторы оператора A.
Достаточность. Предположим, что базис пространства состоит из собственных векторов x 1 , x 2 ,…, x n , а l1, l2,…, ln – соответствующие им собственные значения оператора A. Тогда Ax j = ljx j , j = 1, 2. n. Отсюда следует, что L = = diag (l1, l2,…, ln) – матрица линейного оператора A в базисе x 1 , x 2 ,…, x n .¨
Определение 14.1. Если существует базис пространства R n , состоящий из собственных векторов x 1 , x 2 ,…, x n линейного оператора A: R n ®R n с матрицей А в некотором базисе пространства R n , и Т – матрица перехода от этого базиса к базису x 1 , x 2 ,…, x n , то справедливо равенство
где L – диагональная матрица с собственными значениями, соответствующими собственным векторам оператора A, на главной диагонали. В этом случае матрица А линейного оператора A называется диагонализируемой.
Пример 1. Привести к диагональному виду матрицу
.
Решение. Для этой матрицы в примере 1 из §12.2 найдены собственные векторы x 1 = (–1, 1, 1), x 2 = (11, 1, –14) и x 3 = (1, 1, 1), соответствующие собственным значениям l1 = 1, l2 = – 2 и l3 = 3. Поскольку все собственные значения попарно различны, векторы x 1 , x 2 , x 3 образуют базис пространства R 3 согласно теореме 12.1. Значит, согласно определению 14.1 матрица А диагонализируема.
Составим матрицу перехода Т к базису x 1 , x 2 , x 3 , столбцами которой будут координаты данных базисных векторов.
diag (1, – 2, 3).·