Пропедевтическое. Нужна ли университетская алгебра-1? Курс алгебры-1 состоит из теории детерминантов и систем линейных уравнений; теории векторных пространств с одним эндоморфизмом; кусочка теории евклидовых пространств; кусочка теории многочленов. Он противопоставляется, с одной стороны, курсу геометрии: так, аффинные, проективные, метрические пространства изучаются отдельно. С другой стороны, курсу абстрактной алгебры: в алгебре-1 не используются группы, кроме отдельных утверждений о группе подстановок; теорема о ЖНФ не выводится из структурной теоремы о конечнопорожденных модулях над кольцами главных идеалов. Можно было бы решить, что вместо алгебры-1 нужно изучить сначала теорию множеств, потом общую алгебру, потом геометрию. Мне кажется, что не взлетит. Что в алгебре-1 есть что-то хорошее. Даже несмотря на то, что геометрия-1 - это, по сути, конечномерная линейная алгебра, а понятия общей алгебры могут существенно ускорить изучение линейки, всё же имеет смысл отдельно изучать сюжеты, связанные с чисто знаковыми манипуляциями, такими как классическое определение определителя или арифметика комплексных чисел. Кроме того, алгебра-1 даёт представление об алгебре сразу, не обязуя разобраться сперва в теоретико-множественных инструментах вроде леммы Цорна. Конечно, это означает, что даже бесконечномерные векторные пространства лучше не трогать: уже доказательство существования базиса Коши-Гамеля может показаться сложным. Но это доказательство никак не окупится, поскольку бесконечный базис Гамеля ни для чего и не нужен особенно, без него можно обойтись. Но это общие соображения, лучше разобрать всё подробнее.
1. Определители и линейные уравнения
Пусть есть n-мерное векторное пространство V. Любой его эндоморфизм можно продолжить до эндоморфизма n-й внешней степени, который окажется умножением на скаляр, поскольку n-я внешняя степень одномерна; этот скаляр называется определителем эндоморфизма (оператора, иными словами). Отсюда сразу же следует, что композиция операторов соответствует умножению определителей и что если подействовать оператором на параллелепипед, то его ориентированный объём умножится на определитель. Дальше с помощью двойственного базиса и простой тензорной алгебры получается явное выражение для определителя.
Я не представляю, как объяснить смысл этих слов людям, которые не знают тензорной алгебры и слабо понимают теорию множеств.
Итак, нужно каким-то образом изучать определители, не имея богатой теории. Уже это оправдывает существование алгебры-1. Конечно, встаёт вопрос, что же именно следует делать. Есть несколько старых подходов к изложению теории определителей. Первый подход - явно описать, что такое член определителя для квадратной матрицы, затем назвать определителем сумму всевозможных членов; альтернированная сумма "молний", как называл это Лузин. Второй подход - рекурсивно определить определитель через разложение по Лапласу, как написано, скажем, в учебнике Ильина-Позняка. Первый подход представляется мне несравненно более хорошим. Если уж идти кружным путём, то надо идти так, чтобы было красиво, чтобы все теоремы возникали как логическое достижение, а не брались за отправные аксиомы, от которых ни в какое путешествие отправляться не нужно (пришли уже). Красивые вещи, вытекающие одна из другой, запоминаются гораздо крепче, чем рандомный набор фактов. Кроме этих двух есть ещё один подход, чисто аксиоматический: определителем называется полилинейная кососимметрическая функция от столбцов матрицы, нормированная условием унитарности (равенство единице на единичной матрице); есть и другие варианты аксиоматик. При таком подходе существование и единственность определителя всё равно придётся доказывать, так что особого смысла пользоваться им я не вижу. Кроме того, несколько затуманивается равноправие строк и столбцов.
Итак, определитель (синоним - детерминант) квадратной матрицы - это сумма всевозможных членов определителя. Член определителя получается, когда мы из каждой строки матрицы выбираем по элементу таким образом, чтобы никакие два не были выбраны из одного и того же столбца; затем перемножаем эти элементы; затем дополнительно умножаем на (-1) в степени, равной четности подстановки, образованной номерами столбцов. Подчеркнём, что определитель бывает только у квадратной матрицы, у не-квадратных определителя нет (у них есть похожая штука, перманент, но далеко не такая полезная). К этому определению определителя уже возникает много вопросов. Например, почему оно такое запутанное? Что ещё за подстановки? Сколько всего бывает разных членов? Наконец, зачем нам, собственно, сдались все эти определители?
Проще всего ответить на предпоследний вопрос. Когда мы выбираем элемент из первой строки, у нас n вариантов сделать выбор. Когда из второй строки - уже (n-1) вариант, один из столбиков мы использовали на первом шаге. Когда выбираем из третьей строки, имеем (n-2) варианта. И так далее. Для предпоследней строки 2 варианта выбора, для последней - всего лишь один. Комбинаторика говорит нам, что количество вариантов выбрать член есть n×(n-1)×(n-2)×...×2×1 = n!. Получаем, что определитель квадратной матрицы - это сумма n! членов. То есть определитель - это довольно громоздкая штука: в определителе матрицы 5 на 5 будет 120 членов, а в определителе матрицы 10 на 10 уже свыше трёх миллионов членов. Никто в здравом уме не станет пытаться написать три миллиона членов. Следовательно, изучение определителей путём их явного выписывания бесперспективно. Определителями нужно пользоваться как-то иначе, как-то неявно. Уже здесь полезно подметить, что определитель диагональной матрицы имеет только один ненулевой член - произведение элементов главной диагонали; все остальные члены содержат нулевой сомножитель. Поэтому полезно было бы задаться целью по данной матрице научиться находить диагональную матрицу с таким же определителем. Это, как будет показано далее, возможно.
Чтобы объяснить, зачем нужны определители, нужно сказать, что их изучение - это, по сути, изучение систем линейных уравнений. Связь определителей с уравнениями вскрывают несколько ключевых теорем: теорема Крамера, теорема Кронекера-Капелли и теорема о методе Гаусса, доказательству этих трёх теорем будет посвящена вся дальнейшая теория определителей.
Где-нибудь здесь нужно рассказать, какие системы уравнений называются однородными, какие - совместными и несовместными. Какие - определёнными. Рассказать про метод Гаусса - чем раньше, чем лучше. И показать, что система однородных уравнений из менее чем n уравнений с n неизвестными обязательно имеет ненулевое решение.
На подстановках следует остановиться подробнее. Центральным понятием всей алгебры является группа. Оказывается, что никаких групп, кроме групп подстановок, не бывает; это называется теорема Кэли, однако её доказательство, хотя и не сложное, к алгебре-1 всё-таки не относится. Поэтому изучение подстановок нужно далеко не только ради того, чтобы запилить определители, у подстановок много применений. Я убеждена, что подстановки, чтобы два раза не вставать, следует изучать с прицелом доказательство существования нетривиального внешнего автоморфизма S6 (the exceptional outer automorphism of S6).
Сначала определяем, что такое перестановка и транспозиции. Доказываем, что от любой перестановки можно перейти к любой с помощью транспозиций. Вводим понятие инверсии и объясняем, что такое чётность перестановки. Потом рассказываем, что такое подстановка и что о ней можно думать как о переходе старого набора чисел в новый набор; записываем подстановку в виде двух перестановок одна над другой. Определяем композицию подстановок, обратную и тождественную подстановку; ещё раз проговариваем, что подстановки имеют структуру некоммутативной группы. Доказываем, что уже от подстановки к подстановке можно перейти транспозициями. Четность вводим двумя разными способами: сумма инверсий в верхней и нижней строках и количество инверсий в нижней строке, когда столбики расставлены так, что верхняя строка образует 1, 2, ... n (это можно назвать чем-то вроде "нормальный вид по верхней строке"). Эквивалентность этих способов доказывается одновременным изменением четности верхней и нижней строк при транспозиции столбиков. Вводим разложение на непересекающиеся циклы и цикловой тип, рисуем его с помощью диаграмм Юнга. Обязательно объясняем, что диаграммы Юнга - теоретически важная штука. Учимся считать декремент подстановки. Ещё раз подчеркиваем, что чётность - это гомоморфизм в группу знаков {+, -}. Конечно, вводить тут общее понятие группы и гомоморфизма не обязательно, но выделить ключевые свойства - нужно.
Дальше доказываем свойства определителя. Первое - что определитель не меняется при транспонировании матрицы. Оно легко получается из того, что подстановку с нормальным видом по верхней строке можно переписать в нормальный вид по нижней строке, и она от этого не изменится. Это свойство позволяет в формулировках всех следующих свойств не уточнять, что они верны не только для строк, но и для столбцов. Второе свойство - что определитель меняет знак при перестановке двух строк (подстановки членов домножаются на транспозицию). Отсюда ясно, что определитель с одинаковыми строками равен нулю. Дальше идут уже чисто арифметические свойства. Определитель со строкой из одних нулей равен нулю; при умножении строки на a весь определитель умножается на a; определитель с пропорциональными строками равен нулю; определитель, строка которого - суммы вида (ai + bi), равен сумме двух определителей, один из которых имеет только строку ai, другой только bi; наконец, что если прибавить к строке определителя линейную комбинацию других строк, то определитель не поменяется. Это обосновывает метод Гаусса для поиска определителей.
Дальше нужно поговорить про миноры, алгебраические дополнения и разложение по Лапласу. Пусть мы в матрице выбираем несколько строк и столько же столбцов; из элементов на их пересечении строим квадратную матрицу; минор - определитель этой матрицы. У матрицы может быть много миноров разных порядков. Если матрица была квадратной, то из невыбранных строк и столбцов можно построить другую матрицу; её определитель называется дополнительным минором к данному минору. Если же вдобавок умножить дополнительный минор на -1 в степени, равной сумме номеров выбранных строк и столбиков, то получится алгебраическое дополнение данного минора. Дальше доказываем, что если мы умножим члены минора на члены его алгебраического дополнения, то получим часть членов определителя всей квадратной матрицы. Отсюда получается разложение определителя по строке (столбцу): если мы выберем в квадратной матрице какую-нибудь строку, умножим каждый элемент на его алгебраическое дополнение и просуммируем, то получим определитель. Кроме того, отсюда же вытекает так называемое "фальшивое разложение определителя": сумма произведений элементов строки на алгебраические дополнения соответствующих элементов другой строки будет равна нулю. Обратим внимание: если мы умножим алгебраические дополнения элементов k-ой строки (столбца) матрицы на произвольные числа x1, ... , xn, то это то же самое, как если бы мы k-ую строку заменили на числа x1, ... , xn и взяли определитель этой новой матрицы. Далее нужно ввести определитель Вандермонда и по индукции доказать, чему он равен. А дальше доказываем собственно теорему Лапласа о разложении: если выбрать в квадратной матрице несколько строк, образовать из них всевозможные миноры, умножить каждый на его алгебраическое дополнение и сложить, то получится определитель.
Из теоремы Лапласа вытекает теорема Крамера. Пусть дана система из n линейных уравнений с n неизвестными x1, x2, ... , xn. Пусть d - определитель матрицы коэффициентов этой системы (матрица, очевидно, квадратная). Пусть d1 - определитель матрицы, получающейся заменой первого столбика матрицы коэффициентов на столбик свободных членов, d2 - второго столбика, ... , dn - n-го. Теорема Крамера утверждает, что если d не равен нулю, то у системы уравнений есть только одно решение, получающееся по формулам x1 = d1/d, x2 = d2/d, ... , xn = dn/d. Эта теорема вовсе не используется для непосредственного вычисления определителей. Её значение - теоретическое, она используется в доказательстве многих других теорем. Доказывается она так. Пусть j - номер столбика в матрице коэффициентов. Первое уравнение системы умножаем на A1j - алгебраическое дополнение первого элемента j-го столбика. Второе уравнение на A2j - алгебраическое дополнение второго элемента j-го столбика. И так далее. Последнее уравнение умножаем на Anj - алгебраическое дополнение n-го элемента j-го столбика. Теперь все уравнения почленно складываем. В левой части равенства получается несколько фальшивых разложений определителя - точнее, все разложения, кроме разложения для j-го столбика, будут фальшивыми. Слева от равенства будет стоять, таким образом, d×xj. Справа от равенства получится разложение матрицы, в которой j-ый столбик заменён на столбец свободных членов, то есть справа будет стоять dj. Поэтому окажется, что d×xj = dj, откуда xj = dj/d. Именно тут используется наложенное на d условие: если бы d равнялся нулю, то поделить на d было бы нельзя. Делаем так для каждого j-го столбика.
Доказательство первой большой теоремы закончено. Чтобы доказать вторую, Кронекера-Капелли, уже нужна арифметика упорядоченных n-ок (оно же - арифметическое n-мерное векторное пространство). Мне кажется, здесь ещё нет смысла вводить аксиоматику векторного пространства - хотя бы потому, что похожие манипуляции можно делать не только в модулях над полями. Достаточно просто определить сложение n-ок и их умножение на скаляр (покомпонентные), ввести обратную n-ку, нулевую, понятие линейной комбинации n-ок и линейной зависимости и независимости (если какая-нибудь нетривиальная линейная комбинация n-ок равна нулю, то n-ки линейно зависимы; если только тривиальная - независимы). Система из одной ненулевой n-ки независима, подсистема независимой системы независима. В линейно зависимой системе хотя бы одна n-ка (но, вообще говоря, не любая) линейно выражается через другие. Система независимых n-ок называется максимальной, если добавление к ней любой n-ки превращает её в зависимую. Всегда есть максимальная система из n n-ок: это (1, 0, 0, ... ), (0, 1, 0, ... ) и т.д., она называется стандартной. Любая независимая система содержится в какой-нибудь максимальной. Система n-ок из более чем n штук (скажем, k штук) обязательно линейно зависима: можно рассмотреть систему однородных уравнений, в которой n-ки образуют матрицу коэффициентов, а неизвестные будут коэффициентами линейной комбинации; уравнений меньше чем неизвестных, у системы есть ненулевое решение. Нужно рассказать, когда одна система выражается через другую и когда системы эквивалентны. Потом доказать, что если линейно независимая система I выражается через систему II, то в первой системе не может быть больше векторов, чем во второй. Иными словами, линейно независимая система не может быть выражена через систему из меньшего количества векторов. Таким образом, в эквивалентных линейно независимых системах количество векторов одинаковое. Ясно, что максимальные системы эквивалентны; следовательно, все максимальные системы состоят из одного и того же количества векторов.
Теория n-ок позволяет ввести понятие ранга матрицы. Начнем со столбцового ранга: количество векторов в максимальной линейно независимой системе столбцов матрицы. Дальше вводим понятие окаймляющего минора и доказываем, что ранг матрицы равен порядку её наибольшего отличного от нуля минора. А потом транспонируем матрицу и из-за того, что минор не меняется при транспонировании, говорим, что строковый ранг равен столбцовому. Отсюда следует, что если определитель квадратной матрицы равен нулю, то её строки линейно зависимы. Заодно объясняем, что есть люди, которые требуют вручную считать ранги матриц "методом окаймляющих миноров", и говорим, что таких людей слушать не надо. Показываем, как считать ранг методом Гаусса.
Теперь уже можно доказывать теорему Кронекера-Капелли. Она говорит, что система линейных уравнений совместна тогда и только тогда, когда ранг основной матрицы равен рангу расширенной.
Если система совместна, то возьмём любое её решение и подставим в систему на место неизвестных; получим, что последний столбик расширенной матрицы есть линейная комбинация столбиков основной, поэтому его добавление не увеличивает ранг.
Если же ранги равны, то максимальная независимая система образована столбиками основной матрицы (иначе бы добавление столбика свободных членов увеличивало ранг). Значит, столбик свободных членов линейно выражается через столбики основной матрицы, и потому у системы есть решение.
Теперь осталось лишь объяснить, как в явном виде находить решения систем уравнений. Пусть система совместна, и её ранг равен r. Выбираем (хотя бы методом Гаусса приводя систему к ступенчатому виду) r линейно независимых строк, остальные уравнения отбрасываем. В левой части оставляем r неизвестных так, чтобы коэффициенты образовывали ненулевой определитель; их называем главными. Остальные неизвестные переносим вправо и называем свободными. Придавая свободным неизвестным всевозможные значения, получим все решения исходной системы. Немного систематизируем это.
Однородная система ранга n из n уравнений с n неизвестными не имеет ненулевых решений (как следует из теоремы Крамера). Если у неё есть ненулевые решения, то её ранг обязательно меньше n. Предыдущий абзац вдобавок позволяет утверждать, что если ранг меньше n, то ненулевые решения обязательно есть. Заметим, что линейная комбинация решений однородной системы - снова её решение. Максимальная линейно независимая система решений называется "фундаментальная система решений", ФСР. Понятно, что есть много разных ФСР, и всякое решение - линейная комбинация векторов выбранной ФСР. Доказываем, что если ранг матрицы коэффициентов r, а неизвестных n, то в ФСР будет n-r векторов (доказательство немного нудное). Далее, если взять неоднородную систему и составить однородную систему с той же матрицей коэффициентов (она называется приведённой), то общее решение неоднородной системы будет иметь вид "какое-нибудь частное решение неоднородной системы плюс общее решение однородной".
Дальше про определители рассказывать ничего не требуется. Можно, конечно, рассказать очень многое: определители вандермондовского типа, циркулянты и вспомогательные многочлены, трёхдиагональные матрицы Якоби и континуанты, определители Смита, биномиальные определители и подсчет количества непересекающихся путей, числа Фибоначчи, формулу Бине-Коши, тождество Якоби, тождество и метод конденсации Доджсона (Льюиса Кэрролла), определитель Мак-Магона, тождества Сильвестра, миноры Якоби, миноры Грина, теоремы Митчелла и Чеботарёва... Можно, но это же алгебра-1. Тем более для последних уже нужна обратная матрица.
2. Векторные пространства, их эндоморфизмы. Нормальные формы
Сами по себе векторные пространства в алгебре-1 изучаются для того, чтобы изучить пространства с одним эндоморфизмом, имея в виду диагонализуемость. Полностью изучить не получится, разумеется; не все операторы диагонализуемы. Однако ввести жорданову и фробениусову нормальные формы в алгебре-1 удаётся. В общей алгебре обе получаются из структурной теоремы о конечнопорожденных модулях над областями главных идеалов, однако её доказательство не вполне тривиально. Поэтому в алгебре-1 ЖНФ получают более прямым путём: рассматривая корневые подпространства и разыскивая в них подпространства с циклическими базисами. Фробениусова форма получается, в общем-то, аналогично. Кроме того, векторные пространства нужны для технических целей: их морфизмы приводят к алгебре матриц, а на них самих вводятся геометрические структуры.
Векторное пространство - это модуль над полем. Обычно его определяют с помощью восьми аксиом. Первые четыре - аксиомы абелевой группы, остальные четыре описывают действие поля; элементы поля называют скалярами. Пример векторного пространства - арифметическое пространство упорядоченных n-ок. На векторные пространства без изменений переносится теория линейной зависимости n-ок. Максимальная линейно независимая система векторов называется базисом пространства (базисом Коши-Гамеля); всякий вектор линейно выражается через неё, это позволяет ввести в пространстве координаты. Во всяком векторном пространстве есть базис (это нетривиальное утверждение, равносильное аксиоме выбора). Пространства, в базисах которых лишь конечное количество векторов, называются конечномерными. Пусть V - конечномерное пространство и f - функция из V в V; она называется линейным оператором (синоним - эндоморфизмом пространства V), если f(ax+by) = af(x)+bf(y) для любых скаляров a и b и любых векторов x и y. Линейный оператор полностью задаётся своими значениями на базисных векторах e1, ... , en - то есть если мы знаем, куда оператор переводит векторы хотя бы одного какого-нибудь базиса, мы знаем, как оператор действует на произвольный вектор. В самом деле, если f(ei) = ci, и если x = a1e1 + a2e2 + ... anen, то f(x) = a1c1 + a2c2 + ... ancn по свойствам линейности. Если мы запишем координаты векторов ci столбик за столбиком, то получим квадратную матрицу, называемую матрицей оператора f. Ясно, что какими бы ни были векторы c1, ... , cn, то существует оператор, который векторы из данного конкретного базиса в них переводит. Таким образом, если фиксировать в n-мерном пространстве V какой-то базис, то между квадратными матрицами порядка n и эндоморфизмами V появится взаимно-однозначное соответствие. Можно, далее, ввести сложение операторов и умножение оператора на скаляр (покомпонентные). Это индуцирует соответствующие операции над квадратными матрицами - покомпонентное сложение и умножение на число. Если f и g - два оператора, то матрица их композиции g(f(x)) будет называться произведением матриц. Окажется, что она вычисляется по правилу "строка на столбец". Аналогично вводятся операции для неквадратных матриц - рассматривают два пространства V и V' согласованной размерности, в них фиксируют базисы, функции из V в V' со свойством линейности называют линейными отображениями (морфизмами из V в V'), вводят сложение и умножение. При этом от умножения прямоугольных матриц по понятным причинам требуют, чтобы количество столбцов в первом множителе было равно количеству строк во втором. Рангом морфизма называется ранг его матрицы. Легко видеть, что ранг произведения матриц не превосходит наибольшего из рангов сомножителей. Применение оператора f с матрицей A к вектору x со столбиком координат X - это умножение X на A слева, то есть столбик координат вектора f(x) равен AX.
Биективный морфизм векторных пространств называется изоморфизмом; биективный эндоморфизм - автоморфизмом. Ясно, что изоморфизм переводит базис в базис; таким образом, изоморфны те и только те пространства, у которых совпадает размерность. Изоморфные пространства - это как бы одно и то же пространства, таким образом можно говорить, что для любой натуральной размерности n над данным полем не существует никаких векторных пространств, кроме пространства упорядоченных n-ок. У биекции всегда есть обратное отображение; легко видеть, что обратное к автоморфизму тоже будет автоморфизмом. Для квадратных матриц немедленно ставится вопрос о том, когда она задаёт автоморфизм - иными словами, о наличии обратной матрицы.
Сначала доказываем, что определитель произведения квадратных матриц одного порядка n равен произведению определителей. Можно доказать так: пусть AB = C, рассмотрим блочную матрицу D, у которой в левом верхнем углу A, в правом нижнем B, в левом нижнем по диагонали -1, в правом верхнем 0. Двумя способами посчитаем её определитель. Сначала разложение Лапласа по первым строкам даёт нам, что det D = det A × det B. Прибавим теперь к n+j-му столбику линейную комбинацию n первых, взятых с коэффициентами b1j, b2j, ... , bnj. Это не изменит определителя. Теперь в правом верхнем углу D стоит C, в правом нижнем нули. Дополнительный минор для C равен (-1)^n. Чтобы получить алгебраическое дополнение, домножим на -1^(1+2+...n+(n+1)+(n+2)+...+(n+n)), с помощью формулы Гаусса для суммы первых n натуральных чисел получим (-1)^(2n+n). Окончательно, det D = C×(-1)^(2n+n)×(-1)^n = C. Итак, det(AB) = det A × det B.
Далее вводим понятие невырожденной матрицы (синоним - неособенной) - такой, что её определитель ненулевой. Предыдущая теорема показывает, что класс невырожденных матриц замкнут относительно умножения. Из неё же вытекает, что если определитель матрицы равен нулю, то у этой матрицы нет обратной. Пусть M - квадратная невырожденная матрица с определителем d. Рассмотрим транспонированную матрицу adjM алгебраических дополнений элементов M, она называется союзной (присоединённой, взаимной) для M. Ясно, что M×adjM - это матрица, на главной диагонали которой стоит число d. Если мы теперь домножим adjM на число 1/d, то получим, что M×(1/d)adjM - это единичная матрица. Итак, обратная матрица для M - это союзная матрица, умноженная на число 1/(det M). Невырожденные квадратные матрицы и только они имеют обратные. Определитель обратной матрицы - обратен к определителю исходной, det M' = 1/(det M).
Если e и e' - два разных базиса пространства V, то матрица, состоящая из координат векторов e' в базисе e, называется матрицей перехода от базиса e к базису e'. Есть неоднозначность: как записывать координаты, в столбик или в строчку. В последнее время принято, чтобы координаты векторов нового базиса в старом базисе записывали в матрицу перехода в столбик. То есть первый столбик - координаты первого из векторов системы e' в базисе e, второй столбик - координаты второго, и т.д. Тогда строка из векторов нового базиса - это строка из векторов старого, умноженная справа на матрицу перехода. С операторами, кстати, такая же историческая путаница; я пишу их в столбик. Если X - столбец координат вектора x в базисе e, X' - в базисе e', C - матрица перехода от e к e', то X = CX', то есть координаты вектора в старом базисе - координаты вектора в новом, умноженные слева на матрицу перехода от старого базиса к новому. Матрица перехода обязательно невырождена - если бы она была вырожденной, то между базисными векторами была бы нетривиальная линейная зависимость. Значит, у матрицы перехода всегда есть обратная. Строка векторов старого базиса есть строка векторов нового базиса, умноженная справа на матрицу, обратную к матрице перехода.
Матрица перехода позволяет понять, как связаны между собой матрицы одного и того же оператора f в двух разных базисах. Пусть f - оператор с матрицей A в базисе (e1, ... , en) и матрицей A' в базисе (e1', ... , en'), C - матрица перехода от e к e', C' - обратная к C. Здесь базисные векторы записаны в строчку. Тогда (e1', ... , en') = (e1, ... , en)C. Подействуем оператором на левую и правую части равенства (Ae1', ... , Aen') = (Ae1, ... , Aen)C = (e1, ... , en)AC = (e1', ... , en')C'AC. Отсюда A' = C'AC. Про такие матрицы говорят, что матрица A' получена из матрицы A трансформированием с помощью матрицы C, или что матрицы A' и A сопряжены. Можно попробовать поискать базисы, в которых матрица оператора имеет очень простой вид - скажем, диагональный. Такие базисы могут и не найтись. Но вдруг. Кроме того, можно понять, что определитель матрицы оператора не меняется при переходе к другому базису, det A' = det C' × det A × det C = det A, поскольку det C и det C' сокращаются.
У векторного пространства есть подпространства - подмножества, сами являющиеся векторными пространствами относительного тех же самых сложения векторов и умножения на скаляр. Чтобы множество векторов было подпространством, необходимо и достаточно, чтобы оно было замкнуто относительно сложения и умножения на скаляры. Любая линейно независимая система векторов пространства будет базисом какого-то подпространства - именно, линейной оболочки, натянутой на эти векторы. Пересечение подпространств - снова подпространство. Самое маленькое подпространство пространства V - это пространство {0}, состоящее из одного лишь нулевого вектора; у этого пространства нет базиса, и оно называется нульмерным. Самое большое подпространство V - это само V. Эти два подпространства называются тривиальными. Если dim V больше единицы, то у V есть нетривиальные подпространства. Понятно, что всякий базис подпространства может быть достроен до базиса всего пространства. Если U и W два подпространства в V, то их суммой U+W называется множество всевозможных векторов вида u+w, где u из U, w из W. Сумма подпространств снова подпространство. Если пересечение U и W состоит только из нулевого вектора, то сумма называется прямой. Можно доказать теорему о размерности суммы: она равна сумме размерностей слагаемых минус размерность их пересечения. В самом деле, возьмём в пересечении базис e и достроим его слева векторами u до базиса U, справа векторами w до базиса W. Система u, e, w будет, очевидно, порождать сумму U+W. Кроме того, она линейно независима. Предположим противное; тогда au + be + cw = 0 для некоторых коэффициентов a, b, c. Рассмотрим вектор v = au+be = -cw. Он, с одной стороны, принадлежит пространству U, с другой - пространству W. Первое означает, что коэффициенты c нулевые, второе - что коэффициенты a нулевые. Значит, линейная зависимость обнаружена между векторами из системы e, чего быть не может.
Ядром оператора называется прообраз нулевого вектора. Ядро и образ оператора - подпространства. Размерность образа равна рангу оператора, размерность ядра называется "дефект". Оператор является автоморфизмом, когда выполнено хотя бы одно из эквивалентных друг другу условий: ранг совпадает с размерностью пространства; оператор сюръективен; дефект равен нулю; оператор переводит в нулевой вектор только нулевой вектор; оператор инъективен; оператор биективен; у оператора есть обратный; определитель оператора ненулевой. Автоморфизмы называются невырожденными операторами. Остальные операторы называются вырожденными. Заметим, что у вырожденного оператора определитель обязательно нулевой.
Бывает так, что применение оператора к векторам из подпространства не выводит за пределы подпространства. Тогда такое подпространство называется инвариантным, а ограничение на него оператора оказывается эндоморфизмом этого пространства. Если взять базис инвариантного подпространства и достроить его до базиса всего пространства, то матрица оператора в этом базисе будет иметь красивый вид блочной матрицы 2 на 2 клетки, причем в левом верхнем углу будет стоять матрица оператора-ограничения, а в левом нижнем углу - нулевая матрица. Если же пространство V удастся разложить в прямую сумму пространств U и W, то в базисе, составленном из базисов U и W, матрица оператора окажется и вовсе блочно-диагональной: на главной диагонали стоят матрицы операторов-ограничений, а вне неё - нули.
Чтобы найти наиболее простую форму матрицы оператора, нужно найти инвариантные пространства для этого оператора. При их поиске используются так называемые собственные числа, собственные и корневые векторы. Число a называется собственным для оператора f, если для некоторого ненулевого вектора v оказывается f(v) = av. Вектор v называется собственным вектором, ассоциированным с числом a. В базисе, составленном из собственных векторов, оператор имеет диагональную матрицу. Если матрица оператора в каком-то базисе диагональна, то этот базис состоит из собственных векторов.