что такое размерность матрицы
Что такое размерность матрицы
Матрицей размерности m×n называется таблица чисел aij, содержащая m строк и n столбцов. Числа aij называются элементами этой матрицы, где i – номер строки, j – номер столбца, на пересечении которых стоит данный элемент. Матрица, содержащая m строк и n столбцов, имеет вид:
Виды матриц:
1) при m=n – квадратная, в данном случае n называют порядком матрицы;
2) квадратная матрица, у которой все недиагональные элементы равны нулю – диагональная;
3) диагональная матрица, у которой все диагональные элементы равны единице – единичная и обозначается E;
4) при n≠m – прямоугольная;
5) при m=1 – матрица-строка (вектор-строка);
6) при n=1 – матрица-столбец (вектор-столбец);
7) при всех aij =0 – нулевая матрица.
Заметим, что основной числовой характеристикой квадратной матрицы является ее определитель. Определитель, соответствующий матрице n-го по-порядка, также имеет n-ый порядок.
Дадим ряд необходимых определений.
Определителем матрицы 2-го порядка называется число
Минором Мij элемента aij матрицы n-го порядка А называется определитель матрицы (n-1)-го порядка, полученной из матрицы А путем вычеркивания i-ой строки и j-го столбца.
1. При транспонировании матрицы ее определитель не меняется.
2. При перестановке двух строк (столбцов) матрицы ее определитель меняет знак.
3. Определитель, имеющий две пропорциональные (равные) строки (столбца), равен нулю.
4. Общий множитель элементов какой-либо строки (столбца) определителя можно вынести за знак определителя.
5. Если элементы какой-либо строки (столбца) определителя представляют собой сумму двух слагаемых, то определитель может быть разложен на сумму двух соответствующих определителей.
6. Определитель не изменится, если к элементам любой его строки (столбца) прибавить соответствующие элементы другой его строки (столбца), предварительно умноженные на любое число.
7. Определитель матрицы равен сумме произведений элементов любой его строки (столбца) на алгебраические дополнения этих элементов.
Поясним данное свойство на примере определителя 3-го порядка. В данном случае свойство 7 означает, что
Свойство 7 представляет собой теорему о разложении определителя, сформулированную Лапласом.
8. Сумма произведений элементов какой-либо строки (столбца) определителя на алгебраические дополнения соответствующих элементов другой его строки (столбца) равна нулю.
Последнее свойство часто называют псевдоразложением определителя.
Что такое размерность матрицы
ОПРЕДЕЛЕНИЕ МАТРИЦЫ. ВИДЫ МАТРИЦ
Матрицей размером m×n называется совокупность m·n чисел, расположенных в виде прямоугольной таблицы из m строк и n столбцов. Эту таблицу обычно заключают в круглые скобки. Например, матрица может иметь вид:
Для краткости матрицу можно обозначать одной заглавной буквой, например, А или В.
В общем виде матрицу размером m×n записывают так
.
Числа, составляющие матрицу, называются элементами матрицы. Элементы матрицы удобно снабжать двумя индексами aij: первый указывает номер строки, а второй – номер столбца. Например, a23 – элемент стоит во 2-ой строке, 3-м столбце.
Если в матрице число строк равно числу столбцов, то матрица называется квадратной, причём число ее строк или столбцов называется порядком матрицы. В приведённых выше примерах квадратными являются вторая матрица – её порядок равен 3, и четвёртая матрица – её порядок 1.
Матрица, в которой число строк не равно числу столбцов, называется прямоугольной. В примерах это первая матрица и третья.
Различаются также матрицы, имеющие только одну строку или один столбец.
Матрица, у которой всего одна строка , называется матрицей – строкой (или строковой), а матрица, у которой всего один столбец, матрицей – столбцом.
Матрица, все элементы которой равны нулю, называется нулевой и обозначается (0), или просто 0. Например,
.
Главной диагональю квадратной матрицы назовём диагональ, идущую из левого верхнего в правый нижний угол.
Квадратная матрица, у которой все элементы, лежащие ниже главной диагонали, равны нулю, называется треугольной матрицей.
.
Квадратная матрица, у которой все элементы, кроме, быть может, стоящих на главной диагонали, равны нулю, называется диагональной матрицей. Например, или
.
Диагональная матрица, у которой все диагональные элементы равны единице, называется единичной матрицей и обозначается буквой E. Например, единичная матрица 3-го порядка имеет вид .
ДЕЙСТВИЯ НАД МАТРИЦАМИ
Равенство матриц. Две матрицы A и B называются равными, если они имеют одинаковое число строк и столбцов и их соответствующие элементы равны aij = bij. Так если и
, то A=B, если a11 = b11, a12 = b12, a21 = b21 и a22 = b22.
Транспонирование. Рассмотрим произвольную матрицу A из m строк и n столбцов. Ей можно сопоставить такую матрицу B из n строк и m столбцов, у которой каждая строка является столбцом матрицы A с тем же номером (следовательно, каждый столбец является строкой матрицы A с тем же номером). Итак, если , то
.
Эту матрицу B называют транспонированной матрицей A, а переход от A к B транспонированием.
Связь между матрицей A и её транспонированной можно записать в виде .
Например. Найти матрицу транспонированную данной.
Сложение матриц. Пусть матрицы A и B состоят из одинакового числа строк и одинакового числа столбцов, т.е. имеют одинаковые размеры. Тогда для того, чтобы сложить матрицы A и B нужно к элементам матрицы A прибавить элементы матрицы B, стоящие на тех же местах. Таким образом, суммой двух матриц A и B называется матрица C, которая определяется по правилу, например,
Примеры. Найти сумму матриц:
Легко проверить, что сложение матриц подчиняется следующим законам: коммутативному A+B=B+A и ассоциативному (A+B)+C=A+(B+C).
Умножение матрицы на число. Для того чтобы умножить матрицу A на число k нужно каждый элемент матрицы A умножить на это число. Таким образом, произведение матрицы A на число k есть новая матрица, которая определяется по правилу или
.
Для любых чисел a и b и матриц A и B выполняются равенства:
.
Матрицу C найти нельзя, т.к. матрицы A и B имеют разные размеры.
Умножение матриц. Эта операция осуществляется по своеобразному закону. Прежде всего, заметим, что размеры матриц–сомножителей должны быть согласованы. Перемножать можно только те матрицы, у которых число столбцов первой матрицы совпадает с числом строк второй матрицы (т.е. длина строки первой равна высоте столбца второй). Произведением матрицы A не матрицу B называется новая матрица C=AB, элементы которой составляются следующим образом:
.
Таким образом, например, чтобы получить у произведения (т.е. в матрице C) элемент, стоящий в 1-ой строке и 3-м столбце c13, нужно в 1-ой матрице взять 1-ую строку, во 2-ой – 3-й столбец, и затем элементы строки умножить на соответствующие элементы столбца и полученные произведения сложить. И другие элементы матрицы-произведения получаются с помощью аналогичного произведения строк первой матрицы на столбцы второй матрицы.
В общем случае, если мы умножаем матрицу A = (aij) размера m×n на матрицу B = (bij) размера n×p, то получим матрицу C размера m×p, элементы которой вычисляются следующим образом: элемент cij получается в результате произведения элементов i-ой строки матрицы A на соответствующие элементы j-го столбца матрицы B и их сложения.
Из этого правила следует, что всегда можно перемножать две квадратные матрицы одного порядка, в результате получим квадратную матрицу того же порядка. В частности, квадратную матрицу всегда можно умножить саму на себя, т.е. возвести в квадрат.
Другим важным случаем является умножение матрицы–строки на матрицу–столбец, причём ширина первой должна быть равна высоте второй, в результате получим матрицу первого порядка (т.е. один элемент). Действительно,
.
.
, B·A – не имеет смысла.
Таким образом, эти простые примеры показывают, что матрицы, вообще говоря, не перестановочны друг с другом, т.е. A∙B ≠ B∙A. Поэтому при умножении матриц нужно тщательно следить за порядком множителей.
Можно проверить, что умножение матриц подчиняется ассоциативному и дистрибутивному законам, т.е. (AB)C=A(BC) и (A+B)C=AC+BC.
Легко также проверить, что при умножении квадратной матрицы A на единичную матрицу E того же порядка вновь получим матрицу A, причём AE=EA=A.
Можно отметить следующий любопытный факт. Как известно произведение 2-х отличных от нуля чисел не равно 0. Для матриц это может не иметь места, т.е. произведение 2-х не нулевых матриц может оказаться равным нулевой матрице.
Например, если , то
.
Пусть дана матрица второго порядка – квадратная матрица, состоящая из двух строк и двух столбцов .
Определителем второго порядка, соответствующим данной матрице, называется число, получаемое следующим образом: a11a22 – a12a21.
Определитель обозначается символом .
Итак, для того чтобы найти определитель второго порядка нужно из произведения элементов главной диагонали вычесть произведение элементов по второй диагонали.
Примеры. Вычислить определители второго порядка.
Аналогично можно рассмотреть матрицу третьего порядка и соответствующий ей определитель.
Определителем третьего порядка, соответствующим данной квадратной матрице третьего порядка, называется число, обозначаемое и получаемое следующим образом:
.
Таким образом, эта формула даёт разложение определителя третьего порядка по элементам первой строки a11, a12, a13 и сводит вычисление определителя третьего порядка к вычислению определителей второго порядка.
Примеры. Вычислить определитель третьего порядка.
.
Аналогично можно ввести понятия определителей четвёртого, пятого и т.д. порядков, понижая их порядок разложением по элементам 1-ой строки, при этом знаки «+» и «–» у слагаемых чередуются.
Итак, в отличие от матрицы, которая представляют собой таблицу чисел, определитель это число, которое определённым образом ставится в соответствие матрице.
Знакомство с матрицами
Понятие и базовые операции.
Разработчики нейросетей говорят, что все нейросети — это просто бесконечное перемножение матриц. Мы решили разобраться, что это за матрицы и как их перемножать, а для этого пришлось полезть в линейную алгебру. И это оказалось не так сложно, как мы думали:
Вектор — это «кирпичик» линейной алгебры. На его основе мы переходим к понятию матрицы.
Что такое матрица
Если вектор — это строка с числами в определённом порядке, то матрица — это таблица с числами в определённом порядке. Как у любой таблицы, у матрицы есть столбцы и строки. В них сидят какие-то числа. Всё вместе — это математический объект, то есть в каких-то случаях всю эту таблицу можно рассматривать как единое целое и совершать с ним операции.
Матрицы принято обозначать большими буквами латинского алфавита вроде А, В, С, D и так далее.
Числа внутри матрицы называют элементами. Каждый элемент обозначается двумя цифрами: первая цифра указывает на строку, а вторая — на столбец. Это адрес числа внутри матрицы. Например, элемент А₂₃ означает, что нужное число находится во второй строке и третьем столбце. Нумерация элементов нужна для записи формул и устного объяснения того, где находится нужное число в матрице.
В матрице может находиться неограниченное количество строк, столбцов и элементов. Из-за этого матрицы бывают разных видов и могут обладать разными особенностями. Например, если в матрице совпадает число строк и столбцов, то такая матрица называется квадратной.
В этой статье и в следующих материалах мы будем рассматривать разные виды матрицы и постепенно изучим их особенности.
Общая схема матрицы
Пример квадратной матрицы с пятью строками и столбцами. Записывается как матрица размера 5×5. В числовой матрице мы не нумеруем элементы — они закрепляются за числами по умолчанию. Например, элементу А₂₃ соответствует число три
Простые операции с матрицами
Вынесение минуса за пределы матрицы. Если внутри матрицы у большинства элементов знак минус, то часто это мешает расчётам или приводит к ошибкам. Чтобы этого избежать, от минуса избавляются. Для этого нужно вынести минус за пределы матрицы и изменить знак всех элементов внутри самой матрицы.
И наоборот: если внутри матрицы у большинства элементов знак минус и перед матрицей стоит минус, то минус можно внести в матрицу.
Выносим минус за пределы матрицы и получаем вместо двадцати одного отрицательного элемента — четыре
Перед матрицей минус, и внутри у большинства элементов минус. Вносим минус в матрицу и делаем её удобной для дальнейших вычислений
Умножение матрицы на число. Для умножения матрицы на число достаточно каждый элемент матрицы умножить на это число.
Пример умножения матрицы на число
Транспонирование матрицы. Это операция, которая позже нам понадобится для решения матричных уравнений. Для транспонирования мы берём известную матрицу, меняем в ней местами строки со столбцами и получаем новую матрицу. Как бы поставили матрицу набок.
⚠️ При этом в матрице запрещено в произвольном порядке менять элементы. Зато можно полностью менять местами строки или столбцы. Если мы поменяем местами первую и вторую строку, то это останется прежняя матрица.
Схема транспонирования матриц: первая строка переходит в первый столбец, вторая строка — во второй столбец и так далее в зависимости от количества элементов матрицы
Пример транспонирования. Транспонированная матрица обозначается буквой той же матрицы, из которой она получилась + надстрочечный индекс в виде печатной буквы «Т»
Матрицу можно перетасовывать, но это нужно делать по правилам. Транспонирование — одно из таких правил
Сложение и вычитание матриц
Если в нескольких матрицах совпадает число строк и столбцов, то мы можем их складывать и вычитать. Для вычислений нам нужно поэлементно сложить или вычесть каждый элемент матриц: первый элемент первой матрицы складываем с первым элементом второй матрицы или вычитаем из него и так далее. В результате получаем новую матрицу.
Пример сложения двух прямоугольных матриц с тремя строками и двумя столбцами
Пример вычитания двух матриц
Умножение матриц
Матрицы умножаются по принципу строка на столбец. Мы умножаем первую строку первой матрицы, на первый столбец второй матрицы, складываем результаты и получаем первый элемент новой матрицы. По аналогичной схеме вычисляем все остальные элементы. Звучит запутанно, поэтому идём по шагам:
Если нам нужно найти матрицу в квадрате, то мы умножаем эту матрицу на саму себя. Если нужна матрица в кубе — умножаем её на саму себя три раза и так далее в зависимости от количества степеней. Если в одной из матриц все элементы нули, то она считается нулевой и после умножения на другую матрицу даёт нулевую матрицу — это как нуль умноженный на число всегда даёт нуль.
Формула умножения матриц
Пример умножения квадратных матриц размерностью 2×2
Что дальше
В следующий раз продолжим знакомиться с базовыми понятиями, которые нам понадобятся для решения матричных уравнений. А на сегодня Нео свободен 👽
От действий над матрицами к пониманию их сути…
Очень уважаю людей, которые имеют смелость заявить, что они что-то не понимают. Сам такой. То, что не понимаю, — обязательно должен изучить, осмыслить, понять. Статья «Математика на пальцах», и особенно матричная запись формул, заставили меня поделиться своим небольшим, но, кажется, немаловажным опытом работы с матрицами.
Лет эдак 20 назад довелось мне изучать высшую математику в вузе, и начинали мы с матриц (пожалуй, как и все студенты того времени). Почему-то считается, что матрицы — самая лёгкая тема в курсе высшей математики. Возможно — потому, что все действия с матрицами сводятся к знанию способов расчёта определителя и нескольких формул, построенных — опять же, на определителе. Казалось бы, всё просто. Но… Попробуйте ответить на элементарный вопрос — что такое определитель, что означает число, которое вы получаете при его расчёте? (подсказка: вариант типа «определитель — это число, которое находится по определённым правилам» не является правильным ответом, поскольку говорит о методе получения, а не о самой сути определителя). Сдаётесь? — тогда читаем дальше.
Сразу хочу сказать, что я не математик ни по образованию, ни по должности. Разве что мне интересна суть вещей, и я порой пытаюсь до них «докопаться». Так же было и с определителем: нужно было разобраться со множественной регрессией, а в этом разделе эконометрики практически всё делается через… матрицы, будь они неладны. Вот и пришлось мне самому провести небольшое исследование, поскольку ни один из знакомых математиков не дал внятного ответа на поставленный вопрос, изначально звучавший как «что такое определитель». Все утверждали, что определитель — это такое число, которое особым образом посчитано, и если оно равно нулю, то… В общем, как в любом учебнике по линейной алгебре. Спасибо, проходили.
Если какую-то идею придумал один человек, то другой человек должен быть в состоянии её понять (правда, для этого порой приходится вооружаться дополнительными знаниями). Обращение к «великому и могучему» поисковику показало, что «площадь параллелограмма равна модулю определителя матрицы, образованной векторами — сторонами параллелограмма». Говоря простым языком, если матрица — это способ записи системы уравнений, то каждое уравнение в отдельности описывает вектор. Построив из точки начала координат векторы, заданные в матрице, мы таким образом зададим в пространстве некоторую фигуру. Если наше пространство одномерное, то фигура — это отрезок; если двумерное — то фигура — параллелограмм, и так далее.
Получается, что для одномерного пространства определитель — это длина отрезка, для плоскости — площадь фигуры, для трёхмерной фигуры — её объём… дальше идут n-мерные пространства, вообразить которые нам не дано. Если объём фигуры (то есть определитель для матрицы 3*3) равен нулю, то это означает, что сама фигура не является трёхмерной (она может быть при этом двухмерной, одномерной или вообще представлять собой точку). Ранг матрицы — это истинная (максимальная) размерность пространства, для которого определитель не равен нулю.
Так, с определителем почти всё понятно: он определяет «объёмность» фигуры, образованной описанными системой уравнений векторами (хотя непонятно, почему его значение не зависит от того, имеем мы дело с исходной матрицей, или с транспонированной — возможно, транспонирование — это вид аффинного преобразования?). Теперь нужно разобраться с действиями над матрицами…
Если матрица — это система уравнений (а иначе зачем нам таблица каких-то цифр, не имеющих к реальности никакого отношения?), то мы можем с ней делать разные вещи. Например, можем сложить две строки одной и той же матрицы, или умножить строку на число (то есть каждый коэффициент строки умножаем на одно и то же число). Если у нас есть две матрицы с одинаковыми размерностями, то мы их можем сложить (главное, чтобы при этом мы не сложили бульдога с носорогом — но разве математики, разрабатывая теорию матриц, думали о таком варианте развития событий?). Интуитивно понятно, тем более что в линейной алгебре иллюстрациями подобных операций являются системы уравнений.
Однако в чём смысл умножения матриц? Как я могу умножить одну систему уравнений на другую? Какой смысл будет иметь то, что я получу в этом случае? Почему для умножения матриц неприменимо переместительное правило (то есть произведение матриц В*А не то что не равно произведению А*В, но и не всегда осуществимо)? Почему, если мы перемножим матрицу на вектор-столбец, то получим вектор-столбец, а если перемножим вектор-строку на матрицу, то получим вектор-строку?
Ну, тут уж не то что Википедия, — тут даже современные учебники по линейной алгебре бессильны дать какое-либо внятное объяснение. Поскольку изучение чего-либо по принципу «вы сначала поверьте — а поймёте потом» — не для меня, копаю в глубь веков (точнее — читаю учебники первой половины XX века) и нахожу интересную фразу…
Если совокупность обычных векторов, т.е. направленных геометрических отрезков, является трёхмерным пространством, то часть этого пространства, состоящая из векторов, параллельных некоторой плоскости, является двумерным пространством, а все векторы, параллельные некоторой прямой, образуют одномерное векторное пространство.
В книгах об этом напрямую не говорится, но получается, что векторам, параллельным некоторой плоскости, необязательно лежать на этой плоскости. То есть они могут находиться в трёхмерном пространстве где угодно, но если они параллельны именно этой плоскости, то они образуют двумерное пространство… Из приходящих мне на ум аналогий — фотография: трёхмерный мир представлен на плоскости, при этом вектору, параллельному матрице (или плёнке) фотоаппарата, будет соответствовать такой же вектор на картинке (при условии соблюдении масштаба 1:1). Отображение трёхмерного мира на плоскости «убирает» одно измерение («глубину» картинки). Если я правильно понял сложные математические концепции, перемножение двух матриц как раз и представляет собой подобное отражение одного пространства в другом. Поэтому, если отражение пространства А в пространстве В возможно, то допустимость отражения пространства В в пространстве А — не гарантируется.
Любая статья заканчивается в тот момент, когда автору надоедает её писать. Поскольку я не ставил перед собой цели объять необъятное, а исключительно хотел понять суть описанных операций над матрицами и то, как именно матрицы связаны с решаемыми мной системами уравнений, я не полез в дальнейшие дебри линейной алгебры, а вернулся к эконометрике и множественной регрессии, но сделал это уже более осознанно. Понимая, что и зачем я делаю и почему только так, а не иначе. То, что у меня получилось в этом материале, можно озаглавить как «глава о сути основных операций линейной алгебры, которую почему-то забыли напечатать в учебниках». Но ведь мы же не читаем учебников, правда? Если честно, когда я учился в университете, мне очень не хватало именно понимания затронутых здесь вопросов, поэтому я надеюсь, что, изложив этот непростой материал по возможности простыми словами, я делаю доброе дело и помогаю кому-то вникнуть в саму суть матричной алгебры, переведя операции над матрицами из раздела «камлание с бубном» в раздел «практические инструменты, применяемые осознанно».