は 2 つの行と 3 つの列を持つ行列である。行列自身は、ふつうはアルファベットの大文字イタリック(しばしば太字[注釈 1])で表し、その要素は対応する小文字に二つの添字を付けたもので表す(略式的に行列を表す大文字に添字を付けたものを用いることもあるが、その場合小行列の記号と紛らわしい)。つまり一般の m 行 n 列の行列を
書き並べられた要素は行列の成分 (英: entry, component) と呼ばれる[1]。成分が取り得る値は(さまざまな対象を想定できるが)大抵の場合はある体または可換環K の元であり、このとき K 上の行列 (英: matrix over K) という。特に、K が実数全体の成す体 R であるとき実行列と呼び、複素数全体の成す体 C のとき複素行列と呼ぶ。
一つの成分を特定するには、二つの添字が必要である。行列の第 i 行目、j 列目の成分を特に行列の (i, j) 成分と呼ぶ[1]。例えば上記行列 A の (1, 2) 成分は a1 2 である。行列の (i, j) 成分はふつう ai j のように二つの添字を単に横並びに書くが、誤解を避けるために添字の間にコンマを入れることもある。例えば 1 行 11 列目の成分を a1,11 と書いてよい。また略式的には、行列 A の (i, j) 成分を指定するのに Ai j という記法を用いることがある。この場合、例えば積(後述)A B の (i, j) 成分を (A B)i j と指定したりできるので、これで記述の簡素化を図れる場合もある。
型
行列に含まれる行の数が m, 列の数が n である時に、その行列を m 行 n 列行列や m × n 行列、m n 行列などと呼ぶ[1]。行列を構成する行の数と列の数の対を型 (英: type) あるいはサイズという。したがって m 行 n 列行列のことを (m, n) 型行列などと呼ぶこともある[1]。K 上の m × n 行列の全体は Km×n, Km,n や Mat(m, n; K), Mm×n(K) などで表される。
線型方程式の解法における応用に関して、行列は長い歴史を持つ。紀元前10世紀から紀元前2世紀の間に書かれた中国の書物『九章算術』は連立方程式の解法に行列を用いた最初の例であるといわれ[3]、それには行列式の概念が含まれていた。1545年にイタリアの数学者ジェロラモ・カルダーノは『偉大なる術(アルス・マグナ)』を著し、この方法をヨーロッパに持ち込んだ。日本の関孝和は1683年に連立方程式の解法として同様に行列による方法を用いている[4]。ドイツのヨハン・デ・ウィットは1659年の著書 Elements of Curves において行列の変形について説明している。1700年から1710年にかけてドイツのライプニッツは50以上の異なる体系を用いて行列の使い方を発表した。クラメルが有名な公式を生み出すのは1750年のことである。
行列論の初期においては、行列よりも行列式のほうに非常に重きが置かれており、行列式から離れて現代的な行列の概念と同種のものが浮き彫りにされるのは1858年、ケイリーの歴史的論文 Memoir on the theory of matrices(「行列論回想」)においてである[5][6]。用語 "matrix"(ラテン語で「生み出すもの」の意味の語に由来)[7]はシルベスターが導入した。シルベスターは行列を、(今日小行列式と呼ばれる)もとの行列から一部の行や列を取り除いて得られる小行列の行列式として、たくさんの行列式を生じるものとして理解していた[注釈 2]。1851年の論文でシルベスターは
I have in previous papers defined a "Matrix" as a rectangular array of terms, out of which different systems of determinants may be engendered as from the womb of a common parent. (以前の論文で、項を矩形状に並べた配列として定義した "Matrix" は、そのうちで異なる行列式の体系を生み出す共通の親としての母体である。)
(ここで ∏ は条件を満たす項の総乗を表す)の冪 aj k を ajk で置き換えたものという定義を採用し、それを用いて行列式についての一般的な主張を証明した最初の人である。コーシーは1829年に、対称行列の固有値が全て実数であることも示している[10]。ヤコビは、幾何学的変換の局所的あるいは無限小のレベルでの挙動を記述することができる関数行列式(後にシルベスターが「ヤコビ行列式」と呼んだ)の研究を行った。クロネッカーの Vorlesungen über die Theorie der Determinanten[11] とワイエルシュトラスの Zur Determinantentheorie[12] はともに1903年に出版された。前者は、それまでのコーシーの用いた公式のような具体的な手法とは反対に、行列式を公理的に扱ったものである。これを以って、行列式の概念がきっちりと確立されたと見なされている。
スカラー乗法が意味を持つためには、スカラー λ と行列の成分が同じ環 (K, +, ·, 0) からとった元であるべきであり、このとき m × n 行列の全体 Km×n は、左 K-加群(K が体ならばベクトル空間)になる。ベクトル空間(あるいは自由加群)としての Km×n は m n 次元数ベクトル空間 Km n と同型である。
行列 A のランクまたは階数とは、この行列の列ベクトルの中で線型独立なものの最大個数であり、また
行ベクトルの中で線型独立なものの最大個数とも等しい[20]。あるいは A の表現する線型写像の像の次元と言っても同じである[21]。階数・退化次数の定理は、行列の核に階数を加えると、その行列の列の数に等しいことを述べるものである[22]。
を内積に持つ。K = R のとき、これはユークリッドノルムを導き、Mm×n(R) は m n-次元ユークリッド空間Km n になる。この内積空間において、対称行列全体の成す部分空間と歪対称行列全体の成す部分空間とは互いに直交する。即ち、A が対称, B が歪対称ならば ⟨A, B⟩ = 0 が成り立つ。同様に K = C の場合には、Mm×n(C) は
任意の行列 B に対し、その成分をそれぞれの成分の加法逆元に全て取り換えた行列を −B と書けば、同じサイズの行列 A, B の和 A + (−B) を A − B と略記して差を定めることができる[注釈 3]。より強く、スカラー乗法が定義される場合には、特にスカラー (−1)-倍は (−1)B = −B を満たすのだから、和とスカラー倍を使って差を定義することもできる。
n × n の正方行列A に対して行列のべき乗は An (ここで n は実数) と書かれる[24]。
行列 A が対角化可能であれば、An = (P−1DP)n = P−1DnP として容易に計算できる。
ベクトルの二項積
v と w を n × 1 の列ベクトルとすると、v と w との間に行列の積は定義されないが、tvw および vtw は行列の積として定義することができる。前者は 1 × 1 行列であり、これをスカラーと解釈すれば、v と w との標準内積 ⟨v, w⟩ に他ならない。いっぽう後者は、階数 1 の n × n 行列で、v と w との二項積v w あるいはテンソル積v ⊗ w と呼ばれる。
行列の三項積
可換環 K 上の m × n 行列の全体 Mm×n(K) は加法とスカラー倍について K-加群を成すばかりでなく、その上の三項演算
しばしば実または複素成分の行列に焦点を当てることもあるが、それ以外にももっと一般の種類の成分を持った行列を考えることができる。一般化の最初の段階として任意の体(すなわち四則演算が自由にできる集合、例えば R, C 以外に有理数体 Q や有限体Fqなど)を成分として考える。例えば符号理論では有限体上の行列を利用する。どの体で考えるとしても、固有値は多項式の根として考えることができて、それは行列の係数体の拡大体の中に存在する。たとえば、実行列の場合は固有値は複素数である。ある行列の成分をより大きな体の元と解釈しなおすことはできる(例えば実行列を全ての成分が実数であるような複素行列とみることができる)から、そのような十分大きな体の中で任意の正方行列についてその固有値全てから成る集合を考えることができる。あるいは最初から、複素数体 C のような代数閉体に成分を持つような行列のみを考えるものとすることもできる。
もっと一般に、抽象代数学では環に成分を持つ行列というものが甚だ有用である[30]。環は除法演算を持たない点において体よりも一般の概念である。この場合も、行列の加法と乗法はそのまままったく同じ物を使うことができる。R 上の n-次正方行列全体の成す集合 M(n, R) は全行列環と呼ばれる環であり、左 R-加群Rn の自己準同型環に同型である[31]。環 R が可換環、すなわちその乗法が可換律を満たすならば、全行列環 M(n, R) は(n = 1 でない限り)非可換な R 上の単位的結合多元環となる。可換環 R 上の正方行列の行列式はライプニッツの公式を用いて定義することができて、可換環 R 上の正方行列が可逆であることの必要十分条件をその行列式が R の可逆元であることと述べることができる(これは零元でない任意の元が可逆元であった体の場合の一般化になっている)[32]。超環(英語版)上の行列は超行列(英語版)と呼ばれる[33]。
線型写像 Rn → Rm は既に述べたように m × n 行列と等価である。一般に有限次元ベクトル空間の間の線型写像 f: V → W は(V の次元を n, W の次元を m として) V の基底v1, …, vn と W の基底 w1, …, wm を選べば
を満たす行列 A = (aij) によって記述することができる。言い換えれば、
A の第 j-列は基底ベクトル vj の像を W の基底 {wi} に関して表したものになっている。従ってこのような関係は行列 A の成分から一意的に定まる。注意すべきは線型写像を表す行列は基底の取り方に依存することである。基底の取り方を変えれば別な行列が生じるが、それはもとの行列と同値になる[34]。既に述べた具体的な概念の多くはこの方法を通して解釈しなおすことができる。例えば転置行列 A⊤ は A の定める線型写像の転置写像を、双対基底に関して記述するものである。[35]。
より一般に、m × n 行列全体の成す集合は、勝手な単位的環 R に対して自由加群 Rm および Rn の間の R-線型写像を表すのに利用することができる。n = m のとき、そのような写像の合成を定義することができて、n-次正方行列全体の成す全行列環が、Rn の自己準同型環を表現するものとして生じる。
R を任意の単位的環とすれば、右 R-加群としての の自己準同型環は、I × I で添字付けられ、各列の非零成分の数が有限個であるような列有限行列の環 CFMI(R) に同型である。これと対応するものとして、左 R-加群としての M の自己準同型環を考えれば、同様に各行の非零成分の数が有限な行有限行列の環 RFMI(R) が得られる。
無限次元行列を線型写像を記述するのに用いるならば、次に述べるような理由から、その各列ベクトルが有限個の例外を除いて全ての成分が 0 となるものとならなければ無用である。A が適当な基底に関して線型写像 f: V → W を表現するものとすると、それは定義により、空間の任意のベクトルを基底ベクトルの(有限)線型結合として一意に表すことによって与えられるのであるから、従って(列)ベクトル v の成分 vi で非零となるものは有限個に限られる。また、A の各列は V の各基底ベクトルの f による像を W の基底に関して表したものとなっているから、これが意味を持つのはこれらの列ベクトルの非零成分が有限個である場合に限る。しかし一方で、A の行に関しては何の制約もない。事実、v の非零成分が有限個であるならば、積 Av はその各成分が見かけ上無限和の形で与えられるとしても、実際にはそれは非零の項が有限個しかないから、間違いなく決定することができる。さらに言えば、これは A の実質的に有限個の列の線型結合を成すことになり、また各列の非零成分は有限個だから結果として得られる和も非零成分が有限個になる。(通常は、行と列が同じ集合で添字付けられるような)与えられた型の二つの行列の積は矛盾無く定義できて、もとと同じ型を持ち、線型写像の合成に対応することも確認できる。
R がノルム環ならば、行または列に関する有限性条件を緩めることができる。すなわち、有限和の代わりに、そのノルムに関する絶対収束級数を考えればよい。例えば、列和が絶対収束列となるような行列の全体は環を成す。もちろん同様に、行和が絶対収束列となるような行列の全体も環を成す。
^OEDによれば、数学用語としての "matrix" の最初の用例は J. J. Sylvester in London, Edinb. & Dublin Philos. Mag. 37 (1850), p. 369: "We ‥commence‥ with an oblong arrangement of terms consisting, suppose, of m lines and n columns. This will not in itself represent a determinant, but is, as it were, a Matrix out of which we may form various systems of determinants by fixing upon a number p, and selecting at will p lines and p columns, the squares corresponding to which may be termed determinants of the pth order.
^"Not much of matrix theory carries over to infinite-dimensional spaces, and what does is not so useful, but it sometimes helps." [42]
^"Empty Matrix: A matrix is empty if either its row or column dimension is zero",[43] "A matrix having at least one dimension equal to zero is called an empty matrix", [44]
Gilbarg, David; Trudinger, Neil S. (2001), Elliptic partial differential equations of second order (2nd ed.), Berlin, New York: Springer-Verlag, ISBN978-3-540-41160-4
Greub, Werner Hildbert (1975), Linear algebra, Graduate Texts in Mathematics, Berlin, New York: Springer-Verlag, ISBN978-0-387-90110-7
Halmos, Paul Richard (1982), A Hilbert space problem book, Graduate Texts in Mathematics, 19 (2nd ed.), Berlin, New York: Springer-Verlag, ISBN978-0-387-90685-0, MR675952
Householder, Alston S. (1975), The theory of matrices in numerical analysis, New York: Dover Publications, MR0378371
Krzanowski, W. J. (1988), Principles of multivariate analysis, Oxford Statistical Science Series, 3, The Clarendon Press Oxford University Press, ISBN978-0-19-852211-9, MR969370
Itõ, Kiyosi, ed. (1987), Encyclopedic dictionary of mathematics. Vol. I--IV (2nd ed.), MIT Press, ISBN978-0-262-09026-1, MR901762
Latouche, G.; Ramaswami, V. (1999), Introduction to matrix analytic methods in stochastic modeling (1st ed.), Philadelphia: Society for Industrial and Applied Mathematics, ISBN978-0-89871-425-8
Manning, Christopher D.; Schütze, Hinrich (1999), Foundations of statistical natural language processing, MIT Press, ISBN978-0-262-13360-9
Mehata, K. M.; Srinivasan, S. K. (1978), Stochastic processes, New York: McGraw–Hill, ISBN978-0-07-096612-3
Punnen, Abraham P.; Gutin, Gregory (2002), The traveling salesman problem and its variations, Boston: Kluwer Academic Publishers, ISBN978-1-4020-0664-7
Reichl, Linda E. (2004), The transition to chaos: conservative classical systems and quantum manifestations, Berlin, New York: Springer-Verlag, ISBN978-0-387-98788-0
Stinson, Douglas R. (2005), Cryptography, Discrete Mathematics and Its Applications, Chapman & Hall/CRC, ISBN978-1-58488-508-5
Stoer, Josef; Bulirsch, Roland (2002), Introduction to Numerical Analysis (3rd ed.), Berlin, New York: Springer-Verlag, ISBN978-0-387-95452-3
Ward, J. P. (1997), Quaternions and Cayley numbers, Mathematics and its Applications, 403, Dordrecht: Kluwer Academic Publishers Group, ISBN978-0-7923-4513-8, MR1458894
Bohm, Arno (2001), Quantum Mechanics: Foundations and Applications, Springer, ISBN0-387-95330-2
Burgess, Cliff; Moore, Guy (2007), The Standard Model. A Primer, Cambridge University Press, ISBN0-521-86036-9
Guenther, Robert D. (1990), Modern Optics, John Wiley, ISBN0-471-60538-7
Itzykson, Claude; Zuber, Jean-Bernard (1980), Quantum Field Theory, McGraw–Hill, ISBN0-07-032071-3
Riley, K. F.; Hobson, M. P.; Bence, S. J. (1997), Mathematical methods for physics and engineering, Cambridge University Press, ISBN0-521-55506-X
Schiff, Leonard I. (1968), Quantum Mechanics (3rd ed.), McGraw–Hill
Weinberg, Steven (1995), The Quantum Theory of Fields. Volume I: Foundations, Cambridge University Press, ISBN0-521-55001-7
Wherrett, Brian S. (1987), Group Theory for Atoms, Molecules and Solids, Prentice–Hall International, ISBN0-13-365461-3
Zabrodin, Anton; Brezin, Édouard; Kazakov, Vladimir; Serban, Didina; Wiegmann, Paul (2006), Applications of Random Matrices in Physics (NATO Science Series II: Mathematics, Physics and Chemistry), Berlin, New York: Springer-Verlag, ISBN978-1-4020-4530-1
Knobloch, Eberhard (1994), “From Gauss to Weierstrass: determinant theory and its historical evaluations”, The intersection of history and mathematics, Sci. Networks Hist. Stud., 15, Basel, Boston, Berlin: Birkhäuser, pp. 51–66, MR1308079
Mehra, J.; Rechenberg, Helmut (1987), The Historical Development of Quantum Theory (1st ed.), Berlin, New York: Springer-Verlag, ISBN978-0-387-96284-9
Shen, Kangshen; Crossley, John N.; Lun, Anthony Wah-Cheung (1999), Nine Chapters of the Mathematical Art, Companion and Commentary (2nd ed.), Oxford University Press, ISBN978-0-19-853936-0