8. Dạng toàn phương¶
8.1. Giới thiệu dạng toàn phương¶
Định nghĩa 8.1 (Dạng toàn phương)
Dạng toàn phương (hay quadratic form, квадратная форма) là đa thức bậc hai trên trường \(K\) với \(n\) biến \(x_1\), \(x_2\), ..., \(x_n\), nghĩa là
Ở đây, \(a_{ij}\) được gọi là hệ số (hay coefficient, коэффициент) với \(1 \leqslant i, j \leqslant n\), và \(a_{ij} = a_{ji}\) với mọi \(i \neq j\).
Ví dụ 8.1
Đa thức \(x_1^2 + x_2^2 + 3 x_2 x_3 - x_3^2\) là dạng toàn phương với ba biến.
Đa thức \(x_1^2 - x_2^2 + 3 x_1 + 2 x_2\) là đa thức bậc hai nhưng không phải dạng toàn phương vì có phần tuyến tính \(3 x_1 + 2 x_2\).
Câu hỏi nhỏ cho bạn đọc. Với đa thức bậc hai \(n\) biến bất kì
thì điều kiện nào của hệ số cho phép chúng ta biến đổi về dạng toàn phương? Ví dụ, với đa thức
nếu đặt \(y_1 = x_1 + \frac{3}{2}\) và \(y_2 = x_2 - 1\) thì ta có \(y_1^2 - y_2^2\) là dạng toàn phương ứng với các biến \(y_1\), \(y_2\).
Định nghĩa 8.2 (Dạng toàn phương chính tắc)
Dạng toàn phương được gọi là chính tắc (hay canonical) khi các hệ số \(a_{ij} = 0\) với mọi \(i \neq j\).
Ví dụ 8.2
Đa thức \(x_1^2 + x_2^2 + 3 x_2 x_3 - x_3^2\) không là dạng toàn phương chính tắc vì có đơn thức \(x_2 x_3\).
Đa thức \(x_1^2 - x_2^2 + 4 x_3^2\) là dạng toàn phương chính tắc.
Nếu đặt các biến của dạng toàn phương thành vector cột
thì dạng toàn phương có thể được viết dưới dạng phép nhân ma trận
trong đó \(\bm{A}\) là ma trận đối xứng và \(\bm{x}^{\top}\) là chuyển vị của vector \(\bm{x}\).
Cụ thể hơn, dạng ma trận tương ứng với dạng toàn phương
ở định nghĩa là
với \(a_{ij} = a_{ji}\) và điều này giải thích hệ số \(2\) trong dạng toàn phương
Khi dạng toàn phương là chính tắc thì \(a_{ij} = 0\) với mọi \(i \neq j\) nên \(\bm{A}\) là ma trận đường chéo chính.
Hiện tại chúng ta sẽ khảo sát dạng toàn phương với hệ số thực, tức \(a_{ij} \in \mathbb{R}\).
Bài toán quan trọng của dạng toàn phương là làm thế nào để biến đổi dạng toàn phương tổng quát về dạng chính tắc. Để giải quyết vấn đề này ta sử dụng phương pháp chéo hóa hoặc phương pháp Lagrange.
8.2. Sơ lược về liên hợp Hermitian¶
Với số phức \(z = a + bi\) với :math`a, b in mathbb{R}` và \(i\) là đơn vị ảo, \(i^2 = -1\), ta kí hiệu \(\bar{z}\) là liên hợp của \(z\), nghĩa là \(\bar{z} = a - bi\).
Ngoài ra ta cũng kí hiệu \(\lvert z \rvert\) là module của số phức \(z\). Nếu \(z = a + bi\) thì \(\lvert z \rvert = \sqrt{a^2 + b^2}\). Dễ thấy \(z \cdot \bar{z} = \lvert z \rvert^2\).
Với ma trận \(\bm{A} = (a_{ij})_{n \times m}\), ma trận chuyển vị liên hợp (hay conjugate transpose) là ma trận \(\bm{B} = (b_{ij})_{m \times n}\) được định nghĩa bởi
Như vậy, để thu được ma trận chuyển vị liên hợp, đầu tiên ta chuyển vị ma trận \(\bm{A}\) (tính \(\bm{A}^{\top}\)) và lấy liên hợp từng phần tử.
Ma trận chuyển vị liên hợp của ma trận \(\bm{A}\) được kí hiệu là \(\bm{A}^*\).
Ví dụ, xét ma trận
Tính chất 8.1 (Tính chất của ma trận chuyển vị liên hợp)
Nếu \(\bm{A}\) và \(\bm{B}\) là hai ma trận cùng cỡ thì \(\left(\bm{A} + \bm{B}\right)^* = \bm{A}^* + \bm{B}^*\).
Với mọi ma trận \(\bm{A}\) cỡ \(n \times m\) và với mọi ma trận \(\bm{B}\) cỡ \(m \times p\) thì \(\left(\bm{A} \bm{B}\right)^* = \bm{B}^* \bm{A}^*\).
Với mọi ma trận \(\bm{A}\) thì \(\left(\bm{A}^*\right)^* = \bm{A}\).
Nếu \(\bm{v} \in \mathbb{C}^{n \times 1}\) là vector cột độ dài \(n\) thì tích vô hướng \(\bm{v}^* \bm{v}\) là số thực.
Các tính chất 1-3 có thể dễ dàng chứng minh tương tự như đối với ma trận chuyển vị, và tính chất 4 suy ra từ tính chất của module số phức bên trên.
8.3. Phương pháp trực giao¶
Ta sử dụng tính chất sau của ma trận đối xứng.
Tính chất 8.2 (Số lượng trị riêng của ma trận đối xứng)
Ma trận đối xứng kích thước \(n \times n\) trên \(\mathbb{R}\) có đúng \(n\) trị riêng thực.
Chứng minh
Theo định lí cơ bản của đại số thì mọi đa thức bậc \(n\) trên \(\mathbb{R}\) có đầy đủ \(n\) nghiệm trên \(\mathbb{C}\). Do đó nếu gọi \(\lambda\) là trị riêng của ma trận vuông đối xứng \(\bm{A}\) thì ta cần chứng minh \(\lambda = \overline{\lambda}\), tức \(\lambda\) là số thực.
Vì \(\lambda\) là trị riêng của ma trận \(\bm{A}\) cỡ \(n \times n\) nên tồn tại vector \(\bm{v} \in \mathbb{C}^{n \times 1}\) khác không sao cho
với \(\bm{v}^*\) là chuyển vị liên hợp của vector \(\bm{v}\).
Lúc này, lấy chuyển vị liên hợp hai vế và sử dụng tính chất 3 của tích các ma trận ta có
Vì \(\bm{A}\) là ma trận đối xứng thực nên \(\bm{A}^* = \bm{A}\), do đó
và theo tính chất 4 ở trên, do \(\bm{v}\) là vector khác không nên \(\bm{v}^* \bm{v} \neq 0\), suy ra \(\overline{\lambda} = \lambda\). Như vậy \(\lambda\) là số thực.
Lúc này, với dạng toàn phương cho bởi \(\bm{x}^{\top} \bm{A} \bm{x}\) và \(\bm{A}\) là ma trận đối xứng thì ma trận \(\bm{A}\) có đầy đủ \(n\) trị riêng thực và có thể chéo hóa thành \(\bm{A} = \bm{P} \cdot \bm{D} \cdot \bm{P}^{-1}\), trong đó
\(\bm{D}\) là ma trận chéo với các phần tử trên đường chéo chính là các trị riêng;
\(\bm{P}\) là ma trận với các cột là các vector riêng ứng với các trị riêng (theo thứ tự) trong ma trận \(\bm{D}\).
Tiếp theo ta cần hai tính chất của các vector riêng của ma trận đối xứng thực:
Hai vector riêng ứng với hai trị riêng khác nhau luôn trực giao với nhau.
Hai vector riêng ứng với cùng trị riêng có thể được chọn sao cho trực giao với nhau.
Đối với tính chất 2, hai vector riêng cùng trị riêng sinh ra một không gian vector với cơ sở là hai vector riêng đó. Từ đây áp dụng phương pháp trực giao hóa Gram-Schmidt ta có thể xây dựng hai vector mới trực giao với nhau từ hai vector riêng ban đầu. Sau đây ta sẽ chứng minh tính chất 1.
Chứng minh
Giả sử \(\lambda_1\) và \(\lambda_2\) là hai trị riêng khác nhau của ma trận đối xứng thực \(\bm{A}\), tương ứng là hai vector riêng \(\bm{v}_1\) và \(\bm{v}_2\).
Vì \(\bm{A}\) là ma trận đối xứng thực nên \(\bm{A} = \bm{A}^{\top}\) và ta có
Bây giờ xét \(\bm{v}_1^{\top} \bm{A}^{\top} \bm{v}_2\) thì với \(\bm{A}\)
Như vậy
mà \(\lambda_1 \neq \lambda_2\) nên \(\bm{v}_1^{\top} \bm{v}_2 = \bm{0}\). Kết luận: \(\bm{v}_1\) và \(\bm{v}_2\) trực giao.
Khi ta chuẩn hóa các vector riêng thì ta thu được các vector riêng trực chuẩn nhau đôi một từ hai tính chất trên. Khi đó ta có thể chứng minh được tính chất của ma trận \(\bm{P}\) là \(\bm{P}^{\top} \bm{P} = \bm{I}\), hay \(\bm{P}^{-1} = \bm{P}^{\top}\).
Vì \(\bm{A}\) là ma trận đối xứng nên
mà \(\bm{D}\) là ma trận đường chéo chính nên \(\bm{D}^{\top} = \bm{D}\) và ta thu được
Khi đó dạng toàn phương trở thành
Đặt \(\bm{y} = \bm{P}^{\top} \bm{x}\) thì ta được dạng toàn phương mới theo các biến \(y_1\), \(y_2\), ..., \(y_n\)
và do \(\bm{D}\) là ma trận đường chéo nên đây là dạng toàn phương chính tắc.
Chúng ta hãy thử một ví dụ nhỏ.
Ví dụ 8.3
Chuyển đa thức \(3 x^2 + 8 x y - 3 y^2\) thành dạng toàn phương chính tắc.
Dạng toàn phương trên tương đương phép nhân ma trận
Đầu tiên ta tính các trị riêng của ma trận \(\bm{A} = \begin{pmatrix} 3 & 4 \\ 4 & -3 \end{pmatrix}\) theo Ví dụ 4.1. Khi đó:
tương ứng với trị riêng \(\lambda_1 = 5\) là vector riêng \(\bm{v}_1 = (2, 1)\) và ta chuẩn hóa thành \((2/\sqrt{5}, 1/\sqrt{5})\);
tương ứng với trị riêng \(\lambda_2 = -5\) là vector riêng \(\bm{v}_2 = (1, -2)\) và ta chuẩn hóa thành \((1\sqrt{5}, -2\sqrt{5})\).
Như vậy ma trận \(\bm{A}\) được chéo hóa thành
Cuối cùng, để chuyển đa thức về dạng toàn phương chính tắc ta đổi biến
thì ta có dạng toàn phương chính tắc \(5 u^2 - 5 v^2\).
Để kiểm tra ví dụ trên ta biểu diễn \((x, y)\) theo \((u, v)\) với lưu ý \(\bm{P}^{\top} = \bm{P}^{-1}\)
Ta thay vào đa thức ban đầu
Ghi chú
Nhược điểm của phương pháp trực giao là phải tìm tất cả nghiệm của phương trình đặc trưng. Trong trường hợp tổng quát điều này không dễ thực hiện, thậm chí bất khả thi trong trường hợp tổng quát với kích thước lớn vì không tồn tại công thức nghiệm tổng quát cho phương trình bậc \(5\) trở lên. Do đó chúng ta sẽ tìm hiểu phương pháp thứ hai là phương pháp Lagrange.
8.4. Phương pháp Lagrange¶
Ý tưởng chính của phương pháp Lagrange dựa trên khai triển bình phương
Khi đó ta cố gắng đưa dạng toàn phương
với \(y_1\) là một tổ hợp của các biến \(x_1\), \(x_2\), ..., \(x_n\).
Giả sử ta có dạng toàn phương
Không mất tính tổng quát, giả sử \(a_{11} \neq 0\) và xét biến \(x_1\) (nếu bằng \(0\) thì ta chuyển sang xét \(a_{22}\) với biến \(x_2\), vân vân). Khi đó ta biến đổi
Lúc này, thực hiện đổi biến
và đặt
thì ta thu được dạng toàn phương mới
không còn các đơn thức dạng \(x_1 x_j\).
Tiếp tục thực hiện như vậy cho từng biến và ta thu được dạng toàn phương chính tắc.
Mình sẽ thử nghiệm với ví dụ bên trên: \(3 x^2 + 8 x y - 3 y^2\).
Mình biến đổi
Thực hiện đổi biến \(u = x + 4y/3\) thì ta có dạng toàn phương chính tắc
theo hai biến \(u\) và \(y\).
Chú ý 8.1
Dạng toàn phương không là duy nhất tùy vào phương pháp biến đổi. Hơn nữa, ở ví dụ trên, nếu ta lấy \(y\) làm mốc thay vì \(x\) thì ta có dạng toàn phương
Phương pháp Lagrange khắc phục được nhược điểm của phương pháp trực giao vì không phải tìm nghiệm đa thức bậc cao mà chỉ cần rút gọn từng biến đến khi các đơn thức \(x_i x_j\) với \(i \neq j\) không còn nữa.
Phương pháp Lagrange có nhược điểm khi số biến lớn vì việc khai triển tổng bậc hai ra để thu gọn hệ số với \(n-1\) biến còn lại rất phức tạp. Tuy nhiên điều này có thể được khắc phục khi cài đặt trên máy tính.