Polinomio cuyas raíces son los valores propios de una matriz
En álgebra lineal , el polinomio característico de una matriz cuadrada es un polinomio que es invariante bajo semejanza de matrices y tiene los valores propios como raíces . Tiene el determinante y la traza de la matriz entre sus coeficientes. El polinomio característico de un endomorfismo de un espacio vectorial de dimensión finita es el polinomio característico de la matriz de ese endomorfismo sobre cualquier base (es decir, el polinomio característico no depende de la elección de una base ). La ecuación característica , también conocida como ecuación determinante , [1] [2] [3] es la ecuación que se obtiene al igualar el polinomio característico a cero.
Más precisamente, supongamos que la transformación está representada por una matriz cuadrada. Entonces, un vector propio y el valor propio correspondiente deben satisfacer la ecuación
o, equivalentemente (ya que ),
donde es la matriz identidad , y
(aunque el vector cero satisface esta ecuación para cada no se considera un vector propio).
De ello se deduce que la matriz debe ser singular y su determinante
debe ser cero.
En otras palabras, los valores propios de A son las raíces de
cuyo polinomio es un polinomio mónico en x de grado n si A es una matriz n × n . Este polinomio es el polinomio característico de A .
Definición formal
Considere una matriz El polinomio característico de denotado por es el polinomio definido por [5]
donde denota la matriz identidad .
Algunos autores definen el polinomio característico como Ese polinomio difiere del definido aquí por un signo , por lo que no hay diferencia para propiedades como tener como raíces los valores propios de ; sin embargo, la definición anterior siempre da un polinomio mónico , mientras que la definición alternativa es mónica solo cuando es par.
Ejemplos
Para calcular el polinomio característico de la matriz se calcula
el determinante de lo siguiente:
y se encuentra que es el polinomio característico de
El polinomio característico de una matriz es mónico (su coeficiente principal es ) y su grado es El hecho más importante sobre el polinomio característico ya se mencionó en el párrafo motivacional: los valores propios de son precisamente las raíces de (esto también es válido para el polinomio mínimo de pero su grado puede ser menor que ). Todos los coeficientes del polinomio característico son expresiones polinómicas en las entradas de la matriz. En particular, su coeficiente constante de es el coeficiente de es uno, y el coeficiente de es tr(− A ) = −tr( A ) , donde tr( A ) es la traza de (Los signos dados aquí corresponden a la definición formal dada en la sección anterior; para la definición alternativa, estos serían en cambio y (−1) n – 1 tr( A ) respectivamente. [6] )
Para una matriz el polinomio característico viene dado por
Usando el lenguaje del álgebra exterior , el polinomio característico de una matriz puede expresarse como
donde es la traza de la potencia exterior de la cual tiene dimensión. Esta traza puede calcularse como la suma de todos los menores principales de de tamaño. El algoritmo recursivo de Faddeev-LeVerrier calcula estos coeficientes de manera más eficiente.
Cuando la característica del campo de los coeficientes es cada uno de dichos rastros puede calcularse alternativamente como un determinante único, el de la matriz,
El teorema de Cayley-Hamilton establece que al reemplazar por en el polinomio característico (interpretando las potencias resultantes como potencias matriciales y el término constante como multiplicado por la matriz identidad) se obtiene la matriz cero. En términos informales, cada matriz satisface su propia ecuación característica. Esta afirmación es equivalente a decir que el polinomio mínimo de divide al polinomio característico de
Dos matrices semejantes tienen el mismo polinomio característico. Sin embargo, la inversa no es cierta en general: dos matrices con el mismo polinomio característico no necesariamente son semejantes.
La matriz y su transpuesta tienen el mismo polinomio característico. es similar a una matriz triangular si y solo si su polinomio característico puede factorizarse completamente en factores lineales (lo mismo sucede con el polinomio mínimo en lugar del polinomio característico). En este caso es similar a una matriz en forma normal de Jordan .
Polinomio característico de un producto de dos matrices
Si y son dos matrices cuadradas entonces los polinomios característicos de y coinciden:
Cuando no es singular este resultado se deduce del hecho de que y son similares :
Para el caso en que tanto y son singulares, la identidad buscada es una igualdad entre los polinomios en y los coeficientes de las matrices. Por lo tanto, para probar esta igualdad, basta probar que se verifica en un subconjunto abierto no vacío (para la topología usual , o, más generalmente, para la topología de Zariski ) del espacio de todos los coeficientes. Como las matrices no singulares forman tal subconjunto abierto del espacio de todas las matrices, esto prueba el resultado.
De manera más general, si es una matriz de orden y es una matriz de orden entonces es y es una matriz, y uno tiene
Para demostrarlo, se puede suponer que intercambiando, si es necesario, y Luego, delimitando en la parte inferior con filas de ceros y en la derecha con columnas de ceros, se obtienen dos matrices y tales que y es igual a delimitadas por filas y columnas de ceros. El resultado se deduce del caso de matrices cuadradas, comparando los polinomios característicos de y
Polinomio característico deAa
Si es un valor propio de una matriz cuadrada con vector propio entonces es un valor propio de porque
También se puede demostrar que las multiplicidades concuerdan, y esto se generaliza a cualquier polinomio en lugar de : [7]
Teorema — Sea una matriz cuadrada y sea un polinomio. Si el polinomio característico de tiene una factorización
, entonces el polinomio característico de la matriz está dado por
Es decir, la multiplicidad algebraica de en es igual a la suma de las multiplicidades algebraicas de en sobre tales que
En particular, y
Aquí un polinomio , por ejemplo, se evalúa en una matriz simplemente como
El teorema se aplica a matrices y polinomios sobre cualquier cuerpo o anillo conmutativo . [8]
Sin embargo, la suposición de que tiene una factorización en factores lineales no siempre es verdadera, a menos que la matriz esté sobre un cuerpo algebraicamente cerrado como los números complejos.
Prueba
Esta prueba sólo se aplica a matrices y polinomios sobre números complejos (o cualquier cuerpo algebraicamente cerrado). En ese caso, el polinomio característico de cualquier matriz cuadrada siempre se puede factorizar como
donde son los valores propios de posiblemente repetidos. Además, el teorema de descomposición de Jordan garantiza que cualquier matriz cuadrada se puede descomponer como donde es una matriz invertible y es triangular superior
con en la diagonal (con cada valor propio repetido de acuerdo con su multiplicidad algebraica). (La forma normal de Jordan tiene propiedades más fuertes, pero estas son suficientes; alternativamente se puede utilizar la descomposición de Schur , que es menos popular pero algo más fácil de demostrar).
Sea
entonces
Para una matriz triangular superior con diagonal la matriz es triangular superior con diagonal en
y por lo tanto es triangular superior con diagonal
Por lo tanto, los valores propios de son
Dado que es similar a tiene los mismos valores propios, con las mismas multiplicidades algebraicas.
Función secular y ecuación secular
Función secular
El término función secular se ha utilizado para lo que hoy se denomina polinomio característico (en alguna literatura todavía se utiliza el término función secular). El término proviene del hecho de que el polinomio característico se utilizaba para calcular perturbaciones seculares (en una escala de tiempo de un siglo, es decir, lentas en comparación con el movimiento anual) de las órbitas planetarias, según la teoría de oscilaciones de Lagrange .
Ecuación secular
La ecuación secular puede tener varios significados.
En álgebra lineal a veces se utiliza en lugar de la ecuación característica.
En astronomía es la expresión algebraica o numérica de la magnitud de las desigualdades en el movimiento de un planeta que permanecen después de que se han tenido en cuenta las desigualdades de un período corto. [9]
En los cálculos de orbitales moleculares relacionados con la energía del electrón y su función de onda también se utiliza en lugar de la ecuación característica.
Para álgebras asociativas generales
La definición anterior del polinomio característico de una matriz con entradas en un cuerpo se generaliza sin cambios al caso en el que es simplemente un anillo conmutativo . Garibaldi (2004) define el polinomio característico para elementos de un álgebra de dimensión finita arbitraria ( asociativa , pero no necesariamente conmutativa) sobre un cuerpo y demuestra las propiedades estándar del polinomio característico en esta generalidad.
^ Forsythe, George E.; Motzkin, Theodore (enero de 1952). "Una extensión de la transformación de Gauss para mejorar la condición de los sistemas de ecuaciones lineales" (PDF) . Matemáticas de la computación . 6 (37): 18–34. doi : 10.1090/S0025-5718-1952-0048162-0 . Consultado el 3 de octubre de 2020 .
^ Frank, Evelyn (1946). "Sobre los ceros de polinomios con coeficientes complejos". Boletín de la Sociedad Matemática Americana . 52 (2): 144–157. doi : 10.1090/S0002-9904-1946-08526-2 .
^ "Polinomio característico de un gráfico – Wolfram MathWorld" . Consultado el 26 de agosto de 2011 .
^ Steven Roman (1992). Álgebra lineal avanzada (2.ª ed.). Springer. pág. 137. ISBN3540978372.
Garibaldi, Skip (2004), "El polinomio característico y el determinante no son construcciones ad hoc", American Mathematical Monthly , 111 (9): 761–778, arXiv : math/0203276 , doi :10.2307/4145188, JSTOR 4145188, MR 2104048
Werner Greub (1974) Álgebra lineal , 4.ª edición, págs. 120-5, Springer, ISBN 0-387-90110-8 .