Fórmula de Leibniz para determinantes

Fórmula matemática

En álgebra , la fórmula de Leibniz , llamada así en honor a Gottfried Leibniz , expresa el determinante de una matriz cuadrada en términos de permutaciones de los elementos de la matriz. Si es una matriz, donde es la entrada en la -ésima fila y -ésima columna de , la fórmula es A {\estilo de visualización A} norte × norte {\displaystyle n\veces n} a i yo estilo de visualización a_ {ij}} i {\estilo de visualización i} yo {\estilo de visualización j} A {\estilo de visualización A}

det ( A ) = τ S norte signo ( τ ) i = 1 norte a i τ ( i ) = σ S norte signo ( σ ) i = 1 norte a σ ( i ) i {\displaystyle \det(A)=\sum _{\tau \in S_{n}}\operatorname {sgn}(\tau )\prod _{i=1}^{n}a_{i\tau (i)}=\sum _{\sigma \in S_{n}}\operatorname {sgn}(\sigma )\prod _{i=1}^{n}a_{\sigma (i)i}}

donde es la función de signo de las permutaciones en el grupo de permutaciones , que devuelve y para las permutaciones pares e impares , respectivamente. sgn {\displaystyle \operatorname {sgn} } S n {\displaystyle S_{n}} + 1 {\displaystyle +1} 1 {\displaystyle -1}

Otra notación común utilizada para la fórmula es en términos del símbolo de Levi-Civita y hace uso de la notación de suma de Einstein , donde se convierte en

det ( A ) = ϵ i 1 i n a 1 i 1 a n i n , {\displaystyle \det(A)=\epsilon _{i_{1}\cdots i_{n}}{a}_{1i_{1}}\cdots {a}_{ni_{n}},}

que puede ser más familiar para los físicos.

La evaluación directa de la fórmula de Leibniz a partir de la definición requiere operaciones en general (es decir, un número de operaciones asintóticamente proporcional a factorial ), porque es el número de permutaciones de orden. Esto es poco práctico incluso para . En cambio, el determinante se puede evaluar en operaciones formando la descomposición LU (normalmente mediante eliminación gaussiana o métodos similares), en cuyo caso y los determinantes de las matrices triangulares y son simplemente los productos de sus entradas diagonales. (Sin embargo, en aplicaciones prácticas de álgebra lineal numérica, rara vez se requiere el cálculo explícito del determinante). Véase, por ejemplo, Trefethen y Bau (1997). El determinante también se puede evaluar en menos de operaciones reduciendo el problema a la multiplicación de matrices , pero la mayoría de estos algoritmos no son prácticos. Ω ( n ! n ) {\displaystyle \Omega (n!\cdot n)} n {\displaystyle n} n ! {\displaystyle n!} n {\displaystyle n} n {\displaystyle n} O ( n 3 ) {\displaystyle O(n^{3})} A = L U {\displaystyle A=LU} det A = det L det U {\displaystyle \det A=\det L\cdot \det U} L {\displaystyle L} U {\displaystyle U} O ( n 3 ) {\displaystyle O(n^{3})}

Declaración formal y prueba

Teorema. Existe exactamente una función que es multilineal alternada respecto de las columnas y tal que . F : M n ( K ) K {\displaystyle F:M_{n}(\mathbb {K} )\rightarrow \mathbb {K} } F ( I ) = 1 {\displaystyle F(I)=1}

Prueba.

Unicidad: Sea una función tal y sea una matriz. Llamemos a la -ésima columna de , es decir , de modo que F {\displaystyle F} A = ( a i j ) i = 1 , , n j = 1 , , n {\displaystyle A=(a_{i}^{j})_{i=1,\dots ,n}^{j=1,\dots ,n}} n × n {\displaystyle n\times n} A j {\displaystyle A^{j}} j {\displaystyle j} A {\displaystyle A} A j = ( a i j ) i = 1 , , n {\displaystyle A^{j}=(a_{i}^{j})_{i=1,\dots ,n}} A = ( A 1 , , A n ) . {\displaystyle A=\left(A^{1},\dots ,A^{n}\right).}

Además, denotemos el -ésimo vector columna de la matriz identidad. E k {\displaystyle E^{k}} k {\displaystyle k}

Ahora uno escribe cada uno de los 's en términos de , es decir A j {\displaystyle A^{j}} E k {\displaystyle E^{k}}

A j = k = 1 n a k j E k {\displaystyle A^{j}=\sum _{k=1}^{n}a_{k}^{j}E^{k}} .

Como es multilineal, uno tiene F {\displaystyle F}

F ( A ) = F ( k 1 = 1 n a k 1 1 E k 1 , , k n = 1 n a k n n E k n ) = k 1 , , k n = 1 n ( i = 1 n a k i i ) F ( E k 1 , , E k n ) . {\displaystyle {\begin{aligned}F(A)&=F\left(\sum _{k_{1}=1}^{n}a_{k_{1}}^{1}E^{k_{1}},\dots ,\sum _{k_{n}=1}^{n}a_{k_{n}}^{n}E^{k_{n}}\right)=\sum _{k_{1},\dots ,k_{n}=1}^{n}\left(\prod _{i=1}^{n}a_{k_{i}}^{i}\right)F\left(E^{k_{1}},\dots ,E^{k_{n}}\right).\end{aligned}}}

De la alternancia se deduce que cualquier término con índices repetidos es cero. Por lo tanto, la suma se puede restringir a tuplas con índices no repetidos, es decir, permutaciones:

F ( A ) = σ S n ( i = 1 n a σ ( i ) i ) F ( E σ ( 1 ) , , E σ ( n ) ) . {\displaystyle F(A)=\sum _{\sigma \in S_{n}}\left(\prod _{i=1}^{n}a_{\sigma (i)}^{i}\right)F(E^{\sigma (1)},\dots ,E^{\sigma (n)}).}

Como F es alternante, las columnas se pueden intercambiar hasta que se convierta en la identidad. La función de signo se define para contar la cantidad de intercambios necesarios y dar cuenta del cambio de signo resultante. Finalmente, se obtiene: E {\displaystyle E} sgn ( σ ) {\displaystyle \operatorname {sgn}(\sigma )}

F ( A ) = σ S n sgn ( σ ) ( i = 1 n a σ ( i ) i ) F ( I ) = σ S n sgn ( σ ) i = 1 n a σ ( i ) i {\displaystyle {\begin{aligned}F(A)&=\sum _{\sigma \in S_{n}}\operatorname {sgn}(\sigma )\left(\prod _{i=1}^{n}a_{\sigma (i)}^{i}\right)F(I)\\&=\sum _{\sigma \in S_{n}}\operatorname {sgn}(\sigma )\prod _{i=1}^{n}a_{\sigma (i)}^{i}\end{aligned}}}

como se requiere que sea igual a . F ( I ) {\displaystyle F(I)} 1 {\displaystyle 1}

Por lo tanto, ninguna función además de la función definida por la fórmula de Leibniz puede ser una función alterna multilineal con . F ( I ) = 1 {\displaystyle F\left(I\right)=1}

Existencia: Ahora demostramos que F, donde F es la función definida por la fórmula de Leibniz, tiene estas tres propiedades.

Multilineal :

F ( A 1 , , c A j , ) = σ S n sgn ( σ ) c a σ ( j ) j i = 1 , i j n a σ ( i ) i = c σ S n sgn ( σ ) a σ ( j ) j i = 1 , i j n a σ ( i ) i = c F ( A 1 , , A j , ) F ( A 1 , , b + A j , ) = σ S n sgn ( σ ) ( b σ ( j ) + a σ ( j ) j ) i = 1 , i j n a σ ( i ) i = σ S n sgn ( σ ) ( ( b σ ( j ) i = 1 , i j n a σ ( i ) i ) + ( a σ ( j ) j i = 1 , i j n a σ ( i ) i ) ) = ( σ S n sgn ( σ ) b σ ( j ) i = 1 , i j n a σ ( i ) i ) + ( σ S n sgn ( σ ) i = 1 n a σ ( i ) i ) = F ( A 1 , , b , ) + F ( A 1 , , A j , ) {\displaystyle {\begin{aligned}F(A^{1},\dots ,cA^{j},\dots )&=\sum _{\sigma \in S_{n}}\operatorname {sgn}(\sigma )ca_{\sigma (j)}^{j}\prod _{i=1,i\neq j}^{n}a_{\sigma (i)}^{i}\\&=c\sum _{\sigma \in S_{n}}\operatorname {sgn}(\sigma )a_{\sigma (j)}^{j}\prod _{i=1,i\neq j}^{n}a_{\sigma (i)}^{i}\\&=cF(A^{1},\dots ,A^{j},\dots )\\\\F(A^{1},\dots ,b+A^{j},\dots )&=\sum _{\sigma \in S_{n}}\operatorname {sgn}(\sigma )\left(b_{\sigma (j)}+a_{\sigma (j)}^{j}\right)\prod _{i=1,i\neq j}^{n}a_{\sigma (i)}^{i}\\&=\sum _{\sigma \in S_{n}}\operatorname {sgn}(\sigma )\left(\left(b_{\sigma (j)}\prod _{i=1,i\neq j}^{n}a_{\sigma (i)}^{i}\right)+\left(a_{\sigma (j)}^{j}\prod _{i=1,i\neq j}^{n}a_{\sigma (i)}^{i}\right)\right)\\&=\left(\sum _{\sigma \in S_{n}}\operatorname {sgn}(\sigma )b_{\sigma (j)}\prod _{i=1,i\neq j}^{n}a_{\sigma (i)}^{i}\right)+\left(\sum _{\sigma \in S_{n}}\operatorname {sgn}(\sigma )\prod _{i=1}^{n}a_{\sigma (i)}^{i}\right)\\&=F(A^{1},\dots ,b,\dots )+F(A^{1},\dots ,A^{j},\dots )\\\\\end{aligned}}}

Alternando :

F ( , A j 1 , , A j 2 , ) = σ S n sgn ( σ ) ( i = 1 , i j 1 , i j 2 n a σ ( i ) i ) a σ ( j 1 ) j 1 a σ ( j 2 ) j 2 {\displaystyle {\begin{aligned}F(\dots ,A^{j_{1}},\dots ,A^{j_{2}},\dots )&=\sum _{\sigma \in S_{n}}\operatorname {sgn}(\sigma )\left(\prod _{i=1,i\neq j_{1},i\neq j_{2}}^{n}a_{\sigma (i)}^{i}\right)a_{\sigma (j_{1})}^{j_{1}}a_{\sigma (j_{2})}^{j_{2}}\\\end{aligned}}}

Para cualquier sea la tupla igual a con los índices y intercambiados. σ S n {\displaystyle \sigma \in S_{n}} σ {\displaystyle \sigma '} σ {\displaystyle \sigma } j 1 {\displaystyle j_{1}} j 2 {\displaystyle j_{2}}

F ( A ) = σ S n , σ ( j 1 ) < σ ( j 2 ) [ sgn ( σ ) ( i = 1 , i j 1 , i j 2 n a σ ( i ) i ) a σ ( j 1 ) j 1 a σ ( j 2 ) j 2 + sgn ( σ ) ( i = 1 , i j 1 , i j 2 n a σ ( i ) i ) a σ ( j 1 ) j 1 a σ ( j 2 ) j 2 ] = σ S n , σ ( j 1 ) < σ ( j 2 ) [ sgn ( σ ) ( i = 1 , i j 1 , i j 2 n a σ ( i ) i ) a σ ( j 1 ) j 1 a σ ( j 2 ) j 2 sgn ( σ ) ( i = 1 , i j 1 , i j 2 n a σ ( i ) i ) a σ ( j 2 ) j 1 a σ ( j 1 ) j 2 ] = σ S n , σ ( j 1 ) < σ ( j 2 ) sgn ( σ ) ( i = 1 , i j 1 , i j 2 n a σ ( i ) i ) ( a σ ( j 1 ) j 1 a σ ( j 2 ) j 2 a σ ( j 1 ) j 2 a σ ( j 2 ) j 1 ) = 0 , if  A j 1 = A j 2 {\displaystyle {\begin{aligned}F(A)&=\sum _{\sigma \in S_{n},\sigma (j_{1})<\sigma (j_{2})}\left[\operatorname {sgn}(\sigma )\left(\prod _{i=1,i\neq j_{1},i\neq j_{2}}^{n}a_{\sigma (i)}^{i}\right)a_{\sigma (j_{1})}^{j_{1}}a_{\sigma (j_{2})}^{j_{2}}+\operatorname {sgn}(\sigma ')\left(\prod _{i=1,i\neq j_{1},i\neq j_{2}}^{n}a_{\sigma '(i)}^{i}\right)a_{\sigma '(j_{1})}^{j_{1}}a_{\sigma '(j_{2})}^{j_{2}}\right]\\&=\sum _{\sigma \in S_{n},\sigma (j_{1})<\sigma (j_{2})}\left[\operatorname {sgn}(\sigma )\left(\prod _{i=1,i\neq j_{1},i\neq j_{2}}^{n}a_{\sigma (i)}^{i}\right)a_{\sigma (j_{1})}^{j_{1}}a_{\sigma (j_{2})}^{j_{2}}-\operatorname {sgn}(\sigma )\left(\prod _{i=1,i\neq j_{1},i\neq j_{2}}^{n}a_{\sigma (i)}^{i}\right)a_{\sigma (j_{2})}^{j_{1}}a_{\sigma (j_{1})}^{j_{2}}\right]\\&=\sum _{\sigma \in S_{n},\sigma (j_{1})<\sigma (j_{2})}\operatorname {sgn}(\sigma )\left(\prod _{i=1,i\neq j_{1},i\neq j_{2}}^{n}a_{\sigma (i)}^{i}\right)\underbrace {\left(a_{\sigma (j_{1})}^{j_{1}}a_{\sigma (j_{2})}^{j_{2}}-a_{\sigma (j_{1})}^{j_{2}}a_{\sigma (j_{2})}^{j_{_{1}}}\right)} _{=0{\text{, if }}A^{j_{1}}=A^{j_{2}}}\\\\\end{aligned}}}

Así que si entonces . A j 1 = A j 2 {\displaystyle A^{j_{1}}=A^{j_{2}}} F ( , A j 1 , , A j 2 , ) = 0 {\displaystyle F(\dots ,A^{j_{1}},\dots ,A^{j_{2}},\dots )=0}

Finalmente, : F ( I ) = 1 {\displaystyle F(I)=1}

F ( I ) = σ S n sgn ( σ ) i = 1 n I σ ( i ) i = σ S n sgn ( σ ) i = 1 n δ i , σ ( i ) = σ S n sgn ( σ ) δ σ , id { 1 n } = sgn ( id { 1 n } ) = 1 {\displaystyle {\begin{aligned}F(I)&=\sum _{\sigma \in S_{n}}\operatorname {sgn}(\sigma )\prod _{i=1}^{n}I_{\sigma (i)}^{i}=\sum _{\sigma \in S_{n}}\operatorname {sgn}(\sigma )\prod _{i=1}^{n}\operatorname {\delta } _{i,\sigma (i)}\\&=\sum _{\sigma \in S_{n}}\operatorname {sgn}(\sigma )\operatorname {\delta } _{\sigma ,\operatorname {id} _{\{1\ldots n\}}}=\operatorname {sgn}(\operatorname {id} _{\{1\ldots n\}})=1\end{aligned}}}

Por lo tanto, las únicas funciones multilineales alternantes con están restringidas a la función definida por la fórmula de Leibniz, y de hecho también tiene estas tres propiedades. Por lo tanto, el determinante puede definirse como la única función con estas tres propiedades. F ( I ) = 1 {\displaystyle F(I)=1} det : M n ( K ) K {\displaystyle \det :M_{n}(\mathbb {K} )\rightarrow \mathbb {K} }

Véase también

Referencias

Retrieved from "https://en.wikipedia.org/w/index.php?title=Leibniz_formula_for_determinants&oldid=1184751604"