Transformación de Legendre

Transformación matemática
La función se define en el intervalo . Para un determinado , la diferencia alcanza el máximo en . Por lo tanto, la transformación de Legendre de es . F ( incógnita ) {\estilo de visualización f(x)} [ a , b ] {\textstyle [a,b]} pag {\estilo de visualización p} pag incógnita F ( incógnita ) {\displaystyle px-f(x)} incógnita " {\estilo de visualización x'} F ( incógnita ) {\estilo de visualización f(x)} F ( pag ) = pag incógnita " F ( incógnita " ) {\displaystyle f^{*}(p)=px'-f(x')}

En matemáticas , la transformación de Legendre (o transformada de Legendre ), introducida por primera vez por Adrien-Marie Legendre en 1787 cuando estudiaba el problema de la superficie mínima, [1] es una transformación involutiva sobre funciones de valores reales que son convexas en una variable real. Específicamente, si una función multivariable de valores reales es convexa en una de sus variables reales independientes, entonces la transformada de Legendre con respecto a esta variable es aplicable a la función.

En problemas físicos, la transformada de Legendre se utiliza para convertir funciones de una magnitud (como la posición, la presión o la temperatura) en funciones de la magnitud conjugada (momento, volumen y entropía, respectivamente). De esta manera, se utiliza habitualmente en mecánica clásica para derivar el formalismo hamiltoniano a partir del formalismo lagrangiano (o viceversa) y en termodinámica para derivar los potenciales termodinámicos , así como en la solución de ecuaciones diferenciales de varias variables.

Para funciones suficientemente suaves en la línea real, la transformada de Legendre de una función se puede especificar, hasta una constante aditiva, con la condición de que las primeras derivadas de las funciones sean funciones inversas entre sí. Esto se puede expresar en la notación de derivada de Euler como donde es un operador de diferenciación, representa un argumento o entrada a la función asociada, es una función inversa tal que , o equivalentemente, como y en la notación de Lagrange . F {\estilo de visualización f^{*}} F {\estilo de visualización f} D F ( ) = ( D F ) 1 ( )   , {\displaystyle Df(\cdot )=\left(Df^{*}\right)^{-1}(\cdot )~,} D {\estilo de visualización D} {\estilo de visualización \cdot} ( ϕ ) 1 ( ) {\displaystyle (\phi )^{-1}(\cdot )} ( ϕ ) 1 ( ϕ ( incógnita ) ) = incógnita {\displaystyle (\phi )^{-1}(\phi (x))=x} F " ( F " ( incógnita ) ) = incógnita {\displaystyle f'(f^{*\prime }(x^{*}))=x^{*}} F " ( F " ( incógnita ) ) = incógnita {\displaystyle f^{*\prime}(f'(x))=x}

La generalización de la transformación de Legendre a espacios afines y funciones no convexas se conoce como conjugado convexo (también llamada transformación de Legendre-Fenchel), que puede utilizarse para construir la envoltura convexa de una función .

Definición

Definición en el espacio real unidimensional

Sea un intervalo , y una función convexa ; entonces la transformada de Legendre de es la función definida por donde denota el supremo sobre , p. ej., en se elige de manera que se maximice en cada , o es tal que como existe un valor acotado en todo momento (p. ej., cuando es una función lineal). I R {\displaystyle I\subconjunto \mathbb {R} } F : I R {\displaystyle f:I\to \mathbb {R} } F {\estilo de visualización f} F : I R {\displaystyle f^{*}:I^{*}\to \mathbb {R} } F ( incógnita ) = sorber incógnita I ( incógnita incógnita F ( incógnita ) ) ,         I = { incógnita R : F ( incógnita ) < }   {\displaystyle f^{*}(x^{*})=\sup _{x\in I}(x^{*}xf(x)),\ \ \ \ I^{*}=\left\{x^{*}\in \mathbb {R} :f^{*}(x^{*})<\infty \right\}~} sorber {\textstyle \sup} I {\displaystyle I} incógnita {\textstyle x} I {\textstyle I} x x f ( x ) {\textstyle x^{*}x-f(x)} x {\textstyle x^{*}} x {\textstyle x^{*}} x x f ( x ) {\displaystyle x^{*}x-f(x)} x {\textstyle x} f ( x ) {\displaystyle f(x)}

La función se denomina función conjugada convexa de . Por razones históricas (con raíces en la mecánica analítica), la variable conjugada se denota a menudo como , en lugar de . Si la función convexa está definida en toda la línea y es diferenciable en todas partes , entonces se puede interpretar como el negativo de la intersección con el eje de la línea tangente a la gráfica de que tiene pendiente . f {\displaystyle f^{*}} f {\displaystyle f} p {\displaystyle p} x {\displaystyle x^{*}} f {\displaystyle f} f ( p ) = sup x I ( p x f ( x ) ) = ( p x f ( x ) ) | x = ( f ) 1 ( p ) {\displaystyle f^{*}(p)=\sup _{x\in I}(px-f(x))=\left(px-f(x)\right)|_{x=(f')^{-1}(p)}} y {\displaystyle y} f {\displaystyle f} p {\displaystyle p}

Definición en el espacio real n-dimensional

La generalización a funciones convexas en un conjunto convexo es sencilla: tiene dominio y está definida por donde denota el producto escalar de y . f : X R {\displaystyle f:X\to \mathbb {R} } X R n {\displaystyle X\subset \mathbb {R} ^{n}} f : X R {\displaystyle f^{*}:X^{*}\to \mathbb {R} } X = { x R n : sup x X ( x , x f ( x ) ) < } {\displaystyle X^{*}=\left\{x^{*}\in \mathbb {R} ^{n}:\sup _{x\in X}(\langle x^{*},x\rangle -f(x))<\infty \right\}} f ( x ) = sup x X ( x , x f ( x ) ) , x X   , {\displaystyle f^{*}(x^{*})=\sup _{x\in X}(\langle x^{*},x\rangle -f(x)),\quad x^{*}\in X^{*}~,} x , x {\displaystyle \langle x^{*},x\rangle } x {\displaystyle x^{*}} x {\displaystyle x}

La transformación de Legendre es una aplicación de la relación de dualidad entre puntos y líneas. La relación funcional especificada por se puede representar igualmente bien como un conjunto de puntos o como un conjunto de líneas tangentes especificadas por sus valores de pendiente e intersección. f {\displaystyle f} ( x , y ) {\displaystyle (x,y)}

Comprender la transformada de Legendre en términos de derivadas

Para una función convexa diferenciable en la recta real con primera derivada y su inversa , la transformada de Legendre de , , se puede especificar, hasta una constante aditiva, con la condición de que las primeras derivadas de las funciones sean funciones inversas entre sí, es decir, y . f {\displaystyle f} f {\displaystyle f'} ( f ) 1 {\displaystyle (f')^{-1}} f {\displaystyle f} f {\displaystyle f^{*}} f = ( ( f ) ) 1 {\displaystyle f'=((f^{*})')^{-1}} ( f ) = ( f ) 1 {\displaystyle (f^{*})'=(f')^{-1}}

Para ver esto, primero observe que si como función convexa en la línea real es diferenciable y es un punto crítico de la función de , entonces el supremo se alcanza en (por convexidad, vea la primera figura en esta página de Wikipedia). Por lo tanto, la transformada de Legendre de es . f {\displaystyle f} x ¯ {\displaystyle {\overline {x}}} x p x f ( x ) {\displaystyle x\mapsto p\cdot x-f(x)} x ¯ {\textstyle {\overline {x}}} f {\displaystyle f} f ( p ) = p x ¯ f ( x ¯ ) {\displaystyle f^{*}(p)=p\cdot {\overline {x}}-f({\overline {x}})}

Entonces, supongamos que la primera derivada es invertible y sea . Entonces, para cada , el punto es el único punto crítico de la función (es decir, ) porque y la primera derivada de la función con respecto a en es . Por lo tanto, tenemos para cada . Al derivar con respecto a , encontramos Dado que esto se simplifica a . En otras palabras, y son inversas entre sí . f {\displaystyle f'} g = ( f ) 1 {\displaystyle g=(f')^{-1}} p {\textstyle p} g ( p ) {\displaystyle g(p)} x ¯ {\textstyle {\overline {x}}} x p x f ( x ) {\displaystyle x\mapsto px-f(x)} x ¯ = g ( p ) {\displaystyle {\overline {x}}=g(p)} f ( g ( p ) ) = p {\displaystyle f'(g(p))=p} x {\displaystyle x} g ( p ) {\displaystyle g(p)} p f ( g ( p ) ) = 0 {\displaystyle p-f'(g(p))=0} f ( p ) = p g ( p ) f ( g ( p ) ) {\displaystyle f^{*}(p)=p\cdot g(p)-f(g(p))} p {\textstyle p} p {\textstyle p} ( f ) ( p ) = g ( p ) + p g ( p ) f ( g ( p ) ) g ( p ) . {\displaystyle (f^{*})'(p)=g(p)+p\cdot g'(p)-f'(g(p))\cdot g'(p).} f ( g ( p ) ) = p {\displaystyle f'(g(p))=p} ( f ) ( p ) = g ( p ) = ( f ) 1 ( p ) {\displaystyle (f^{*})'(p)=g(p)=(f')^{-1}(p)} ( f ) {\displaystyle (f^{*})'} f {\displaystyle f'}

En general, si como la inversa de entonces la integración da con una constante h = ( f ) 1 {\displaystyle h'=(f')^{-1}} f , {\displaystyle f',} h = ( f ) {\displaystyle h'=(f^{*})'} f = h + c . {\displaystyle f^{*}=h+c.} c . {\displaystyle c.}

En términos prácticos, dado el gráfico paramétrico de versus equivale al gráfico de versus f ( x ) , {\displaystyle f(x),} x f ( x ) f ( x ) {\displaystyle xf'(x)-f(x)} f ( x ) {\displaystyle f'(x)} f ( p ) {\displaystyle f^{*}(p)} p . {\displaystyle p.}

En algunos casos (por ejemplo, potenciales termodinámicos, a continuación), se utiliza un requisito no estándar, que equivale a una definición alternativa de f * con un signo menos , f ( x ) f ( p ) = x p . {\displaystyle f(x)-f^{*}(p)=xp.}

Definición formal en el contexto de la física

En mecánica analítica y termodinámica, la transformación de Legendre se define habitualmente de la siguiente manera: supongamos que es una función de entonces tenemos f {\displaystyle f} x , {\displaystyle x,}

d f = d f d x d x . {\displaystyle \mathrm {d} f={\frac {\mathrm {d} f}{\mathrm {d} x}}\mathrm {d} x.}

realizar la transformación de Legendre en esta función significa que tomamos como variable independiente, por lo que la expresión anterior se puede escribir como p = d f d x {\displaystyle p={\frac {\mathrm {d} f}{\mathrm {d} x}}}

d f = p d x , {\displaystyle \mathrm {d} f=p\mathrm {d} x,}

y según la regla de Leibniz entonces tenemos d ( u v ) = u d v + v d u , {\displaystyle \mathrm {d} (uv)=u\mathrm {d} v+v\mathrm {d} u,}

d ( x p f ) = x d p , {\displaystyle \mathrm {d} \left(xp-f\right)=x\mathrm {d} p,}

y tomando lo que tenemos significa f = x p f , {\displaystyle f^{*}=xp-f,} d f = x d p , {\displaystyle \mathrm {d} f^{*}=x\mathrm {d} p,}

d f d p = x . {\displaystyle {\frac {\mathrm {d} f^{*}}{\mathrm {d} p}}=x.}

Cuando es una función de variables , entonces podemos realizar la transformación de Legendre sobre cada una o varias variables: tenemos f {\displaystyle f} n {\displaystyle n} x 1 , x 2 , , x n {\displaystyle x_{1},x_{2},\cdots ,x_{n}}

d f = p 1 d x 1 + p 2 d x 2 + + p n d x n {\displaystyle \mathrm {d} f=p_{1}\mathrm {d} x_{1}+p_{2}\mathrm {d} x_{2}+\cdots +p_{n}\mathrm {d} x_{n}}

donde Entonces, si queremos realizar la transformación de Legendre en, por ejemplo, entonces tomamos junto con como variables independientes, y con la regla de Leibniz tenemos p i = f x i . {\displaystyle p_{i}={\frac {\partial f}{\partial x_{i}}}.} x 1 {\displaystyle x_{1}} p 1 {\displaystyle p_{1}} x 2 , , x n {\displaystyle x_{2},\cdots ,x_{n}}

d ( f x 1 p 1 ) = x 1 d p 1 + p 2 d x 2 + + p n d x n . {\displaystyle \mathrm {d} (f-x_{1}p_{1})=-x_{1}\mathrm {d} p_{1}+p_{2}\mathrm {d} x_{2}+\cdots +p_{n}\mathrm {d} x_{n}.}

Entonces para la función tenemos φ ( p 1 , x 2 , , x n ) = f ( x 1 , x 2 , , x n ) x 1 p 1 , {\displaystyle \varphi (p_{1},x_{2},\cdots ,x_{n})=f(x_{1},x_{2},\cdots ,x_{n})-x_{1}p_{1},}

φ p 1 = x 1 , φ x 2 = p 2 , , φ x n = p n . {\displaystyle {\frac {\partial \varphi }{\partial p_{1}}}=-x_{1},\quad {\frac {\partial \varphi }{\partial x_{2}}}=p_{2},\quad \cdots ,\quad {\frac {\partial \varphi }{\partial x_{n}}}=p_{n}.}

También podemos hacer esta transformación para las variables . Si lo hacemos con todas las variables, entonces tenemos x 2 , , x n {\displaystyle x_{2},\cdots ,x_{n}}

d φ = x 1 d p 1 x 2 d p 2 x n d p n {\displaystyle \mathrm {d} \varphi =-x_{1}\mathrm {d} p_{1}-x_{2}\mathrm {d} p_{2}-\cdots -x_{n}\mathrm {d} p_{n}} dónde φ = f x 1 p 1 x 2 p 2 x n p n . {\displaystyle \varphi =f-x_{1}p_{1}-x_{2}p_{2}-\cdots -x_{n}p_{n}.}

En mecánica analítica, la gente realiza esta transformación en variables del Lagrangiano para obtener el Hamiltoniano: q ˙ 1 , q ˙ 2 , , q ˙ n {\displaystyle {\dot {q}}_{1},{\dot {q}}_{2},\cdots ,{\dot {q}}_{n}} L ( q 1 , , q n , q ˙ 1 , , q ˙ n ) {\displaystyle L(q_{1},\cdots ,q_{n},{\dot {q}}_{1},\cdots ,{\dot {q}}_{n})}

H ( q 1 , , q n , p 1 , , p n ) = i = 1 n p i q ˙ i L ( q 1 , , q n , q ˙ 1 , q ˙ n ) {\displaystyle H(q_{1},\cdots ,q_{n},p_{1},\cdots ,p_{n})=\sum _{i=1}^{n}p_{i}{\dot {q}}_{i}-L(q_{1},\cdots ,q_{n},{\dot {q}}_{1}\cdots ,{\dot {q}}_{n})}

Y en termodinámica, la gente realiza esta transformación sobre variables según el tipo de sistema termodinámico que deseen. Por ejemplo, a partir de la función cardinal de estado, la energía interna , tenemos U ( S , V ) {\displaystyle U(S,V)}

d U = T d S p d V , {\displaystyle \mathrm {d} U=T\mathrm {d} S-p\mathrm {d} V,}

Podemos realizar la transformación de Legendre en uno o ambos de los resultados. S , V {\displaystyle S,V}

d H = d ( U + p V )                     =         T d S + V d p {\displaystyle \mathrm {d} H=\mathrm {d} (U+pV)\ \ \ \ \ \ \ \ \ \ =\ \ \ \ T\mathrm {d} S+V\mathrm {d} p}
d F = d ( U T S )                     = S d T p d V {\displaystyle \mathrm {d} F=\mathrm {d} (U-TS)\ \ \ \ \ \ \ \ \ \ =-S\mathrm {d} T-p\mathrm {d} V}
d G = d ( U T S + p V ) = S d T + V d p {\displaystyle \mathrm {d} G=\mathrm {d} (U-TS+pV)=-S\mathrm {d} T+V\mathrm {d} p}

y cada una de estas tres expresiones tiene un significado físico.

Esta definición de transformación de Legendre es la que introdujo originalmente Legendre en su obra de 1787 [1] y que los físicos siguen aplicando hoy en día. De hecho, esta definición puede ser matemáticamente rigurosa si tratamos todas las variables y funciones definidas anteriormente, por ejemplo, como funciones diferenciables definidas en un conjunto abierto de o en una variedad diferenciable, y sus diferenciales (que se tratan como un campo de vectores cotangentes en el contexto de una variedad diferenciable). Y esta definición es equivalente a la definición de los matemáticos modernos siempre que sea diferenciable y convexa para las variables. f , x 1 , , x n , p 1 , , p n , {\displaystyle f,x_{1},\cdots ,x_{n},p_{1},\cdots ,p_{n},} R n {\displaystyle \mathbb {R} ^{n}} d f , d x i , d p i {\displaystyle \mathrm {d} f,\mathrm {d} x_{i},\mathrm {d} p_{i}} f {\displaystyle f} x 1 , x 2 , , x n . {\displaystyle x_{1},x_{2},\cdots ,x_{n}.}

Propiedades

  • La transformada de Legendre de una función convexa, cuyos valores de derivadas dobles son todos positivos, es también una función convexa cuyos valores de derivadas dobles son todos positivos.
    Demostración. Demostremos esto con una función doblemente diferenciable con todos los valores positivos de derivada doble y con una derivada biyectiva (invertible). f ( x ) {\displaystyle f(x)}
    Para un fijo , maximice o haga que la función esté acotada sobre . Entonces, la transformación de Legendre de es , por lo tanto, por la condición de maximización o acotación . Nótese que depende de . (Esto se puede mostrar visualmente en la primera figura de esta página anterior). p {\displaystyle p} x ¯ {\displaystyle {\bar {x}}} p x f ( x ) {\displaystyle px-f(x)} x {\displaystyle x} f {\displaystyle f} f ( p ) = p x ¯ f ( x ¯ ) {\displaystyle f^{*}(p)=p{\bar {x}}-f({\bar {x}})} f ( x ¯ ) = p {\displaystyle f'({\bar {x}})=p} d d x ( p x f ( x ) ) = p f ( x ) = 0 {\displaystyle {\frac {d}{dx}}(px-f(x))=p-f'(x)=0} x ¯ {\displaystyle {\bar {x}}} p {\displaystyle p}
    Por lo tanto , donde , es decir que es la inversa de que es la derivada de (por lo que ). x ¯ = g ( p ) {\displaystyle {\bar {x}}=g(p)} g ( f ) 1 {\displaystyle g\equiv (f')^{-1}} g {\displaystyle g} f {\displaystyle f'} f {\displaystyle f} f ( g ( p ) ) = p {\displaystyle f'(g(p))=p}
    Nótese que también es diferenciable con la siguiente derivada (Regla de función inversa) , por lo tanto, la transformación de Legendre es la composición de funciones diferenciables, por lo tanto, es diferenciable. g {\displaystyle g} d g ( p ) d p = 1 f ( g ( p ) )   . {\displaystyle {\frac {dg(p)}{dp}}={\frac {1}{f''(g(p))}}~.} f ( p ) = p g ( p ) f ( g ( p ) ) {\displaystyle f^{*}(p)=pg(p)-f(g(p))}
    Aplicando la regla del producto y la regla de la cadena con la igualdad encontrada se obtiene que es convexa y sus derivadas dobles son todas positivas. x ¯ = g ( p ) {\displaystyle {\bar {x}}=g(p)} d ( f ) d p = g ( p ) + ( p f ( g ( p ) ) ) d g ( p ) d p = g ( p ) , {\displaystyle {\frac {d(f^{*})}{dp}}=g(p)+\left(p-f'(g(p))\right)\cdot {\frac {dg(p)}{dp}}=g(p),} d 2 ( f ) d p 2 = d g ( p ) d p = 1 f ( g ( p ) ) > 0 , {\displaystyle {\frac {d^{2}(f^{*})}{dp^{2}}}={\frac {dg(p)}{dp}}={\frac {1}{f''(g(p))}}>0,} f {\displaystyle f^{*}}
  • La transformación de Legendre es una involución , es decir, . f = f   {\displaystyle f^{**}=f~}
    Demostración. Al utilizar las identidades anteriores como , , y su derivada , Nótese que esta derivación no requiere que la condición tenga todos los valores positivos en la derivada doble de la función original . f ( x ¯ ) = p {\displaystyle f'({\bar {x}})=p} x ¯ = g ( p ) {\displaystyle {\bar {x}}=g(p)} f ( p ) = p x ¯ f ( x ¯ ) {\displaystyle f^{*}(p)=p{\bar {x}}-f({\bar {x}})} ( f ) ( p ) = g ( p ) {\displaystyle (f^{*})'(p)=g(p)} f ( y ) = ( y p ¯ f ( p ¯ ) ) | ( f ) ( p ¯ ) = y = g ( p ¯ ) p ¯ f ( p ¯ ) = g ( p ¯ ) p ¯ ( p ¯ g ( p ¯ ) f ( g ( p ¯ ) ) ) = f ( g ( p ¯ ) ) = f ( y )   . {\displaystyle {\begin{aligned}f^{**}(y)&{}=\left(y\cdot {\bar {p}}-f^{*}({\bar {p}})\right)|_{(f^{*})'({\bar {p}})=y}\\[5pt]&{}=g({\bar {p}})\cdot {\bar {p}}-f^{*}({\bar {p}})\\[5pt]&{}=g({\bar {p}})\cdot {\bar {p}}-({\bar {p}}g({\bar {p}})-f(g({\bar {p}})))\\[5pt]&{}=f(g({\bar {p}}))\\[5pt]&{}=f(y)~.\end{aligned}}} f {\displaystyle f}

Identidades

Como se muestra arriba, para una función convexa , con maximización o acotación en cada uno para definir la transformada de Legendre y con , se cumplen las siguientes identidades. f ( x ) {\displaystyle f(x)} x = x ¯ {\displaystyle x={\bar {x}}} p x f ( x ) {\displaystyle px-f(x)} p {\displaystyle p} f ( p ) = p x ¯ f ( x ¯ ) {\displaystyle f^{*}(p)=p{\bar {x}}-f({\bar {x}})} g ( f ) 1 {\displaystyle g\equiv (f')^{-1}}

  • f ( x ¯ ) = p {\displaystyle f'({\bar {x}})=p} ,
  • x ¯ = g ( p ) {\displaystyle {\bar {x}}=g(p)} ,
  • ( f ) ( p ) = g ( p ) {\displaystyle (f^{*})'(p)=g(p)} .

Ejemplos

Ejemplo 1

f ( x ) = e x {\displaystyle f(x)=e^{x}} sobre el dominio se representa en rojo y su transformada de Legendre sobre el dominio en azul discontinuo. Nótese que la transformada de Legendre parece convexa. I = R {\displaystyle I=\mathbb {R} } f ( x ) = x ( ln ( x ) 1 ) {\displaystyle f^{*}(x^{*})=x^{*}(\ln(x^{*})-1)} I = ( 0 , ) {\displaystyle I^{*}=(0,\infty )}

Considere la función exponencial que tiene el dominio . De la definición, la transformada de Legendre es donde queda por determinar. Para evaluar el supremo , calcule la derivada de con respecto a e iguale a cero: La segunda derivada es negativa en todas partes, por lo que el valor máximo se logra en . Por lo tanto, la transformada de Legendre es y tiene dominio Esto ilustra que los dominios de una función y su transformada de Legendre pueden ser diferentes. f ( x ) = e x , {\displaystyle f(x)=e^{x},} I = R {\displaystyle I=\mathbb {R} } f ( x ) = sup x R ( x x e x ) , x I {\displaystyle f^{*}(x^{*})=\sup _{x\in \mathbb {R} }(x^{*}x-e^{x}),\quad x^{*}\in I^{*}} I {\displaystyle I^{*}} x x e x {\displaystyle x^{*}x-e^{x}} x {\displaystyle x} d d x ( x x e x ) = x e x = 0. {\displaystyle {\frac {d}{dx}}(x^{*}x-e^{x})=x^{*}-e^{x}=0.} e x {\displaystyle -e^{x}} x = ln ( x ) {\displaystyle x=\ln(x^{*})} f ( x ) = x ln ( x ) e ln ( x ) = x ( ln ( x ) 1 ) {\displaystyle f^{*}(x^{*})=x^{*}\ln(x^{*})-e^{\ln(x^{*})}=x^{*}(\ln(x^{*})-1)} I = ( 0 , ) . {\displaystyle I^{*}=(0,\infty ).}

Para encontrar la transformación de Legendre de la transformación de Legendre de , donde una variable se utiliza intencionalmente como argumento de la función para mostrar la propiedad de involución de la transformada de Legendre como . calculamos así que el máximo ocurre en porque la segunda derivada sobre el dominio de como Como resultado, se encuentra como lo que confirma que como se esperaba. f {\displaystyle f} f ( x ) = sup x R ( x x x ( ln ( x ) 1 ) ) , x I , {\displaystyle f^{**}(x)=\sup _{x^{*}\in \mathbb {R} }(xx^{*}-x^{*}(\ln(x^{*})-1)),\quad x\in I,} x {\displaystyle x} f {\displaystyle f^{**}} f = f {\displaystyle f^{**}=f} 0 = d d x ( x x x ( ln ( x ) 1 ) ) = x ln ( x ) {\displaystyle {\begin{aligned}0&={\frac {d}{dx^{*}}}{\big (}xx^{*}-x^{*}(\ln(x^{*})-1){\big )}=x-\ln(x^{*})\end{aligned}}} x = e x {\displaystyle x^{*}=e^{x}} d 2 d x 2 f ( x ) = 1 x < 0 {\displaystyle {\frac {d^{2}}{{dx^{*}}^{2}}}f^{**}(x)=-{\frac {1}{x^{*}}}<0} f {\displaystyle f^{**}} I = ( 0 , ) . {\displaystyle I^{*}=(0,\infty ).} f {\displaystyle f^{**}} f ( x ) = x e x e x ( ln ( e x ) 1 ) = e x , {\displaystyle {\begin{aligned}f^{**}(x)&=xe^{x}-e^{x}(\ln(e^{x})-1)=e^{x},\end{aligned}}} f = f , {\displaystyle f=f^{**},}

Ejemplo 2

Sea f ( x ) = cx 2 definida en R , donde c > 0 es una constante fija.

Para x * fijo, la función de x , x * xf ( x ) = x * xcx 2 tiene la primera derivada x * − 2 cx y la segunda derivada −2 c ; hay un punto estacionario en x = x */2 c , que siempre es un máximo.

Por lo tanto, I * = R y f ( x ) = x 2 4 c   . {\displaystyle f^{*}(x^{*})={\frac {{x^{*}}^{2}}{4c}}~.}

Las derivadas primeras de f , 2 cx , y de f * , x */(2 c ) , son funciones inversas entre sí. Claramente, además, f ** = f . f ( x ) = 1 4 ( 1 / 4 c ) x 2 = c x 2   , {\displaystyle f^{**}(x)={\frac {1}{4(1/4c)}}x^{2}=cx^{2}~,}

Ejemplo 3

Sea f ( x ) = x 2 para x ∈ ( I = [2, 3]) .

Para x * fijo, x * xf ( x ) es continua en I compact , por lo tanto siempre toma un máximo finito en ella; se deduce que el dominio de la transformada de Legendre de es I * = R . f {\displaystyle f}

El punto estacionario en x = x */2 (que se obtiene haciendo que la primera derivada de x * xf ( x ) con respecto a sea igual a cero) está en el dominio [2, 3] si y solo si 4 ≤ x * ≤ 6 . De lo contrario, el máximo se toma en x = 2 o x = 3 porque la segunda derivada de x * xf ( x ) con respecto a es negativa cuando ; para una parte del dominio, el máximo que x * xf ( x ) puede tomar con respecto a se obtiene en mientras que para se convierte en el máximo en . Por lo tanto, se sigue que x {\displaystyle x} x {\displaystyle x} 2 {\displaystyle -2} x < 4 {\displaystyle x^{*}<4} x [ 2 , 3 ] {\displaystyle x\in [2,3]} x = 2 {\displaystyle x=2} x > 6 {\displaystyle x^{*}>6} x = 3 {\displaystyle x=3} f ( x ) = { 2 x 4 , x < 4 x 2 4 , 4 x 6 , 3 x 9 , x > 6. {\displaystyle f^{*}(x^{*})={\begin{cases}2x^{*}-4,&x^{*}<4\\{\frac {{x^{*}}^{2}}{4}},&4\leq x^{*}\leq 6,\\3x^{*}-9,&x^{*}>6.\end{cases}}}

Ejemplo 4

La función f ( x ) = cx es convexa para cada x (no se requiere convexidad estricta para que la transformación de Legendre esté bien definida). Claramente x * xf ( x ) = ( x * − c ) x nunca está acotada desde arriba como función de x , a menos que x * − c = 0 . Por lo tanto, f * está definida en I * = { c } y f *( c ) = 0 . (La definición de la transformada de Legendre requiere la existencia del supremo , que requiere límites superiores).

Se puede comprobar la involutividad: por supuesto, x * xf *( x *) siempre está acotada como función de x *∈{ c } , por lo tanto I ** = R . Entonces, para todo x se tiene y por lo tanto f **( x ) = cx = f ( x ) . sup x { c } ( x x f ( x ) ) = x c , {\displaystyle \sup _{x^{*}\in \{c\}}(xx^{*}-f^{*}(x^{*}))=xc,}

Ejemplo 5

Como ejemplo de una función continua convexa que no es diferenciable en todas partes, considere . Esto da y por lo tanto en su dominio . f ( x ) = | x | {\displaystyle f(x)=|x|} f ( x ) = sup x ( x x | x | ) = max ( sup x 0 x ( x 1 ) , sup x 0 x ( x + 1 ) ) , {\displaystyle f^{*}(x^{*})=\sup _{x}(xx^{*}-|x|)=\max \left(\sup _{x\geq 0}x(x^{*}-1),\,\sup _{x\leq 0}x(x^{*}+1)\right),} f ( x ) = 0 {\displaystyle f^{*}(x^{*})=0} I = [ 1 , 1 ] {\displaystyle I^{*}=[-1,1]}

Ejemplo 6: varias variables

Sea definida en X = R n , donde A es una matriz real, definida positiva. f ( x ) = x , A x + c {\displaystyle f(x)=\langle x,Ax\rangle +c}

Entonces f es convexa, y tiene gradiente p − 2 Ax y hessiano −2 A , que es negativo; por lo tanto, el punto estacionario x = A −1 p /2 es un máximo. p , x f ( x ) = p , x x , A x c , {\displaystyle \langle p,x\rangle -f(x)=\langle p,x\rangle -\langle x,Ax\rangle -c,}

Tenemos X * = R n , y f ( p ) = 1 4 p , A 1 p c . {\displaystyle f^{*}(p)={\frac {1}{4}}\langle p,A^{-1}p\rangle -c.}

Comportamiento de diferenciales bajo transformadas de Legendre

La transformada de Legendre está vinculada a la integración por partes , p dx = d ( px ) − x dp .

Sea f ( x , y ) una función de dos variables independientes x e y , con la diferencial d f = f x d x + f y d y = p d x + v d y . {\displaystyle df={\frac {\partial f}{\partial x}}\,dx+{\frac {\partial f}{\partial y}}\,dy=p\,dx+v\,dy.}

Supongamos que la función f es convexa en x para todo y , de modo que se puede realizar la transformada de Legendre sobre f en x , con p la variable conjugada a x (para información, existe una relación donde es un punto en x que maximiza o acota para p e y dados ). Como la nueva variable independiente de la transformada con respecto a f es p , las diferenciales dx y dy en df devuelven a dp y dy en la diferencial de la transformada, es decir, construimos otra función con su diferencial expresada en términos de la nueva base dp y dy . f x | x ¯ = p {\displaystyle {\frac {\partial f}{\partial x}}|_{\bar {x}}=p} x ¯ {\displaystyle {\bar {x}}} p x f ( x , y ) {\displaystyle px-f(x,y)}

Consideramos entonces la función g ( p , y ) = fpx de manera que d g = d f p d x x d p = x d p + v d y {\displaystyle dg=df-p\,dx-x\,dp=-x\,dp+v\,dy} x = g p {\displaystyle x=-{\frac {\partial g}{\partial p}}} v = g y . {\displaystyle v={\frac {\partial g}{\partial y}}.}

La función g ( p , y ) es la transformada de Legendre de f ( x , y ) , donde solo la variable independiente x ha sido suplantada por p . Esto se utiliza ampliamente en termodinámica , como se ilustra a continuación.

Aplicaciones

Mecánica analítica

En mecánica clásica se utiliza una transformada de Legendre para derivar la formulación hamiltoniana a partir de la formulación lagrangiana y viceversa. Una lagrangiana típica tiene la forma

L ( v , q ) = 1 2 v , M v V ( q ) , {\displaystyle L(v,q)={\tfrac {1}{2}}\langle v,Mv\rangle -V(q),} donde son coordenadas en R n × R n , M es una matriz real definida positiva, y ( v , q ) {\displaystyle (v,q)} x , y = j x j y j . {\displaystyle \langle x,y\rangle =\sum _{j}x_{j}y_{j}.}

Para cada q fijo, es una función convexa de , mientras que juega el papel de una constante. L ( v , q ) {\displaystyle L(v,q)} v {\displaystyle v} V ( q ) {\displaystyle V(q)}

Por lo tanto, la transformada de Legendre de como función de es la función hamiltoniana, L ( v , q ) {\displaystyle L(v,q)} v {\displaystyle v} H ( p , q ) = 1 2 p , M 1 p + V ( q ) . {\displaystyle H(p,q)={\tfrac {1}{2}}\langle p,M^{-1}p\rangle +V(q).}

En un contexto más general, son coordenadas locales en el fibrado tangente de una variedad . Para cada q , es una función convexa del espacio tangente V q . La transformada de Legendre da el hamiltoniano como una función de las coordenadas ( p , q ) del fibrado cotangente ; el producto interno utilizado para definir la transformada de Legendre se hereda de la estructura simpléctica canónica pertinente . En este contexto abstracto, la transformación de Legendre corresponde a la forma unitaria tautológica . [ se necesita más explicación ] ( v , q ) {\displaystyle (v,q)} T M {\displaystyle T{\mathcal {M}}} M {\displaystyle {\mathcal {M}}} L ( v , q ) {\displaystyle L(v,q)} H ( p , q ) {\displaystyle H(p,q)} T M {\displaystyle T^{*}{\mathcal {M}}}

Termodinámica

La estrategia detrás del uso de las transformadas de Legendre en termodinámica es cambiar de una función que depende de una variable a una nueva función (conjugada) que depende de una nueva variable, la conjugada de la original. La nueva variable es la derivada parcial de la función original con respecto a la variable original. La nueva función es la diferencia entre la función original y el producto de las variables antigua y nueva. Normalmente, esta transformación es útil porque cambia la dependencia de, por ejemplo, la energía de una variable extensiva a su variable intensiva conjugada, que a menudo se puede controlar más fácilmente en un experimento físico.

Por ejemplo, la energía interna U es una función explícita de las variables extensivas entropía S , volumen V y composición química N i (por ejemplo, ) que tiene una diferencial total i = 1 , 2 , 3 , {\displaystyle i=1,2,3,\ldots } U = U ( S , V , { N i } ) , {\displaystyle U=U\left(S,V,\{N_{i}\}\right),} d U = T d S P d V + μ i d N i {\displaystyle dU=T\,dS-P\,dV+\sum \mu _{i}\,dN_{i}}

dónde . T = U S | V , N i   f o r   a l l   i   v a l u e s , P = U V | S , N i   f o r   a l l   i   v a l u e s , μ i = U N i | S , V , N j   f o r   a l l   j i {\displaystyle T=\left.{\frac {\partial U}{\partial S}}\right\vert _{V,N_{i\ for\ all\ i\ values}},P=\left.-{\frac {\partial U}{\partial V}}\right\vert _{S,N_{i\ for\ all\ i\ values}},\mu _{i}=\left.{\frac {\partial U}{\partial N_{i}}}\right\vert _{S,V,N_{j\ for\ all\ j\neq i}}}

(Los subíndices no son necesarios según la definición de derivadas parciales, pero se dejan aquí para aclarar las variables). Estipulando algún estado de referencia común, al utilizar la transformada de Legendre (no estándar) de la energía interna U con respecto al volumen V , la entalpía H se puede obtener de la siguiente manera.

Para obtener la transformada de Legendre (estándar) de la energía interna U con respecto al volumen V , primero se define la función , luego se debe maximizar o acotar por V . Para hacer esto, se debe cumplir la condición , por lo que se obtiene . Este enfoque se justifica porque U es una función lineal con respecto a V (por lo tanto, una función convexa en V ) por la definición de variables extensivas . La transformada de Legendre no estándar aquí se obtiene negando la versión estándar, por lo que . U {\textstyle U^{*}} u ( p , S , V , { N i } ) = p V U {\textstyle u\left(p,S,V,\{{{N}_{i}}\}\right)=pV-U} u V = p U V = 0 p = U V {\textstyle {\frac {\partial u}{\partial V}}=p-{\frac {\partial U}{\partial V}}=0\to p={\frac {\partial U}{\partial V}}} U = U V V U {\textstyle U^{*}={\frac {\partial U}{\partial V}}V-U} U = H = U U V V = U + P V {\textstyle -U^{*}=H=U-{\frac {\partial U}{\partial V}}V=U+PV}

H es definitivamente una función de estado ya que se obtiene sumando PV ( P y V como variables de estado ) a una función de estado , por lo que su diferencial es una diferencial exacta . Debido a y al hecho de que debe ser una diferencial exacta, . U = U ( S , V , { N i } ) {\textstyle U=U\left(S,V,\{N_{i}\}\right)} d H = T d S + V d P + μ i d N i {\textstyle dH=T\,dS+V\,dP+\sum \mu _{i}\,dN_{i}} H = H ( S , P , { N i } ) {\displaystyle H=H(S,P,\{N_{i}\})}

La entalpía es adecuada para la descripción de procesos en los que la presión se controla desde el entorno.

Asimismo, es posible desplazar la dependencia de la energía de la variable extensiva de entropía, S , a la variable intensiva T (a menudo más conveniente) , lo que da como resultado las energías libres de Helmholtz y Gibbs . La energía libre de Helmholtz A y la energía de Gibbs G se obtienen realizando transformadas de Legendre de la energía interna y la entalpía, respectivamente, A = U T S   , {\displaystyle A=U-TS~,} G = H T S = U + P V T S   . {\displaystyle G=H-TS=U+PV-TS~.}

La energía libre de Helmholtz suele ser el potencial termodinámico más útil cuando la temperatura y el volumen se controlan desde el entorno, mientras que la energía de Gibbs suele ser la más útil cuando la temperatura y la presión se controlan desde el entorno.

Condensador variable

Como otro ejemplo de física , considere un condensador de placas conductoras paralelas , en el que las placas pueden moverse unas respecto de otras. Un condensador de este tipo permitiría la transferencia de la energía eléctrica que se almacena en el condensador en trabajo mecánico externo, realizado por la fuerza que actúa sobre las placas. Se puede pensar en la carga eléctrica como análoga a la "carga" de un gas en un cilindro , con la fuerza mecánica resultante ejercida sobre un pistón .

Calcular la fuerza sobre las placas en función de x , la distancia que las separa. Para hallar la fuerza, calcular la energía potencial y luego aplicar la definición de fuerza como el gradiente de la función de energía potencial.

La energía potencial electrostática almacenada en un capacitor de capacidad C ( x ) y una carga eléctrica positiva + Q o carga negativa - Q en cada placa conductora es (usando la definición de la capacitancia como ), C = Q V {\textstyle C={\frac {Q}{V}}}

U ( Q , x ) = 1 2 Q V ( Q , x ) = 1 2 Q 2 C ( x ) ,   {\displaystyle U(Q,\mathbf {x} )={\frac {1}{2}}QV(Q,\mathbf {x} )={\frac {1}{2}}{\frac {Q^{2}}{C(\mathbf {x} )}},~}

donde la dependencia del área de las placas, la constante dieléctrica del material aislante entre las placas y la separación x se abstraen como la capacitancia C ( x ) . (Para un capacitor de placas paralelas, esto es proporcional al área de las placas e inversamente proporcional a la separación).

La fuerza F entre las placas debido al campo eléctrico creado por la separación de carga es entonces F ( x ) = d U d x   . {\displaystyle \mathbf {F} (\mathbf {x} )=-{\frac {dU}{d\mathbf {x} }}~.}

Si el capacitor no está conectado a ningún circuito eléctrico, entonces las cargas eléctricas en las placas permanecen constantes y el voltaje varía cuando las placas se mueven una con respecto a la otra, y la fuerza es el gradiente negativo de la energía potencial electrostática como F ( x ) = 1 2 d C ( x ) d x Q 2 C ( x ) 2 = 1 2 d C ( x ) d x V ( x ) 2 {\displaystyle \mathbf {F} (\mathbf {x} )={\frac {1}{2}}{\frac {dC(\mathbf {x} )}{d\mathbf {x} }}{\frac {Q^{2}}{{C(\mathbf {x} )}^{2}}}={\frac {1}{2}}{\frac {dC(\mathbf {x} )}{d\mathbf {x} }}V(\mathbf {x} )^{2}}

mientras que en esta configuración la carga es fija. V ( Q , x ) = V ( x ) {\textstyle V(Q,\mathbf {x} )=V(\mathbf {x} )}

Sin embargo, supongamos que el voltaje entre las placas V se mantiene constante a medida que la placa se mueve mediante la conexión a una batería , que es un depósito de cargas eléctricas con una diferencia de potencial constante. Entonces, la cantidad de cargas es una variable en lugar del voltaje; y son el conjugado de Legendre entre sí. Para encontrar la fuerza, primero calcule la transformada de Legendre no estándar con respecto a (también con el uso de ), Q {\textstyle Q} Q {\textstyle Q} V {\textstyle V} U {\textstyle U^{*}} Q {\textstyle Q} C = Q V {\textstyle C={\frac {Q}{V}}}

U = U U Q | x Q = U 1 2 C ( x ) Q 2 Q | x Q = U Q V = 1 2 Q V Q V = 1 2 Q V = 1 2 V 2 C ( x ) . {\displaystyle U^{*}=U-\left.{\frac {\partial U}{\partial Q}}\right|_{\mathbf {x} }\cdot Q=U-{\frac {1}{2C(\mathbf {x} )}}\left.{\frac {\partial Q^{2}}{\partial Q}}\right|_{\mathbf {x} }\cdot Q=U-QV={\frac {1}{2}}QV-QV=-{\frac {1}{2}}QV=-{\frac {1}{2}}V^{2}C(\mathbf {x} ).}

Esta transformación es posible porque ahora es una función lineal de, por lo que es convexa con respecto a ella. La fuerza ahora se convierte en el gradiente negativo de esta transformación de Legendre, lo que da como resultado la misma fuerza obtenida a partir de la función original . U {\textstyle U} Q {\textstyle Q} U {\textstyle U} F ( x ) = d U d x = 1 2 d C ( x ) d x V 2 . {\displaystyle \mathbf {F} (\mathbf {x} )=-{\frac {dU^{*}}{d\mathbf {x} }}={\frac {1}{2}}{\frac {dC(\mathbf {x} )}{d\mathbf {x} }}V^{2}.}

Las dos energías conjugadas resultan opuestas entre sí (sus signos son opuestos), sólo por la linealidad de la capacitancia , excepto que ahora Q ya no es una constante. Reflejan las dos vías diferentes de almacenamiento de energía en el capacitor, lo que da como resultado, por ejemplo, la misma "tracción" entre las placas de un capacitor. U {\textstyle U} U {\textstyle U^{*}}

Teoría de la probabilidad

En la teoría de grandes desviaciones , la función de tasa se define como la transformación de Legendre del logaritmo de la función generadora de momentos de una variable aleatoria. Una aplicación importante de la función de tasa es el cálculo de probabilidades de cola de sumas de variables aleatorias iid , en particular en el teorema de Cramér .

Si son variables aleatorias iid, sea el paseo aleatorio asociado y la función generadora de momentos de . Para , . Por lo tanto, por la desigualdad de Markov , se tiene para y donde . Dado que el lado izquierdo es independiente de , podemos tomar el ínfimo del lado derecho, lo que lleva a considerar el supremo de , es decir, la transformada de Legendre de , evaluada en . X n {\displaystyle X_{n}} S n = X 1 + + X n {\displaystyle S_{n}=X_{1}+\cdots +X_{n}} M ( ξ ) {\displaystyle M(\xi )} X 1 {\displaystyle X_{1}} ξ R {\displaystyle \xi \in \mathbb {R} } E [ e ξ S n ] = M ( ξ ) n {\displaystyle E[e^{\xi S_{n}}]=M(\xi )^{n}} ξ 0 {\displaystyle \xi \geq 0} a R {\displaystyle a\in \mathbb {R} } P ( S n / n > a ) e n ξ a M ( ξ ) n = exp [ n ( ξ a Λ ( ξ ) ) ] {\displaystyle P(S_{n}/n>a)\leq e^{-n\xi a}M(\xi )^{n}=\exp[-n(\xi a-\Lambda (\xi ))]} Λ ( ξ ) = log M ( ξ ) {\displaystyle \Lambda (\xi )=\log M(\xi )} ξ {\displaystyle \xi } ξ a Λ ( ξ ) {\displaystyle \xi a-\Lambda (\xi )} Λ {\displaystyle \Lambda } x = a {\displaystyle x=a}

Microeconomía

La transformación de Legendre surge naturalmente en microeconomía en el proceso de encontrar la oferta S ( P ) de algún producto dado un precio fijo P en el mercado conociendo la función de costo C ( Q ) , es decir, el costo para el productor de fabricar/extraer/etc. Q unidades del producto dado.

Una teoría sencilla explica la forma de la curva de oferta basándose únicamente en la función de costes. Supongamos que el precio de mercado de una unidad de nuestro producto es P . Para una empresa que vende este bien, la mejor estrategia es ajustar la producción Q de forma que se maximice su beneficio. Podemos maximizar el beneficio diferenciando con respecto a Q y resolviendo profit = revenue costs = P Q C ( Q ) {\displaystyle {\text{profit}}={\text{revenue}}-{\text{costs}}=PQ-C(Q)} P C ( Q opt ) = 0. {\displaystyle P-C'(Q_{\text{opt}})=0.}

Q opt representa la cantidad óptima Q de bienes que el productor está dispuesto a suministrar, que es en realidad la oferta misma: S ( P ) = Q opt ( P ) = ( C ) 1 ( P ) . {\displaystyle S(P)=Q_{\text{opt}}(P)=(C')^{-1}(P).}

Si consideramos el beneficio máximo como una función del precio, , vemos que es la transformada de Legendre de la función de costo . profit max ( P ) {\displaystyle {\text{profit}}_{\text{max}}(P)} C ( Q ) {\displaystyle C(Q)}

Interpretación geométrica

Para una función estrictamente convexa , la transformación de Legendre puede interpretarse como una aplicación entre el gráfico de la función y la familia de tangentes del gráfico. (Para una función de una variable, las tangentes están bien definidas en todos los puntos, excepto en un número contable , ya que una función convexa es diferenciable en todos los puntos, excepto en un número contable).

La ecuación de una recta con pendiente e intersección en el origen está dada por . Para que esta recta sea tangente a la gráfica de una función en el punto se requiere y p {\displaystyle p} y {\displaystyle y} b {\displaystyle b} y = p x + b {\displaystyle y=px+b} f {\displaystyle f} ( x 0 , f ( x 0 ) ) {\displaystyle \left(x_{0},f(x_{0})\right)} f ( x 0 ) = p x 0 + b {\displaystyle f(x_{0})=px_{0}+b} p = f ( x 0 ) . {\displaystyle p=f'(x_{0}).}

Al ser la derivada de una función estrictamente convexa, la función es estrictamente monótona y, por lo tanto, inyectiva . La segunda ecuación se puede resolver para permitir la eliminación de de la primera y resolver para la intersección con la tangente en función de su pendiente, donde denota la transformada de Legendre de f {\displaystyle f'} x 0 = f 1 ( p ) , {\textstyle x_{0}=f^{\prime -1}(p),} x 0 {\displaystyle x_{0}} y {\displaystyle y} b {\displaystyle b} p , {\displaystyle p,} b = f ( x 0 ) p x 0 = f ( f 1 ( p ) ) p f 1 ( p ) = f ( p ) {\textstyle b=f(x_{0})-px_{0}=f\left(f^{\prime -1}(p)\right)-p\cdot f^{\prime -1}(p)=-f^{\star }(p)} f {\displaystyle f^{\star }} f . {\displaystyle f.}

La familia de rectas tangentes del grafo de parametrizadas por la pendiente viene dada por tanto por o, escrito implícitamente, por las soluciones de la ecuación f {\displaystyle f} p {\displaystyle p} y = p x f ( p ) , {\textstyle y=px-f^{\star }(p),} F ( x , y , p ) = y + f ( p ) p x = 0   . {\displaystyle F(x,y,p)=y+f^{\star }(p)-px=0~.}

La gráfica de la función original se puede reconstruir a partir de esta familia de líneas como la envolvente de esta familia exigiendo F ( x , y , p ) p = f ( p ) x = 0. {\displaystyle {\frac {\partial F(x,y,p)}{\partial p}}=f^{\star \prime }(p)-x=0.}

Eliminando de estas dos ecuaciones se obtiene p {\displaystyle p} y = x f 1 ( x ) f ( f 1 ( x ) ) . {\displaystyle y=x\cdot f^{\star \prime -1}(x)-f^{\star }\left(f^{\star \prime -1}(x)\right).}

Identificar y reconocer el lado derecho de la ecuación anterior como la transformada de Legendre del rendimiento y {\displaystyle y} f ( x ) {\displaystyle f(x)} f , {\displaystyle f^{\star },} f ( x ) = f ( x )   . {\textstyle f(x)=f^{\star \star }(x)~.}

Transformación de Legendre en más de una dimensión

Para una función real diferenciable en un subconjunto convexo abierto U de R n el conjugado de Legendre del par ( U , f ) se define como el par ( V , g ) , donde V es la imagen de U bajo la función de gradiente Df , y g es la función en V dada por la fórmula donde g ( y ) = y , x f ( x ) , x = ( D f ) 1 ( y ) {\displaystyle g(y)=\left\langle y,x\right\rangle -f(x),\qquad x=\left(Df\right)^{-1}(y)} u , v = k = 1 n u k v k {\displaystyle \left\langle u,v\right\rangle =\sum _{k=1}^{n}u_{k}\cdot v_{k}}

es el producto escalar en R n . La transformada multidimensional puede interpretarse como una codificación de la envoltura convexa del epígrafe de la función en términos de sus hiperplanos de soporte . [2] Esto puede verse como consecuencia de las dos observaciones siguientes. Por un lado, el hiperplano tangente al epígrafe de en algún punto tiene vector normal . Por otro lado, cualquier conjunto convexo cerrado puede caracterizarse a través del conjunto de sus hiperplanos de soporte por las ecuaciones , donde es la función de soporte de . Pero la definición de la transformada de Legendre a través de la maximización coincide precisamente con la de la función de soporte, es decir, . Por lo tanto, concluimos que la transformada de Legendre caracteriza el epígrafe en el sentido de que el plano tangente al epígrafe en cualquier punto está dado explícitamente por f {\displaystyle f} ( x , f ( x ) ) U × R {\displaystyle (\mathbf {x} ,f(\mathbf {x} ))\in U\times \mathbb {R} } ( f ( x ) , 1 ) R n + 1 {\displaystyle (\nabla f(\mathbf {x} ),-1)\in \mathbb {R} ^{n+1}} C R m {\displaystyle C\in \mathbb {R} ^{m}} x n = h C ( n ) {\displaystyle \mathbf {x} \cdot \mathbf {n} =h_{C}(\mathbf {n} )} h C ( n ) {\displaystyle h_{C}(\mathbf {n} )} C {\displaystyle C} f ( x ) = h epi ( f ) ( x , 1 ) {\displaystyle f^{*}(\mathbf {x} )=h_{\operatorname {epi} (f)}(\mathbf {x} ,-1)} ( x , f ( x ) ) {\displaystyle (\mathbf {x} ,f(\mathbf {x} ))} { z R n + 1 : z x = f ( x ) } . {\displaystyle \{\mathbf {z} \in \mathbb {R} ^{n+1}:\,\,\mathbf {z} \cdot \mathbf {x} =f^{*}(\mathbf {x} )\}.}

Alternativamente, si X es un espacio vectorial e Y es su espacio vectorial dual , entonces para cada punto x de X e y de Y , hay una identificación natural de los espacios cotangentes T* X x con Y y T* Y y con X. Si f es una función real diferenciable sobre X , entonces su derivada exterior , df , es una sección del fibrado cotangente T* X y como tal, podemos construir una función de X a Y. De manera similar, si g es una función real diferenciable sobre Y , entonces dg define una función de Y a X. Si ambas funciones resultan ser inversas entre sí, decimos que tenemos una transformada de Legendre. La noción de la forma única tautológica se usa comúnmente en este contexto.

Cuando la función no es diferenciable, la transformada de Legendre puede extenderse y se la conoce como transformación de Legendre-Fenchel . En este contexto más general, se pierden algunas propiedades: por ejemplo, la transformada de Legendre ya no es su propia inversa (a menos que haya suposiciones adicionales, como la convexidad ).

Transformación de Legendre en variedades

Sea una variedad suave , sean y un fibrado vectorial en y su proyección de fibrado asociada , respectivamente. Sea una función suave. Pensamos en como un lagrangiano por analogía con el caso clásico donde , y para algún número positivo y función . M {\textstyle M} E {\displaystyle E} π : E M {\textstyle \pi :E\to M} M {\displaystyle M} L : E R {\textstyle L:E\to \mathbb {R} } L {\textstyle L} M = R {\textstyle M=\mathbb {R} } E = T M = R × R {\textstyle E=TM=\mathbb {R} \times \mathbb {R} } L ( x , v ) = 1 2 m v 2 V ( x ) {\textstyle L(x,v)={\frac {1}{2}}mv^{2}-V(x)} m R {\textstyle m\in \mathbb {R} } V : M R {\textstyle V:M\to \mathbb {R} }

Como es habitual, el dual de se denota por . La fibra de sobre se denota por , y la restricción de a se denota por . La transformación de Legendre de es el morfismo suavizado definido por , donde . Aquí usamos el hecho de que como es un espacio vectorial, se puede identificar con . En otras palabras, es el covector que envía a la derivada direccional . E {\textstyle E} E {\textstyle E^{*}} π {\textstyle \pi } x M {\textstyle x\in M} E x {\textstyle E_{x}} L {\textstyle L} E x {\textstyle E_{x}} L | E x : E x R {\textstyle L|_{E_{x}}:E_{x}\to \mathbb {R} } L {\textstyle L} F L : E E {\displaystyle \mathbf {F} L:E\to E^{*}} F L ( v ) = d ( L | E x ) v E x {\textstyle \mathbf {F} L(v)=d(L|_{E_{x}})_{v}\in E_{x}^{*}} x = π ( v ) {\textstyle x=\pi (v)} E x {\textstyle E_{x}} T v ( E x ) {\textstyle T_{v}(E_{x})} E x {\textstyle E_{x}} F L ( v ) E x {\textstyle \mathbf {F} L(v)\in E_{x}^{*}} w E x {\textstyle w\in E_{x}} d d t | t = 0 L ( v + t w ) R {\textstyle \left.{\frac {d}{dt}}\right|_{t=0}L(v+tw)\in \mathbb {R} }

Para describir la transformación de Legendre localmente, sea un gráfico de coordenadas sobre el cual es trivial. Eligiendo una trivialización de sobre , obtenemos gráficos y . En términos de estos gráficos, tenemos , donde para todo . Si, como en el caso clásico, la restricción de a cada fibra es estrictamente convexa y está limitada por debajo por una forma cuadrática definida positiva menos una constante, entonces la transformación de Legendre es un difeomorfismo. [3] Supongamos que es un difeomorfismo y sea la función " hamiltoniana " definida por donde . Usando el isomorfismo natural , podemos ver la transformación de Legendre de como un mapa . Entonces tenemos [3] U M {\textstyle U\subseteq M} E {\textstyle E} E {\textstyle E} U {\textstyle U} E U U × R r {\textstyle E_{U}\cong U\times \mathbb {R} ^{r}} E U U × R r {\textstyle E_{U}^{*}\cong U\times \mathbb {R} ^{r}} F L ( x ; v 1 , , v r ) = ( x ; p 1 , , p r ) {\textstyle \mathbf {F} L(x;v_{1},\dotsc ,v_{r})=(x;p_{1},\dotsc ,p_{r})} p i = L v i ( x ; v 1 , , v r ) {\displaystyle p_{i}={\frac {\partial L}{\partial v_{i}}}(x;v_{1},\dotsc ,v_{r})} i = 1 , , r {\textstyle i=1,\dots ,r} L : E R {\textstyle L:E\to \mathbb {R} } E x {\textstyle E_{x}} F L : E E {\textstyle \mathbf {F} L:E\to E^{*}} F L {\textstyle \mathbf {F} L} H : E R {\textstyle H:E^{*}\to \mathbb {R} } H ( p ) = p v L ( v ) , {\displaystyle H(p)=p\cdot v-L(v),} v = ( F L ) 1 ( p ) {\textstyle v=(\mathbf {F} L)^{-1}(p)} E E {\textstyle E\cong E^{**}} H {\textstyle H} F H : E E {\textstyle \mathbf {F} H:E^{*}\to E} ( F L ) 1 = F H . {\displaystyle (\mathbf {F} L)^{-1}=\mathbf {F} H.}

Otras propiedades

Propiedades de escala

La transformación de Legendre tiene las siguientes propiedades de escala: Para a > 0 ,

f ( x ) = a g ( x ) f ( p ) = a g ( p a ) {\displaystyle f(x)=a\cdot g(x)\Rightarrow f^{\star }(p)=a\cdot g^{\star }\left({\frac {p}{a}}\right)} f ( x ) = g ( a x ) f ( p ) = g ( p a ) . {\displaystyle f(x)=g(a\cdot x)\Rightarrow f^{\star }(p)=g^{\star }\left({\frac {p}{a}}\right).}

De ello se deduce que si una función es homogénea de grado r entonces su imagen bajo la transformada de Legendre es una función homogénea de grado s , donde 1/ r + 1/ s = 1 . (Dado que f ( x ) = x r / r , con r > 1 , implica f *( p ) = p s / s .) Por lo tanto, el único monomio cuyo grado es invariante bajo la transformada de Legendre es el cuadrático.

Comportamiento bajo traducción

f ( x ) = g ( x ) + b f ( p ) = g ( p ) b {\displaystyle f(x)=g(x)+b\Rightarrow f^{\star }(p)=g^{\star }(p)-b} f ( x ) = g ( x + y ) f ( p ) = g ( p ) p y {\displaystyle f(x)=g(x+y)\Rightarrow f^{\star }(p)=g^{\star }(p)-p\cdot y}

Comportamiento bajo inversión

f ( x ) = g 1 ( x ) f ( p ) = p g ( 1 p ) {\displaystyle f(x)=g^{-1}(x)\Rightarrow f^{\star }(p)=-p\cdot g^{\star }\left({\frac {1}{p}}\right)}

Comportamiento bajo transformaciones lineales

Sea A  : R nR m una transformación lineal . Para cualquier función convexa f en R n , se tiene donde A * es el operador adjunto de A definido por y Af es el avance de f a lo largo de A ( A f ) = f A {\displaystyle (Af)^{\star }=f^{\star }A^{\star }} A x , y = x , A y , {\displaystyle \left\langle Ax,y^{\star }\right\rangle =\left\langle x,A^{\star }y^{\star }\right\rangle ,} ( A f ) ( y ) = inf { f ( x ) : x X , A x = y } . {\displaystyle (Af)(y)=\inf\{f(x):x\in X,Ax=y\}.}

Una función convexa cerrada f es simétrica con respecto a un conjunto dado G de transformaciones lineales ortogonales , si y sólo si f * es simétrica con respecto a G. f ( A x ) = f ( x ) , x , A G {\displaystyle f(Ax)=f(x),\;\forall x,\;\forall A\in G}

Convolución infimal

La convolución infimal de dos funciones f y g se define como

( f inf g ) ( x ) = inf { f ( x y ) + g ( y ) | y R n } . {\displaystyle \left(f\star _{\inf }g\right)(x)=\inf \left\{f(x-y)+g(y)\,|\,y\in \mathbf {R} ^{n}\right\}.}

Sean f 1 , ..., f m funciones convexas propias en R n . Entonces

( f 1 inf inf f m ) = f 1 + + f m . {\displaystyle \left(f_{1}\star _{\inf }\cdots \star _{\inf }f_{m}\right)^{\star }=f_{1}^{\star }+\cdots +f_{m}^{\star }.}

Desigualdad de Fenchel

Para cualquier función f y su conjugado convexo f * la desigualdad de Fenchel (también conocida como desigualdad de Fenchel-Young ) se cumple para cada xX y pX * , es decir, pares independientes x , p , p , x f ( x ) + f ( p ) . {\displaystyle \left\langle p,x\right\rangle \leq f(x)+f^{\star }(p).}

Véase también

Referencias

  1. ^ ab Legendre, Adrien-Marie (1789). Mémoire sur l'intégration de quelques équations aux différences partielles. En Histoire de l'Académie royale des sciences, avec les mémoires de mathématique et de physique (en francés). vol. 1787. París: Imprimerie royale. págs. 309–351.
  2. ^ "Legendre Transform | Nick Alger // Mapas, arte, etc." Archivado desde el original el 12 de marzo de 2015. Consultado el 26 de enero de 2011 .
  3. ^ ab Ana Cannas da Silva. Conferencias sobre Geometría Simpléctica , 2ª impresión corregida. Springer-Verlag, 2008. págs. 147-148. ISBN 978-3-540-42195-5 . 

Lectura adicional

  • Nielsen, Frank (1 de septiembre de 2010). "Transformación de Legendre y geometría de la información" (PDF) . Consultado el 24 de enero de 2016 .
  • Touchette, Hugo (27 de julio de 2005). "Legendre-Fenchel se transforma en pocas palabras" (PDF) . Consultado el 24 de enero de 2016 .
  • Touchette, Hugo (2006-11-21). «Elementos de análisis convexo» (PDF) . Archivado desde el original (PDF) el 2016-02-01 . Consultado el 2016-01-24 .
  • Legendre se transforma con figuras en maze5.net
  • Transformaciones de Legendre y Legendre-Fenchel explicadas paso a paso en onmyphd.com
Retrieved from "https://en.wikipedia.org/w/index.php?title=Legendre_transformation&oldid=1250624996"