Parte de una serie sobre |
Mecánica clásica |
---|
En física , la mecánica de Lagrange es una formulación de la mecánica clásica basada en el principio de acción estacionaria (también conocido como principio de mínima acción). Fue introducida por el matemático y astrónomo italo-francés Joseph-Louis Lagrange en su presentación a la Academia de Ciencias de Turín en 1760 [1], que culminó en su gran obra de 1788, Mécanique analytique [2] .
La mecánica lagrangiana describe un sistema mecánico como un par ( M , L ) que consta de un espacio de configuración M y una función suave dentro de ese espacio llamada lagrangiana . Para muchos sistemas, L = T − V , donde T y V son la energía cinética y potencial del sistema, respectivamente. [3]
El principio de acción estacionaria exige que la función de acción del sistema derivada de L permanezca en un punto estacionario (un máximo , un mínimo o una silla ) durante toda la evolución temporal del sistema. Esta restricción permite el cálculo de las ecuaciones de movimiento del sistema utilizando las ecuaciones de Lagrange. [4]
Las leyes de Newton y el concepto de fuerzas son el punto de partida habitual para la enseñanza de los sistemas mecánicos. [5] Este método funciona bien para muchos problemas, pero para otros el enfoque es terriblemente complicado. [6] Por ejemplo, en el cálculo del movimiento de un toro que rueda sobre una superficie horizontal con una perla deslizándose en su interior, las fuerzas de restricción variables en el tiempo, como la velocidad angular del toro y el movimiento de la perla en relación con el toro, hicieron que fuera difícil determinar el movimiento del toro con las ecuaciones de Newton. [7] La mecánica lagrangiana adopta la energía en lugar de la fuerza como su ingrediente básico, [5] lo que conduce a ecuaciones más abstractas capaces de abordar problemas más complejos. [6]
En particular, el enfoque de Lagrange fue establecer coordenadas generalizadas independientes para la posición y la velocidad de cada objeto, lo que permite escribir una forma general de lagrangiano (energía cinética total menos energía potencial del sistema) y sumar esto sobre todos los caminos posibles de movimiento de las partículas produjo una fórmula para la "acción", que minimizó para dar un conjunto generalizado de ecuaciones. Esta cantidad sumada se minimiza a lo largo del camino que realmente toma la partícula. Esta elección elimina la necesidad de que la fuerza de restricción entre en el sistema generalizado de ecuaciones resultante . Hay menos ecuaciones ya que uno no está calculando directamente la influencia de la restricción sobre la partícula en un momento dado. [7]
Para una amplia variedad de sistemas físicos, si el tamaño y la forma de un objeto masivo son insignificantes, es una simplificación útil tratarlo como una partícula puntual . Para un sistema de N partículas puntuales con masas m 1 , m 2 , ..., m N , cada partícula tiene un vector de posición , denotado r 1 , r 2 , ..., r N . Las coordenadas cartesianas suelen ser suficientes, por lo que r 1 = ( x 1 , y 1 , z 1 ) , r 2 = ( x 2 , y 2 , z 2 ) y así sucesivamente. En el espacio tridimensional , cada vector de posición requiere tres coordenadas para definir de forma única la ubicación de un punto, por lo que hay 3 N coordenadas para definir de forma única la configuración del sistema. Todos estos son puntos específicos en el espacio para ubicar las partículas; un punto general en el espacio se escribe r = ( x , y , z ) . La velocidad de cada partícula es la rapidez con la que se mueve la partícula a lo largo de su trayectoria de movimiento y es la derivada temporal de su posición, por lo tanto En la mecánica newtoniana, las ecuaciones de movimiento están dadas por las leyes de Newton . La segunda ley " fuerza neta igual a masa por aceleración " se aplica a cada partícula. Para un sistema de N partículas en 3 dimensiones, hay 3 N ecuaciones diferenciales ordinarias de segundo orden en las posiciones de las partículas para resolver.
En lugar de fuerzas, la mecánica lagrangiana utiliza las energías del sistema. La cantidad central de la mecánica lagrangiana es el lagrangiano , una función que resume la dinámica de todo el sistema. En general, el lagrangiano tiene unidades de energía, pero no una expresión única para todos los sistemas físicos. Cualquier función que genere las ecuaciones de movimiento correctas, de acuerdo con las leyes físicas, puede tomarse como lagrangiana. No obstante, es posible construir expresiones generales para grandes clases de aplicaciones. El lagrangiano no relativista para un sistema de partículas en ausencia de un campo electromagnético está dado por [8] donde es la energía cinética total del sistema, igual a la suma Σ de las energías cinéticas de las partículas. Cada partícula etiquetada tiene masa y v k 2 = v k · v k es la magnitud al cuadrado de su velocidad, equivalente al producto escalar de la velocidad consigo misma. [9]
La energía cinética T es la energía del movimiento del sistema y es función únicamente de las velocidades v k , no de las posiciones r k , ni del tiempo t , por lo que T = T ( v 1 , v 2 , ...).
V , la energía potencial del sistema, refleja la energía de interacción entre las partículas, es decir, cuánta energía tiene cada partícula debido a todas las demás, junto con cualquier influencia externa. Para fuerzas conservativas (por ejemplo, la gravedad newtoniana ), es una función de los vectores de posición de las partículas solamente, por lo que V = V ( r 1 , r 2 , ...). Para aquellas fuerzas no conservativas que se pueden derivar de un potencial apropiado (por ejemplo, el potencial electromagnético ), las velocidades también aparecerán, V = V ( r 1 , r 2 , ..., v 1 , v 2 , ...). Si hay algún campo externo o fuerza impulsora externa que cambia con el tiempo, el potencial cambia con el tiempo, por lo que, en general, V = V ( r 1 , r 2 , ..., v 1 , v 2 , ..., t ).
Como ya se ha señalado, esta forma de L es aplicable a muchas clases importantes de sistemas, pero no en todas partes. Para la mecánica lagrangiana relativista debe reemplazarse en su totalidad por una función consistente con la relatividad especial (escalar bajo transformaciones de Lorentz) o la relatividad general (4-escalar). [10] Cuando hay un campo magnético, es necesario volver a formular la expresión de la energía potencial. [ cita requerida ] Y para las fuerzas disipativas (por ejemplo, la fricción ), debe introducirse otra función junto con la función lagrangiana, a menudo denominada "función de disipación de Rayleigh", para tener en cuenta la pérdida de energía. [11]
Una o más de las partículas pueden estar sujetas a una o más restricciones holonómicas ; dicha restricción se describe mediante una ecuación de la forma f ( r , t ) = 0. Si el número de restricciones en el sistema es C , entonces cada restricción tiene una ecuación f 1 ( r , t ) = 0, f 2 ( r , t ) = 0, ..., f C ( r , t ) = 0, cada una de las cuales podría aplicarse a cualquiera de las partículas. Si la partícula k está sujeta a la restricción i , entonces f i ( r k , t ) = 0. En cualquier instante de tiempo, las coordenadas de una partícula restringida están vinculadas entre sí y no son independientes. Las ecuaciones de restricción determinan los caminos permitidos a lo largo de los cuales las partículas pueden moverse, pero no dónde están o qué tan rápido van en cada instante de tiempo. Las restricciones no holonómicas dependen de las velocidades de las partículas, aceleraciones o derivadas superiores de la posición. La mecánica lagrangiana sólo se puede aplicar a sistemas cuyas restricciones, si las hay, sean todas holonómicas . Tres ejemplos de restricciones no holonómicas son: [12]
Cuando las ecuaciones de restricción no son integrables, cuando las restricciones tienen desigualdades o con fuerzas no conservativas complicadas como la fricción, las restricciones no holonómicas requieren un tratamiento especial y es posible que haya que recurrir a la mecánica newtoniana o utilizar otros métodos. [13]
Si T o V o ambos dependen explícitamente del tiempo debido a restricciones que varían con el tiempo o influencias externas, el lagrangiano L ( r 1 , r 2 , ... v 1 , v 2 , ... t ) es explícitamente dependiente del tiempo . Si ni la energía potencial ni la cinética dependen del tiempo, entonces el lagrangiano L ( r 1 , r 2 , ... v 1 , v 2 , ...) es explícitamente independiente del tiempo . En cualquier caso, el lagrangiano siempre tiene una dependencia implícita del tiempo a través de las coordenadas generalizadas.
Con estas definiciones, las ecuaciones de Lagrange del primer tipo son [14]
donde k = 1, 2, ..., N etiqueta las partículas, hay un multiplicador de Lagrange λ i para cada ecuación de restricción f i , y son cada uno abreviaturas de un vector de derivadas parciales ∂/∂ con respecto a las variables indicadas (no una derivada con respecto a todo el vector). [nb 1] Cada punto sobrepuesto es una abreviatura de una derivada temporal . Este procedimiento aumenta el número de ecuaciones para resolver en comparación con las leyes de Newton, de 3 N a 3 N + C , porque hay 3 N ecuaciones diferenciales de segundo orden acopladas en las coordenadas de posición y los multiplicadores, más C ecuaciones de restricción. Sin embargo, cuando se resuelven junto con las coordenadas de posición de las partículas, los multiplicadores pueden proporcionar información sobre las fuerzas de restricción. No es necesario eliminar las coordenadas resolviendo las ecuaciones de restricción.
En el lagrangiano, las coordenadas de posición y los componentes de velocidad son todas variables independientes , y las derivadas del lagrangiano se toman con respecto a estas por separado de acuerdo con las reglas de diferenciación habituales (por ejemplo, la derivada parcial de L con respecto al componente de velocidad z de la partícula 2, definida por v z ,2 = dz 2 / dt , es simplemente ∂ L /∂ v z ,2 ; no es necesario utilizar reglas de cadena incómodas ni derivadas totales para relacionar el componente de velocidad con la coordenada correspondiente z 2 ).
En cada ecuación de restricción, una coordenada es redundante porque se determina a partir de las otras coordenadas. Por lo tanto, el número de coordenadas independientes es n = 3 N − C . Podemos transformar cada vector de posición en un conjunto común de n coordenadas generalizadas , convenientemente escritas como una n -tupla q = ( q 1 , q 2 , ... q n ) , expresando cada vector de posición, y por lo tanto las coordenadas de posición, como funciones de las coordenadas generalizadas y el tiempo:
El vector q es un punto en el espacio de configuración del sistema. Las derivadas temporales de las coordenadas generalizadas se denominan velocidades generalizadas y, para cada partícula, la transformación de su vector de velocidad, la derivada total de su posición con respecto al tiempo, es
Dado este v k , la energía cinética en coordenadas generalizadas depende de las velocidades generalizadas, las coordenadas generalizadas y el tiempo si los vectores de posición dependen explícitamente del tiempo debido a restricciones que varían con el tiempo, por lo que
Con estas definiciones, las ecuaciones de Euler-Lagrange , o ecuaciones de Lagrange de segundo tipo [15] [16] [17]
son resultados matemáticos del cálculo de variaciones , que también se pueden utilizar en mecánica. Sustituyendo en el lagrangiano L ( q , d q /d t , t ) se obtienen las ecuaciones de movimiento del sistema. El número de ecuaciones ha disminuido en comparación con la mecánica newtoniana, de 3 N a n = 3 N − C ecuaciones diferenciales de segundo orden acopladas en las coordenadas generalizadas. Estas ecuaciones no incluyen fuerzas de restricción en absoluto, solo se deben tener en cuenta las fuerzas no restrictivas.
Aunque las ecuaciones de movimiento incluyen derivadas parciales , los resultados de las derivadas parciales siguen siendo ecuaciones diferenciales ordinarias en las coordenadas de posición de las partículas. La derivada total del tiempo denotada d/d t a menudo implica una diferenciación implícita . Ambas ecuaciones son lineales en el lagrangiano, pero generalmente son ecuaciones acopladas no lineales en las coordenadas.
Para simplificar, las leyes de Newton se pueden ilustrar para una partícula sin mucha pérdida de generalidad (para un sistema de N partículas, todas estas ecuaciones se aplican a cada partícula del sistema). La ecuación de movimiento para una partícula de masa constante m es la segunda ley de Newton de 1687, en notación vectorial moderna, donde a es su aceleración y F la fuerza resultante que actúa sobre ella. Cuando la masa varía, la ecuación debe generalizarse para tomar la derivada temporal del momento. En tres dimensiones espaciales, este es un sistema de tres ecuaciones diferenciales ordinarias de segundo orden acopladas para resolver, ya que hay tres componentes en esta ecuación vectorial. La solución es el vector de posición r de la partícula en el tiempo t , sujeto a las condiciones iniciales de r y v cuando t = 0.
Las leyes de Newton son fáciles de usar en coordenadas cartesianas, pero las coordenadas cartesianas no siempre son convenientes, y para otros sistemas de coordenadas las ecuaciones de movimiento pueden volverse complicadas. En un conjunto de coordenadas curvilíneas ξ = ( ξ 1 , ξ 2 , ξ 3 ), la ley en notación de índice tensorial es la "forma lagrangiana" [18] [19] donde F a es el a -ésimo componente contravariante de la fuerza resultante que actúa sobre la partícula, Γ a bc son los símbolos de Christoffel de segundo tipo, es la energía cinética de la partícula, y g bc los componentes covariantes del tensor métrico del sistema de coordenadas curvilíneas. Todos los índices a , b , c , toman cada uno los valores 1, 2, 3. Las coordenadas curvilíneas no son lo mismo que las coordenadas generalizadas.
Puede parecer una complicación excesiva formular la ley de Newton de esta forma, pero tiene sus ventajas. Los componentes de aceleración en términos de los símbolos de Christoffel se pueden evitar evaluando en su lugar las derivadas de la energía cinética. Si no hay una fuerza resultante que actúe sobre la partícula, F = 0 , no se acelera, sino que se mueve con velocidad constante en línea recta. Matemáticamente, las soluciones de la ecuación diferencial son geodésicas , las curvas de longitud extrema entre dos puntos en el espacio (estas pueden terminar siendo mínimas, es decir, los caminos más cortos, pero no necesariamente). En el espacio real plano 3D, las geodésicas son simplemente líneas rectas. Entonces, para una partícula libre, la segunda ley de Newton coincide con la ecuación geodésica y establece que las partículas libres siguen geodésicas, las trayectorias extremas a lo largo de las cuales pueden moverse. Si la partícula está sujeta a fuerzas F ≠ 0 , la partícula acelera debido a las fuerzas que actúan sobre ella y se desvía de las geodésicas que seguiría si fuera libre. Con extensiones apropiadas de las cantidades dadas aquí en el espacio plano 3D al espacio-tiempo curvo 4D , la forma anterior de la ley de Newton también se traslada a la relatividad general de Einstein , en cuyo caso las partículas libres siguen geodésicas en el espacio-tiempo curvo que ya no son "líneas rectas" en el sentido ordinario. [20]
Sin embargo, todavía necesitamos conocer la fuerza resultante total F que actúa sobre la partícula, lo que a su vez requiere la fuerza resultante sin restricción N más la fuerza de restricción resultante C ,
Las fuerzas de restricción pueden ser complicadas, ya que generalmente dependen del tiempo. Además, si hay restricciones, las coordenadas curvilíneas no son independientes, sino que están relacionadas por una o más ecuaciones de restricción.
Las fuerzas de restricción pueden eliminarse de las ecuaciones de movimiento, de modo que solo permanezcan las fuerzas sin restricción, o bien pueden incluirse incluyendo las ecuaciones de restricción en las ecuaciones de movimiento.
Un resultado fundamental en la mecánica analítica es el principio de D'Alembert , introducido en 1708 por Jacques Bernoulli para comprender el equilibrio estático , y desarrollado por D'Alembert en 1743 para resolver problemas dinámicos. [21] El principio afirma que para N partículas el trabajo virtual, es decir, el trabajo a lo largo de un desplazamiento virtual, δ r k , es cero: [9]
Los desplazamientos virtuales , δ r k , son por definición cambios infinitesimales en la configuración del sistema consistentes con las fuerzas de restricción que actúan sobre el sistema en un instante de tiempo , [22] es decir, de tal manera que las fuerzas de restricción mantienen el movimiento restringido. No son los mismos que los desplazamientos reales en el sistema, que son causados por las fuerzas resultantes de restricción y no restricción que actúan sobre la partícula para acelerarla y moverla. [nb 2] El trabajo virtual es el trabajo realizado a lo largo de un desplazamiento virtual para cualquier fuerza (restricción o no restricción).
Dado que las fuerzas de restricción actúan perpendicularmente al movimiento de cada partícula en el sistema para mantener las restricciones, el trabajo virtual total de las fuerzas de restricción que actúan sobre el sistema es cero: [23] [nb 3] de modo que
Así, el principio de D'Alembert nos permite concentrarnos sólo en las fuerzas no restrictivas aplicadas y excluir las fuerzas restrictivas en las ecuaciones de movimiento. [24] [25] La forma mostrada también es independiente de la elección de coordenadas. Sin embargo, no se puede utilizar fácilmente para establecer las ecuaciones de movimiento en un sistema de coordenadas arbitrario, ya que los desplazamientos δ r k podrían estar conectados por una ecuación restrictiva, que nos impide establecer los N sumandos individuales en 0. Por lo tanto, buscaremos un sistema de coordenadas mutuamente independientes para el cual la suma total será 0 si y sólo si los sumandos individuales son 0. Establecer cada uno de los sumandos en 0 nos dará eventualmente nuestras ecuaciones de movimiento separadas.
Si existen restricciones sobre la partícula k , entonces, dado que las coordenadas de la posición r k = ( x k , y k , z k ) están vinculadas entre sí por una ecuación de restricción, también lo están las de los desplazamientos virtuales δ r k = ( δx k , δy k , δz k ) . Dado que las coordenadas generalizadas son independientes, podemos evitar las complicaciones con δ r k convirtiendo a desplazamientos virtuales en las coordenadas generalizadas. Estos están relacionados de la misma forma que una diferencial total , [9]
No existe una derivada temporal parcial con respecto al tiempo multiplicado por un incremento de tiempo, ya que se trata de un desplazamiento virtual, a lo largo de las restricciones en un instante de tiempo.
El primer término del principio de D'Alembert anterior es el trabajo virtual realizado por las fuerzas no restrictivas N k a lo largo de los desplazamientos virtuales δ r k , y puede, sin pérdida de generalidad, convertirse en análogos generalizados mediante la definición de fuerzas generalizadas de modo que
Esta es la mitad de la conversión a coordenadas generalizadas. Queda por convertir el término de aceleración a coordenadas generalizadas, lo cual no es inmediatamente obvio. Recordando la forma de Lagrange de la segunda ley de Newton, se pueden hallar las derivadas parciales de la energía cinética con respecto a las coordenadas generalizadas y las velocidades para obtener el resultado deseado: [9]
Ahora bien, el principio de D'Alembert está en las coordenadas generalizadas como se requiere, y dado que estos desplazamientos virtuales δq j son independientes y distintos de cero, los coeficientes se pueden igualar a cero, lo que da como resultado las ecuaciones de Lagrange [26] [27] o las ecuaciones generalizadas de movimiento [28].
Estas ecuaciones son equivalentes a las leyes de Newton para las fuerzas sin restricciones . Las fuerzas generalizadas en esta ecuación se derivan únicamente de las fuerzas sin restricciones; las fuerzas con restricciones se han excluido del principio de D'Alembert y no es necesario encontrarlas. Las fuerzas generalizadas pueden ser no conservativas, siempre que satisfagan el principio de D'Alembert. [29]
Para una fuerza no conservativa que depende de la velocidad, puede ser posible encontrar una función de energía potencial V que dependa de posiciones y velocidades. Si las fuerzas generalizadas Q i pueden derivarse de un potencial V tal que [31] [32] igualando a las ecuaciones de Lagrange y definiendo el lagrangiano como L = T − V se obtienen las ecuaciones de Lagrange de segundo tipo o las ecuaciones de movimiento de Euler-Lagrange
Sin embargo, las ecuaciones de Euler-Lagrange solo pueden dar cuenta de fuerzas no conservativas si se puede encontrar un potencial como se muestra. Esto puede no ser siempre posible para fuerzas no conservativas, y las ecuaciones de Lagrange no involucran ningún potencial, solo fuerzas generalizadas; por lo tanto, son más generales que las ecuaciones de Euler-Lagrange.
Las ecuaciones de Euler-Lagrange también se deducen del cálculo de variaciones . La variación del lagrangiano es que tiene una forma similar a la diferencial total de L , pero los desplazamientos virtuales y sus derivadas temporales reemplazan a las diferenciales, y no hay incremento temporal de acuerdo con la definición de los desplazamientos virtuales. Una integración por partes con respecto al tiempo puede transferir la derivada temporal de δq j a ∂ L /∂(d q j /d t ), en el proceso intercambiando d( δq j )/d t por δq j , lo que permite factorizar los desplazamientos virtuales independientes a partir de las derivadas del lagrangiano,
Ahora bien, si la condición δq j ( t 1 ) = δq j ( t 2 ) = 0 se cumple para todo j , los términos no integrados son cero. Si además la integral temporal completa de δL es cero, entonces como los δq j son independientes y la única manera de que una integral definida sea cero es si el integrando es igual a cero, cada uno de los coeficientes de δq j también debe ser cero. Entonces obtenemos las ecuaciones de movimiento. Esto se puede resumir mediante el principio de Hamilton :
La integral temporal del lagrangiano es otra cantidad llamada acción , definida como [33] que es una función ; toma la función lagrangiana para todos los tiempos entre t 1 y t 2 y devuelve un valor escalar. Sus dimensiones son las mismas que [ momento angular ], [energía]·[tiempo] o [longitud]·[momento]. Con esta definición, el principio de Hamilton es
En lugar de pensar en partículas que se aceleran en respuesta a fuerzas aplicadas, se podría pensar en ellas eligiendo el camino con una acción estacionaria, con los puntos finales del camino en el espacio de configuración mantenidos fijos en los tiempos inicial y final. El principio de Hamilton es uno de varios principios de acción . [34]
Históricamente, la idea de encontrar el camino más corto que una partícula puede seguir sujeta a una fuerza motivó las primeras aplicaciones del cálculo de variaciones a problemas mecánicos, como el problema de la braquistócrona resuelto por Jean Bernoulli en 1696, así como Leibniz , Daniel Bernoulli , L'Hôpital en la misma época y Newton al año siguiente. [35] El propio Newton estaba pensando en la línea del cálculo variacional, pero no publicó. [35] Estas ideas a su vez conducen a los principios variacionales de la mecánica, de Fermat , Maupertuis , Euler , Hamilton y otros.
El principio de Hamilton se puede aplicar a restricciones no holonómicas si las ecuaciones de restricción se pueden poner en una forma determinada, una combinación lineal de diferenciales de primer orden en las coordenadas. La ecuación de restricción resultante se puede reorganizar en una ecuación diferencial de primer orden. [36] Esto no se explicará aquí.
El lagrangiano L puede variarse en las coordenadas cartesianas r k , para N partículas,
El principio de Hamilton sigue siendo válido incluso si las coordenadas en las que se expresa L no son independientes, aquí r k , pero se sigue suponiendo que las restricciones son holonómicas. [37] Como siempre, los puntos finales son fijos δ r k ( t 1 ) = δ r k ( t 2 ) = 0 para todo k . Lo que no se puede hacer es simplemente igualar los coeficientes de δ r k a cero porque los δ r k no son independientes. En cambio, se puede utilizar el método de los multiplicadores de Lagrange para incluir las restricciones. Al multiplicar cada ecuación de restricción f i ( r k , t ) = 0 por un multiplicador de Lagrange λ i para i = 1, 2, ..., C , y sumar los resultados al lagrangiano original, se obtiene el nuevo lagrangiano
Los multiplicadores de Lagrange son funciones arbitrarias del tiempo t , pero no funciones de las coordenadas rk , por lo que los multiplicadores están en igualdad de condiciones con las coordenadas de posición. Variando este nuevo lagrangiano e integrando con respecto al tiempo se obtiene
Los multiplicadores introducidos se pueden hallar de modo que los coeficientes de δ r k sean cero, aunque r k no sean independientes. De ello se deducen las ecuaciones de movimiento. A partir del análisis anterior, obtener la solución de esta integral es equivalente a afirmar que son ecuaciones de Lagrange de primera especie . Además, las ecuaciones de Euler-Lagrange λ i para el nuevo lagrangiano devuelven las ecuaciones de restricción
Para el caso de una fuerza conservativa dada por el gradiente de alguna energía potencial V , una función de las coordenadas r k solamente, sustituyendo el Lagrangiano L = T − V se obtiene e identificando las derivadas de la energía cinética como la (negativa de la) fuerza resultante, y las derivadas del potencial igualando la fuerza sin restricción, se deduce que las fuerzas de restricción están dando las fuerzas de restricción explícitamente en términos de las ecuaciones de restricción y los multiplicadores de Lagrange.
El lagrangiano de un sistema dado no es único. Un lagrangiano L puede multiplicarse por una constante distinta de cero a y desplazarse por una constante arbitraria b , y el nuevo lagrangiano L ′ = aL + b describirá el mismo movimiento que L . Si uno restringe como arriba a trayectorias q sobre un intervalo de tiempo dado [ t st , t fin ] } y puntos finales fijos P st = q ( t st ) y P fin = q ( t fin ) , entonces dos lagrangianos que describen el mismo sistema pueden diferir por la "derivada temporal total" de una función f ( q , t ) : [38] donde significa
Ambos lagrangianos L y L ′ producen las mismas ecuaciones de movimiento [39] [40] ya que las acciones correspondientes S y S ′ están relacionadas a través de los dos últimos componentes f ( P fin , t fin ) y f ( P st , t st ) independientes de q .
Dado un conjunto de coordenadas generalizadas q , si cambiamos estas variables a un nuevo conjunto de coordenadas generalizadas Q de acuerdo con una transformación de puntos Q = Q ( q , t ) que es invertible cuando q = q ( Q , t ) , el nuevo Lagrangiano L ′ es una función de las nuevas coordenadas y por la regla de la cadena para la diferenciación parcial, las ecuaciones de Lagrange son invariantes bajo esta transformación; [41]
Esto puede simplificar las ecuaciones de movimiento.
Para una transformación de coordenadas , tenemos que implica que lo que implica que .
También se sigue que: y de manera similar: lo que implica que . Las dos relaciones derivadas pueden emplearse en la prueba.
Partiendo de las ecuaciones de Euler Lagrange en el conjunto inicial de coordenadas generalizadas, tenemos:
Dado que la transformación de es invertible, se deduce que la forma de la ecuación de Euler-Lagrange es invariante, es decir,
Una propiedad importante del lagrangiano es que las cantidades conservadas se pueden leer fácilmente a partir de él. El momento generalizado "canónicamente conjugado con" la coordenada q i se define por
Si el lagrangiano L no depende de ninguna coordenada q i , se sigue inmediatamente de las ecuaciones de Euler-Lagrange que y al integrar se muestra que el momento generalizado correspondiente es igual a una constante, una cantidad conservada. Este es un caso especial del teorema de Noether . Tales coordenadas se denominan "cíclicas" o "ignorables".
Por ejemplo, un sistema puede tener un Lagrangiano donde r y z son longitudes a lo largo de líneas rectas, s es una longitud de arco a lo largo de alguna curva, y θ y φ son ángulos. Nótese que z , s y φ están todos ausentes en el Lagrangiano aunque sus velocidades no lo estén. Entonces los momentos son todos cantidades conservadas. Las unidades y la naturaleza de cada momento generalizado dependerán de la coordenada correspondiente; en este caso p z es un momento de traslación en la dirección z , p s es también un momento de traslación a lo largo de la curva en la que se mide s , y p φ es un momento angular en el plano en el que se mide el ángulo φ . Por más complicado que sea el movimiento del sistema, todas las coordenadas y velocidades variarán de tal manera que estos momentos se conservan.
Dado un lagrangiano, el hamiltoniano del sistema mecánico correspondiente es, por definición, Esta cantidad será equivalente a energía si las coordenadas generalizadas son coordenadas naturales, es decir, no tienen dependencia explícita del tiempo al expresar el vector de posición: . De: donde es una matriz simétrica que se define para la derivación.
En cada instante de tiempo t , la energía es invariante bajo los cambios de coordenadas del espacio de configuración q → Q , es decir (usando coordenadas naturales) Además de este resultado, la prueba a continuación muestra que, bajo tal cambio de coordenadas, las derivadas cambian como coeficientes de una forma lineal.
Para una transformación de coordenadas Q = F ( q ) , tenemos donde es la función tangente del espacio vectorial al espacio vectorial y es el jacobiano. En las coordenadas y la fórmula anterior para tiene la forma Después de la diferenciación que involucra la regla del producto, donde
En notación vectorial,
Por otro lado,
Se mencionó anteriormente que los lagrangianos no dependen de la elección de las coordenadas del espacio de configuración, es decir, una implicación de esto es que y Esto demuestra que, para cada y es una forma lineal bien definida cuyos coeficientes son 1-tensores contravariantes. Al aplicar ambos lados de la ecuación a y usar la fórmula anterior para se obtiene la invariancia de la energía .
En la mecánica lagrangiana, el sistema es cerrado si y solo si su lagrangiano no depende explícitamente del tiempo. La ley de conservación de la energía establece que la energía de un sistema cerrado es una integral del movimiento .
Más precisamente, sea q = q ( t ) un extremal . (En otras palabras, q satisface las ecuaciones de Euler-Lagrange). Tomando la derivada temporal total de L a lo largo de este extremal y utilizando las ecuaciones EL se llega a
Si el lagrangiano L no depende explícitamente del tiempo, entonces ∂ L /∂ t = 0 , entonces H no varía con el tiempo, evolución de la partícula, de hecho, es una integral del movimiento, lo que significa que Por lo tanto, si las coordenadas elegidas fueran coordenadas naturales, la energía se conserva.
En todas estas circunstancias, [42] la constante es la energía total del sistema. Las energías cinética y potencial siguen cambiando a medida que el sistema evoluciona, pero el movimiento del sistema será tal que su suma, la energía total, será constante. Esta es una simplificación valiosa, ya que la energía E es una constante de integración que cuenta como una constante arbitraria para el problema, y puede ser posible integrar las velocidades a partir de esta relación de energía para resolver las coordenadas.
Si la energía potencial es una función homogénea de las coordenadas e independiente del tiempo, [43] y todos los vectores de posición están escalados por la misma constante distinta de cero α , r k ′ = α r k , de modo que y el tiempo está escalado por un factor β , t ′ = βt , entonces las velocidades v k están escaladas por un factor de α / β y la energía cinética T por ( α / β ) 2 . Todo el Lagrangiano ha sido escalado por el mismo factor si
Como las longitudes y los tiempos se han escalado, las trayectorias de las partículas en el sistema siguen caminos geométricamente similares que difieren en tamaño. La longitud l recorrida en el tiempo t en la trayectoria original corresponde a una nueva longitud l ′ recorrida en el tiempo t ′ en la nueva trayectoria, dada por las razones
Para un sistema dado, si dos subsistemas A y B no interactúan, el lagrangiano L del sistema general es la suma de los lagrangianos L A y L B para los subsistemas: [38]
Si interactúan, esto no es posible. En algunas situaciones, puede ser posible separar el lagrangiano del sistema L en la suma de los lagrangianos que no interactúan, más otro lagrangiano L AB que contiene información sobre la interacción.
Esto puede estar motivado físicamente al tomar los lagrangianos que no interactúan como energías cinéticas solamente, mientras que el lagrangiano de interacción es la energía potencial total del sistema. Además, en el caso límite de interacción despreciable, L AB tiende a cero, lo que reduce el caso anterior de no interacción.
La extensión a más de dos subsistemas que no interactúan es sencilla: el lagrangiano general es la suma de los lagrangianos separados para cada subsistema. Si hay interacciones, se pueden agregar los lagrangianos de interacción.
De las ecuaciones de Euler-Lagrange se deduce que:
donde la matriz se define como . Si la matriz no es singular, las ecuaciones anteriores se pueden resolver para representar como una función de . Si la matriz no es invertible, no sería posible representar todas las como una función de pero, además, las ecuaciones de movimientos hamiltonianas no adoptarán la forma estándar. [44]
Los siguientes ejemplos aplican las ecuaciones de Lagrange del segundo tipo a problemas mecánicos.
Una partícula de masa m se mueve bajo la influencia de una fuerza conservativa derivada del gradiente ∇ de un potencial escalar ,
Si hay más partículas, de acuerdo con los resultados anteriores, la energía cinética total es una suma de todas las energías cinéticas de las partículas, y el potencial es una función de todas las coordenadas.
El lagrangiano de la partícula se puede escribir
Las ecuaciones de movimiento para la partícula se encuentran aplicando la ecuación de Euler-Lagrange para la coordenada x con derivadas de aquí y de manera similar para las coordenadas y y z . Recopilando las ecuaciones en forma vectorial encontramos que es la segunda ley de movimiento de Newton para una partícula sujeta a una fuerza conservativa.
Utilizando las coordenadas esféricas ( r , θ , φ ) como se usan comúnmente en física (convención ISO 80000-2:2019), donde r es la distancia radial al origen, θ es el ángulo polar (también conocido como colatitud, ángulo cenital, ángulo normal o ángulo de inclinación) y φ es el ángulo azimutal, el lagrangiano para un potencial central es Entonces, en coordenadas esféricas, las ecuaciones de Euler-Lagrange son La coordenada φ es cíclica ya que no aparece en el lagrangiano, por lo que el momento conservado en el sistema es el momento angular en el que r , θ y dφ / dt pueden variar con el tiempo, pero solo de tal manera que p φ sea constante.
El lagrangiano en coordenadas polares bidimensionales se recupera fijando θ en el valor constante π /2.
Consideremos un péndulo de masa m y longitud ℓ , que está unido a un soporte con masa M , que puede moverse a lo largo de una línea en la dirección . Sea la coordenada a lo largo de la línea del soporte, y denotemos la posición del péndulo por el ángulo desde la vertical. Las coordenadas y los componentes de velocidad del cuerpo del péndulo son
Las coordenadas generalizadas pueden tomarse como y . La energía cinética del sistema es entonces y la energía potencial es dando el lagrangiano
Como x no está presente en la ecuación de Lagrange, se trata de una coordenada cíclica. El momento conservado es y la ecuación de Lagrange para la coordenada de apoyo es
La ecuación de Lagrange para el ángulo θ es y simplificando
Estas ecuaciones pueden parecer bastante complicadas, pero encontrarlas con las leyes de Newton habría requerido identificar cuidadosamente todas las fuerzas, lo que habría sido mucho más laborioso y propenso a errores. Al considerar casos límite, se puede verificar la corrección de este sistema: por ejemplo, debe dar las ecuaciones de movimiento para un péndulo simple que está en reposo en algún marco inercial , mientras que debe dar las ecuaciones para un péndulo en un sistema en aceleración constante, etc. Además, es trivial obtener los resultados numéricamente, dadas las condiciones iniciales adecuadas y un paso de tiempo elegido, recorriendo los resultados iterativamente .
Dos cuerpos de masas m 1 y m 2 con vectores de posición r 1 y r 2 están en órbita uno alrededor del otro debido a un potencial central atractivo V . Podemos escribir el Lagrangiano en términos de las coordenadas de posición tal como están, pero es un procedimiento establecido convertir el problema de dos cuerpos en un problema de un cuerpo de la siguiente manera. Introduzca las coordenadas de Jacobi ; la separación de los cuerpos r = r 2 − r 1 y la ubicación del centro de masas R = ( m 1 r 1 + m 2 r 2 )/( m 1 + m 2 ) . El Lagrangiano es entonces [45] [46] [nb 4] donde M = m 1 + m 2 es la masa total, μ = m 1 m 2 /( m 1 + m 2 ) es la masa reducida , y V el potencial de la fuerza radial, que depende solo de la magnitud de la separación | r | = | r 2 − r 1 | . El lagrangiano se divide en un término de centro de masa L cm y un término de movimiento relativo L rel .
La ecuación de Euler-Lagrange para R es simplemente la que establece que el centro de masa se mueve en línea recta a velocidad constante.
Dado que el movimiento relativo sólo depende de la magnitud de la separación, lo ideal es utilizar coordenadas polares ( r , θ ) y tomar r = | r | , por lo que θ es una coordenada cíclica con el momento (angular) conservado correspondiente.
La coordenada radial r y la velocidad angular d θ /d t pueden variar con el tiempo, pero sólo de tal manera que ℓ sea constante. La ecuación de Lagrange para r es
Esta ecuación es idéntica a la ecuación radial obtenida utilizando las leyes de Newton en un sistema de referencia co-rotativo , es decir, un sistema que gira con la masa reducida de modo que parece estacionario. Eliminando la velocidad angular d θ /d t de esta ecuación radial, [47] que es la ecuación de movimiento para un problema unidimensional en el que una partícula de masa μ está sometida a la fuerza central hacia adentro −d V /d r y una segunda fuerza hacia afuera, llamada en este contexto fuerza centrífuga (lagrangiana) (ver fuerza centrífuga#Otros usos del término ):
Por supuesto, si uno permanece completamente dentro de la formulación unidimensional, ℓ entra sólo como algún parámetro impuesto de la fuerza externa hacia afuera, y su interpretación como momento angular depende del problema bidimensional más general del cual se originó el problema unidimensional.
Si se llega a esta ecuación utilizando la mecánica newtoniana en un marco co-rotativo, la interpretación es evidente como la fuerza centrífuga en ese marco debido a la rotación del marco mismo. Si se llega a esta ecuación directamente utilizando las coordenadas generalizadas ( r , θ ) y simplemente siguiendo la formulación lagrangiana sin pensar en los marcos en absoluto, la interpretación es que la fuerza centrífuga es una consecuencia del uso de coordenadas polares . Como dice Hildebrand: [48]
"Como estas magnitudes no son verdaderas fuerzas físicas, se las suele llamar fuerzas de inercia . Su presencia o ausencia no depende del problema concreto en cuestión, sino del sistema de coordenadas elegido ". En particular, si se eligen coordenadas cartesianas, la fuerza centrífuga desaparece y la formulación implica únicamente la propia fuerza central, que proporciona la fuerza centrípeta para un movimiento curvo.
Este punto de vista, de que las fuerzas ficticias se originan en la elección de coordenadas, es expresado a menudo por los usuarios del método lagrangiano. Esta visión surge naturalmente en el enfoque lagrangiano, porque el marco de referencia es seleccionado (posiblemente inconscientemente) por la elección de coordenadas. Por ejemplo, véase [49] para una comparación de los lagrangianos en un marco de referencia inercial y en uno no inercial. Véase también la discusión de las formulaciones lagrangianas "totales" y "actualizadas" en. [50] Desafortunadamente, este uso de "fuerza inercial" entra en conflicto con la idea newtoniana de una fuerza inercial. En la visión newtoniana, una fuerza inercial se origina en la aceleración del marco de observación (el hecho de que no es un marco de referencia inercial ), no en la elección del sistema de coordenadas. Para mantener las cosas claras, es más seguro referirse a las fuerzas inerciales lagrangianas como fuerzas inerciales generalizadas , para distinguirlas de las fuerzas inerciales vectoriales newtonianas. Es decir, no se debe seguir a Hildebrand cuando dice (p. 155) " siempre tratamos con fuerzas, velocidades, aceleraciones y momentos generalizados . Para abreviar, el adjetivo "generalizado" se omitirá con frecuencia".
Se sabe que el lagrangiano de un sistema no es único. Dentro del formalismo lagrangiano las fuerzas ficticias newtonianas pueden identificarse por la existencia de lagrangianos alternativos en los que las fuerzas ficticias desaparecen, a veces hallados explotando la simetría del sistema. [51]
La disipación (es decir, los sistemas no conservativos) también se puede tratar con un lagrangiano efectivo formulado por una cierta duplicación de los grados de libertad. [52] [53] [54] [55]
En una formulación más general, las fuerzas podrían ser tanto conservativas como viscosas . Si se puede encontrar una transformación apropiada a partir de F i , Rayleigh sugiere utilizar una función de disipación , D , de la siguiente forma: [56] donde C jk son constantes que están relacionadas con los coeficientes de amortiguamiento en el sistema físico, aunque no necesariamente iguales a ellos. Si D se define de esta manera, entonces [56] y
Una partícula de prueba es una partícula cuya masa y carga se supone que son tan pequeñas que su efecto sobre el sistema externo es insignificante. A menudo es una partícula puntual simplificada hipotética sin propiedades distintas a la masa y la carga. Las partículas reales, como los electrones y los quarks up, son más complejas y tienen términos adicionales en sus lagrangianos. Los campos no solo pueden formar potenciales no conservativos, sino que estos potenciales también pueden depender de la velocidad.
El lagrangiano de una partícula cargada con carga eléctrica q , que interactúa con un campo electromagnético , es el ejemplo prototípico de un potencial dependiente de la velocidad. El potencial escalar eléctrico ϕ = ϕ ( r , t ) y el potencial vectorial magnético A = A ( r , t ) se definen a partir del campo eléctrico E = E ( r , t ) y el campo magnético B = B ( r , t ) de la siguiente manera:
El lagrangiano de una partícula de prueba cargada masiva en un campo electromagnético se denomina acoplamiento mínimo . Este es un buen ejemplo de cuándo la regla general común de que el lagrangiano es la energía cinética menos la energía potencial es incorrecta. Combinada con la ecuación de Euler-Lagrange , produce la ley de fuerza de Lorentz .
Bajo la transformación de calibre : donde f ( r , t ) es cualquier función escalar del espacio y el tiempo, las transformadas lagrangianas antes mencionadas son como: que todavía produce la misma ley de fuerza de Lorentz.
Nótese que el momento canónico (conjugado a la posición r ) es el momento cinético más una contribución del campo A (conocido como momento potencial):
Esta relación también se utiliza en la prescripción de acoplamiento mínimo en mecánica cuántica y teoría cuántica de campos . A partir de esta expresión, podemos ver que el momento canónico p no es invariante de calibre y, por lo tanto, no es una cantidad física medible; Sin embargo, si r es cíclico (es decir, el lagrangiano es independiente de la posición r ), lo que sucede si los campos ϕ y A son uniformes, entonces este momento canónico p dado aquí es el momento conservado, mientras que el momento cinético físico medible m v no lo es.
Las ideas de la mecánica lagrangiana tienen numerosas aplicaciones en otras áreas de la física y pueden adoptar resultados generalizados del cálculo de variaciones.
Una formulación estrechamente relacionada con la mecánica clásica es la mecánica hamiltoniana . El hamiltoniano se define por y se puede obtener realizando una transformación de Legendre sobre el lagrangiano, que introduce nuevas variables canónicamente conjugadas a las variables originales. Por ejemplo, dado un conjunto de coordenadas generalizadas, las variables canónicamente conjugadas son los momentos generalizados. Esto duplica el número de variables, pero hace que las ecuaciones diferenciales sean de primer orden. El hamiltoniano es una cantidad particularmente ubicua en la mecánica cuántica (véase Hamiltoniano (mecánica cuántica) ).
La mecánica routhiana es una formulación híbrida de la mecánica lagrangiana y hamiltoniana, que no se utiliza con frecuencia en la práctica, pero es una formulación eficiente para coordenadas cíclicas.
Las ecuaciones de Euler-Lagrange también pueden formularse en términos de los momentos generalizados en lugar de las coordenadas generalizadas. Al realizar una transformación de Legendre en el lagrangiano de coordenadas generalizadas L ( q , d q /d t , t ) se obtiene el lagrangiano de momentos generalizados L ′( p , d p /d t , t ) en términos del lagrangiano original, así como las ecuaciones EL en términos de los momentos generalizados. Ambos lagrangianos contienen la misma información y cualquiera de ellos puede utilizarse para resolver el movimiento del sistema. En la práctica, las coordenadas generalizadas son más cómodas de utilizar e interpretar que los momentos generalizados.
No hay ninguna razón matemática para restringir las derivadas de coordenadas generalizadas solo al primer orden. Es posible derivar ecuaciones EL modificadas para un lagrangiano que contenga derivadas de orden superior; véase la ecuación de Euler-Lagrange para más detalles. Sin embargo, desde el punto de vista físico existe un obstáculo para incluir derivadas temporales superiores al primer orden, lo que está implícito en la construcción de Ostrogradsky de un formalismo canónico para lagrangianos de derivada superior no degenerados; véase la inestabilidad de Ostrogradsky.
La mecánica lagrangiana se puede aplicar a la óptica geométrica , aplicando principios variacionales a los rayos de luz en un medio, y resolviendo las ecuaciones EL se obtienen las ecuaciones de los caminos que siguen los rayos de luz.
La mecánica lagrangiana se puede formular en relatividad especial y relatividad general . Algunas características de la mecánica lagrangiana se conservan en las teorías relativistas, pero rápidamente aparecen dificultades en otros aspectos. En particular, las ecuaciones EL toman la misma forma, y la conexión entre coordenadas cíclicas y momentos conservados todavía se aplica, sin embargo, el lagrangiano debe modificarse y no es simplemente la energía cinética menos la energía potencial de una partícula. Además, no es sencillo manejar sistemas multipartículas de una manera manifiestamente covariante , puede ser posible si se señala un marco de referencia particular.
En mecánica cuántica , la acción y la fase mecánico-cuántica están relacionadas a través de la constante de Planck , y el principio de acción estacionaria puede entenderse en términos de interferencia constructiva de funciones de onda .
En 1948, Feynman descubrió la formulación de la integral de trayectorias, que extiende el principio de mínima acción a la mecánica cuántica para electrones y fotones . En esta formulación, las partículas recorren todos los caminos posibles entre los estados inicial y final; la probabilidad de un estado final específico se obtiene sumando todas las trayectorias posibles que conducen a él. En el régimen clásico, la formulación de la integral de trayectorias reproduce claramente el principio de Hamilton y el principio de Fermat en óptica .
En la mecánica de Lagrange, las coordenadas generalizadas forman un conjunto discreto de variables que definen la configuración de un sistema. En la teoría clásica de campos , el sistema físico no es un conjunto de partículas discretas, sino un campo continuo ϕ ( r , t ) definido sobre una región del espacio 3D. Asociada con el campo hay una densidad de Lagrange definida en términos del campo y sus derivadas espaciales y temporales en una ubicación r y un tiempo t . De manera análoga al caso de las partículas, para aplicaciones no relativistas la densidad de Lagrange es también la densidad de energía cinética del campo, menos su densidad de energía potencial (esto no es cierto en general, y la densidad de Lagrange tiene que ser "ingeniería inversa"). El Lagrange es entonces la integral de volumen de la densidad de Lagrange sobre el espacio 3D donde d 3 r es un elemento de volumen diferencial 3D . El lagrangiano es una función del tiempo ya que la densidad lagrangiana tiene una dependencia espacial implícita a través de los campos, y puede tener una dependencia espacial explícita, pero estos se eliminan en la integral, dejando solo el tiempo como variable para el lagrangiano.
El principio de acción y el formalismo lagrangiano están estrechamente vinculados al teorema de Noether , que conecta las cantidades físicas conservadas con las simetrías continuas de un sistema físico.
Si el lagrangiano es invariante bajo una simetría, entonces las ecuaciones de movimiento resultantes también son invariantes bajo esa simetría. Esta característica es muy útil para demostrar que las teorías son consistentes con la relatividad especial o la relatividad general .