Parte de una serie de artículos sobre |
Mecánica cuántica |
---|
En física de partículas , la ecuación de Dirac es una ecuación de onda relativista derivada por el físico británico Paul Dirac en 1928. En su forma libre, o incluyendo interacciones electromagnéticas, describe todas las partículas masivas de espín 1/2 , llamadas "partículas de Dirac", como los electrones y los quarks para los que la paridad es una simetría . Es consistente tanto con los principios de la mecánica cuántica como con la teoría de la relatividad especial , [1] y fue la primera teoría en explicar completamente la relatividad especial en el contexto de la mecánica cuántica. Fue validada al explicar la estructura fina del espectro del hidrógeno de una manera completamente rigurosa. Se ha vuelto vital en la construcción del Modelo Estándar . [2]
La ecuación también implicaba la existencia de una nueva forma de materia, la antimateria , previamente insospechada e inobservada y que fue confirmada experimentalmente varios años después. También proporcionó una justificación teórica para la introducción de varias funciones de onda componentes en la teoría fenomenológica del espín de Pauli . Las funciones de onda en la teoría de Dirac son vectores de cuatro números complejos (conocidos como bispinores ), dos de los cuales se asemejan a la función de onda de Pauli en el límite no relativista, en contraste con la ecuación de Schrödinger que describía funciones de onda de un solo valor complejo. Además, en el límite de masa cero, la ecuación de Dirac se reduce a la ecuación de Weyl .
En el contexto de la teoría cuántica de campos , la ecuación de Dirac se reinterpreta para describir campos cuánticos correspondientes a partículas de espín 1 ⁄ 2 .
Dirac no apreció plenamente la importancia de sus resultados; sin embargo, la explicación del espín como consecuencia de la unión de la mecánica cuántica y la relatividad —y el eventual descubrimiento del positrón— representa uno de los grandes triunfos de la física teórica . Este logro ha sido descrito como totalmente a la par con los trabajos de Newton , Maxwell y Einstein antes que él. [3] Algunos físicos han considerado que la ecuación es la "verdadera semilla de la física moderna". [4] La ecuación también ha sido descrita como la "pieza central de la mecánica cuántica relativista", y también se ha afirmado que "la ecuación es quizás la más importante de toda la mecánica cuántica". [5]
La ecuación de Dirac está inscrita en una placa en el suelo de la Abadía de Westminster . La placa, inaugurada el 13 de noviembre de 1995, conmemora la vida de Dirac. [6]
La ecuación de Dirac en la forma propuesta originalmente por Dirac es: [7] : 291 [8] donde ψ ( x , t ) es la función de onda para un electrón de masa en reposo m con coordenadas espaciotemporales x , t . p 1 , p 2 , p 3 son los componentes del momento , entendido como el operador de momento en la ecuación de Schrödinger . c es la velocidad de la luz , y ħ es la constante de Planck reducida ; estas constantes físicas fundamentales reflejan la relatividad especial y la mecánica cuántica, respectivamente.
El propósito de Dirac al formular esta ecuación era explicar el comportamiento del electrón en movimiento relativista, permitiendo así que el átomo fuera tratado de una manera consistente con la relatividad. Esperaba que las correcciones introducidas de esta manera pudieran tener una relación con el problema de los espectros atómicos .
Hasta ese momento, los intentos de compatibilizar la antigua teoría cuántica del átomo con la teoría de la relatividad —basada en la discretización del momento angular almacenado en la órbita posiblemente no circular del electrón alrededor del núcleo atómico— habían fracasado, y la nueva mecánica cuántica de Heisenberg , Pauli , Jordan , Schrödinger y el propio Dirac no se había desarrollado lo suficiente para abordar este problema. Aunque las intenciones originales de Dirac se vieron satisfechas, su ecuación tuvo implicaciones mucho más profundas para la estructura de la materia e introdujo nuevas clases matemáticas de objetos que ahora son elementos esenciales de la física fundamental.
Los nuevos elementos en esta ecuación son las cuatro matrices de 4 × 4 α 1 , α 2 , α 3 y β , y la función de onda de cuatro componentes ψ . Hay cuatro componentes en ψ porque su evaluación en cualquier punto dado en el espacio de configuración es un bispinor . Se interpreta como una superposición de un electrón de espín hacia arriba , un electrón de espín hacia abajo, un positrón de espín hacia arriba y un positrón de espín hacia abajo.
Las matrices 4 × 4 α k y β son todas hermíticas e involutivas : y todas son mutuamente anticonmutativas :
Estas matrices y la forma de la función de onda tienen un profundo significado matemático. La estructura algebraica representada por las matrices gamma había sido creada unos 50 años antes por el matemático inglés W. K. Clifford . A su vez, las ideas de Clifford habían surgido del trabajo de mediados del siglo XIX del matemático alemán Hermann Grassmann en su Lineare Ausdehnungslehre ( Teoría de la expansión lineal ). [ cita requerida ]
El lado izquierdo representa el cuadrado del operador de momento dividido por el doble de la masa, que es la energía cinética no relativista. Debido a que la relatividad trata el espacio y el tiempo como un todo, una generalización relativista de esta ecuación requiere que las derivadas del espacio y el tiempo entren simétricamente como lo hacen en las ecuaciones de Maxwell que gobiernan el comportamiento de la luz: las ecuaciones deben ser diferencialmente del mismo orden en el espacio y el tiempo. En relatividad, el momento y las energías son las partes del espacio y el tiempo de un vector espacio-tiempo, el cuatrimomento , y están relacionadas por la relación relativista invariante
que dice que la longitud de este cuatrivector es proporcional a la masa en reposo m . Sustituyendo los operadores equivalentes de la energía y el momento de la teoría de Schrödinger se obtiene la ecuación de Klein-Gordon que describe la propagación de ondas, construida a partir de objetos relativistas invariantes, con la función de onda siendo un escalar relativista: un número complejo que tiene el mismo valor numérico en todos los marcos de referencia. Las derivadas del espacio y del tiempo entran en segundo orden. Esto tiene una consecuencia reveladora para la interpretación de la ecuación. Debido a que la ecuación es de segundo orden en la derivada del tiempo, uno debe especificar valores iniciales tanto de la función de onda en sí como de su primera derivada del tiempo para resolver problemas definidos. Dado que ambos pueden especificarse más o menos arbitrariamente, la función de onda no puede mantener su papel anterior de determinar la densidad de probabilidad de encontrar el electrón en un estado de movimiento dado. En la teoría de Schrödinger, la densidad de probabilidad está dada por la expresión definida positiva y esta densidad se convecta de acuerdo con el vector de corriente de probabilidad con la conservación de la corriente de probabilidad y la densidad que sigue a partir de la ecuación de continuidad:
El hecho de que la densidad sea definida positiva y convectiva según esta ecuación de continuidad implica que se puede integrar la densidad sobre un cierto dominio y fijar el total en 1, y esta condición se mantendrá por la ley de conservación . Una teoría relativista adecuada con una corriente de densidad de probabilidad también debe compartir esta característica. Para mantener la noción de una densidad convectiva, se debe generalizar la expresión de Schrödinger de la densidad y la corriente de modo que las derivadas de espacio y tiempo entren nuevamente simétricamente en relación con la función de onda escalar. La expresión de Schrödinger se puede mantener para la corriente, pero la densidad de probabilidad debe reemplazarse por la expresión formada simétricamente [ se necesita más explicación ] que ahora se convierte en el cuarto componente de un vector espacio-temporal, y toda la densidad de probabilidad 4-corriente tiene la expresión relativistamente covariante.
La ecuación de continuidad es la misma que antes. Ahora todo es compatible con la relatividad, pero la expresión para la densidad ya no es definida positiva; los valores iniciales de ψ y ∂ t ψ pueden elegirse libremente, y la densidad puede volverse negativa, algo que es imposible para una densidad de probabilidad legítima. Por lo tanto, no se puede obtener una generalización simple de la ecuación de Schrödinger bajo la suposición ingenua de que la función de onda es un escalar relativista y la ecuación que satisface es de segundo orden en el tiempo.
Aunque no se trata de una generalización relativista exitosa de la ecuación de Schrödinger, esta ecuación resucita en el contexto de la teoría cuántica de campos , donde se conoce como ecuación de Klein–Gordon , y describe un campo de partículas sin espín (p. ej. mesón pi o bosón de Higgs ). Históricamente, el propio Schrödinger llegó a esta ecuación antes que a la que lleva su nombre pero pronto la descartó. En el contexto de la teoría cuántica de campos, se entiende que la densidad indefinida corresponde a la densidad de carga , que puede ser positiva o negativa, y no a la densidad de probabilidad.
Dirac pensó entonces en probar una ecuación que fuera de primer orden tanto en el espacio como en el tiempo. Postuló una ecuación de la forma donde los operadores deben ser independientes de para la linealidad e independientes de para la homogeneidad espacio-temporal. Estas restricciones implicaban variables dinámicas adicionales de las que dependerían los operadores; a partir de este requisito, Dirac concluyó que los operadores dependerían de matrices 4x4, relacionadas con las matrices de Pauli. [9] : 205
Por ejemplo, se podría tomar formalmente (es decir, mediante un abuso de la notación ) la expresión relativista para la energía , reemplazar p por su operador equivalente, desarrollar la raíz cuadrada en una serie infinita de operadores derivados, plantear un problema de valores propios y luego resolver la ecuación formalmente mediante iteraciones. La mayoría de los físicos tenían poca fe en un proceso así, incluso si fuera técnicamente posible.
Según cuenta la historia, Dirac estaba mirando fijamente la chimenea en Cambridge, reflexionando sobre este problema, cuando se le ocurrió la idea de tomar la raíz cuadrada del operador de onda (ver también derivada parcial ) de esta manera:
Al multiplicar el lado derecho, es evidente que, para que desaparezcan todos los términos cruzados como ∂ x ∂ y , se debe suponer con
Dirac, que por aquel entonces se encontraba intensamente involucrado en la elaboración de los fundamentos de la mecánica matricial de Heisenberg , comprendió inmediatamente que estas condiciones podían cumplirse si A , B , C y D son matrices , con la implicación de que la función de onda tiene múltiples componentes . Esto explicó inmediatamente la aparición de funciones de onda de dos componentes en la teoría fenomenológica del espín de Pauli , algo que hasta entonces había sido considerado un misterio, incluso para el propio Pauli. Sin embargo, se necesitan al menos matrices de 4 × 4 para configurar un sistema con las propiedades requeridas, por lo que la función de onda tenía cuatro componentes, no dos, como en la teoría de Pauli, o uno, como en la teoría de Schrödinger. La función de onda de cuatro componentes representa una nueva clase de objeto matemático en las teorías físicas que hace su primera aparición aquí.
Dada la factorización en términos de estas matrices, ahora se puede escribir inmediatamente una ecuación con a determinar. Aplicando nuevamente el operador matricial en ambos lados se obtiene
La ecuación que se busca, que es de primer orden tanto en el espacio como en el tiempo, muestra que todos los componentes de la función de onda satisfacen individualmente la relación energía- momento relativista .
Al establecer y debido a que , la ecuación de Dirac se produce como está escrita arriba.
Para demostrar la invariancia relativista de la ecuación, es ventajoso formularla en una forma en la que las derivadas espaciales y temporales aparezcan en pie de igualdad. Se introducen nuevas matrices de la siguiente manera: y la ecuación toma la forma (recordando la definición de los componentes covariantes del 4-gradiente y especialmente que ∂ 0 = 1/do ∂ t )
donde hay una suma implícita sobre los valores del índice repetido dos veces μ = 0, 1, 2, 3 y ∂ μ es el gradiente 4. En la práctica, a menudo se escriben las matrices gamma en términos de submatrices 2 × 2 tomadas de las matrices de Pauli y la matriz identidad 2 × 2 . Explícitamente, la representación estándar es
El sistema completo se resume utilizando la métrica de Minkowski sobre el espacio-tiempo en la forma donde la expresión entre corchetes denota el anticonmutador . Estas son las relaciones definitorias de un álgebra de Clifford sobre un espacio pseudo-ortogonal de 4 dimensiones con signatura métrica (+ − − −) . El álgebra de Clifford específica empleada en la ecuación de Dirac se conoce hoy como el álgebra de Dirac . Aunque Dirac no la reconoció como tal en el momento en que se formuló la ecuación, en retrospectiva la introducción de esta álgebra geométrica representa un enorme paso adelante en el desarrollo de la teoría cuántica.
La ecuación de Dirac ahora puede interpretarse como una ecuación de valor propio , donde la masa en reposo es proporcional a un valor propio del operador de 4 momentos , siendo la constante de proporcionalidad la velocidad de la luz:
Usando ( se pronuncia "d-slash"), [10] según la notación de barra de Feynman, la ecuación de Dirac se convierte en:
En la práctica, los físicos suelen utilizar unidades de medida tales que ħ = c = 1 , conocidas como unidades naturales . La ecuación entonces toma la forma simple
Un teorema fundamental [ ¿cuál? ] establece que si se dan dos conjuntos distintos de matrices que satisfacen las relaciones de Clifford , entonces están conectados entre sí por una transformada de similitud :
Si además las matrices son todas unitarias , como lo es el conjunto de Dirac, entonces S mismo es unitario ;
La transformación U es única hasta un factor multiplicativo de valor absoluto 1. Imaginemos ahora que se ha realizado una transformación de Lorentz sobre las coordenadas espacio-temporales y sobre los operadores de derivadas, que forman un vector covariante. Para que el operador γ μ ∂ μ permanezca invariante, las gammas deben transformarse entre sí como un vector contravariante con respecto a su índice espacio-temporal. Estas nuevas gammas satisfarán por sí mismas las relaciones de Clifford, debido a la ortogonalidad de la transformación de Lorentz. Por el teorema fundacional mencionado anteriormente, [ ¿cuál? ] se puede reemplazar el nuevo conjunto por el antiguo conjunto sujeto a una transformación unitaria. En el nuevo marco, recordando que la masa en reposo es un escalar relativista, la ecuación de Dirac tomará entonces la forma
Si el espinor transformado se define como entonces la ecuación de Dirac transformada se produce de una manera que demuestra una invariancia relativista manifiesta :
Por lo tanto, la decisión sobre cualquier representación unitaria de los gammas es definitiva, siempre que el espinor se transforme de acuerdo con la transformación unitaria que corresponde a la transformación de Lorentz dada.
Las distintas representaciones de las matrices de Dirac empleadas permitirán destacar aspectos particulares del contenido físico de la función de onda de Dirac. La representación que se muestra aquí se conoce como representación estándar : en ella, los dos componentes superiores de la función de onda pasan a la función de onda de 2 espinores de Pauli en el límite de energías bajas y velocidades pequeñas en comparación con la luz.
Las consideraciones anteriores revelan el origen de los gammas en geometría , que se remontan a la motivación original de Grassmann; representan una base fija de vectores unitarios en el espacio-tiempo. De manera similar, los productos de los gammas como γ μ γ ν representan elementos de superficie orientados , y así sucesivamente. Con esto en mente, uno puede encontrar la forma del elemento de volumen unitario en el espacio-tiempo en términos de los gammas de la siguiente manera. Por definición, es
Para que esto sea invariante, el símbolo épsilon debe ser un tensor y, por lo tanto, debe contener un factor de √ g , donde g es el determinante del tensor métrico . Como es negativo, ese factor es imaginario . Por lo tanto
Esta matriz recibe el símbolo especial γ 5 , debido a su importancia cuando se consideran transformaciones impropias del espacio-tiempo, es decir, aquellas que cambian la orientación de los vectores base. En la representación estándar, es
También se encontrará que esta matriz conmuta de forma anticonmutativa con las otras cuatro matrices de Dirac:
Desempeña un papel fundamental cuando surgen cuestiones de paridad , ya que el elemento de volumen, como magnitud dirigida, cambia de signo bajo una reflexión espacio-temporal. Por lo tanto, tomar la raíz cuadrada positiva anterior equivale a elegir una convención de lateralidad en el espacio-tiempo.
La necesidad de introducir un espín semientero se remonta experimentalmente a los resultados del experimento de Stern-Gerlach . Un haz de átomos se hace pasar a través de un fuerte campo magnético no homogéneo , que luego se divide en N partes dependiendo del momento angular intrínseco de los átomos. Se encontró que para los átomos de plata , el haz se dividió en dos; por lo tanto, el estado fundamental no podía ser entero , porque incluso si el momento angular intrínseco de los átomos fuera lo más pequeño posible, 1, el haz se dividiría en tres partes, correspondientes a átomos con L z = −1, 0, +1 . La conclusión es que los átomos de plata tienen un momento angular intrínseco neto de 1/2 . Pauli estableció una teoría que explicaba esta división introduciendo una función de onda de dos componentes y un término de corrección correspondiente en el hamiltoniano , lo que representa un acoplamiento semiclásico de esta función de onda a un campo magnético aplicado, como en las unidades del SI : (Tenga en cuenta que los caracteres en negrita implican vectores euclidianos en 3 dimensiones , mientras que el cuatro vectores de Minkowski A μ se puede definir como )
Aquí A y representan los componentes del potencial electromagnético de cuatro polos en sus unidades estándar del SI, y las tres sigmas son las matrices de Pauli . Al elevar al cuadrado el primer término, se encuentra una interacción residual con el campo magnético, junto con el hamiltoniano clásico habitual de una partícula cargada que interactúa con un campo aplicado en unidades del SI :
Este hamiltoniano es ahora una matriz 2 × 2 , por lo que la ecuación de Schrödinger basada en él debe utilizar una función de onda de dos componentes. Al introducir el potencial electromagnético externo de 4 vectores en la ecuación de Dirac de una manera similar, conocida como acoplamiento mínimo , toma la forma:
Una segunda aplicación del operador de Dirac reproducirá ahora el término de Pauli exactamente como antes, porque las matrices espaciales de Dirac multiplicadas por i tienen las mismas propiedades de cuadratura y conmutación que las matrices de Pauli. Es más, el valor de la relación giromagnética del electrón, que se encuentra frente al nuevo término de Pauli, se explica a partir de los primeros principios. Este fue un logro importante de la ecuación de Dirac y dio a los físicos una gran fe en su corrección general. Sin embargo, hay más. La teoría de Pauli puede verse como el límite de baja energía de la teoría de Dirac de la siguiente manera. Primero, la ecuación se escribe en forma de ecuaciones acopladas para 2-espinores con las unidades del SI restauradas: así
Suponiendo que el campo es débil y el movimiento del electrón no relativista, la energía total del electrón es aproximadamente igual a su energía en reposo , y el momento pasa al valor clásico, por lo que la segunda ecuación puede escribirse
que es de orden Por lo tanto, a energías y velocidades típicas, los componentes inferiores del espinor de Dirac en la representación estándar se suprimen mucho en comparación con los componentes superiores. Sustituyendo esta expresión en la primera ecuación se obtiene después de algún reordenamiento
El operador de la izquierda representa la energía total de la partícula reducida por su energía en reposo, que es simplemente su energía cinética clásica , por lo que se puede recuperar la teoría de Pauli al identificar su espinor 2 con los componentes superiores del espinor de Dirac en la aproximación no relativista. Una aproximación adicional da la ecuación de Schrödinger como el límite de la teoría de Pauli. Por lo tanto, la ecuación de Schrödinger puede verse como la aproximación no relativista lejana de la ecuación de Dirac cuando se puede ignorar el espín y trabajar solo a bajas energías y velocidades. Esto también fue un gran triunfo para la nueva ecuación, ya que rastreó la misteriosa i que aparece en ella, y la necesidad de una función de onda compleja, de vuelta a la geometría del espacio-tiempo a través del álgebra de Dirac. También destaca por qué la ecuación de Schrödinger, aunque ostensiblemente en forma de una ecuación de difusión , en realidad representa la propagación de ondas.
Es importante enfatizar que el espinor de Dirac en su totalidad representa un todo irreducible . La separación que se hace aquí del espinor de Dirac en componentes grandes y pequeños depende de que la aproximación de baja energía sea válida. Los componentes que se descuidaron anteriormente, para demostrar que la teoría de Pauli puede recuperarse mediante una aproximación de baja velocidad de la ecuación de Dirac, son necesarios para producir nuevos fenómenos observados en el régimen relativista, entre ellos la antimateria y la creación y aniquilación de partículas.
En el caso sin masa , la ecuación de Dirac se reduce a la ecuación de Weyl , que describe partículas relativistas sin masa con espín 1 ⁄ 2. [11]
La teoría adquiere una segunda simetría: ver más abajo.
La pregunta física crítica en una teoría cuántica es ésta: ¿cuáles son las cantidades observables físicamente definidas por la teoría? Según los postulados de la mecánica cuántica, dichas cantidades están definidas por operadores hermíticos que actúan sobre el espacio de Hilbert de estados posibles de un sistema. Los valores propios de estos operadores son entonces los resultados posibles de medir la cantidad física correspondiente. En la teoría de Schrödinger, el objeto más simple de este tipo es el hamiltoniano global, que representa la energía total del sistema. Para mantener esta interpretación al pasar a la teoría de Dirac, el hamiltoniano debe tomarse como donde, como siempre, hay una suma implícita sobre el índice dos veces repetido k = 1, 2, 3 . Esto parece prometedor, porque uno puede ver por inspección la energía en reposo de la partícula y, en el caso de A = 0 , la energía de una carga colocada en un potencial eléctrico cqA 0 . ¿Qué pasa con el término que involucra el potencial vectorial? En la electrodinámica clásica, la energía de una carga que se mueve en un potencial aplicado es
Por lo tanto, el hamiltoniano de Dirac se distingue fundamentalmente de su contraparte clásica, y hay que tener mucho cuidado para identificar correctamente lo que es observable en esta teoría. Gran parte del comportamiento aparentemente paradójico que implica la ecuación de Dirac equivale a una identificación errónea de estos observables. [ cita requerida ]
Las soluciones E negativas de la ecuación son problemáticas, ya que se supuso que la partícula tiene una energía positiva. Sin embargo, matemáticamente hablando, no parece haber razón para que rechacemos las soluciones de energía negativa. Dado que existen, no se las puede ignorar simplemente, ya que una vez que se incluye la interacción entre el electrón y el campo electromagnético, cualquier electrón colocado en un estado propio de energía positiva se desintegraría en estados propios de energía negativa de energía sucesivamente menor. Los electrones reales obviamente no se comportan de esta manera, o desaparecerían emitiendo energía en forma de fotones .
Para hacer frente a este problema, Dirac introdujo la hipótesis, conocida como teoría de los agujeros , de que el vacío es el estado cuántico de muchos cuerpos en el que están ocupados todos los estados propios de los electrones de energía negativa. Esta descripción del vacío como un "mar" de electrones se denomina mar de Dirac . Dado que el principio de exclusión de Pauli prohíbe que los electrones ocupen el mismo estado, cualquier electrón adicional se vería obligado a ocupar un estado propio de energía positiva, y los electrones de energía positiva tendrían prohibido decaer en estados propios de energía negativa.
Dirac razonó además que si los estados propios de energía negativa están incompletamente llenos, cada estado propio desocupado – llamado agujero – se comportaría como una partícula cargada positivamente. El agujero posee una energía positiva porque se requiere energía para crear un par partícula-agujero a partir del vacío. Como se señaló anteriormente, Dirac inicialmente pensó que el agujero podría ser el protón, pero Hermann Weyl señaló que el agujero debería comportarse como si tuviera la misma masa que un electrón, mientras que el protón es más de 1800 veces más pesado. El agujero fue finalmente identificado como el positrón , descubierto experimentalmente por Carl Anderson en 1932. [12]
No es del todo satisfactorio describir el "vacío" utilizando un mar infinito de electrones de energía negativa. Las contribuciones infinitamente negativas del mar de electrones de energía negativa tienen que ser canceladas por una energía "desnuda" positiva infinita y la contribución a la densidad de carga y corriente que viene del mar de electrones de energía negativa es cancelada exactamente por un fondo " gelatino " positivo infinito de modo que la densidad de carga eléctrica neta del vacío es cero. En la teoría cuántica de campos , una transformación de Bogoliubov sobre los operadores de creación y aniquilación (convirtiendo un estado de electrón de energía negativa ocupado en un estado de positrón de energía positiva desocupado y un estado de electrón de energía negativa desocupado en un estado de positrón de energía positiva ocupado) nos permite pasar por alto el formalismo del mar de Dirac aunque, formalmente, es equivalente a él.
Sin embargo, en ciertas aplicaciones de la física de la materia condensada , los conceptos subyacentes de la "teoría de los huecos" son válidos. El mar de electrones de conducción en un conductor eléctrico , llamado mar de Fermi , contiene electrones con energías que alcanzan el potencial químico del sistema. Un estado vacío en el mar de Fermi se comporta como un electrón cargado positivamente y, aunque también se lo conoce como "hueco electrónico", es distinto de un positrón. La carga negativa del mar de Fermi se equilibra con la red iónica cargada positivamente del material.
En las teorías cuánticas de campos , como la electrodinámica cuántica , el campo de Dirac está sujeto a un proceso de segunda cuantificación , que resuelve algunas de las características paradójicas de la ecuación.
En su formulación moderna para la teoría de campos, la ecuación de Dirac se escribe en términos de un campo de espinores de Dirac que toma valores en un espacio vectorial complejo descrito concretamente como , definido en el espacio-tiempo plano ( espacio de Minkowski ) . Su expresión también contiene matrices gamma y un parámetro interpretado como la masa, así como otras constantes físicas. Dirac obtuvo primero su ecuación a través de una factorización de la relación de equivalencia de Einstein de energía-momento-masa asumiendo un producto escalar de vectores de momento determinado por el tensor métrico y cuantizó la relación resultante asociando los momentos a sus respectivos operadores.
En términos de un campo , la ecuación de Dirac es entonces
y en unidades naturales , con notación de barra de Feynman ,
Las matrices gamma son un conjunto de cuatro matrices complejas (elementos de ) que satisfacen las relaciones anticonmutativas definitorias : donde es el elemento de la métrica de Minkowski, y los índices se extienden sobre 0,1,2 y 3. Estas matrices se pueden realizar explícitamente bajo una elección de representación. Dos opciones comunes son la representación de Dirac y la representación quiral. La representación de Dirac es donde son las matrices de Pauli .
Para la representación quiral son los mismos, pero
La notación de barra es una notación compacta para donde es un cuatrivector (a menudo es el operador diferencial de cuatrivector ). La suma sobre el índice está implícita.
Alternativamente, las cuatro ecuaciones diferenciales parciales de primer orden lineales acopladas para las cuatro cantidades que componen la función de onda se pueden escribir como un vector. En unidades de Planck, esto se convierte en: [13] : 6 , lo que deja más claro que es un conjunto de cuatro ecuaciones diferenciales parciales con cuatro funciones desconocidas. (Obsérvese que el término no está precedido por i porque σ y es imaginario).
El adjunto de Dirac del campo de espinor se define como Utilizando la propiedad de las matrices gamma (que se deduce directamente de las propiedades de hermicidad de la ) que uno puede derivar la ecuación de Dirac adjunta tomando el conjugado hermítico de la ecuación de Dirac y multiplicando a la derecha por : donde la derivada parcial actúa desde la derecha sobre : escrito de la manera usual en términos de una acción izquierda de la derivada, tenemos
Aplicando la ecuación de Dirac se obtiene Es decir, cada componente del campo de espinor de Dirac satisface la ecuación de Klein-Gordon .
Una corriente conservada de la teoría es
Sumando las ecuaciones de Dirac y las ecuaciones adjuntas de Dirac se obtiene, por la regla de Leibniz,
Otro enfoque para derivar esta expresión es mediante métodos variacionales, aplicando el teorema de Noether para la simetría global para derivar la corriente conservada.
Recordemos que el Lagrangiano está bajo una simetría que envía encontramos que el Lagrangiano es invariante.
Ahora, considerando que el parámetro de variación es infinitesimal, trabajamos en primer orden en e ignoramos los términos. De la discusión anterior, vemos inmediatamente que la variación explícita en el lagrangiano debido a se desvanece, es decir, bajo la variación, donde .
Como parte del teorema de Noether, encontramos la variación implícita en el lagrangiano debido a la variación de los campos. Si se satisface la ecuación de movimiento para , entonces
( * ) |
Esto se simplifica inmediatamente ya que no hay derivadas parciales de en el Lagrangiano. es la variación infinitesimal Evaluamos La ecuación ( * ) finalmente es
Dado que el operador de Dirac actúa sobre 4-tuplas de funciones integrables al cuadrado , sus soluciones deberían ser miembros del mismo espacio de Hilbert . El hecho de que las energías de las soluciones no tengan un límite inferior es inesperado.
Las soluciones de ondas planas son aquellas que surgen de un ansatz que modela una partícula con un momento 4 definido donde
Para este ansatz, la ecuación de Dirac se convierte en una ecuación para : Después de elegir una representación para las matrices gamma , resolver esto es una cuestión de resolver un sistema de ecuaciones lineales. Es una propiedad libre de representación de las matrices gamma que el espacio de solución es bidimensional (ver aquí ).
Por ejemplo, en la representación quiral de , el espacio de soluciones está parametrizado por un vector , con donde y es la raíz cuadrada de la matriz hermítica.
Estas soluciones de ondas planas proporcionan un punto de partida para la cuantificación canónica.
Tanto la ecuación de Dirac como la ecuación de Dirac adjunta se pueden obtener a partir de (variando) la acción con una densidad lagrangiana específica que viene dada por:
Si se varía esto con respecto a uno se obtiene la ecuación adjunta de Dirac. Mientras tanto, si se varía esto con respecto a uno se obtiene la ecuación de Dirac.
En unidades naturales y con la notación de barra, la acción es entonces
Para esta acción, la corriente conservada anterior surge como la corriente conservada correspondiente a la simetría global a través del teorema de Noether para la teoría de campos. Al medir esta teoría de campos cambiando la simetría a una local, dependiente del punto espacio-temporal, se obtiene la simetría de calibración (en realidad, redundancia de calibración). La teoría resultante es la electrodinámica cuántica o QED. Vea a continuación un análisis más detallado.
La ecuación de Dirac es invariante bajo las transformaciones de Lorentz, es decir, bajo la acción del grupo de Lorentz o estrictamente , el componente conectado a la identidad.
En el caso de un espinor de Dirac considerado concretamente como que toma valores en , la transformación bajo una transformación de Lorentz está dada por una matriz compleja . Existen algunas sutilezas en la definición del correspondiente , así como un abuso estándar de la notación.
La mayoría de los tratamientos se realizan en el nivel del álgebra de Lie . Para un tratamiento más detallado, consulte aquí . El grupo de Lorentz de matrices reales que actúan sobre se genera mediante un conjunto de seis matrices con componentes Cuando ambos índices se elevan o se reducen, estos son simplemente la "base estándar" de las matrices antisimétricas.
Estos satisfacen las relaciones de conmutación del álgebra de Lorentz. En el artículo sobre el álgebra de Dirac , también se encuentra que los generadores de espín satisfacen las relaciones de conmutación del álgebra de Lorentz.
Una transformación de Lorentz se puede escribir como donde los componentes son antisimétricos en .
La transformación correspondiente en el espacio de espín es Esto es un abuso de notación, pero es estándar. La razón es que no es una función bien definida de , ya que hay dos conjuntos diferentes de componentes (hasta la equivalencia) que dan el mismo pero diferente . En la práctica, elegimos implícitamente uno de estos y luego está bien definido en términos de
Bajo una transformación de Lorentz, la ecuación de Dirac se convierte en
Multiplicando ambos lados desde la izquierda por y devolviendo la variable ficticia a obtenemos Habremos demostrado la invariancia si o equivalentemente Esto se muestra más fácilmente a nivel de álgebra. Suponiendo que las transformaciones están parametrizadas por componentes infinitesimales , entonces en primer orden en , en el lado izquierdo obtenemos mientras que en el lado derecho obtenemos Es un ejercicio estándar evaluar el conmutador en el lado izquierdo. Escribir en términos de componentes completa la prueba.
Asociada a la invariancia de Lorentz hay una corriente de Noether conservada, o más bien un tensor de corrientes de Noether conservadas . De manera similar, dado que la ecuación es invariante bajo traslaciones, hay un tensor de corrientes de Noether conservadas , que puede identificarse como el tensor de tensión-energía de la teoría. La corriente de Lorentz puede escribirse en términos del tensor de tensión-energía además de un tensor que representa el momento angular interno.
La ecuación de Dirac es covariante de Lorentz . Articular esto ayuda a esclarecer no solo la ecuación de Dirac, sino también el espinor de Majorana y el espinor de Elko, que aunque están estrechamente relacionados, tienen diferencias sutiles e importantes.
La comprensión de la covarianza de Lorentz se simplifica teniendo en cuenta el carácter geométrico del proceso. [14] Sea un único punto fijo en la variedad espacio-temporal . Su ubicación se puede expresar en múltiples sistemas de coordenadas . En la literatura de física, estos se escriben como y , con el entendimiento de que ambos y describen el mismo punto , pero en diferentes marcos de referencia locales (un marco de referencia sobre un pequeño parche extendido de espacio-tiempo). Uno puede imaginarse como tener una fibra de diferentes marcos de coordenadas sobre él. En términos geométricos, uno dice que el espacio-tiempo se puede caracterizar como un haz de fibras , y específicamente, el haz de marcos . La diferencia entre dos puntos y en la misma fibra es una combinación de rotaciones y refuerzos de Lorentz . Una elección de marco de coordenadas es una sección (local) a través de ese haz.
Acoplado al fibrado de marco hay un segundo fibrado, el fibrado espinor . Una sección a través del fibrado espinor es simplemente el campo de partículas (el espinor de Dirac, en el presente caso). Diferentes puntos en la fibra espinor corresponden al mismo objeto físico (el fermión) pero expresado en diferentes marcos de Lorentz. Claramente, el fibrado de marco y el fibrado espinor deben estar unidos de manera consistente para obtener resultados consistentes; formalmente, uno dice que el fibrado espinor es el fibrado asociado ; está asociado a un fibrado principal , que en el presente caso es el fibrado de marco. Las diferencias entre los puntos de la fibra corresponden a las simetrías del sistema. El fibrado espinor tiene dos generadores distintos de sus simetrías: el momento angular total y el momento angular intrínseco . Ambos corresponden a transformaciones de Lorentz, pero de diferentes maneras.
La presentación aquí sigue la de Itzykson y Zuber. [15] Es casi idéntica a la de Bjorken y Drell. [16] Una derivación similar en un entorno relativista general se puede encontrar en Weinberg. [17] Aquí fijamos nuestro espacio-tiempo para que sea plano, es decir, nuestro espacio-tiempo es el espacio de Minkowski.
Bajo una transformación de Lorentz, el espinor de Dirac se transforma como Se puede demostrar que una expresión explícita para está dada por donde parametriza la transformación de Lorentz, y son las seis matrices 4×4 que satisfacen:
Esta matriz puede interpretarse como el momento angular intrínseco del campo de Dirac. El hecho de que merezca esta interpretación surge al contrastarla con el generador de transformaciones de Lorentz , que tiene la forma Esto puede interpretarse como el momento angular total . Actúa sobre el campo de espinores como Nótese que lo anterior no tiene un primo en él: lo anterior se obtiene transformando obteniendo el cambio a y luego volviendo al sistema de coordenadas original .
La interpretación geométrica de lo anterior es que el campo de marco es afín , sin origen preferido. El generador genera las simetrías de este espacio: proporciona un reetiquetado de un punto fijo . El generador genera un movimiento de un punto en la fibra a otro: un movimiento desde con ambos y aún correspondiente al mismo punto del espacio-tiempo. Estas observaciones quizás obtusas se pueden dilucidar con álgebra explícita.
Sea una transformación de Lorentz. La ecuación de Dirac es Si la ecuación de Dirac ha de ser covariante, entonces debería tener exactamente la misma forma en todos los marcos de Lorentz: Los dos espinores y deberían describir el mismo campo físico, y por lo tanto deberían estar relacionados por una transformación que no cambie ningún observable físico (carga, corriente, masa, etc. ) La transformación debería codificar solo el cambio de marco de coordenadas. Se puede demostrar que dicha transformación es una matriz unitaria de 4×4 . Por lo tanto, se puede presumir que la relación entre los dos marcos se puede escribir como Insertando esto en la ecuación transformada, el resultado es Las coordenadas relacionadas por la transformación de Lorentz satisfacen: La ecuación de Dirac original se recupera entonces si Se puede obtener una expresión explícita para (igual a la expresión dada anteriormente) considerando una transformación de Lorentz de rotación infinitesimal cerca de la transformación identidad: donde es el tensor métrico : y es simétrico mientras que es antisimétrico. Después de conectar y desconectar, se obtiene que es la forma (infinitesimal) para anterior y produce la relación . Para obtener el reetiquetado afín, escriba
Después de antisimetrizar correctamente, se obtiene el generador de simetrías dado anteriormente. Por lo tanto, tanto y pueden decirse que son los "generadores de transformaciones de Lorentz", pero con una distinción sutil: el primero corresponde a un reetiquetado de puntos en el fibrado de marco afín , que fuerza una traslación a lo largo de la fibra del espinor en el fibrado de espín , mientras que el segundo corresponde a traslaciones a lo largo de la fibra del fibrado de espín (tomado como un movimiento a lo largo del fibrado de marco, así como un movimiento a lo largo de la fibra del fibrado de espín). Weinberg proporciona argumentos adicionales para la interpretación física de estos como momento angular total e intrínseco. [18]
La ecuación de Dirac se puede formular de muchas otras maneras.
En este artículo se ha desarrollado la ecuación de Dirac en el espacio-tiempo plano según la relatividad especial. Es posible formular la ecuación de Dirac en el espacio-tiempo curvo .
En este artículo se desarrolló la ecuación de Dirac utilizando cuatro vectores y operadores de Schrödinger. La ecuación de Dirac en el álgebra del espacio físico utiliza un álgebra de Clifford sobre los números reales, un tipo de álgebra geométrica.
Como se mencionó anteriormente, la ecuación de Dirac sin masa se reduce inmediatamente a la ecuación homogénea de Weyl . Al usar la representación quiral de las matrices gamma , la ecuación de masa distinta de cero también se puede descomponer en un par de ecuaciones de Weyl no homogéneas acopladas que actúan sobre el primer y último par de índices del espinor original de cuatro componentes, es decir , donde y son cada uno espinores de Weyl de dos componentes . Esto se debe a que la forma de bloque sesgado de las matrices gamma quirales significa que intercambian y y aplican las matrices de Pauli de dos por dos a cada una:
.
Así que la ecuación de Dirac
se convierte en
lo que a su vez es equivalente a un par de ecuaciones de Weyl no homogéneas para espinores de helicidad izquierda y derecha sin masa , donde la fuerza de acoplamiento es proporcional a la masa:
. [ aclaración necesaria ]
Esto se ha propuesto como una explicación intuitiva del Zitterbewegung , ya que estos componentes sin masa se propagarían a la velocidad de la luz y se moverían en direcciones opuestas, ya que la helicidad es la proyección del espín sobre la dirección del movimiento. [19] Aquí el papel de la "masa" no es hacer que la velocidad sea menor que la velocidad de la luz, sino que controla la tasa promedio a la que ocurren estas inversiones; específicamente, las inversiones se pueden modelar como un proceso de Poisson . [20]
En esta sección se utilizan unidades naturales. La constante de acoplamiento se denomina por convención con : este parámetro también puede considerarse como un modelo de la carga del electrón.
La ecuación y la acción de Dirac admiten una simetría donde los campos se transforman como Esta es una simetría global, conocida como simetría vectorial (en oposición a la simetría axial : ver más abajo). Por el teorema de Noether hay una corriente conservada correspondiente: esto se ha mencionado anteriormente como
Si 'promovemos' la simetría global, parametrizada por la constante , a una simetría local, parametrizada por una función , o equivalentemente, la ecuación de Dirac ya no es invariante: hay una derivada residual de .
La solución se lleva a cabo como en la electrodinámica escalar : la derivada parcial se convierte en una derivada covariante . La derivada covariante depende del campo sobre el que actúa. El nuevo potencial de 4 vectores introducido por la electrodinámica, pero también puede considerarse un campo de calibración o una conexión .
La ley de transformación bajo transformaciones de calibre para es entonces la usual pero también se puede derivar pidiendo que las derivadas covariantes se transformen bajo una transformación de calibre como Obtenemos entonces una acción de Dirac invariante de calibre al promover la derivada parcial a una covariante: El paso final necesario para escribir un Lagrangiano invariante de calibre es agregar un término Lagrangiano de Maxwell, Poniendo estos juntos obtenemos
Al desarrollar la derivada covariante es posible escribir la acción en una segunda forma útil:
Los fermiones de Dirac sin masa , es decir, campos que satisfacen la ecuación de Dirac con , admiten una segunda simetría no equivalente.
Esto se ve más fácilmente escribiendo el fermión de Dirac de cuatro componentes como un par de campos vectoriales de dos componentes y adoptando la representación quiral para las matrices gamma, de modo que pueda escribirse donde tiene componentes y tiene componentes .
La acción de Dirac toma entonces la forma: Es decir, se desacopla en una teoría de dos espinores de Weyl o fermiones de Weyl.
La simetría vectorial anterior sigue presente, donde y giran de forma idéntica. Esta forma de la acción hace que se manifieste la segunda simetría no equivalente: Esto también se puede expresar a nivel del fermión de Dirac como donde es la función exponencial para matrices.
Esta no es la única simetría posible, pero es convencional. Cualquier "combinación lineal" de las simetrías vectorial y axial también es una simetría.
Clásicamente, la simetría axial admite una teoría de calibración bien formulada, pero a nivel cuántico existe una anomalía , es decir, una obstrucción a la calibración.
Podemos extender esta discusión desde una simetría abeliana a una simetría no abeliana general bajo un grupo de calibre , el grupo de simetrías de color para una teoría.
Para ser más concretos, fijamos , el grupo unitario especial de matrices que actúan sobre .
Antes de esta sección, podía verse como un campo de espín en el espacio de Minkowski, en otras palabras una función , y sus componentes están etiquetados por índices de espín, convencionalmente índices griegos tomados del comienzo del alfabeto .
Al promover la teoría a una teoría de calibre, se adquiere informalmente una parte que se transforma como , y estas se etiquetan con índices de color, convencionalmente índices latinos . En total, tiene componentes, dados en índices por . El 'espinor' etiqueta solo cómo se transforma el campo bajo transformaciones del espacio-tiempo.
Formalmente, se valora en un producto tensorial, es decir, es una función
El calibrado se lleva a cabo de manera similar al caso abeliano, con algunas diferencias. Bajo una transformación de calibrado, los campos de espinores se transforman como El campo de calibrado con valores matriciales o la conexión se transforma como y las derivadas covariantes definidas se transforman como
La escritura de una acción invariante de calibre se lleva a cabo exactamente como en el caso, reemplazando el Lagrangiano de Maxwell por el Lagrangiano de Yang-Mills , donde la intensidad o curvatura del campo de Yang-Mills se define aquí como y es el conmutador matricial.
La acción es entonces
Para aplicaciones físicas, el caso describe el sector de quarks del Modelo Estándar que modela interacciones fuertes . Los quarks se modelan como espinores de Dirac; el campo de calibración es el campo de gluones . El caso describe parte del sector electrodébil del Modelo Estándar. Los leptones, como los electrones y los neutrinos, son los espinores de Dirac; el campo de calibración es el bosón de calibración.
Esta expresión se puede generalizar a un grupo de Lie arbitrario con conexión y una representación , donde la parte de color de se valora en . Formalmente, el campo de Dirac es una función
Luego se transforma bajo una transformación de calibre como y la derivada covariante se define donde aquí la vemos como una representación del álgebra de Lie del álgebra de Lie asociada a .
Esta teoría se puede generalizar al espacio-tiempo curvo, pero hay sutilezas que surgen en la teoría de gauge en un espacio-tiempo general (o, más generalmente aún, en una variedad) que, en el espacio-tiempo plano, se pueden ignorar. Esto se debe, en última instancia, a la contractibilidad del espacio-tiempo plano que nos permite ver un campo de gauge y las transformaciones de gauge como definidas globalmente en .
Artículos sobre la ecuación de Dirac | Otras ecuaciones | Otros temas
|