10 jul 2020

¿Qué es cuantizar?

A principios del siglo XX la física sufrió dos revoluciones que la cambiaron para siempre. La mayor de ellas, la revolución cuántica, nos hizo ver que objetos matemáticos que dábamos por hecho que poseían existencia física, como, por ejemplo, la trayectoria de las partículas, en realidad de forma precisa no existen en la naturaleza. El principio de indeterminación nos dice que las partículas elementales no son ni ondas ni corpúsculos clásicos, sino unos objetos cuánticos que, en su movimiento, no siguen una trayectoria bien definida. En la teoría que describe el comportamiento de estos objetos, la mecánica cuántica, las variables dinámicas como la posición $x$ o la cantidad de movimiento $p$ no son números reales, sino operadores $\hat{x}$, $\hat{p}$ en un espacio vectorial cuyos elementos son los estados de la partícula cuántica. El principio de indeterminación da lugar a que estos operadores no conmutan, sino que obedecen a la relación de conmutación $ [\hat{x},\hat{p}]=i\hbar$. Todo en la naturaleza es cuántico y, por tanto, obedece a los principios de la mecánica cuántica.

Se denomina cuantización a los procedimientos que nos permiten obtener una descripción cuántica de un sistema físico a partir de su descripción clásica. Gracias a los métodos de cuantización, podemos pasar de la mecánica clásica de un sistema físico a la mecánica cuántica del mismo. Por ejemplo, si tomamos el oscilador armónico clásico, cuyo hamiltoniano$$
H=\frac{{p}^2}{2m}+\frac{1}{2}m\omega^2{x}^2
$$ es una constante de movimiento que puede tomar cualquier valor mayor o igual que cero, y promocionamos las funciones $x$ y $p$ del espacio de fases a operadores en un espacio de Hilbert con la relación de conmutación antes descrita, obtenemos el oscilador armónico cuántico. En éste, por culpa del principio de indeterminación, el estado de menor energía no es el de $E=0$, sino el de $E=\hbar \omega /2$, mientras que los demás niveles toman, por ser un sistema ligado, valores discretos, en este caso separados por $\hbar \omega$. Análogamente, si cogemos la descripción clásica del átomo de hidrógeno, la del modelo de Rutherford, en la que un electrón orbita en torno a un protón, y promocionamos la posición y la cantidad de movimiento del electrón a operadores, obtenemos el modelo mecanocántico del átomo de hidrógeno, en el que, también por culpa del principio de indeterminación, el electrón en el estado de menor energía está deslocalizado en torno al protón en una región de un tamaño del orden de magnitud de $$ a_0=\frac{4\pi \epsilon_0 \hbar^2}{me^2}$$
Al método de cuantización que acabamos de describir se le denomina cuantización canónica. Éste consiste en promocionar a operadores las funciones del espacio de fases del sistema clásico, imponiendo las relaciones de conmutación adecuadas. Sin embargo, éste no es el único método de cuantización que existe. Hay otros métodos, como son la cuantización geométrica, la integral de camino de Feynman, la basada en las funciones de distribución cuánticas, etc.

En los dos ejemplos que acabamos de mencionar, o en el caso más general de una partícula no relativista sometida a un potencial $V(x)$, al promocionar $x$ y $p$ a operadores no tenemos ningún problema de ambigüedad en la mayoría de las aplicaciones por el hecho de que en la teoría cuántica $\hat{x}$ y $\hat{p}$ no conmutan. Sin embargo, en el momento en el que estamos interesados en observables que clásicamente sean funciones tanto de $x$ como de $p$, o en sistemas con hamiltonianos que poseen términos que combinan $x$ con $p$ (como por ejemplo en el caso de una partícula cargada) entonces hay distintas formas de asignar, a cada observable $f(x,p)$ en mecánica clásica, su correspodiente observable $f(\hat{x},\hat{p})$ en mecánica cuántica. Hay distintas asignaciones posibles porque estos observables dependen de con qué criterio se ordenan los productos de $x$ con $p$. A cada una de estas formas se le denomina esquema de cuantización, y cada uno de ellos da lugar a predicciones distintas, con lo que es importante saber cuál es el adecuado en cada caso. Es importante señalar que este problema de saber qué orden es el adecuado en el hamiltoniano y en los observables mecanocuánticos aparece de forma genérica incluso aunque impongamos que estos operadores deben ser hermíticos. La condición de hermiticidad no es suficiente para fijar sin ambigüedad qué observable mecánocuántico $f(\hat{x},\hat{p})$ es el que se corresponde con el observable clásico $f(x,p)$. Son en última instancia los experimentos los que tienen que decidir cuál es el esquema de cuantización adecuado para un sistema físico.

Bien, supongamos que tenemos resuelto para un sistema físico concreto el problema del esquema (orden) de cuantización. Para muchos estudiantes, la cuantización es un procedimiento que, aunque pueda ser en la mayoría de casos mucho más largo y tedioso que en el oscilador armónico o el átomo de hidrógeno, es directo, una vez que se ha elegido el esquema de cuantización adecuado. Piensan que los distintos métodos de cuantización son recetas infalible mediante las cuales, a partir de una teoría clásica concreta, se obtiene su correspondiente teoría cuántica.

En este artículo vamos a ver por qué esta visión ingenua que tienen en general los estudiantes después de su primer curso de mecánica cuántica en la universidad es incorrecta, y que la razón es mucho más profunda que la ambigüedad de orden que acabamos de mencionar. Esto lo vamos a hacer utilizando como ejemplo los intentos de cuantización de la partícula relativista. De la misma manera que en nuestro primer curso de cuántica en la universidad teníamos una partícula clásica no relativista sometida al potencial del oscilador armónico, o al del átomo de hidrógeno, y la hemos hecho cuántica, ahora vamos a intentar hacer lo mismo con la partícula relativista. A ver qué ocure.


La cuantización canónica de una partícula


Si queremos que nuestra descripción física del comportamiento de una partícula obedezca a los principios de la mecánica cuántica, ésta tiene que ser un objeto cuántico. Es importante insistir en que, al contrario de lo que muchos piensan, la mecánica cuántica no es una teoría que asigna propiedades ondulatorias a las partículas y propiedades corpusculares a las ondas, sino que es una teoría que afirma que todos los entes de la naturaleza son cuánticos. Una partícula cuántica no es ni una onda ni un corpúsculo, sino un ente diferente, con sus propias características, entre las que destaca que obedece al principio de indeterminación.

El estado de toda partícula cuántica debe ser descrito mediante un vector $|\psi\rangle$ en cierto espacio de Hilbert. Este estado representa el conocimiento subjetivo de un observador acerca de la partícula cuántica, por eso "colapsa" cada vez que el observador recibe información de una nueva medición, sin que ese colapso represente ningún proceso físico. Los observables, representados mediante operadores hermíticos en este espacio de Hilbert, no son, propiamente dichos, magnitudes físicas de la partícula, sino del conjunto formado por la partícula cuántica más los aparatos de medida.

Hay estados en los que un observable concreto posee un valor bien determinado, pero en general el estado cuántico de la partícula será una combinación lineal (superposición) de estados en los que ese observable toma valores diferentes. Por ejemplo, si llamamos $| \vec{x}\rangle$ al estado en el que el observable "posición de la partícula" $\hat{\vec{x}}$ toma un valor bien determinado $\vec{x}$, en general el estado de la partícula será una combinación lineal $$
|\psi\rangle=\int d^3\vec{x} \psi(\vec{x}) |\vec{x}\rangle
$$ de estados en el que la posición es distinta, con lo que en este estado general la posición de la partícula no está bien determinada. Otra idea equivocada muy extendida sobre la mecánica cuántica es pensar que ésta implica que todas las magnitudes físicas toman valores discretos. Esto no es cierto. El observable posición $\hat{x}$ puede tomar cualquier valor dentro del conjunto de los números reales al ser medido.

A la función $\psi(\vec{x})$, que asigna a cada valor del observable el coeficiente de esa combinación lineal (que es un número complejo) se la denomina función de ondaEn este caso de superposición la descripción del estado cuántico de la partícula es esencialmente probabilística, donde la (densidad de) probabilidad de que se obtenga un valor concreto en la medida de ese observable viene dada por el módulo al cuadrado de la la función de onda (regla de Born).

Por otro lado, como el operador $\hat{\vec{x}}$ no conmuta con el operador momento lineal $\hat{\vec{p}}$, $$
[x^i,p_j]=i\delta^i_j
$$ es imposible que la posición y el momento lineal de una partícula tomen valores bien definidos al mismo tiempo. Por ejemplo, en el estado $|\vec{p}\rangle$, que es el estado de la partícula en la que el momento lineal está perfectamente bien determinado y vale $\vec{p}$, la posición $\vec{x}$ de la partícula está completamente indeterminada. Ojo, esto no quiere decir que la partícula tenga una posición bien definida pero que es desconocida, sino que la partícula cuántica en este estado no tiene una posición bien definida. No tiene la propiedad de estar en un sitio concreto.

El conjunto formado por los operadores $\hat{x^i}$, $\hat{p^i}$ y el operador identidad $\hat{I}$ forma un espacio vectorial de dimensión $2\cdot 3+1=7$, con una operación interna, el conmutador entre operadores, que actúa como corchete de Lie y dota a este espacio vectorial de la estructura de álgebra de Lie. Al actuar estos operadores sobre el espacio vectorial de dimensión infinita formado por las funciones $\psi(x)$ y ser todos estos operadores hermíticos, este álgebra de Lie es en realidad una representación unitaria en dimensión infinita del conocido como álgebra de Heisenberg. El conjunto de todas las transformaciones que este álgebra genera sobre las funciones de onda de la partícula es una representación de un grupo, denominado grupo de Heisenberg. En él se encuentran todas las traslaciones en el espacio de fases de la partícula, tanto traslaciones en el espacio de coordenadas (generadas por $\hat{p}^i$) como en el espacio de momentos (generadas por $\hat{x}^i$). A esta representación del grupo de Heisenberg se la denomina representación de Schrödinger. Además, hay un teorema, denominado teorema de Stone-von Neumann, que nos asegura que ésta es la única representación que se puede hacer de forma efectiva del grupo de Heisenberg, ya que todas son unitariamente equivalentes.

Dada la naturaleza probabilística de la función de onda, la evolución temporal del estado cuántico de la partícula debe ser unitaria, es decir, no debe permitir que la suma de todas las probabilidades deje de ser uno. Al operador hermítico que genera esta evolución temporal se le denomina hamiltoniano, con lo que el establecimiento de un hamiltoniano para la partícula cuántica nos determina cómo ésta evoluciona. Al generar traslaciones temporales, el operador hamiltoniano representa la energía del sistema.

Dado cualquier sistema clásico con un hamiltoniano, los manuales de mecánica cuántica con los que habitualmente se estudia esta asignatura nos dicen que hay una receta estándar para construir el correspondiente sistema cuántico. A esta receta se la denomina cuántización canónica. Ésta consiste en asignar, a cada función $f(x,p)$ en el espacio de fases, incluyendo el hamiltoniano, un operador hermítico $\hat{f}$. Pero esto hay que hacerlo de forma consistente con la estructura de álgebra de Lie que tiene el conjunto de funciones en el espacio de fases, es decir, de tal manera que a la función $\{f,g\}$ que se obtiene al hacer el corchete de Poisson de $f$ con $g$ le corresponda el operador $ \hat{\{f,g\}}=-\frac{i}{\hbar}[\hat{f},\hat{g}] $.
En otras palabras, como el conjunto de funciones en el espacio de fases es un espacio vectorial de dimensión infinita al que el corchete de Poisson dota de la estructura de álgebra de Lie, lo que tenemos que hacer es buscar una representación unitaria del álgebra de Lie de funciones en el espacio de fases. El problema es que el álgebra de Heisenberg sólo es isomorfa al subálgebra del espacio de funciones en el espacio de fases que estén formadas por combinaciones lineales de $\hat{x}^i$, $\hat{p}^i$ y $\hat{I}$ y la representación de Schrödinger es una representación unitaria sólo de este subálgebra, no del álgebra completa de funciones en el espacio de fases.

Se puede demostrar que la representación de Schrödinger se puede extender hasta un subálgebra un poco mayor, la formada por todos los polinomios cuadráticos en el espacio de fases. Esto incluye añadir los operadores $\hat{x}^i\hat{x}^j$, $\hat{p}^i\hat{p}^j$ y $\hat{p}^i\hat{x}^j$, pero en este último caso, cuando $i=j$, tenemos la ambigüedad de orden al no conmutar las posiciones y los momentos. Afortunadamente en este caso esta ambigüedad de orden se elimina al imponer que el operador sea hermítico y simetrizar $(1/2)(\hat{x}^i\hat{p}^i+\hat{p}^i\hat{x}^i)$.  Si el hamiltoniano, como es el caso del oscilador armónico, pertenece a este conjunto, sólo hay un esquema de cuantizacón posible. Este subálgebra, de dimensión $2\cdot 3+1+3\cdot 6=25$, genera un grupo que se denomina grupo de Jacobi y que tiene como subgrupo normal al grupo de Heisenberg, pero sigue sin ser el álgebra completa de funciones del espacio de fases, que es de dimensión infinita y que incluye polinomios de orden mayor que dos.

Sin embargo, en cuanto queremos cuantizar funciones polinomiales en el espacio de fases de orden mayor que dos, nos encontramos con que la condición de hermiticidad no es suficiente para fijar la ambigüedad de orden, de forma que tenemos diferentes esquemas de cuantización para un mismo sistema clásico. Hay un teorema, denominado teorema de Groenewold-van Hove, que nos dice que es imposible construir una representación unitaria de un subálgebra del espacio de funciones en el espacio de fases que incluya polinomios de orden mayor que dos. Este teorema nos garantiza que, a no ser que nos limitemos a observables mecanocuánticos que sean polinomios de $\hat{x}^i$ y $\hat{p}^i$ de orden dos o menores (como ocurre con el hamiltoniano del oscilador armónico) o con sumandos que no mezclen coordenadas con momentos (como ocurre en el del átomo de hidrógeno), nos vamos a encontrar genéricamente con distintos esquemas de cuantización para un mismo sistema clásico que dan predicciones físicas distintas. Esto es lo que ocurre genéricamente, por ejemplo, en el caso de una partícula cargada sometida a un campo electromagnético.


Los problemas de la cuantización ingenua de la partícula relativista


Consideremos una partícula relativista de masa $m$ que, para empezar con el caso más sencillo y evitar la ambigüdad de orden, no está sometida a ninguna interacción. Al ser relativista, clásicamente la energía $E$ de esta partícula libre no está relacionada con su momento lineal $\vec{p}$ mediante la expresión $E=p^2/(2m)$, sino mediante la fórmula relativista $E=+\sqrt{(|\vec{p}|c)^2+(mc^2)^2}$ que vamos a escribir $E=+\sqrt{|\vec{p}|^2+m^2}$, ya que vamos a trabajar en unidades naturales $\hbar=c=1$, en vez de en el Sistema Internacional. Por tanto, lo primero que se le ocurre a uno es postular que la evolución temporal del estado de una partícula libre relativista está generada por el hamiltoniano $ \hat{H}=+\sqrt{\hat{|\vec{p}|}^2+m^2\hat{I}} $ entendiendo la raíz cuadrada como un desarrollo en serie de potencias de $\hat{|\vec{p}|}$, y donde $\hat{I}$ es el operador identidad. En la representación de momentos el operador $\hat{H}$ que hemos tomado como hamiltoniano está bien definido, y actúa de la siguiente manera: $ \langle \vec{p} | \hat{H} | \psi \rangle= +\sqrt{|\vec{p}|^2+m^2} \langle \vec{p} |  \psi \rangle $.

Nos podemos venir arriba y pensar que este cambio en el hamiltoniano basta para describir consistentemente y con precisión el comportamiento cuántico de las partículas relativistas. Sin embargo, a partir de este momento los problemas no van más que a crecer.

El primero de ellos, de fácil solución, surge de darnos cuenta de que la relación de cierre que habitualmente se utiliza en mecánica cuántica no relativista $$
\hat{I}=\int \frac{d^3\vec{p}}{(2\pi)^3} |\vec{p}\rangle \langle \vec{p} |
$$ no es invariante al cambiar de un sistema de referencia inercial a otro, violando así los principios de la relatividad especial. En efecto, para que se satisfaga tanto el principio de relatividad como el principio de velocidad máxima de propagación de las interacciones (principio de localidad), el cuadrivector energía-momento $(E,\vec{p})$ debe cambiar, al irnos a otro sistema de referencia inercial, de acuerdo con la transformación de Lorentz correspondiente, que implica que este cuadrivector quede multiplicado por la matriz de Lorentz. Esto hace que la cantidad $$
\int \frac{d^3\vec{p}}{(2\pi)^3} f(\vec{p})
$$ (con $f(\vec{p})$ una función invariante de Lorentz) no sea invariante de Lorentz. Sin embargo, la cantidad $$
\int \frac{d^4p}{(2\pi)^4} (2\pi) \delta(-{p^0}^2+|\vec{p}|^2+m^2)|_{p^0>0} f(\vec{p}) =\int \frac{d^3\vec{p}}{(2\pi)^32E} f(\vec{p})
$$ sí es invariante de Lorentz. Si queremos que la condición de normalización de los estados $|\vec{p}\rangle$ sea la misma en todos los sistemas de referencia inerciales, entonces nos vemos obligados a utilizar una nueva la relación de cierre $$
\hat{I}=\int \frac{d^3\vec{p}}{(2\pi)^32E} |\vec{p}\rangle \langle \vec{p} |
$$ con lo que la condición de normalización es $$
\langle \vec{p}|\vec{p}^\prime  \rangle= 2E (2\pi)^3 \delta(\vec{p}-\vec{p}^\prime)
$$
Un segundo problema, éste sí grave, nos lo encontramos cuando nos damos cuenta de que el hamiltoniano que hemos escogido no está bien definido en la representación de coordenadas. Podemos estudiar la evolución de la función de onda en la representación de coordenadas pasando primero a la representación de momentos, haciendo los cálculos y luego volviendo a la representación de coordenadas. Pero el efecto que tiene todo esto sobre la función de onda en la representación coordenadas es que $\hat{H}$ es un operador no local. Es decir, la ecuación de Schrödinger a la que da lugar este hamiltoniano $$
i\frac{\partial \psi }{\partial t}=+\sqrt{-\nabla^2+m^2} \psi
$$ hace que la función de onda de la partícula en la representación de coordenadas se propage más rápido que la luz, violando el principio de localidad de la relatividad especial [Peskin1995]. En efecto, la amplitud de probabilidad de que una partícula situada en el instante $y^0$ en $\vec{y}$ acabe en el instante $x^0$ en el punto $\vec{x}$ es: $$
\langle   \vec{x} |\exp[-i(x^0-y^0)\hat{H}]|\vec{y} \rangle=
$$ $$
=\int \frac{d^3\vec{p}}{(2\pi)^32E} \exp[+i(x-y)p]=D(\vec{x}-\vec{y})
$$ Y esta amplitud de probabilidad no se anula fuera del cono de luz, es decir, no es nula en el caso de que el intervalo entre los sucesos $x$ y $y$ sea tipo espacio. Por ejemplo, si nos vamos a un sistema de referencia en el que ambos sucesos ocurren prácticamente al mismo tiempo, se tiene $$
D(\vec{x}-\vec{y}) \sim \exp (-m |\vec{x}-\vec{y}|)
$$ Es decir, si emitimos una partícula desde el punto espacial $\vec{y}$, hay una probabilidad no nula de que ésta pueda ser detectada en otro punto $\vec{x}$ al mismo tiempo que fue emitida.

Es verdad que, por la exponencial decreciente que aparece, este efecto sólo es apreciable dentro de la denominada longitud de onda de Compton de la partícula$$
\lambda_c=1/m,
$$ pero no deja de ser un efecto que contradice el principio de localidad de la relatividad especial.

Tenemos, además, otro problema. En el caso de que $x$ esté fuera del cono de luz de $y$, existen sistemas de referencia en los que $x$ ocurre antes que $y$. De hecho, en uno de ellos, el papel de $x$ y de $y$ queda intercambiado. Podemos irnos a ese sistema de referencia realizando un transformación de Lorentz continua que lleva de $(x-y)\to-(x-y)$. Como la función $D(\vec{x}-\vec{y})$, que se denomina función de Wightman, es invariante de Lorentz, de aquí se desprende que $D(x-y)=D(y-x)$ para pares de sucesos cuyo intervalo es de tipo espacio. Sin embargo, esta amplitud de probabilidad la hemos calculado para el proceso en el que la partícula se emite en $y$ y se detecta en $x$, luego debería ser cero para el orden temporal opuesto. En otras palabras, el orden establecido para pares de sucesos cuyo intervalo es de tipo espacio no es invariante Lorentz, con lo que, aunque $D(x-y)$ es invariante Lorentz, el hecho de que esta amplitud no se anule fuera del cono de luz nos dice que la invariancia de Lorentz en esta teoría está rota.

Por otro lado, en el caso de que el suceso $x$ esté dentro del cono de luz futuro del suceso $y$, ambos sucesos está conectados causalmente. Lo que ocurre en $x$ puede ser consecuencia de lo que ocurrió en $y$, y por eso no existe ningún sistema de referencia en el que $x$ ocurra antes que $y$. No hay ninguna transformación de Lorentz continua que lleve de $(x-y)\to-(x-y)$, con lo que este tipo de pares de sucesos no presenta ningún problema.

Tratando de cuantizar la partícula libre relativista, hemos llegado a una amplitud de probabilidad que viola los principios de la relatividad especial. Esto nos indica que algo estamos haciendo mal. Pero, ¿en qué nos hemos equivocado?


La cuantización covariante de la partícula libre relativista es no trivial

  
En la cuantización ingenua que hemos hecho en el apartado anterior hemos tratado a la energía de forma distinta que al momento lineal. No obstante, energía y momento lineal en relatividad no son más que distintas componentes de un mismo cuadrivector. Así que lo siguiente que se nos ocurre es tratar de realizar la cuantización con cuidado, respetando siempre la invariancia bajo transformaciones de Lorentz que tiene que tener la teoría. El problema que tiene la formulación hamiltoniana de la teoría de la que hemos partido es que no es nada fácil formular las condiciones que este tipo de teorías basadas en un hamiltoniano tienen que cumplir para respetar los principios de la relatividad especial.

Necesitamos, por tanto, un procedimiento de cuantización en el que la invariancia Lorentz siempre sea explícita. A este procedimiento de cuantización se le denomina cuantización covariante. De hecho, incluso aunque no nos hubiéramos encontrado con el problema de la expansión superlumínica de la función de onda, aun así habríamos tenido que recurrir a la cuantización covariante a la hora de introducir interacciones, ya que ésta es la manera más adecuada de asegurarnos de que estas interacciones también respetan la invariancia de Lorentz.

A partir de ahora vamos a tratar a la coordenada temporal $x^0$ de la misma manera que al resto de coordenadas espaciales $\vec{x}$. Para ello, vamos a recurrir a un parámetro arbitrario $\tau$ para marcar las distintas posiciones dentro de la línea de mundo de la partícula relativista. Dicho de otra manera, la línea de mundo (también llamada línea de universo) de la partícula relativista en un diagrama espacio-tiempo entre los sucesos $y$ y $x$ es una variedad de dimensión uno de topología trivial, que parametrizamos mediante al coordenada $\tau$. El cuadrivector posición de la partícula será, por tanto, una función de $\tau$, que denotamos como $x(\tau)$, y nos permite identificar el espaciotiempo como el espacio de target de una teoría que "vive" en la línea de mundo.

Lineamundo.PNG
Utilizando las 4 coordenadas del cuadrivector posición $x^mu$ como variables dinámicas, y $\tau$ como el tiempo dinámico, la acción de la partícula libre relativista tiene que ser un funcional invariante de Lorentz dependiente de las funciones $x^{\mu}(\tau)$ y que tome el valor mínimo cuando estas funciones describen una línea recta en el espacio de Minkowski, ya que sabemos que la trayectoria clásica de toda partícula libre tiene que ser una línea recta, por la ley de inercia. Dado que en el experimento mental de la "paradoja de los gemelos" el gemelo que envejece más es el inercial, el tiempo propio a lo largo de la línea de mundo cambiado de signo obedece todas las características que tiene que tener la acción. Se tiene, por tanto, que la acción es proporcional a menos el tiempo propio $$ S=-m\int ds=-m\int d\tau \sqrt{-\dot{x}\dot{x}} $$ (donde $\dot{x}\dot{x}=-\dot{x}^0\dot{x}^0+|\dot{\vec{x}}|^2$). Nótese que, en la unidades naturales ($c=\hbar=1$) en la que estamos trabajando, el tiempo propio $s$ es igual al intervalo relativista, y éste tiene dimensiones de longitud. La acción, en cambio, tiene dimensiones de longitud por masa y, de hecho, desarrollando esta acción para velocidades pequeñas se puede ver que se retoma la expresión de la acción de la partícula libre no relativista, donde la constante de proporcionalidad elegida $m$ juega al papel de la masa de la partícula.


Nótese también que la forma en que hemos escrito la acción de la partícula libre relativista hace que la invariancia de Lorentz sea manifiesta, al expresar el interior de la raíz cuadrada como un producto escalar. Esta es la gran ventaja que tiene el comenzar describiendo la teoría mediante la acción: podemos fácilmente hacer que la teoría sea compatible con los principios de la relatividad especial.

Al tratarse de una partícula libre, esta acción da lugar a un lagrangiano $$
L=-m\sqrt{-\dot{x}\dot{x}}
$$ que sólo depende de las velocidades $\dot{x}^\mu$ y no de las coordenadas $x^\mu$. Las traslaciones espaciotemporales, que son transformaciones globales con respecto a la línea de mundo, son por tanto simetrías de la teoría que, sumadas a las transformaciones de Lorentz, dan lugar al grupo de Poincaré.

Sin embargo, el precio que hemos tenido que pagar por trabajar con una acción explícitamente invariante de Lorentz es que tenemos también una simetría local desde el punto de vista de la línea de mundo, relacionada con la libertad que tenemos de reparametrizar la línea de mundo. En efecto, si sumamos a $\tau$ una función arbitraria $\delta\varepsilon(\tau)$, las coordenadas cambian $\delta  x=\delta\varepsilon(\tau)\dot{x}(\tau)$, de forma que la acción cambia sólo en una derivada total $$
\delta S=\int d\tau \frac{d}{d\tau} (\delta\varepsilon L)
$$ Se trata, por tanto, de una invariacia gauge que tiene la teoría que "vive" en la línea de mundo.

Dejando de momento a un lado esta invariancia gauge, ingenuamente uno podría pensar que lo único que tenemos que hacer para cuantizar la teoría es meter la acción en la integral de camino de Feynman para calcular la amplitud de probabilidad de que la partícula llegue a determinado sitio. Por ejemplo, en el cálculo de la amplitud de probabilidad de que una partícula situada en $\vec{y}$ en el instante $y^0$ acabe en el punto $\vec{x}$ en un instante posterior $x^0$, hay que sumar las amplitudes de probabilidad asociadas a cada camino posible, siendo cada una de éstas un número complejo de módulo 1 y cuya fase viene dada por la acción $S$:
$$
\langle \vec{x}| \hat{U}(x^0-y^0) | \vec{y}\rangle = \int Dx(\tau) e^{iS}
$$ donde $\hat{U}$ es el operador unitario de evolución del estado de la partícula.

En muchos de los sistemas con los que trabajamos habitualmente los físicos el lagrangiano es cuadrático en las velocidades. Esto hace que la integral de camino de Feynman esté bien definida, como un conjunto de integrales gaussianas, de tal manera que esta técnica, desarrollada por Feynman, nos permite pasar directamente de la formulación lagrangiana de la teoría clásica a la deseada teoría cuántica.

Sin embargo, la acción con la que estamos trabajado, que, por analogía con lo que vamos a hacer posteriormente en otro artículo con la cuerda, vamos a llamar de Nambu-Goto, contiene una raíz cuadrada que hace que no tengamos ningún método totalmente universal de definir y calcular las integrales de camino con ese tipo de exponentes. Con las intergrales de camino que tienen una parte gaussiana no tenemos problemas, pero este no es el caso. Además, para las trayectorias tipo espacio el lagrangiano se vuelve imaginario, dando lugar a amplitudes de probabilidad que dejan de ser números complejos de módulo uno, y no sabemos cómo tratar esos casos [Henneaux1982].

Uno podría pensar que, dado que clásicamente las trayectorias tipo espacio están prohibidas por violar el principio de localidad, una opción que tenemos es eliminar las trayectorias de tipo espacio de la suma de caminos. Sin embargo, no podemos hacer esto sin violar los principios de la mecáncia cuántica. En particular, las trayectorias superlumínicas, al igual que las trayectorias no diferenciables, juegan un papel fundamental para que la integral de camino dé lugar al conmutador $[x^i,p_j]=i\delta^i_j$.

Además, tenemos el problema de la invariancia gauge, que nos plantea el reto de averiguar cómo evitar sumar más de una vez historias que son equivalentes debido a esta invariancia gauge, ya que hay infinitas funciones $x(\tau)$ que dan lugar a la misma trayectoria en el espaciotiempo.

En cambio, todas estas dificultades se pueden salvar si nos vamos a la formulación hamiltoniana de la integral de camino. Ésta consiste en, primero, poner la teoría clásica en forma hamiltoniana y, segundo, aplicar una serie de reglas estándar para obtener lo que sería una aproximación de la teoría cuántica que estamos buscando. Y eso es lo que vamos a hacer a continuación.


Hamiltonización de la partícula libre relativista


Necesitamos obtener, a partir del lagrangiano de la teoría, su hamiltoniano correspondiente. Para ello introducimos los momentos lineales canónicos:$$
p_\mu=\frac{\partial L}{\partial \dot{x}^\mu}=\frac{m\dot{x}^\mu}{\sqrt{-\dot{x}\dot{x}}}
$$ que son las cargas conservadas de Noether asociadas a las simetrías (globales en la línea de mundo) de traslación en el espaciotiempo. Esto ya nos está diciendo que en la teoría cuántica los estados de la partícula libre deben transformar en representaciones unitarias del grupo de Poincaré. Como éste es no compacto, todas estas representaciones unitarias son de dimensión infinita, lo que tiene como consecuencia el hecho familiar de que los estados cuánticos de la partícula van a venir marcados por los parámetros continuos $p_\mu$, que son las componentes del cuadrivector energía-momento, y que son, al ser la partícula libre, constantes de movimiento.

Ahora, para obtener el hamiltoniano, tendríamos que despejar las velocidades $\dot{x}^\mu$ como función de los momentos $p_\mu$. Pero en el sistema concreto con el que estamos trabajando, ¡no podemos hacer esto! Esto se debe a que la matriz$$
M_{\mu\nu}=\frac{\partial^2 L}{\partial \dot{x}^\mu \partial \dot{x}^\nu}
$$no es invertible, al tener determinante cero. Se dice entonces que el lagrangiano con el que estamos trabajando es singular.

Los sistemas singulares no se pueden hamiltonizar de la forma estándar. Vamos a explorar qué caminos podemos seguir. Una posibilidad es tratar a las coordenadas $x$ y a las velocidades $u$ como si fueran coordenadas independientes, y minimizar la acción$$
S[x,u]=-m\int d\tau \sqrt{-uu}
$$ con la restricción de que $u=\dot{x}$. Usando el método de los multiplicadores de Lagrange, esto es equivalente a minimizar la acción$$
S^\prime[x,u,p]=\int d\tau \left( p^\mu (\dot{x}^\mu-u^\mu)-m\sqrt{-uu}\right)=\int d\tau ( p^\mu \dot{x}^\mu-H^*(x,u,p))
$$ donde hemos definido la cantidad $H^*(x,u,p)=p^\mu u_\mu -L(x,u)$. De las ecuaciones de movimiento que se obtienen de este problema variacional con ligaduras$$
\dot{p}_\mu=0
$$ $$
p^\mu=\frac{mu^\mu}{\sqrt{-uu}}
$$ $$
u^\mu=\dot{x}^\mu
$$se observa que los multiplicadores de Lagrange $p^\mu$ coinciden con los momentos del sistema que hemos definido anteriormente, y por eso los hemos llamado con la misma letra.

Sin embargo, a la cantidad $H^*$ no podemos llamarla "hamiltoniano" porque, para expresarla sólo como función de $x$ y $p$, necesitamos despejar las velocidades $u$, cosa que no podemos hacer en este sistema singular. Una solución para encontrar un hamiltoniano es considerar que la cantidad$$
\lambda=2\sqrt{-uu}
$$ es una velocidad inexpresable, pero que las demás velocidades sí son expresables, ya que podemos despejar las velocidades en función de los momentos y $\lambda$ de la forma$$
u^\mu=\frac{\lambda p^\mu}{2m}
$$ Sustituyendo esta expresión en $H^*$, obtenemos la función$$
H_T(x,p,\lambda)=\frac{\lambda}{2m}(p_\mu p^\mu+m^2)
$$Vamos a llamar a esta función hamiltoniano total, siguiendo la nomenclatura de Dirac. No obstante, para que sea un verdadero hamiltoniano, es necesario que no dependa de la velocidad inexpresable$$
\frac{\partial H}{\partial \lambda}=0
$$es decir, es necesario que la cantidad$$
\Phi=\frac{1}{2m}(p_\mu p^\mu+m^2)
$$se anule.

Es importante detenerse a entender físicamente lo que está ocurriendo. En nuestro sistema, los momentos lineales no son funciones independientes de la velocidad. Existe una relación que conecta a los distintos momentos lineales, y esa relación es $\Phi=0$. El sistema con el que estamos trabajando es un sistema con ligaduras. Tenemos al menos la ligadura $\Phi=0$, que se denomina condición mass-shell.

Los sistemas hamiltonianos con ligaduras típicamente surgen cuando uno intenta encontrar una formulación hamiltoniana de lagrangianos singulares, como es el caso. Toda ligadura en un sistema hamiltoniano es la ecuación de una hipersuperficie en el espacio de fases. Clásicamente, no puede haber estados del sistema que no satisfagan esta ecuación. La dinámica del sistema está confinada a esta hipersuperficie. A este tipo de ligaduras, que surgen directamente del lagrangiano, es a lo que Dirac llamaba ligaduras primarias [Dirac1961], siguiendo la nomenclatura de Bergmann [Anderson1951].

Si tenemos en cuenta la ecuación que define a los momentos, podemos ver que la variación de la cantidad$$
H=p_\mu x^\mu -L
$$ conlleva sólo la variación de las coordenadas y de los momentos, pero no la variación de las velocidades. Este es el motivo por el que a esta cantidad se la define en los libros de mecánica clásica como el hamiltoniano del sistema, que es una función sólo de las coordenadas y de los momentos.

Sin embargo, en los sistemas con ligaduras, el hamiltoniano, definido de esta manera, no está unívocamente determinado, ya que siempre es posible añadir cualquier función lineal de las ligaduras, donde los coeficientes de la combinación lineal son funciones arbitrarias de las coordenadas y los momentos. En nuestro caso, el hamiltoniano más general que podemos construir es$$
H_T=H+\lambda \Phi
$$En efecto, así se consigue construir una magnitud física que toma los mismos valores que $H$ y que, además, es, como función, también dependiente sólo de las coordenadas y los momentos, pero no de las velocidades. En nuestro caso concreto, tenemos que $H=0$, con lo que $H_T=\lambda\Phi$.

Podemos entonces aplicar el método general del cálculo de variaciones con ligaduras:
$$ \delta S = \delta (p_\mu \dot{x}^\mu-H-\lambda \Phi)=\delta x^{\mu} (-\frac{\partial \lambda}{\partial x^\mu}\Phi -\dot{p_\mu})+\delta p_\mu (\dot{x}^\mu-\frac{\partial \lambda}{\partial p^\mu }\Phi -\lambda \frac{\partial \Phi}{\partial p^\mu})-\Phi \delta\lambda=0 $$ de donde se obtienen las ecuaciones de movimiento: $$
\dot{p}_\mu=0
$$ $$
p_\mu=\frac{m\dot{x}_\mu}{\lambda}
$$ $$
\Phi=0
$$ De la primera de estas ecuaciones se obtiene que $\dot{\Phi}=0$, con lo que no es necesario imponer por consistencia ninguna ligadura secundaria. De la combinación de la segunda y la tercera se obtiene $ \lambda=\sqrt{-\dot{x}\dot{x}} $, recuperando así las ecuaciones de movimiento clásicas para la partícula relativista.

Con la ayuda de los corchetes de Poisson podemos escribir estas ecuaciones de la forma:$$
\dot{g}=\{g,H\}+\lambda\{g,\Phi\}
$$(siendo $g$ cualquier variable dinámica), que podemos escribir simbólicamente como$$
\dot{g}=\{g,H_T\}=\{g,H\}+\lambda\{g,\Phi\}+\{g,\lambda\}\Phi
$$El corchete de Poisson $\{g,\lambda\}$ no está definido, al no poderse expresar $\lambda$ en función de las coordenadas y los momentos, pero esta fórmula tiene sentido, ya que este corchete está multiplicado por una cantidad que es cero una vez impongamos la ligadura. En esta notación es también importante darse cuenta de que uno no debe imponer la ligadura $\Phi=0$ hasta después de calcular los corchetes de Poisson. Este es el motivo por el que Dirac se refería a las ecuaciones que igualan a las ligaduras a cero como ecuaciones débiles, usando la notación $\Phi\approx 0$ para recordarlo.

De acuerdo con la metodología desarrollada por Dirac para hamiltonizar sistemas singulares, las ligaduras, independientemente de si son primarias o secundarias, se pueden clasificar en dos tipos: las de primera y las de segunda clase. Las ligaduras de primera clase son aquellas cuyos corchetes de Poisson con todas las ligaduras es nulo. En este caso tenemos una única ligadura $\Phi$, que es por tanto de primera clase. El hamiltoniano total es igual al coeficiente $\lambda$ por esta ligadura de primera clase. Nótese, además, que esta formulación hamiltoniana nos permite trabajar con partículas de masa nula, cosa que no podíamos hacer con la formulación lagrangiana con la que comenzamos, al anularse el lagrangiano cuando $m=0$.

Aunque hemos satisfecho ya todos los requerimientos de consistencia de la teoría, el coeficiente $\lambda$ sigue siendo arbitrario. De hecho, $\lambda$ podría ser cualquier función arbitraria de $\tau$ y se seguirían satisfaciendo todos los requerimientos. Llegamos así a la conclusión de que, dadas unas condiciones iniciales (dadas en el instante $\tau =0$ las coordenadas $x^\mu_0$ y los momentos $p^\mu_0$) la solución de las ecuaciones de movimiento depende de una función arbitraria del tiempo:$$
p^\mu=p^\mu_0
$$ $$
x^\mu=x^\mu_0+\int\frac{\lambda p^\mu_0}{2m}d\tau
$$
Esta función arbitraria $\lambda(\tau)$ nos recuerda que estamos trabajando con una teoría con un elemento arbitrario: la parametrización de la línea de mundo. La coordenada $\tau$ elegida para esta variedad de dimensión 1 es arbitraria, y esto hace que las variables dinámicas $x^\mu$ y $p_\mu$ futuras de la partícula no estén completamente determinadas por sus valores iniciales.

En la formulación hamiltoniana de la teoría el estado físico de la partícula debe estar determinado por las coordenadas y los momentos, pero no por el coeficiente $\Lambda$, y el estado inicial debe determinar por completo el estado final. Pero acabamos de ver que los valores de las coordenadas y de los momentos en el futuro no están unívocamente determinados por sus valores iniciales, debido a las funciones arbitrarias $\lambda(\tau)$. Esto quiere decir que el estado de la partícula no determina unos valores concretos de todas las coordenadas y los momentos, aunque el conjunto de todas las coordenadas y los momentos sí determina el estado físico de la partícula. Es decir, hay varios puntos del espacio de fases (dentro de la hipersuperficie $\Phi=0$) que corresponden al mismo estado físico de la partícula.

Una forma de determinar una región de la hipersuperficie $\Phi=0$ que corresponde al mismo estado físico es hallar todos los valores de las coordenadas y los momentos en determinado instante $d\tau$ que vienen de la evolución del mismo estado inicial en $\tau=0$, pero que vienen de usar funciones $\lambda (\tau)$ diferentes. La diferencia entre estos valores es:$$
\delta p^\mu = 0
$$ $$
\delta x^\mu = \delta \tau (\lambda-\lambda^\prime) \{x^\mu, \Phi\}=\delta \tau (\lambda-\lambda^\prime) p^\mu /m
$$ Vemos, por tanto, que podemos variar todas las variables $x^{\mu}$ en la descripción hamiltoniana de la teoría de acuerdo con esta regla de forma que éstas siguen representando al mismo estado físico de la partícula. Este cambio en las variables hamiltonianas no es más que la transformación gauge mencionada en el apartado anterior que surge como consecuencia de la invariancia (local en la línea de mundo) bajo reparametrizaciones de la línea de mundo.  Lo que hemos obtenido es que la función generatriz de estas transformaciones gauge es la ligadura de primera clase $\Phi$. Podemos escribir esa transformación gauge de la forma$$
\delta p^\mu = 0
$$ $$
\delta x^\mu = \zeta p^\mu
$$ donde $\zeta (\tau)$ es un parámetro gauge arbitrario.

La clave de las ligaduras de primera clase, como $\Phi$, es que, además de darnos la hipersuperficie del espacio de fases donde está confinada la dinámica del sistema, también generan las transformaciones gauge que unen los puntos de esa hipersuperficie que representan el mismo estado físico. Todos los puntos equivalentes gauge constituyen una órbita. Cada órbita es una clase de equivalencia de puntos de la hipersuperficie que describen la misma física. Nótese que en esa hipersuperficie, como $\{H_T, \Phi\}\approx 0$, el hamiltoniano total es invariante gauge, enunciado que es equivalente a la condición de que $\Phi$ sea constante en $\tau$.


Cuantización a la Dirac de la partícula relativista


Los métodos para cuantizar este tipo de sistemas gauge se pueden agrupar en tres tipos: el método del espacio de fases reducido, el método de Dirac y el método BRST. Nosotros vamos a describir aquí en qué consiste el método de Dirac. Dirac propuso trabajar, para cuantizar el sistema, con todo el espacio de fases, sin limitarnos a la hipersuperficie $\Phi \approx 0$. Entonces promocionamos las coordenadas $x^\mu$ y los momentos $p^\mu$ a operadores que satisfacen las relaciones de conmutación que se corresponden con los corchetes de Poisson que había clásicamente entre ellos $$
[x^\mu, p_\nu]=i\delta^\mu_\nu
$$

El estado cuántico $|\psi\rangle$ de la partícula debe evolucionar según la ecuación de Schrödinger $$
i\frac{d |\psi\rangle}{d\tau}=\hat{H} |\psi\rangle
$$ Pero en nuestro caso, como $\hat{H}=0$, esto implica que los estados cuánticos de la partícula libre relativista no dependen del parámetro $\tau$. Era de esperar, ya que se trata de una coordenada arbitraria de la línea de mundo sin ningún significado físico.

Sim embargo, no todos los estados del espacio de Hilbert que surge de hacer la cuantización de Dirac se corresponden con estados físicos de la partícula. La ligadora clásica $\Phi$ se convierte en un operador $\hat{\Phi}$ que genera transformaciones gauge a nivel cuántico y que debe usarse para seleccionar los vectores del espacio de Hilbert que describen estados físicos de la partícula. Esto se hace mediante la imposición de que los estados físicos deben satisfacer la condición $$
\hat{\Phi} |\psi\rangle=0
$$ En la representación de coordenadas, $p_\mu=-i\frac{\partial}{\partial x^\mu}$, con lo que esta condición se convierte en la ecuación de Klein-Gordon (KG) $$
\left( -\frac{\partial^2}{\partial x^\mu \partial x_\mu}+m^2\right) \psi (x)=0
$$


¿Es la ecuación de Klein-Gordon la generalización relativista de la ecuación de Schrödinger?


Realizando con cuidado la cuantización de la partícula libre relativista acabamos de obtener que su función de onda debe obedecer a la ecuación de Klein-Gordon, que es una ecuación covariante relativista, como buscábamos. De hecho, ésta fue una de las primeras ecuaciones con las que trabajó Schrödinger como ecuación de evolución de la función de onda, incluso antes de llegar a su famosa ecuación. ¿Por qué se vio Schrödinger obligado a descartar la ecuación de Klein-Gordon y optó por una ecuación no relativista? Vamos a verlo.

Las soluciones a la ecuación de KG con energía bien definida son, como esperábamos, las ondas planas:$$
\psi_p(x)=N\exp (ip_\mu x^\mu)
$$ Hay una onda plana para cada cuadrivector $p$. Sin embargo, no sólo son solución de la ecuación de KG las ondas planas cuyo cuadrivector energía momento satisface la condición$$
E=+\sqrt{|\vec{p}|^2+m^2}
$$ sino también las que satisfacen la relación$$
E=-\sqrt{|\vec{p}|^2+m^2}
$$ que corresponden con partículas de ¡enegía negativa! En efecto, tanto las partículas con energía $E$ positiva como las partículas con energía $E$ negativa satisfacen la ligadura $\Phi=0$, con lo que, en la cuantización que hemos llevado a cabo los estados de energía negativa también son estados físicos. ¿Cuál es el significado de estos estados de energía negativa?

Si queremos que la ecuación de KG juegue en mecánica cuántica relativista el mismo papel que juega la ecuación de Schrödinger en mecánica cuántica no relativista, entonces debe ser también posible con ella derivar una ley de conservación para la corriente de probabilidad. Si multiplicamos la ecuación de KG por el conjugado de la función de onda $\psi^*$ y a la expresión resultante le restamos su conjugado, se llega a la ecuación de continuidad$$
\frac{\partial j^\mu}{\partial x^\mu}=0
$$ donde $j^\mu$ es el cuadrivector corriente de probabilidad $j^\mu=(\rho, \vec{j})$ definido mediante$$
j_\mu=i\left(  \psi^* \frac{\partial \psi}{\partial x^\mu}- \psi \frac{\partial \psi^*}{\partial x^\mu} \right)
$$Su parte espacial$$
\vec{j}=i\left(  \psi^* \vec{\nabla} \psi - \psi  \vec{\nabla} \psi^* \right)
$$coincide con la corriente de probabilidad en mecánica cuántica no relativista. Sin embargo, su parte temporal$$
\rho=-i\left(  \psi^* \frac{\partial \psi}{\partial t}- \psi \frac{\partial \psi^*}{\partial t} \right)
$$ es muy distinta a la densidad de probabilidad $\rho=|\psi|^2$ de la mecánica cuántica no relativista. En particular, la $\rho$ que acabamos de derivar en mecánica cuántica relativista ni siquiera es definido-positiva. Por ejemplo, para las soluciones de tipo onda plana se tiene$$
\rho=2|N|^2E
$$ de tal forma que a las soluciones con energía negativa le corresponde ¡una densidad de probabilidad negativa! Esto no tiene ningún sentido, y este es el motivo por el que históricamente tanto Schrödinger como, posteriormente, Dirac, abandonaron la ecuación de KG. En el caso de Dirac, escogió el camino de buscar una ecuación para la función de onda de una partícula de espín 1/2 que sea lineal en la derivada temporal, evitando así llegar a una densidad de probabilidad negativa, aunque siguió teniendo el problema de las soluciones con energías negativas. ¿Cual es el significado físico de las soluciones con energía negativa? En todo caso, para partículas de espín 0 no podemos utilizar la ecuación de Dirac, así que seguimos teniendo ambos problemas, el de las energías negativas y el de las densidades de probabilidad negativas.

Lo que hemos visto en este apartado es que la ecuación de KG no puede ser la ecuación que sustituye a la ecuación de Schrödinger para mecánica cuántica relativista porque es cuadrática en la derivada temporal. Esto va en contra de los postulados de la mecánica cuántica. Según estos postulados, la función de onda no es más que la amplitud de probabilidad de encontrar a la partícula en determinado punto, con lo que, por estos mismos postulados, la densidad de probabilidad tiene que ser necesariamente el módulo al cuadrado de la función de onda. Schrödinger, y también Dirac al principio, estaban todavía confundidos acerca del significado de los conceptos básicos de mecánica cuántica, y pensaban que la función de onda era una onda física, una onda con existencia física real. Este es el motivo por el que intentaron inicialmente que la ecuación de KG sea la ecuación de evolución temporal de la función de onda. Pero la función de onda no es una onda de verdad. No es un campo físico que se propaga. En el caso de los campos con existencia física, dos configuraciones infinitesimalmente cercanas del campo son físicamente distinguibles, corresponden a estados físicos dinstintos. Sin embargo, el efecto Zenón cuántico nos enseña que dos configuraciones infinitesimalmente cercanas de la función de onda son físicamente indistinguibles, ya que dan lugar a las mismos predicciones para los resultados de las mediciones. La función de onda no existe en la naturaleza, sino en la mente de los físicos que analizan la naturaleza y hacen predicciones sobre su comportamiento futuro.

Los mismos principios de la mecánica cuántica nos dicen que la evolución temporal de las amplitudes de probabilidad, de la función de onda, debe ser unitaria, ya que debe conservarse la probabiloidad total, que siempre debe ser uno. El operador unitario que implementa esta evolución se puede escribir como la exponencial de un operador hermítico, el hamiltoniano, que es el que genera esta evolución$$
\hat{U(t)}=\exp{(i\hat{H}t)}
$$ Esto nos conduce necesariamente a la ecuación de Schrödinger, no a la de KG. La ecuación de Schrödinger se debe seguir cumpliendo en la teoría cuántica que describe el comportamiento de las partículas relativistas, sólo que con un operador evolución (con un hamiltoniano) distino. ¿Cómo podemos obtener ese operador evolución?


La acción de "Polyakov" de la partícula puntual relativista


La mejor forma de obtener el operador evolución de un sistema cuántico, sin peligro de caer en el error conceptual de considerar a la función de onda como una onda física, es mediante la formulación de la integral de camino de Feynman. No obstante, ya hemos dicho que no sabemos cuantizar una teoría a partir de su acción clásica mediante el método de la integral de camino de Feynman si esta acción no es cuadrática en las velocidades, para que la integral de camino se reduzca a un producto de integrales gaussianas.

Sin embargo, sí es posible encontrar una acción cuadrática en las velocidades para la partícula libre relativista a partir de la formulación hamiltoniana que hemos obtenido antes. Si partimos de la acción$$
S[x,p, \lambda]=\int d\tau ( p^\mu \dot{x}^\mu-H_T(x,p,\lambda))
$$ y sustituimos los momentos por$$
p_\mu=\frac{m\dot{x}_\mu}{\lambda}
$$ y definimos $e=\lambda/m$ obtenemos la acción$$
S[x,\lambda]=\int d\tau e \left( \frac{\dot{x}_\mu\dot{x}^\mu }{e^2}-\frac{m^2}{2} \right)
$$ que es cuadrática en las velocidades. Por analogía con la acción correspondiente para la cuerda relativista vamos a llamar a esta acción la acción de Polyakov para la partícula puntual relativista. Es importante remarcar que la integral de camino basada en la acción de Nambu-Goto con la que comenzamos es sólo una inspiración eurística que no está bien definida matemáticamente, mientras que la integral de camino basada en la acción de Polyakov es la que constituye la teoría cuántica bien definida que se obtiene a partir de esa inspiración eurística.

La acción de Polyakov es equivalente a la acción de Nambu-Goto. Sin embargo, entre sus virtudes está, además de dar lugar a una integral de camino de Feynman bien definida, el que posee una interpretación en términos de una teoría de campos que vive en la línea de mundo. En efecto, la acción de Polyakov, además de describir a una partícula puntual que se mueve en el espaciotiempo de Minkowski de D dimensiones (1 dimensión temporal y (D-1) espaciales), también es la acción de D campos escalares que se propagan por un un espaciotiempo de 1 dimensión (1 temporal y 0 espaciales). Estos campos escalares están acoplados a la interacción gravitatoria en esa variedad 1-dimensional y $e$ juega el papel de la raíz cuadrada de la métrica (que es una matriz 1x1) en la línea de mundo. Por eso a $e$ se le denomina einbein. El término correspondiente a la curvatura en la línea de mundo es cero, ya que la curvatura escalar es nula en toda variedad de dimensión 1. Sin embargo, sí que tenemos el término $-\frac{m^2}{2}$, que juega el papel de constante cosmológica en la línea de mundo.

La invariancia gauge con la que hemos trabajado antes es una simetría local en la línea de mundo que nos dice que la teoría es invariante bajo reparametrizaciones o, equivalentemente, bajo difeomorfismos de la línea de mundo. Esta es fundamentalmente la esencia de la teoría de Einstein acerca de la gravitación, y por eso decimos que la teoría de campos que vive en la línea de mundo es una teoría de gravedad cuántica, aunque en este caso unidimiensional la curvatura sea nula. En efecto, esta simetría gauge toma ahora la forma geométrica:$$
\delta x^\mu = \xi \dot{x}^\mu
$$ $$
\delta e =\frac{d \xi e}{d\tau}
$$ donde $\zeta=e\xi$

Para poder trabajar con la integral de camino es necesario fijar el gauge de alguna manera. Una posibilidad es hace que $\tau$ coincida con $x^0$. [Hanson1976]. Otra opción es imponer la condición gauge del cono de luz [Zwiebach2009].


El propagador de Feynman


Ahora pordemos calcular la amplitud de probabilidad de que una partícula situada en el instante $y^0$ en $\vec{y}$ acabe en el instante $x^0$ en el punto $\vec{x}$ con una integral de camino. Los resultados del apartado anterior nos dicen que esta integración se realiza sobre todas las métricas $e^2$ de la línea de mundo y sobre todos los campos escalares en la línea de mundo $x^\mu(\tau)$ que conectan los sucesos inicial y final. Pero la integración en la métrica debe hacerse módulo difeomorfismos en la línea de mundo y, salvo difeomorfismos, ésta sólo tiene un invariante: la longitud total $T$ de la línea de mundo, que es el intervalo de tiempo propio entre los sucesos inicial y final. Fijando el gauge de tal manera que $e=1$, la variedad unidimimensional de la línea de mundo se describe poniendo como rango del parámetro $\tau$ el segmento $0\leq \tau \leq T$. La parte gravitacional de la integral de camino es, por tanto, una integración en $T$. Teniendo en cuenta que el hamiltoniano es $\hat{H}_T$, el resultado que se obtiene es:$$
\langle   \vec{x} |\exp[-i(x^0-y^0)\hat{H}]|\vec{y} \rangle=
$$ $$
= \int_0^\infty dT  \int \frac{d^4p}{(2\pi)^4} \exp [-i(x-y)p] \exp [iT(p^2+m^2)]
$$
 $$
= \int \frac{d^4p}{(2\pi)^4}\frac{i}{p^2+m^2+i\epsilon} \exp [-i(x-y)p]=D_F(x-y)
$$ Aquí $\epsilon$ es un parámetro pequeño que sirve para colocar los dos polos de la función uno por encima y otro por debajo de la línea de integración.

Al resultado que se obtiene, $D_F(x-y)$, se le denomina propagador de Feynman, y coincide con la cantidad $D(x-y)$ obtenida con la cuantización ingenua en el caso de que $x^0>y^0$. Pero, en el caso de que $y^0>x^0$, el propagador de Feynman es igual a $D(y-x)$.  Por tanto, cuando los sucesos $x$ y $y$ están desconectados causalmente, seguimos teniendo el mismo problema de que la amplitud de probabilidad de que la partícula vaya de uno al otro sigue sin ser nula. 

Ahora sí estamos en condiciones de afirmar que la mecánica cuántica de una partícula libre relativista es inconsistente con los principios de la relatividad especial. La función de onda de esta partícula se propaga más rápido que la luz.

¿Cómo podemos modificar la forma en que hemos hecho la cuantización para que la función de onda no se propague superlumínicamente? La respuesta es que no podemos. La condición de que una función de onda localizada inicialmente en torno a un punto $\vec{y}$ no se propague más rápido que la luz violaría el principio de indeterminación. Ya hemos dicho que en la integral de camino tanto las trayectorias superlumínicas como las no diferenciables son fundamentales para que no se violen las desigualdades de Heisenberg.


Las teorías cuánticas no son descendientes de las teorías clásicas


Hemos tratado de cuantizar una partícula libre relativista, y nos hemos encontrado con dificultades insalvables. Este fracaso nos invita a reflexionar sobre en qué consisten realmente los procedimientos de cuantización que hemos tratado de utilizar.

Ya hemos dicho que, para muchos estudiantes, la cuantización es un procedimiento que, aunque pueda ser largo y tedioso, es directo. Piensan que es una receta infalible mediante la cual, a partir de una teoría clásica concreta, se obtiene su correspondiente teoría cuántica promocionando las magnitudes físicas a operadores, determinando las relaciones de conmutación de esos operadores mediante la identificación de las coordenadas canónicas y construyendo el hamiltoniano cuántico a partir del hamiltoniano clásico como una función similar de las coordenadas y los momentos (sólo que en este caso con operadores).

Sin embargo, acabamos de ver que la idea que tienen muchos estudiantes de que hay una correspondencia biyectiva entre las teorías clásicas y las cuánticas es equivocada. La partícula libre relativista, como ente individual, no se puede cuantizar siguiendo las recetas estándar y respetando, a la vez, los principio de la relatividad especial. Como veremos en un post posterior, para poder construir una teoría que respete los principio de la mecánica cuántica y de la relatividad especial es necesario cambiar completamente nuestra forma de pensar y trabajar con la teoría cuántica de campos. Las partículas no son las entidades fundamentales con las que trabajar, sino que éstas surgen al cuantizar un campo relativista como excitaciones cuánticas de este campo. 

Es verdad que una descripción cuántica de la partícula relativista surge dentro de un subespacio del espacio de Hilbert de la teoría cuántica de campos, pero la teoría cuántica de campos es una teoría de multipartículas, no de una sola. Además, la de la partícula libre relativista no es la única teoría en el conjunto de teorías clásicas que no se pueden cuantizar, es decir, teorías clásicas para las cuales no existe ninguna teoría cuántica cuyo límite clásico sea equivalente a ellas. Las teorías de campos con anomalías gauge son el ejemplo más claro. Otro ejemplo son las teorías efectivas a baja energía que pertenecen al Swampland, es decir, que pueden acoplarse a la gravedad clásicamente pero no pueden hacerlo cuánticamente de forma consistente.

La realidad es que las teorías cuánticas no son descendientes de las teorías clásicas. Es decir, no es el caso que la teoría fundamental sea la clásica y que ésta, al ser cuantizada, dé lugar a la teoría cuántica. Lo que ocurre es precisamente al revés. La naturaleza es cuántica, y las teorías clásicas surgen como casos límite de las cuánticas en determinadas condiciones. Todo en la naturaleza es cuántico. Los entes fundamentales de la naturaleza son cuánticos. Por eso la descripción cuántica siempre es la fundamental, aunque en muchos casos tengamos la suerte de que el límite clásico de cierta teoría nos sirve en buena aproximación.

Es cierto, como se dice en el primer capítulo del volumen 3 del Curso de Física Teórica de Landau y Lifshitz, que, al contrario de lo que ocurre con la relatividad especial  (que se puede construir sobre la base de sus propios principios fundamentales sin hacer uso de la mecánica newtoniana), en el caso de la mecánica cuántica es imposible formular sus conceptos fundamentales sin utilizar la mecánica clásica. Los aparatos de media que se utilizan para definir los observables mecanocuánticos son esencialmente sistemas físicos clásicos que miden sólo propiedades clásicas como la posición y el momento lineal. Para poder describir mediante la mecánica cuántica cualquier experimento hay que poner en algún sitio el denominado "corte de Heisenberg", el punto a partir del cual empezamos a describir el aparato de medida clásicamente.

Sin embargo, el sitio concreto donde poner el corte de Heisenberg no tiene significado físico, siempre que éste esté puesto más allá de la escala de decoherencia. El fenómeno de la decoherencia nos muestra que los estados del sistema macroscópico que constituye el aparato de medida, y cuyas probabilidades están bien definidas, son los autoestados de la matriz densidad y, por tanto, son exactamente aquellos que podemos identificar con los estados "clásicos" de un colectivo de la mecánica estadística. Los correspondientes autovalores son las probabilidades predichas por la mecánica cuántica para el resultado de la medición. Es decir, la decoherencia nos da la frontera a partir de la cual nos podemos olvidar de la mecánica cuántica, porque la descripción clásica es ahí equivalente, pero este corte de Heisemberg lo podemos poner donde queramos siempre que estemos más allá de esa frontera. El punto donde está el corte de Heisenberg no tiene significado físico, no es algo que esté en la naturaleza, sino en la mente de cada física o físico. Los aparatos de medida, en su totalidad, también son cuánticos, aunque necesitemos que tengan límite clásico y que estén en ese límite en el experimento para poder definir los observables de los demás sistemas cuánticos. Por eso, aunque en la práctica la construcción de la mecánica cuántica como teoría necesite de la clásica, la cuántica es la teoría que describe la naturaleza a nivel fundamental.

De acuerdo con el principio de correspondencia de Böhr y Heisenberg, en el límite de la "óptica geométrica" la descripción cuántica de todo sistema físico cuya descripción clásica se conoce de antemano debe aproximarse a la descripción clásica. Lo que llamamos vulgarmente cuantización no es más que un método heurístico que utiliza este principio para construir teorías cuánticas con la idea de que tengan algún límite clásico igual a alguna teoría clásica dada. Al ser heurístico, no es importante que este procedimiento de cuantización sea riguroso, siempre que nos permita construir una teoría cuántica consistente y que tenga el límite clásico deseado. Si la naturaleza se comporta o no como dicta esa teoría cuántica es algo que tendrán que determinar los experimentos. Una vez que tenemos construida la teoría cuántica adecuada, el cómo hemos llegado hasta ella es completamente irrelevante.

A muchos físicos les gusta citar la frase de Feynman:
"En general la forma en que llegamos a una nueva ley es mediante el siguiente proceso: primero la adivinamos, luego calculamos las consecuencias que implica y posteriormente comparamos estos resultados teóricos con la naturaleza"
Sin embargo, esto que dice Feynman en el vídeo, y que tanta gracia hace a los estudiantes, no es más que el método inductivo-deductivo de Aristóteles [Aristoteles-345]. Aristóteles está considerado el primer filósofo de la ciencia, y esta idea constituye el primer recurso metodológico en antigüedad, de los muchos que se incorporaron más tarde, de la práctica científica. Pero es tal la veneración de la figura de Feynman que continuamente vemos como se la asigna la autoría hasta de ideas que tienen miles de años.

La naturaleza continuamente nos sorprende. ¿Quién se podía esperar en el siglo XIX que dos gemelos separados al nacer y que viajan en naves espaciales distintas tienen distintas edades cuando se vuelven a encontrar? ¿Quién se podía esperar en ese siglo que en las propiedades de un átomo no está el haber seguido ninguna trayectoria exacta concreta? Es imposible que pueda existir un método sistemático que nos permita encontrar la teoría científica adecuada para cada conjunto de fenómenos físicos. Los ordenadores nunca podrán sustituir a los físicos teóricos. La física, desde que existe, pongamos que desde los tiempos de Aristóteles, nunca ha sido computable, y el descubrimiento de que el mundo es cuántico no cambia esto. Con el objetivo que nos hemos planteado de construir la teoría cuántica de las partículas relativistas utilizando como punto de partida la teoría clásica, estamos intentando inferir una teoría a partir de uno de sus límites. En general, esto es imposible. No hay ningún algoritmo que nos haga eso. Si queremos saber cuál es la teoría cuántica que describe el comportamiento de las partículas relativistas, hay que adivinarla (parte inductiva), analizar en profundidad sus consecuencias (parte deductiva) y diseñar y ejecutar experimentos que la pongan a prueba.

Uno podría pensar que de esa parte "adivinatoria" saldrán genéricamente muchas teorías cuánticas rivales que tendrán que competir para ver quién aguanta mejor los tests de los experimentos. Por ejemplo, cuando promocionamos a operador una característica dinámica que es una función $f(x,p)$ de las coordenadas y los momentos, tenemos ambigüedad en cuando al orden en el que aparecen en la expresión los productos $\hat{x}\hat{p}$, debido a que $\hat{x}$ y $\hat{p}$ no conmutan. Sin embargo, lo que suele ocurrir es que los principios fundamentales con los que trabajamos los físicos (cuánticosrelativistasgauge y demás simetrías) y algunos hechos experimentales previamente conocidos (existencia de determinado tipo de partícula) suelen acabar imponiendo tantas ligaduras, que esa teoría cuántica buscada podría acabar siendo única. Nótese que esta unicidad a la que se suele llegar mediante el criterio de consistencia con todos los principios y leyes bien establecidas nada tiene que ver con los procedimientos de cuantización, ni con su refinamiento, sino que descansa en las características que tiene la teoría cuántica como producto final, independientemente de cómo se ha llegado hasta ella.

Los procedimientos de cuantización que tenemos en el mercado son sólo una guía para adivinar la teoría cuántica adecuada, pero esto es algo que podría hacerse incluso sin ninguna guía sobre cómo es el límite clásico de la teoría, mediante la aplicación de algún principio filosófico abstracto o estético, o mediante un golpe de suerte. Este hecho remarca el carácter artístico del quehacer científico.

Ocurre que ciencias, artes y humanidades no son cosas distintas. Cuando hablamos de humanidades (por ejemplo, la literatura, el arte, la política, la economía), hablamos de cosas que hace el ser humano, a diferencia de los procesos de la naturaleza. Pero resulta que la ciencia también es una humanidad, porque la ciencia la hace el ser humano. La ciencia estudia la naturaleza, pero es una disciplina humanística. Los científicos debemos vernos a nosotros mismos y ser vistos como humanistas, porque es lo que somos, aunque nuestro objeto de estudio no sea el ser humano. Y también debemos vernos como artistas, porque ¿qué son el planteamiento de preguntas, la emisión de hipótesis y el diseño de experimentos científicos, sino procesos creativos?

El arte no se construye siguiendo reglas estrictas, no se puede mecanizar. Análogamente, la tarea de los físicos teóricos y las físicas teóricas no es simplemente aclarar los detalles de los procedimientos de cuantización, como hemos hecho hasta ahora en este artículo. Nunca debemos entender los procedimientos de cuantización como "el método" para construir todas las teorías cuánticas que son importantes en física. No lo es, por eso hemos fracasado en nuestro intento de construir una teoría cuántica de una partícula relativista y por eso han fracasado hasta ahora todos los intentos de cuantizar el campo gravitatorio. En cambio, la única teoría cuántica que tenemos que incorpora de forma consistente a la interacción gravitatoria es, aunque todavía esté incompleta, la teoría de cuerdas. Esta teoría no surge de aplicar ninguna receta de cuantización al campo gravitatorio clásico, sino de pensar de manera totalmente distinta: suponer que los objetos fundamentales de la naturaleza no son puntulaes, sino extensos.


Teorías cuánticas sin límite clásico


El ejemplo más claro de que es equivocada la idea de que las teorías cuánticas son el resultado de aplicar una receta de cuantización a las teorías clásicas es el hecho de que existen teorías cuánticas que no tienen límite clásico. Veamos un ejemplo bastante impactante.

Una de las simetrías matemáticas que tiene una importancia fundamental en la física teórica actual es la supersimetría. Una transformación de supersimetría nos permite transformar bosones en fermiones y viceversa. Una de las cosas que hacen actualmente los físicos teóricos es estudiar teorías cuánticas de campos con múltiples simetrías. Si, por ejemplo, la teoría tiene 2 supersimetrías, entonces se le denomina $\mathcal{N}=2$. Su uno se pregunta cuántas supersimetrías puede tener una teoría, la respuesta que da cualquier libro de introducción a la supersimetría es que las posibilidades son $\mathcal{N}=1$, $\mathcal{N}=2$ y $\mathcal{N}=4$. Más de 4 es imposible. Pero, ¿qué pasa con $\mathcal{N}=3$? El motivo es que, si tomamos el conjunto de todas las acciones con supersimetría $\mathcal{N}=2$, y de ahí seleccionamos sólo aquellas que tienen alguna supersimetría adicional, entonces se tiene que todas ellas tienen $\mathcal{N}=4$. Por ello, no hay teorías cuánticas supersimétricas con $\mathcal{N}=3$, ¿verdad? Entonces, ¿de dónde ha salido este paper?


Iñaki García-Etxeberría, que me consta que es un fuera de serie, y Diego Regalado nos demuestran en este paper que, utilizando la teoría de cuerdas, es posible encontrar teorías cuánticas de campos con supersimetría $\mathcal{N}=3$ que no tienen $\mathcal{N}=4$. ¿Significa esto que están todos los manuales de supersimetría equivocados?

No. Lo que ocurre es que, lo que demuestran estos libros realmente es que aquellas teorías con $\mathcal{N}=3$ y no $\mathcal{N}=4$ no pueden tener formulación en términos de una acción o de una lagrangiana. Pero la formulación de una teoría física en términos de una acción o de una lagrangiana sólo es necesaria en mecánica clásica. Las teorías cuánticas no tienen por qué tener una acción. La acción en éstas sólo surge como la función que toma valores extremos en el límite clásico. Hay teorías cuánticas con varios límites clásicos distintos y, por tanto, que tienen asociado distintas acciones. A la relación entre ellas se les denomina dualidades. Y también ocurre, como es este caso, que hay teorías cuánticas sin límite clásico y que, por tanto, no tienen acción ni lagrangiana. Otro ejemplo de teoría cuántica sin ningún límite clásico es el de la teoría (2,0), cuya existencia también conocemos gracias a la teoría de cuerdas. Este es otro motivo por el que no hay una correspondencia biyectiva entre teorías clásicas y cuánticas.

Lo que acabamos de mencionar constituye un ejemplo más de por qué todo físico teórico que no quiere acabar desconectado de los nuevos avances en su disciplina debe conocer la teoría de cuerdas. Muchos físicos todavía piensan que con la formulación lagrangiana de las teorías cuánticas de campos se cubren todas las posibilidades, y sólo buscan teorías más allá del Modelo Estándar dentro de las que tienen una acción. Sin embargo, la teoría de cuerdas nos ha enseñado que ese marco es demasiado estrecho para cubrir todas las posibilidades. Independiente del papel concreto que vaya a jugar en cómo vamos a entender la gravedad cuántica y la física de partículas en nuestro universo, la teoría de cuerdas está ya insertada en el corazón de la física teórica y ya no se puede desaprender. Es imposible que los físicos la abandonemos.


Conclusión


Acabamos de ver que no es cierto que las teorías cuánticas, en general, surjan de cuantizar una teoría clásica. Lo que ocurre es lo contrario. Todo en la naturaleza es cuántico. Las teorías que describen la naturaleza son cuánticas, y éstas no son descendientes de las clásicas, sino que lo que ocurre es lo contrario: hay teorías clásicas que surgen como un determinado límite de teorías cuánticas. Hay también teorías clásicas que no son el límite de ninguna teoría cuántica y, por tanto, no pueden describir la naturaleza. Y también ocurre que hay teorías cuánticas que no tienen ningún límite clásico, y otras que tienen más de un límite clásico.

Lo que ocurrió con la partícula relativista es que no es posible construir una teoría que integre de forma consistente los principio de la relatividad especial y de la mecánica cuántica partiendo de la descripción clásica de la partícula e intentando cuantizarla. Fue necesario abordar el problema de manera totalmente distinta (trabajando con campos cuánticos relativistas) para construir una teoría que integre todos estos principios de forma consistente. Análogamente, no parece posible que vayamos a llegar a una teoría cuántica de la interacción gravitatoria aplicando un procedimiento de cuantización al campo gravitatorio, sino abordando el problema con elementos nuevos. Estos nuevos elementos parece que son los objetos extensos de la teoría de cuerdas. Por todo ello, cada vez que oigamos la palabra "cuantizar", tenemos que pensar en ella de forma más amplia de lo que lo hace un estudiante en su primer curso de mecánica cuántica. Cuantizar no es sólo aplicar una receta que nos lleva de una descripción clásica de un sistema a su versión cuántica. Cuantizar es construir, usando la metodología que sea necesaria, una teoría que tenga algún límite clásica deseado. Cuantizar es, por tanto, una actividad artística, creativa, una actividad humana que no puede sustituir ningún algoritmo.

Sobre el autor: Sergio Montañez Naz es doctor en física y profesor de secundaria de la enseñanza pública en la Comunidad de Madrid.


Referencias bibliográficas

  • Anderson, James L.; Bergmann, Peter G. (1951), "Constraints in covariant field theories", Physical Review, Series 2, 83: 1018–1025, Bibcode:1951PhRv...83.1018A, doi:10.1103/PhysRev.83.1018, MR 0044382.
  • Aristotle (-345). Posterior Analytics, trans. with notes by J. Barnes (Oxford: Clarendon Press, 1975). The Works of Aristotle Translated into English, ed. J. A. Smith and W. D. Ross, 12 vols (Oxford: Clarendon Press, 1908-52).
  • Dirac, Paul A. M. (1964), Lectures on quantum mechanics, Belfer Graduate School of Science Monographs Series, 2, Belfer Graduate School of Science, New York, MR 222089
  • Hanson, Andrew; Regge, Tullio; Teitelboim, Claudio (1976). Constrained Hamiltonian Systems.  Accademia Nazionale dei Lincei
  • Henneaux Mark, Teitelboim Claudio (1982). "Relativistic quantum mechanics of supersymmetric particles". Annals of Physics. Volume 143, Issue 1, 1 October 1982, Pages 127-159
  • Peskin, Michael E. and Schroeder, Daniel V. (1995), An Introduction to quantum field theory, Addison-Wesley, Reading, USA, http://www.slac.stanford.edu/~mpeskin/QFT.html, 9780201503975, 0201503972.
  • Zwiebach B. (2009), A First Course in String Theory (Second Edition), Cambridge University Press, 2009

No hay comentarios:

Publicar un comentario