DivulgaMadrid: Lo que la mecánica cuántica nos enseñó acerca de la invariancia gauge

De todas las interacciones de la naturaleza, la que se estudia en mayor detalle en la universidad en los denominados grados STEM (Ciencia, Tecnología, Ingeniería y Matemáticas) es la electromagnética. Todos los estudiantes que entran en estos grados saben ya desde Bachillerato que sobre toda partícula con carga $q$ y velocidad $\vec{v}$ sometida a un campo electromagnético se ejerce siempre una fuerza (denominada fuerza de Lorentz) de valor $$
\vec{F}=q\vec{E}+q\vec{v}\times \vec{B}
$$ donde $\vec{E}$ es valor del campo eléctrico en el punto donde está situada la partícula y $\vec{B}$ el campo magnético. Esto implica que, en el caso de que la partícula sea no relativista, la ecuación diferencial que describe su movimiento es, si la fuerza de Lorentz es la única que actúa:

$$
m\vec{a}=q\vec{E}+q\vec{v}\times \vec{B}
$$ donde $m$ es la masa de la partícula y $\vec{a}$ es su aceleración.

Por otro lado, ya en la universidad los estudiantes aprenden que esta ecuación de movimiento se puede obtener imponiendo que el camino que tiene que seguir la partícula entre los puntos espaciotemporales $(t_i, \vec{r}_i)$ y $(t_f, \vec{r}_f)$ sea aquel que minimiza la acción
$$
S=\int \left( \frac{1}{2} m v^2 -q\phi \right)dt+ q\int \vec{A}\cdot d\vec{r} =
$$ $$
=\int \left( \frac{1}{2} m v^2 -q\phi +q\vec{A}\cdot\vec{v}\right)dt
$$ (donde las integrales se realizan entre esos dos puntos espaciotiemporales) siempre que identifiquemos a $\vec{E}$ y $\vec{B}$ con
$$
\vec{E}=-\vec{\nabla} \phi - \frac{\partial \vec{A}}{\partial t}
$$ $$
\vec{B}=\vec{\nabla} \times \vec{A}
$$ Aquí $\phi$ es el potencial eléctrico y $\vec{A}$ es el potencial vector magnético.

Sin embargo, aunque aparecen en la acción, en mecánica clásica tanto $\phi$ como $\vec{A}$ no representan entes reales, no tienen ningún significado físico. Son simplemente campos auxiliares matemáticos que se introducen por pura utilidad para poder calcular mejor los campos $\vec{E}$ y $\vec{B}$. Estos últimos sí tienen significado físico, ya que ejercen fuerzas que podemos medir sobre las partículas cargadas.

Dada una configuración concreta de $\phi$ y $\vec{A}$, si hacemos la transformación (denominada transformación gauge)
$$
\phi^\prime=\phi - \frac{\partial \chi}{\partial t}
$$ $$
\vec{A}^\prime=\vec{A} + \vec{\nabla} \chi
$$ (donde $\chi$ es una función diferenciable arbitraria de $\vec{r}$ y $t$) los campos $\vec{E}$ y $\vec{B}$ se mantienen invariantes y la acción $S$ de la partícula cargada sólo cambia en la cantidad $q(\chi_f-\chi_i)$, que es una constante que no afecta a las ecuaciones de movimiento. Además, las ecuaciones de Maxwell son invariantes bajo una transformación gauge, ya que en ellas parecen $\vec{E}$ y $\vec{B}$, y no los potenciales $\vec{A}$ y $\phi$. Es decir, la nueva configuración que se obtiene al hacer una transformación gauge describe exactamente la misma física que la configuración inicial, con los mismos campos $\vec{E}$ y $\vec{B}$ evolucionando igual y ejerciendo la misma fuerza sobre las partículas cargadas. A esta invariancia que tiene la teoría del campo electromagnético se la denomina invariacia gauge [Landau1992].

Algunas configuraciones gauge son más convenientes que otras para realizar ciertos cálculos, pero es muy importante tener esta invariancia gauge presente para distinguir las cosas que ocurren físicamente en la realidad de lo que son simplemente elementos matemáticos sin existencia física que nos ayudan a hacer los cálculos. La realidad no es lo que los matemáticos y los físicos escribimos en nuestros papeles, y los procesos físicos no son los pasos que realizamos cuando hacemos cálculos. En la teoría clásica del electromagnetismo lo que existe en realidad son los campos $\vec{E}$ y $\vec{B}$ y las partículas cargadas que interaccionan con ellos. Los valores concretos de $\vec{A}$ y $\phi$ no tienen existencia real. Esto lo sabe cualquier estudiante de los grados STEM cuando asigna arbitrariamente el valor de $\phi$ igual a cero voltios al punto que quiere a la hora de resolver los problemas de electrostática. En estos problemas sólo las diferencias de potencial eléctrico entre distintos puntos tienen significado físico, pero no su valor concreto, ya que estas diferencias son las que determinan el campo eléctrico $\vec{E}$.

Sin embargo, el universo en el que vivimos no es clásico. Es cuántico. ¿Siguen siendo en mecánica cuántica las leyes de la física invariantes ante una transformación gauge? ¿Siguen siendo los campos $\vec{E}$ y $\vec{B}$ los que tienen significado físico frente a $\vec{A}$ y $\phi$? Para entender en su totalidad qué ocurre con la invariancia gauge en mecánica cuántica habría que irse al formalismo de la teoría cuántica de campos. Sin embargo, muchas de las ideas cruciales ya se pueden discutir en el contexto de una partícula cuántica no relativista que interacciona con un campo electromagnético clásico. Y eso es lo que vamos a hacer en el presente artículo.

La ecuación de Schrödinger y la integral de camino de la partícula cargada

En mecánica cuántica las probabilidades de cada posible resultado a la hora de realizar una medición se calculan mediante el módulo al cuadrado de la amplitud de probabilidad asociada a ese suceso. Esta amplitud de probabilidad se puede calcular mediante una integral de camino de Feynman. Por ejemplo, en el cálculo de la amplitud de probabilidad de que una partícula situada en $\vec{r}_i$ en el instante $t_i$ acabe en el punto $\vec{r}_f$ en un instante posterior $t_f$, hay que sumar las amplitudes de probabilidad asociadas a cada camino posible, siendo cada una de éstas un número complejo de módulo 1 y cuya fase viene dada por la acción $S$ dividida entre $\hbar$:
$$
U(\vec{r}_f , t_f ; \vec{r}_i, t_i)=\langle \vec{r}_f | \hat{U}(t_f-t_i) | \vec{r}_i \rangle = \int D\vec{r}(t) e^{i\frac{S}{\hbar}}
$$ donde $\hat{U}$ es el operador unitario de evolución del estado de la partícula. A la función $U(\vec{r}_f , t_f ; \vec{r}_i, t_i)$ se la denomina propagador de la partícula cargada en el espacio de posición.

Ya hemos visto que el lagrangiano de la partícula cargada incluye, además del término de la energía cinética, el término de interacción con el campo electromagnético, y que éste no sólo depende de la posición de la partícula, sino también de su velocidad. Esto nos da lugar a una ambigüedad en cuanto a cómo ordenar los productos de operadores posición y velocidad, ya que en mecánica cuántica la posición $\hat{\vec{r}}$ y la velocidad $\hat{\vec{v}}$ de una partícula no conmutan. Como hemos explicado en otro post, este problema de ordenamiento queda oculto en la notación simplificada de la integral de camino que acabamos de utilizar. Como se trata de una cuestión técnica que no afecta a lo que vamos a discutir aquí, remitimos al lector a este otro post, donde se demuestra que el orden en el término de interacción $q\vec{A}(\vec{r})\cdot \vec{v}$ que se tiene que establecer en la integral de camino de Feynman es el correspondiente a la regla del punto medio [Rosenfelder2009]. Al hacer esto la evolución temporal que se obtiene para la partícula cargada es equivalente a la que genera el hamiltoniano $$
\hat{H}=
\frac{1}{2m} \left( \frac{\hbar}{i} \nabla
- q \vec{A}(\vec{r}) \right)^2 + q\phi(\vec{r}),
$$ Este hamiltoniano no es más que el resultado de realizar la sustitución minimal en el hamiltoniano de la partícula libre del operador momento $\hat{\vec{p}}$ por el operador $$
\hat{\vec{p}}_F=\hat{\vec{p}}-q\vec{A}(\hat{\vec{r}})
$$ (añadiendo también el sumando correspondiente a la energía potencial eléctrica). La correspondiente ecuación de Schrödinger que se obtiene en la representación de coordenadas es $$
i \hbar \, \frac{\partial \psi(\vec{r},t)}{\partial t} = \left[ - \frac{\hbar^2}{2 m} \Delta +
q\phi(\vec{r})
+ \frac{i \hbar q}{m }
\vec{A}(\vec{r}) \cdot \nabla + \frac{i \hbar q}{2m c} \, \left( \nabla \cdot \vec{A}(\vec{r})\right) +
\frac{q^2}{2 m } \vec{A}^2(\vec{r}) \right] \, \psi(\vec{r},t)
$$

Covariancia gauge

Aquí es donde nos damos cuenta de que en mecánica cuántica ocurre algo distinto con la invariancia gauge que en mecánica clásica. La acción $S$ no depende de los campos $\vec{E}$ y $\vec{B}$, que son los que clásicamente tienen sentido físico, sino de los potenciales $\vec{A}$ y $\phi$. Esto hace que estos potenciales también aparezcan en la ecuación de Schrödinger, que nos dice cómo evoluciona con el tiempo la función de onda de la partícula cargada. Al contrario de lo que le ocurre a las ecuaciones de Maxwell, la ecuación de Schrödinger no es invariante gauge. Es decir, el operador unitario de evolución $\hat{U}$ depende de los potenciales electromagnéticos. Si estos potenciales tomaran un valor distinto, entonces la amplitud de probabilidad de que la partícula acabe en el punto $\vec{r}_f$ sería distinta, la función de onda de la partícula evolucionaría de forma distinta, con lo que podríamos detectar experimentalmente este cambio en los potenciales. ¿Significa eso que, al contrario de lo que ocurre en mecánica clásica, en mecánica cuántica los potenciales electromagnéticos sí tienen sentido físico? Vamos a verlo en detalle.

Como al realizar una transformación gauge la acción cambia de la forma
$$
S^\prime=S+q(\chi_f-\chi_i)
$$ la amplitud de probabilidad de que la partícula vaya desde $\vec{r}_i$ hasta $\vec{r}_f$ cambia en un factor de fase, de tal forma que el operador unitario de evolución cambia de la forma
$$
\hat{U}^\prime(t_f-t_i)= e^{\frac{i}{\hbar}q\chi(\hat{\vec{r}}_f, t_f)}\hat{U}(t_f-t_i) e^{-\frac{i}{\hbar}q\chi(\hat{\vec{r}}_i, t_i)}
$$ Esto hace que, si redefinimos el estado inicial como
$$
|\psi^\prime(t_i)\rangle= e^{\frac{i}{\hbar}q\chi(\hat{\vec{r}}_i, t_i)} |\psi(t_i)\rangle
$$ entonces el nuevo operador evolución $\hat{U}^\prime$ convierte este estado inicial en el estado final
$$
|\psi^\prime(t_f)\rangle= e^{\frac{i}{\hbar}q\chi(\hat{\vec{r}}_f, t_f)} |\psi(t_f)\rangle
$$
Nos damos cuenta así de que en cualquier instante de tiempo el estado cuántico de la partícula ante una transformación gauge sufre una transformación unitaria
$$
|\psi^\prime(t_f)\rangle= \Lambda (\chi(\hat{\vec{r}},t_f)) |\psi(t_f)\rangle
$$ donde
$$
\Lambda (\chi(\hat{\vec{r}},t))=e^{\frac{i}{\hbar}q\chi(\hat{\vec{r}}, t_f)}
$$
La conclusión es que, al hacer una transformación gauge, la evolución temporal de la función de onda de la partícula cargada va a ser distinta, pero acaba teniendo exactamente la misma forma funcional que antes de la transformación si hacemos, simultáneamente a la transformación gauge, un cambio de fase en la función de onda: $$
\phi^\prime=\phi - \frac{\partial \chi}{\partial t}
$$ $$
\vec{A}^\prime=\vec{A} + \vec{\nabla} \chi
$$ $$
\psi^\prime(\vec{r},t)= e^{\frac{i}{\hbar}q\chi(\hat{\vec{r}}, t)} \psi(\vec{r},t)
$$ Es decir, la invariacia gauge de las ecuaciones del electromagnetismo clásico emerge de nuevo en mecánica cuántica sólo si, simultáneamente con la transformación de los potenciales $\vec{A}$ y $\phi$, transformamos también la función de onda mediante un factor de fase. Nótese que, al tratarse de un factor de fase que no afecta al módulo de la función de onda, la probabilidad de encontrar a la partícula en un $\vec{r}$ y un $t$ concretos no depende de la elección del gauge.

En matemáticas, al conjunto de todos los despazamientos de la fase de un número complejo se le denomina grupo U(1). Es el grupo de rotaciones del plano complejo en torno al origen.

En este caso tenemos una transformación U(1) distinta en cada punto del espaciotiempo, y este es el motivo por el que esta transformación gauge U(1) se dice que no es global, sino local. Al contrario que el grupo global U(1), que tiene dimensión real 1, el grupo gauge U(1) tiene infinitas dimensiones, ya que está formado por todas las funciones $$
\Lambda=e^{\frac{i}{\hbar}q\chi}
$$ con dominio en todo el espacio-tiempo y que toman valores en la circunferencia unidad (la operación del grupo aquí es simplemente la multiplicación de estas funciones $\Lambda$). Las funciones $\chi$, que los físicos denominamos generadores de la transformación gauge, son matemáticamente los vectores (en este caso de una dimensión real) del álgebra de Lie asociada al grupo gauge U(1) solo que en este caso, por tratarse de un grupo abeliano, los corchetes de Lie son nulos. Nótese también que esta acción del grupo gauge U(1) sobre la función de onda no se corresponde con la acción de ningún grupo actuando sobre el espacio de fases de coordenadas y momentos de la partícula. No tiene, por tanto, interpretación clásica.

Por todo esto, no podemos decir que la mecánica cuántica de una partícula cargada sometida a un campo electromagnético sea invariante gauge. No lo es. Lo que sí se puede decir es que es covariante, es decir, que las ecuaciones en esta teoría, por ejemplo, la ecuación de Schrödinger, que nos dice cómo es la evolución temporal de la función de onda, tienen exactamente la misma forma tras una transformación gauge que las ecuaciones originales pero con todos los elementos (función de onda y potenciales electromagnéticos) con primas. $$
i \hbar \, \frac{\partial \psi^\prime(\vec{r},t)}{\partial t} = \left[ - \frac{\hbar^2}{2 m} \Delta +
q\phi^\prime(\vec{r})
+ \frac{i \hbar q}{m }
\vec{A}^\prime(\vec{r}) \cdot \nabla + \frac{i \hbar q}{2m c} \, \left( \nabla \cdot \vec{A}^\prime(\vec{r})\right) +
\frac{q^2}{2 m } \vec{A}^{\prime 2}(\vec{r}) \right] \, \psi^\prime(\vec{r},t)
$$ Todos estos elementos cambian coordinados para dar las mismas predicciones físicas. ¿Verdad?

Observables físicos

Aunque la probabilidad de encontrar a la partícula en un punto $\vec{r}$ concreto no depende del gauge, es fácil comprobar que la probabilidad asociada a otros observables, distintos de $\hat{\vec{r}}$, sí puede depender del gauge.

Por ejemplo, el momento canónico en la dirección X, que se denota mediante $\hat{p}_x$ (el que cumple con la relaciones de conmutación $[\hat{x}_i, \hat{p}_j]=i\hbar \delta_{ij} $ y $[\hat{p}_i, \hat{p}_j]=0$) tiene autoestados $|p_x\rangle$ con autovalor $p_x$. Ya sabemos que esto significa que en los estados $|p_x\rangle$ el observable $\hat{p}_x$ toma un valor bien definido $p_x$. Este operador es invariante ante una trasformación gauge. Sin embargo, tras una trasformación gauge, los estados $|p_x\rangle^\prime=\hat{\Lambda}|p_x\rangle$ ya no son autovectores de $\hat{p}_x$. En efecto:
$$
\hat{p}_x|p_x\rangle^\prime=\hat{p}_x\hat{\Lambda}|p_x\rangle \neq p_x |p_x\rangle^\prime
$$ ya que $\hat{p}_x$ no conmuta con $\hat{\Lambda}$, al ser $\hat{\Lambda}$ función de $\hat{x}$. Es decir, los estados transformados bajo una transformación gauge $|\vec{p_x}\rangle^\prime$ son estados en los que el momento canónico ya no toma un valor bien definido.

La única forma de que la teoría tenga las mismas predicciones físicas tras una transformación gauge es asumir que no todos los operadores hermíticos que podemos construir son realmente observables físicos que se pueden medir. La condición que debe cumplir un operador hermítico para representar un observable físico de la teoría es que al conmutar con el operador $\hat{\Lambda}$ el operador tenga la misma dependencia funcional de los potenciales $\vec{A}$ y $\vec{\phi}$, pero cambiando éstos por $\vec{A}^\prime$ y $\vec{\phi}^\prime$. Sin embargo $\hat{p_x}$ no cumple esa condición. Por ello $\hat{p_x}$ no representa ningún observable físico.

¿A qué se debe esto? Ya en mecánica clásica sabíamos que el momento canónico de una partícula cargada sometida a un campo electromagnético no coincide con el momento físico $\vec{p}_F$ (el que es igual a $m\vec{v}$). La relación entre estos dos momentos lineales
$$
\vec{p}=m\vec{v}+q\vec{A}
$$ se traduce en mecánica cuántica en la relación entre los operadores
$$
\hat{\vec{p}}=\hat{\vec{p}}_F+q\vec{A}(\hat{\vec{r}},t)
$$ A partir de las relaciones de conmutación $[\hat{x}_i, \hat{p}_j]=i\hbar\delta{ij}$ es fácil comprobar que $$
(\hat{\vec{p}}-q\hat{\vec{A}}^\prime ) \hat{\Lambda} = \hat{\Lambda} ( \hat{\vec{p}}-q\hat{\vec{A}} )
$$ de donde se ve que $\hat{\vec{p}}_F=\hat{\vec{p}}-q\vec{A}(\hat{\vec{r}},t)$ sí es un observable físico. Además, se puede probar fácilmente que en la imagen de Heisenberg el operador que es igual a la derivada del operador $\hat{\vec{r}}$ respecto del tiempo no es $\hat{\vec{p}}/m$, sino $\hat{\vec{p}}_F/m$.

¿Qué tipo de objeto matemático es la función de onda de una partícula cargada?

Nos encontramos así con que los elementos matemáticos necesarios para describir la mecánica cuántica de una partícula sometida a un campo electromagnético tienen que sofisticarse respecto a los que se usaban en mecánica cuántica sin campos electromagnéticos. En la representación de coordenadas la función de onda ya no es simplemente un número complejo asociado a cada punto del espaciotiempo. Al cambiar mediante una trasformación gauge con un factor de fase, la función de onda tiene que ser ahora lo que los matemáticos denominan una sección de un recubrimiento fibrado vectorial U(1) de dimensión compleja 1 sobre el espaciotiempo. Este fibrado vectorial se construye asociando un espacio vectorial de dimensión compleja 1 a cada punto del espaciotiempo de forma que estos espacios vectoriales varíen suavemente a medida que nos movemos por el espaciotiempo. Para ello, lo que se hace es realizar una asignación distinta en cada abierto, y dar una serie de funciones de transición que nos dicen cómo están relacionados los distintos espacios vectoriales en las intersecciones de estos abiertos. Estas funciones de transición son transformaciones gauge U(1) en este caso.

Por ejemplo, en el espaciotiempo de Minkowski, de topología trivial, nos basta con sólo un abierto, pero podemos tener distintas formas de asignar el espacio vectorial a cada punto de ese abierto. Si tomamos como funciones de transición entre esas distintas formas las transformaciones U(1) $\psi^\prime=\Lambda \psi$, entonces tenemos un fibrado vectorial U(1) sobre el espacio de Minkoswki. Se trata de una extensión del espaciotiempo en la que a cada punto del espaciotiempo le asociamos un número complejo al que podemos someter a las transformaciones U(1) que queramos (al que podemos cambiar su fase). Una especificación de qué número complejo concreto debe cogerse en cada punto del espaciotiempo es lo que se denomina una sección de ese fibrado, y eso es lo que es en realidad la función de onda de la partícula cargada. El operador unitario $\hat{\Lambda}$ no es más que la representación de la acción del grupo gauge U(1) sobre ese número complejo, es decir, sobre la función de onda en ese punto espaciotemporal.

De la misma manera que en la representación de coordenadas el operador $\hat{\vec{p}}$ actúa como el operador gradiente $-i\hbar \vec{\nabla}$, cuyas componentes son derivadas parciales, el operador momento físico $\hat{\vec{p}}_F$ actúa como el operador gradiente que se construye a partir de derivadas covariantes, en vez de parciales:
$$
-i\hbar \vec{D}=-i\hbar \vec{\nabla}-q\vec{A}
$$ Estas derivadas covariantes nos permiten comparar los valores de la función de onda en distintos puntos espaciotemporales. Se dice entonces que $\vec{A}$ nos da una conexión para el fibrado. Como veremos más adelante, $\phi$ nos da la parte temporal de esa conexión.

Toda conexión en un fibrado nos permite transportar paralelamente a sí mismo un vector de la fibra a medida que nos movemos por el espaciotiempo. Sin embargo, para poder hacer esto de forma global por todo el espaciotiempo es necesario que este transporte paralelo entre dos puntos del espaciotiempo no dependa del camino seguido para ir del primer punto al segundo. En los casos en los que sí hay dependencia del camino se dice que la conexión tiene curvatura.

Los potenciales electromagnéticos nos dan una conexión para el fibrado vectorial U(1). ¿Tiene curvatura esta conexión? ¿Obtenemos el mismo resultado cuando trasladamos paralelamente la función de onda si primero avanzamos en el ele X y luego en el Y, que si lo hacemos primero en el Y y luego en el X? Son los operadores momento los que generan en mecánica cuántica las traslaciones espaciales. Y resulta que, aunque los momentos canónicos $\hat{p}_x$ y $\hat{p}_y$ conmutan entre ellos, los momentos físicos $\hat{p}_{Fx}$ y $\hat{p}_{Fy}$ no conmutan entre ellos. Esto se debe a que las componentes de $\hat{\vec{p}}_F$ dependen de las coordenadas a través de su dependencia en $\vec{A}$, con lo que el conmutador entre estas componentes va a depender de las derivadas de $\vec{A}$. En concreto:
$$
[\hat{p}_{Fx}, \hat{p}_{Fy}]=i\hbar q \hat{B}_z $$
Llegamos así al sorprendente resultado de que, cuando hay campo magnético en el eje Z, las traslaciones en el eje $X$, realizadas con derivadas covariantes, no conmutan con las traslaciones en el eje $Y$. Cuando el campo magnético en el eje Z no es nulo la conexión del fibrado tiene curvatura, lo que quiere decir físicamente que ¡las componentes $X$ y $Y$ del momento físico no pueden tomar valores bien definidos simultáneamente!

El efecto Aharonov-Bohm

Esto es algo que podemos entender mejor con la integral de camino de Feynman. El campo $\vec{A}$ es responsable de que cada una de las amplitudes asociada a cada camino adquiera una fase distinta
$$
\frac{1}{\hbar}q\int \vec{A}\cdot d\vec{r}
$$ de tal manera que la diferencia de fase entre las amplitudes asociadas a dos caminos concretos es la integral de camino a lo largo de un camino cerrado $C$ que recorre el primer camino y luego en sentido contrario el segundo camino

$$
\frac{1}{\hbar}q\oint_C \vec{A}\cdot d\vec{r}=\frac{1}{\hbar}q\int_S \vec{B}\cdot d\vec{S}
$$ donde la segunda integral es una integral de superficie a lo largo de una superficie $S$ cuya frontera es el contorno cerrado $C$. Es decir, la diferencia de fase entre las amplitudes de probabilidad asociadas a dos caminos distintos depende del flujo de campo magnético a lo largo de la superficie encerrada entre esos dos caminos.

Vemos por tanto que la presencia del campo magnético tiene efectos observables sobre los patrones de interferencia entre estos dos caminos, a no ser que dé la casualidad de que esta diferencia de fases sea un múltiplo de $2\pi$. La conclusión es que todo flujo de campo magnético a lo largo de una superficie va a tener consecuencias observables sobre la interferencia entre los dos caminos que limitan a la superficie. A este efecto se le conoce como efecto Aharonov-Bohm.

Lo más llamativo es que este efecto ocurre incluso en el caso en el que el que el flujo de campo magnético esté confinado dentro de una pequeña región de la superficie $S$ muy alejada de su borde $C$. Por ejemplo, el campo magnético podría estar confinado en el interior de un solenoide largo y estrecho, como indica la figura:

Incluso en aquellos casos en los que la amplitud de probabilidad de que la partícula pase por la zona donde hay campo magnético sea prácticamente nula, aun así el campo magnético tiene un efecto medible en el patrón de interferencia de esos caminos $C_1$ y $C_2$. Hay quién pretende darle un halo de misterio a este hecho insinuando que éste es un efecto no local en el que el campo magnético afecta instantáneamente a distancia a la partícula cuántica, lo cuál supone una violación del principio de localidad de la relatividad especial. Por supuesto, esto no es así. La mecánica cuántica es perfectamente compatible con la relatividad especial. Lo que está provocando un cambio en el patrón de interferencia es el campo $\vec{A}$ y no $\vec{B}$. Nos vemos, por tanto, obligados a admitir que en mecánica cuántica, al contrario de lo que ocurre en mecánica clásica, de alguna manera el campo $\vec{A}$ sí tiene significado físico. Un razonamiento similar puede hacerse con el campo $\phi$. No obstante, hay que aclarar que se trata de un significado físico muy especial, ya que todas la configuraciones de los campos $\vec{A}$ y $\phi$ relacionados entre sí mediante una transformación gauge son equivalentes desde el punto de vista físico, ya que $$
\oint \vec{A}^\prime \times d \vec{r}=\oint \vec{A}\times d \vec{r}+\oint \vec{\nabla}\chi\times d \vec{r}=\oint \vec{A}\times d \vec{r}
$$ $$
\oint \phi^\prime d t=\oint \phi d t-\oint \frac{\partial \chi}{\partial t}d t=\oint \phi d t
$$ ¿Cuál es ese significado de los potenciales electromagnéticos? Ya estamos cerca de descubrirlo.

Los lazos de Wilson

El lector que no le convenza el argumento anterior puede probar a imaginar la siguiente situación: ¿qué pasaría si el eje $Y$ fuese una circunferencia, compacta mediante la identificación $y\equiv y+ L_y$, y hacemos que el contorno $C$ sea precisamente un contorno que da una vuelta en esta dimensión compacta? En este caso, la superficie $S$ cuya frontera es $C$ no existe. No hay nada interior al contorno.

A lo largo del eje $Y$ podría haber perfectamente un campo $A_y$ constante. Esta configuración sería solución de las ecuaciones de Maxwell sin fuentes porque corresponde a un $\vec{B}$ nulo en todo es espacio. Sin embargo, esto hace que haya una diferencia de fase entre los caminos que van desde $y=0$ hasta el extremo opuesto del círculo $y=L_y/2$ (uno viajando en un sentido y el otro en sentido contrario) de valor
$$
w=\frac{1}{\hbar}q\oint_C \vec{A}\cdot d\vec{r}=\frac{qA_yL_y}{\hbar}
$$ Esta diferencia de fase se puede medir experimentalmente módulo $2\pi$, ya que es un ángulo. Por ello, lo que tiene significado físico no es w, sino el número complejo de módulo 1
$$
W=e^{iw}
$$ que se denomina lazo de Wilson.

En lenguaje matemático decimos que los lazos de Wilson son las holonomías de la conexión gauge. En el caso de que haya también campo $\phi$ en el contorno, el lazo de Wilson se define mediante una integral de contorno cerrado en el espaciotiempo
$$
W=e^{\frac{i}{\hbar}q\oint_C ( \vec{A}\cdot d\vec{r}-\phi dt)}
$$
Con este ejemplo se ve claro que lo que tiene existencia real, lo que se puede medir, no son sólo los campos $\vec{B}$ y $\vec{E}$, sino los lazos de Wilson a los que dan lugar los campos $\vec{A}$ y $\vec{\phi}$. De hecho, los lazos de Wilson en cierto sentido generalizan a $\vec{B}$ y $\vec{E}$ ya que estos últimos pueden entenderse como aquellas cantidades que especifican el valor de los lazos de Wilson asociados a contornos infinitesimales. $\vec{B}$ y $\vec{E}$ son los valores que especifican la curvatura de la conexión en cada punto.

Nótese que bajo una transformación gauge $w$ cambia de la forma
$$
w^\prime=w+\frac{q}{\hbar}(\chi_f-\chi_i)
$$ Al tratarse de un contorno cerrado uno estaría tentado a pensar que, el ser el punto final igual al punto inicial, $\chi_f=\chi_i$. Sin embargo, como $w$ sólo tiene significado físico módulo $2\pi$, al ser un ángulo, es perfectamente posible hacer transformaciones gauge en las que
$$
\chi_f=\chi_i+\frac{2\pi \hbar n}{q}
$$ (con $n$ un número entero) ya que éstas dejan invariante el lazo de Wilson. Además, a cada una de estas transformaciones gauge le corresponde un operador unitario $\Lambda(\hat{y})$ que está bien definido en todo el círculo, ya que
$$
\Lambda_f=e^{2\pi n i}\Lambda_i=\Lambda_i
$$ Esto nos deja claro que el verdadero parámetro que implementa las transformaciones gauge no es $\chi$ sino $\Lambda$. Además, los lazos de Wilson son invariantes ante cualquier función $\Lambda$ (de la posición y del tiempo) que está bien definida en toda la circunferencia. Los valores de $w$ que difieren en un múltiplo de $2\pi$ son equivalentes gauge, y dan lugar a las mismas holonomías.

Es posible construir explícitamente esas funciones $\chi(y)$ que no están bien definidas en toda la circunferencia, pero que sí dan lugar a a una transformación gauge $\Lambda$ que sí lo está. La opción más sencilla es que $\chi$ sea proporcional a $y$:
$$
\chi=\frac{2\pi \hbar n y}{L_y q}
$$ Esta transformación gauge hace que a $A_y$ se le sume una constante
$$
A_y^\prime=A_y+\frac{2\pi \hbar n}{L_yq}
$$ Con lo que
$$
w^\prime=w+2 \pi n
$$ y $W$ se mantiene invariante.

Nótese que estas transformaciones gauge en las que $\chi_i$ no coincide con $\chi_f$ son transformaciones gauge largas. No están continuamente conectadas con la identidad (el elemento neutro del grupo aplicado a todos los puntos del espaciotiempo). Estas trasformaciones largas están bien definidas en este ejemplo, pero no lo estarían si existiese el interior del círculo. Por ejemplo, no estarían bien definidas en el interior del solenoide en el experimento del efecto Aharonov-Bohm. Se trataría de transformaciones gauge que cambiarían el valor del flujo de $\vec{B}$, con lo que sí tendrían consecuencias medibles si hacemos pasar a la partícula por el interior del solenoide.

Para explicar cómo el hecho de que la partícula cargada se mueva sometida a un lazo de Wilson no trivial $W \neq 1$ cambia de forma importante el comportamiento de la partícula cargada, vamos a calcular los estados estacionarios y sus correspondientes energías. El hamiltoniano clásico de la partícula cargada es
$$
H=\frac{p_F^2}{2m}+ q\phi=\frac{(\vec{p}-q\vec{A})^2}{2m}+ q\phi
$$ con lo que en mecánica cuántica podemos escribir
$$
\hat{H}=\frac{\hat{p}_F^2}{2m}+ q\phi(\hat{\vec{r}},t)=\frac{(\hat{\vec{p}}-q\vec{A}(\hat{\vec{r}},t))^2}{2m}+ q\phi(\hat{\vec{r}},t)
$$ En nuestro ejemplo, en el que el único potencial no nulo es $A_y$, que es constante en toda la circunferencia, los autoestados de este operador son los mismos que si $A_y$ fuese cero:
$$
\varphi_{\vec{p}}(\vec{r})=\exp \left[ \frac{i}{\hbar}(p_x x+ p_y y+p_z z ) \right]
$$ donde $p_x$ y $p_z$ son números reales, pero $p_y$ toma los valores discretos
$$
p_y=\frac{2 \pi \hbar \ell}{L_y}
$$ con $\ell$ un número entero. Sin embargo, los correspondientes autovalores sí dependen de $A_y$ y están desplazados con respecto a los de la partícula libre:
$$
E_{\vec{p}}=\frac{\hbar^2}{2m} \left( \frac{2\pi\ell }{ L_y}-\frac{w}{L_y}\right)^2
$$ Nótese que cuando $w$ no es ni nulo ni múltiplo de $2\pi$, entonces los niveles de energía están desplazados con respecto a los de la partícula libre, de forma que el nivel $\ell$ tiene una energía distinta del nivel $-\ell$. Es decir, una partícula con un momento canónico $p_y$ va a tener una energía distinta a otra con momento canónico $-p_y$. Esto se debe a que el momento canónico $p_y$ no coincide con el momento físico $p_y-qA_y$.

Este ejemplo nos sirve para ilustrar con mayor claridad el concepto de covariancia gauge. Ante una transformación gauge $w^\prime=w+2\pi n$ el estado estacionario $\varphi_{\vec{p}}(\vec{r})$, al que corresponde un número cuántico $\ell$, se mantiene invariante, pero su energía y su cantidad de movimiento física pasan a ser las que tenía el estado estacionario de número cuántico $\ell + n$. Es decir, ante una transformación gauge el espectro de momentos lineales físicos y de energías de la partícula sigue siendo el mismo, lo que cambia es qué asignación de estado estacionario corresponde a cada valor del momento lineal físico y de la energía. Distintas configuraciones de $w$ que son equivalentes gauge dan lugar a modelos mecanocuánticos para la partícula que son indistinguibles experimentalmente.

El ángulo $w$ tiene una interpretación geométrica bastante bonita en teoría de cuerdas. En los volúmenes de mundo de las Dp-branas hay campos gauge U(1). Si la Dp-brana está enrollada en la dirección compacta $y$ con valor pequeño de $L_y$, y el campo gauge que vive en su interior tiene holonomía dada por el ángulo $w$, esta configuración es T-dual a otra en la que el tamaño de la circunferncia $L_y$ es grande y hay una D(p-1)-brana en una posición angular concreta dentro de esa circunferencia. ¡En la descripción T-dual el ángulo $w$ no es más que la posición angular de esa D(p-1)-brana en esa circunferencia! [Zwiebach2009] Es decir, en la descripción T-dual queda claro que $w$ sí es una magnitud con significado físico, que se puede medir, ya que es la posición de un objeto físico.

Por otro lado, en este ejemplo de teoría de cuerdas la partícula cargada es una cuerda abierta cuyo extremo acaba en la Dp-brana y que se mueve en la dirección $y$ con momento generalizado $p_y=\frac{\hbar 2 \pi \ell}{L_y}$. Pero en la descripción T-dual sería una cuerda abierta cuyo extremo acaba en la D(p-1)-brana y que está enrollada $\ell$ veces en la circunferencia. Al hacer una transformación gauge $w^\prime=w+2\pi n$, hacemos que este extremo dé $n$ vueltas a la circunferencia, con lo que el número de enrollamientos $\ell$ de la cuerda aumenta en un valor de $n$, pasando a tener esta misma cuerda más energía. Este es el motivo por el que ante una transformación gauge el estado estacionario $\ell$ pasa a tener la energía y el momento físico que tenía el estado estacionario $\ell+n$, pero el espectro de $\hat{p}_{yF}$ y $\hat{H}$ y el conjunto de los estados estacionarios sigue siendo el mismo. Es decir, la covariancia de la teoría bajo trasformaciones gauge largas tiene un origen geométrico que viene del hecho de que la posición de la D(p-1)-brana en la descripción dual es una posición angular en vez de lineal. En esa descripción dual el ángulo $\ell$ está ligado al número de vueltas que da el ángulo $w$ sobre la circunferencia. En cambio, en la descripción inicial $\ell$ y $w$ parecían parámetros físicamente desligados.

Lo que acabamos de indicar en estos dos párrafos es una característica general de la teoría de cuerdas: en esta teoría típicamente todos los elementos algebraicos que utilizamos para describir los fenómenos físicos, como en este caso los lazos de Wilson y las transformaciones gauge, acaban teniendo una interpretación geométrica sencilla en alguna descripción dual que nos hace entender los fenómenos físicos en mayor profundidad. La teoría de cuerdas ha cambiado ya para siempre nuestra forma de entender los fenómenos físicos. Se trata de un cambio irreversible que todo estudiante de física teórica tiene que conocer.

Si $A_y$ fuera puro gauge
$$
A_y=\frac{2\pi \hbar n}{L_yq}
$$ entonces $W=1$, con lo que, aunque $A_y$ no fuera nulo, no podríamos decir que la partícula está sometida a ningún campo magnético, ya que este $A_y$ no tendría ningún efecto observable. Esta es otra forma de ver que lo que tiene existencia física no son los potenciales $\vec{A}$ y $\phi$, sino los lazos de Wilson. Siempre podríamos eliminar ese $A_y$ simplemente redefiniendo el operador momento canónico $p_y$ para que el número entero $n$ quede absorbido por $\ell$.

La cuantización del flujo magnético

Para profundizar todavía más en el significado de los lazos de Wilson, compliquemos un poco el ejemplo anterior y hagamos que $A_y$, que es constante a lo largo de la dimensión compacta $Y$, varíe a medida que nos movemos en el eje $X$. En el caso más sencillo, esta variación es
$$
A_y=Bx
$$ Es inmediato ver que la constante de proporcionalidad entre $A_y$ y $x$ coincide con el valor del campo magnético en el eje $Z$, y este es el motivo por el que hemos denotado esta constante mediante la letra $B$.

Ahora lo que tenemos es una partícula cargada que se mueve en presencia de un campo magnético uniforme y constante en el eje $Z$. En este caso el cálculo del espectro de $\hat{H}$ da lugar a los denominados niveles de Landau.

Pero en lo que nos vamos a detener aquí es que el hecho de que los valores de $A_y$ sólo tengan significado físico salvo múltiplo de $\frac{2\pi \hbar n}{L_yq}$ nos permite hacer también que la dimensión $X$ sea compacta mediante la identificación $x\equiv x+ L_x$, de forma que lo que tenemos ahora es que el plano $XY$ es un 2-toro, y que este 2-toro está siendo atravesado por un flujo magnético de valor $BL_xL_y$.

Pero esto sólo lo podemos hacer de forma consistente si, cuando $x=L_x$, el potencial $A_y$ difiere de cero en $\frac{2\pi \hbar n}{L_yq}$. Como los potenciales $\vec{A}$ y $\phi$ nos dan la conexión del fibrado, una configuración de estos potenciales en un espaciotiempo arbitrario es una en la que podemos tener diferentes expresiones para $\vec{A}$ y $\phi$ en distintas regiones (abiertos), siempre que en la intersección de esas regiones esos potenciales difieran sólo en una transformación gauge. Es decir, estamos hablado de introducir un fibrado no trivial en el que las funciones de transición al dar la vuelta en el círculo $X$ son
$$
A_y(x=L_x)=A_y(x=0) + \frac{2\pi \hbar n}{L_yq}
$$ $$
w(x=L_x)=w(x=0)+2\pi n
$$ $$
\psi(x=L_x, y)=\psi(x=0, y)
$$
Como en este ejemplo tenemos que $A_y(x=L_x))=BL_x$ y que $A_y(x=0)=0$, la conclusión a la que llegamos es que la mecánica cuántica impide que pueda haber un flujo de campo magnético arbitrario atravesando el 2-toro. Los únicos valores permitidos del flujo son
$$
BL_xL_y=\frac{2\pi \hbar n}{q}
$$ donde recordamos que $n$ es un número entero.

Es importante señalar aquí que el motivo por el que el resto de valores del flujo de campo magnético no están permitidos en la naturaleza es porque darían lugar a un campo $\vec{A}$ que no estaría bien definido en todo el toro. Es decir, aunque una configuración concreta de los campos $\vec{E}$ y $\vec{B}$ satisfaga las ecuaciones de Maxwell, si no existen ninguna configuración de potenciales $\vec{A}$ y $\phi$ que la origine, esa configuración de $\vec{E}$ y $\vec{B}$ no puede darse en la naturaleza. Esto nos deja claro que no son los campos $\vec{E}$ y $\vec{B}$ los que caracterizan al campo electromagnético. El comportamiento mecanocuántico de las partículas cargadas que se mueven en su seno nos indica que son los lazos de Wilson (que, al contrario que $\vec{A}$ y $\phi$, sí son invariantes gauge) las magnitudes físicas que realmente caracterizan al campo electromagnéitco [Healey2001].

Cuantización de la carga eléctrica

Es interesante ver que podemos entender esta cuantización del flujo de campo magnético como una condición sobre las posibles cargas eléctricas que pueden existir. Dada una carga $q$, podemos definir el conjunto $S(q)$ de todos los flujos de campo magnético en los que esta carga se puede mover mecanocuánticamente de forma consistente. Se trata de todos los flujos que son múltiplos de $\frac{2\pi \hbar }{q}$. Si, además de $q$, existe otra carga de valor $q^\prime$ en la naturaleza, entonces los únicos flujos de campo magnético posibles son los que pertenecen a la intersección de los conjuntos $S(q)$ y $S(q^\prime)$. Es decir, los únicos flujos posibles son aquellos que son, a la vez, múltiplos de $\frac{2\pi \hbar }{q}$ y de $\frac{2\pi \hbar }{q^\prime}$. Esto implica que si el cociente $q/q^\prime$ es irracional, no habría ningún flujo de campo magnético consistente en el toro. Asumiendo que hay flujos consistentes, concluimos que las únicas cargas que pueden existir deben estar relacionadas entre ellas mediante números racionales. Reduciendo a común denominador, vemos que todas las cargas que existen en la naturaleza han de ser múltiplos de una carga fundamental, aunque esta carga fundamental podría no existir.

Vamos a llamar a esta carga fundamental $q_f$. Podemos identificar la acción del grupo U(1) sobre la función de onda de esta carga como el mismo grupo U(1) en abstracto. Así, el fibrado asociado a esta carga es lo que se denomina fibrado principal. El resto de cargas poseen funciones de onda que transforman de acuerdo a distintas representaciones de ese grupo U(1), representaciones que vienen especificadas por el valor del número entero $q/q_f$. De esta forma, cualquier flujo de campo magnético sobre el 2-toro que sea múltiplo de $\frac{2\pi \hbar }{q_f}$ también va a ser múltiplo de $\frac{2\pi \hbar }{q}$, con lo que va a ser posible describir mecanocuánticamente el movimiento de todas las cargas de forma consistente.

El motivo por el que las funciones de onda de las partículas con carga $q$ que es múltiplo de la carga fundamental $q_f$ transforman de acuerdo a representaciones del grupo gauge $U(1)$ es porque las transformaciones $$
\Lambda_q(\chi) = e^{\frac{i}{\hbar}q\chi}
$$ preservan la estructura del grupo U(1) $$
\Lambda_q(\chi_1)\Lambda_q(\chi_2)=\Lambda_q(\chi_1+\chi_2)
$$ pero sólo si cumplen la condición de periodicidad $$
\Lambda_q(\chi+2\pi\hbar/q_f)=\Lambda_q(\chi)
$$ y esto sólo ocurre si $q$ es múltiplo de $q_f$. Por tratarse de un grupo abeliano, el lema de Schur nos dice que todas las representaciones irreducibles tienen que ser como éstas, de dimensión compleja 1. La conclusión es que las representaciones $\Lambda_q(\chi)$, con $q$ múltiplo de $q_f$, son todas las representaciones irreducibles que hay del grupo U(1) del fibrado principal y se denotan por el número entero $q/q_f$, que se denomina peso (weight) de la representación.

Si el fibrado principal es no trivial, como en el caso que acabamos de ver del 2-toro, entonces todos los fibrados asociados a todas las cargas $q$ tampoco van a ser triviales, ya que tendrán funciones de transición que no son más que la representación $q/q_f$ de las funciones de transición del fibrado principal. Esto refleja el hecho de que el campo electromagnético, que viene dado por al conexión del fibrado principal a través de los lazos de Wilson, es único. Simplemente lo que tenemos son distintas cargas que, al pertenecer a distintas representaciones del grupo U(1), se mueven bajo la acción del mismo campo electromagnético.

La primera clase de Chern

Es interesante ver que la condición de cuantización del flujo que acabamos de obtener no depende de la conexión escogida, sino de la topología del fibrado no trivial escogido, ya que sólo depende de las funciones de transición del fibrado principal. En efecto, sea cual sea la conexión escogida, en el abierto compuesto por todo el círculo X menos $x=0$ el lazo de Wilson viene representado por una función $w(x)$, mientras que en el abierto compuesto por todo el círculo menos $x=L_x/2$ viene dado por la función $w^\prime(x^\prime)$. Estos dos abiertos intersecan en los dos abiertos $x\in (0,L_x/2)$ y $x\in (L_x/2,L_x)$. En el primero de ellos las funciones de transición son $$
w^\prime(x^\prime)=w^\prime(x+L_x/2)=w(x)
$$ En cambio, en el abierto $x\in (L_x/2,L_x)$ las funciones de transición son no triviales $$
w^\prime(x^\prime)=w^\prime(x-L_x/2)=w(x)+2 \pi n
$$

Por tanto, el flujo de campo magnético a lo largo de todo el 2-toro es $$
\int_{T^2} \vec{B} \cdot d\vec{S}=\int_{U_1} \vec{B} \cdot d\vec{S}+\int_{U_2} \vec{B}\cdot d\vec{S}
$$ donde $U_1$ es el abierto $x\in (L_x/2,L_x)$ y $U_2$ es el resto del 2-toro. La primera integral es igual, por el teorema de Stokes, a la cantidad $\hbar w^\prime/q_f$ evaluada en la frontera de $U_1$, mientras que la segunda integral es igual $\hbar w/q_f$ evaluada en esa misma frontera, pero con sentido inverso. Por tanto $$
\int_{T^2} \vec{B} \cdot d\vec{S}=(w^\prime-w)\hbar/q_f
$$ Y aquí se ve claro que esta diferencia depende sólo de las funciones de transición. En este caso $$
\int_{T^2} \vec{B} \cdot d\vec{S}=2 \pi \hbar n /q_f
$$
Es por ello que la cantidad $$
n=\frac{q_f}{2 \pi \hbar}\int_{T^2} \vec{B} \cdot d\vec{S}
$$
es un invariante topológico del fibrado escogido sobre el 2-toro. A este invariante topológico se le denomina primera clase de Chern del fibrado [Nakahara1990].

Análogamente, si en vez de un 2-toro tuvieramos una 2-esfera, entonces también necesitaríamos dos abiertos para definir al fibrado sobre esa 2-esfera. Por ejemplo, podemos coger un abierto $U^+$ que contenga a toda la esfera menos el polo sur y otro $U^-$ que contenga a toda la esfera menos el polo norte.

La conexión vendrá entonces especificada por las funciones $w^+(\theta)$ en $U^+$ y $w^-(\theta)$ en $U^-$ (siendo $\theta$ la latitud) y por la función de transición $$
w^+(\theta)=w^-(\theta)+2 \pi n
$$ en el entorno del ecuador, ya que, como hemos visto, las transformaciones gauge U(1) siempre cambian el valor de $w$ en un múltiplo de $2 \pi$. Si descomponemos la integral del campo magnético a lo largo de la superficie de toda la esfera como suma de las integrales sobre el hemisferio norte y sobre el hemisferio sur, y aplicamos el teorema de Stokes a cada hemisferio (utilizando para cada uno la expresión de $w$ que sí cubra la totalidad del hemisferio) vemos que se obtiene exactamente la misma condición de cuantización para el flujo magnético a lo largo de toda la 2-esfera que en el caso del 2-toro, y esto, de nuevo, independientemente de la conexión concreta escogida. Este resultado es general. No puede haber cualquier flujo de campo magnético a lo largo de una superficie bidimensional compacta y orientable. Éste tiene siempre que ser múltiplo de un flujo fundamental. La primera clase de Chern siempre es un número entero.

Pero, ¿cuál es el significado físico de este flujo fundamental? Para ello supongamos ahora que el interior de la esfera sí existe, es decir, que la 2-esfera que acabamos de considerar sería una superficie cerrada, una esfera real en nuestro espacio tridimensional. En ese caso ese flujo de campo magnético nos estaría diciendo que hay líneas de campo magnético que salen de la 2-esfera pero que no vuelven a entrar. Esto lo que quiere decir es que hay fuentes del campo magnético en el interior de la 2-esfera, es decir, que hay ¡monolopos magnéticos!

Monopolos magnéticos

En efecto, por analogía con la ley de Gauss para el campo eléctrico tendríamos $$
\oint \vec{B}\cdot d\vec{S}=q_m
$$
donde $q_m$ es la carga magnética que hay en el interior de la esfera. Igualando con la condición de cuantización del flujo se tiene
$$
q_mq=2 \pi \hbar n
$$
A esta relación se la conoce como condición de cuantización de Dirac. Esta condición lo que nos dice es que basta con que exista en la naturaleza un sólo monopolo magnético de carga magnética $q_m$ para que, por consistencia de la teoría cuántica, las cargas eléctricas en el universo tengan necesariamente que estar cuantizadas, tengan que ser múltiplos de $2 \pi \hbar /q_m$.

Pero, ¿es posible encontrar una solución de las ecuaciones del electromagnetismo que represente un monopolo magnético? La respuesta que encontró Dirac [Dirac1931], cuyo trabajo fue aclarado décadas más tarde por Wu y Yang [Wu1975], es que sí. Para construir el monopolo de Dirac basta con interpretar las coordenadas esféricas $\theta$ y $\varphi$ de la 2-esfera anterior como la parte angular de las coordenadas esféricas tridimensionales $(r, \theta, \varphi)$ y con poner una conexión en el fibrado U(1) sobre el espacio tridimensional dada, en cada abierto, por $$
A_\varphi^+=\frac{q_m}{4 \pi r \sin \theta} (+1 -\cos \theta)
$$ $$
A_\varphi^-=\frac{q_m}{4 \pi r \sin \theta} (-1 -\cos \theta)
$$
En la intersección de los abiertos $U^+$ y $U^-$ los dos potenciales magnéticos $\vec{A}^+$ y $\vec{A}^-$ están relacionados mediante la transformación gauge $$
\chi=q_m\frac{\varphi}{2 \pi}
$$
con lo que ambos dan lugar al mismo campo magnético $$
B_r=\frac{q_m}{4 \pi r^2}
$$

Es importante darse cuenta de que $A_\varphi^+$ no está bien definida en el complementario de $U^+$, que es la semirrecta $\theta=\pi$, que va desde el origen hasta $z \to- \infty$, denominada cuerda de Dirac. Sin embargo, esta cuerda de Dirac no tiene ningún significado físico, ya que en esa semirrecta debemos usar la función $A_\varphi^+$ para describir la conexión del fibrado. Análogamente, $A_\varphi^-$ no está bien definida en la cuerda de Dirac $\theta=0$, que va desde el origen hasta $z \to + \infty$, pero ahí hay que usar $A_\varphi^+$. Eso sí, el único punto el espacio tridimensional que estos abiertos no cubren es justamente el origen de coordenadas, que es donde está situado el monopolo magnético puntual. Es evidente que ahí no puede haber ningún potencial vector que describa el campo magnético, ya que ahí la divergencia de $\vec{B}$ no se anula, con lo que es imposible que $\vec{B}=\vec{\nabla} \times \vec{A}$.

Otra forma de entender este monopolo magnético puntual es considerarlo un solenoide infinitamente largo y estrecho con un extremo en $z \to- \infty$ y el otro en el origen de coordenadas, de tal forma que las líneas de campo magnético suben desde $-\infty$ a través de la cuerda de Dirac y luego salen radialmente desde el origen de coordenadas hacia todas las direcciones. Parece que esta configuración no es físicamente equivalente al monopolo, por el efecto Aharonov-Bohm que tendría el solenoide sobre las partículas cargadas. No obstante, el flujo del campo magnético que viajaría por el interior del solenoide, al ser de valor $q_m$, daría lugar a unos lazos de Wilson $w=qq_m/\hbar=2 \pi n$ que, al ser múltiplos de $2 \pi$, no serían observables. En cambio, lo lazos de Wilson a los que daría lugar al campo $\vec{B}$ que sale radialmente del origen, en las circunferencias definidas por $\theta$ constante (los paralelos de la esfera), sí son observables, ya que son $$
w^+=\frac{q_mq}{2 \hbar } (+1 -\cos \theta)
$$ $$
w^-=\frac{q_mq}{2\hbar } (-1 -\cos \theta)
$$
Como en la intersección $$
w^+=w^-+\frac{q_mq}{ \hbar }=w^-+2\pi n
$$
da igual que los describamos como $w^+$ o como $w^-$. Ambos tienen los mismos efectos físicos sobre las partículas cargadas.

La ventaja de utilizar la descripción del monopolo mediante la cuerda de Dirac como si fuera un solenoide es que en este caso no necesitamos el concepto de fibrado no trivial, ya que, fuera de la cuerda de Dirac, podemos trabajar con un potencial vector $\vec{A}$ bien definido en todas partes y con las ecuaciones de Maxwell ordinarias del electromagnetismo. En este escenario las transformaciones gauge cambian la orientación de la cuerda de Dirac. Esta fue la idea original de Dirac en 1931.

No obstante, aunque las conclusiones físicas son las mismas, desde el punto de vista matemático es mucho más elegante utilizar el formalismo de fibrados no triviales que introdujeron Wu y Yang en 1975, en el que, como hemos explicado, se evita la presencia de la cuerda de Dirac utilizando potenciales definidos sólo localmente y relacionados entre ellos mediante funciones de transición, que son transformaciones gauge, que implementan una topología no trivial en el fibrado U(1) sobre el espaciotiempo.

Vamos a detenernos en analizar lo que hemos aprendido. Por un lado, acabamos de ver que, al contrario de lo que ocurre en mecánica clásica, en mecánica cuántica ya no podemos caracterizar al campo electromagnético mediante los campos vectoriales $\vec{B}$ y $\vec{E}$, ya que hay valores de estos campos a los que no les corresponde ninguna configuración de los potenciales $\vec{A}$ y $\phi$, con lo que serían inconsistentes con que las partículas cargadas puedan moverse mecanocuánticamente a través de ellos, por ejemplo, los valores de $B$ en el 2-toro o en la 2-esfera que hacen que el flujo no sea múltiplo de $\frac{2\pi \hbar }{q_f}$. Esto hace que sea imposible que en el universo puedan convivir cargas eléctricas y magnéticos que no satisfagan la condición de cuantización de Dirac.

Por otro lado, hemos visto que configuraciones de $\vec{A}$ y $\phi$ que están relacionadas bajo una transformación gauge dan lugar a la misma física, con lo que físicamente describen al mismo campo electromagnético. Es decir, no son los potenciales $\vec{A}$ y $\phi$ los que caracterizan al campo electromagnético, sino los lazos de Wilson. Esto es lo mismo que decir que el campo electromagnético es el conjunto de las holonomías de la conexión en el fibrado principal U(1) sobre el espaciotiempo. Las transformaciones gauge no son más que transformaciones U(1) definidas en cada punto del espaciotiempo, con lo que son secciones del fibrado principal U(1). En lo que queda vamos a profundizar sobre el papel que juega este grupo de transformaciones U(1) en la estructura de la interacción electromagnética.

El principio gauge

La ecuación de Schrödinger de una partícula libre
$$
\frac{1}{2m}\hat{p}^2 |\psi\rangle=i\hbar\frac{d | \psi\rangle}{d t}
$$ es invariante bajo la transformación U(1)
$$
|\psi^\prime\rangle= \Lambda (\chi ) |\psi\rangle
$$ sólo si es global, es decir, si afecta por igual a todos los puntos espaciotemporales (sólo si $\chi$ es una constante). Podemos hacer esta transformación sin que cambien las predicciones físicas de la teoría, ya que lo que hace esta trasformación es cambiar por igual las fases de todas las amplitudes de probabilidad, y esto no afecta, ni a las probabilidades asociadas a esas amplitudes, ni a posibles efectos de interferencia entre esas amplitudes al hacer la suma de caminos de Feynman, ya que la interferencia depende de las diferencia de fase entre los caminos (de los lazos de Wilson), pero no de sus valores absolutos.

Si, en cambio, hacemos una transformación local, es decir, si $\chi$ es una función de la posición y del tiempo, entonces la ecuación de Schrödinger ya no se mantendría invariante. Al hacer la suma de caminos de Feynman tendríamos que la fase asociada a unos caminos que pasan por un sitio ha cambiado en un valor distinto a la fase asociada por otros caminos que pasan por otro sitio, lo que tendría consecuencias observables. Es decir, si la partícula no interacciona con el campo electromagnético (es decir, si no tiene carga), entonces no tenemos libertad de hacer una transformación gauge local.

Pero si la partícula está cargada, entonces la ecuación de Schrödinger queda
$$
[ \frac{1}{2m}(\hat{\vec{p}}-q\vec{A}(\hat{\vec{r}},t))^2 +q\phi(\hat{\vec{r}},t) ] |\psi\rangle=i\hbar\frac{d | \psi\rangle}{d t}
$$ En la representación de coordenadas esta sustitución es equivalente a cambiar las derivadas por derivadas covariantes
$$
-i\hbar \vec{D}=-i\hbar \vec{\nabla}-q\vec{A}
$$ $$
i\hbar D^0=i\hbar \frac{\partial}{\partial t}-q\phi
$$ y, dado que
$$
(i\hbar \frac{\partial}{\partial t}-q\phi^\prime)\hat{\Lambda}=\hat{\Lambda}(i\hbar \frac{\partial}{\partial t}-q\phi)
$$ $$
(-i\hbar \vec{\nabla}-q\vec{A}^\prime)\hat{\Lambda}=\hat{\Lambda}(-i\hbar \vec{\nabla}-q\vec{A})
$$ la ecuación de Schrödinger que se obtiene es covariante gauge. De hecho, cualquier ecuación de evolución para la función de onda que tenga derivadas temporales y espaciales se puede hacer covariante gauge si cambiamos las derivadas por derivadas covariantes.

Por tanto, si lo que queremos es obligar a la teoría a ser invariante bajo transformaciones U(1) locales de la función de onda (es decir, obligar a la función de onda a ser una sección de un fibrado vectoral U(1) de dimensión compleja 1), esto nos obliga a cambiar en las ecuaciones las derivadas espaciotemporales por las derivadas covariantes asociadas al fibrado princial U(1). Pero al hacer esto, la partícula ya no va a ser una partícula libre, sino que va a interaccionar con los campos $\vec{A}$ y $\phi$. Es decir, el modo en que la partícula interacciona con esos campos queda fijado una vez imponemos que la simetría U(1) sea local, en vez de global [Aitchison2012].

Esta es la base del denominado principio gauge. Podemos describir modelos en los que tengamos partículas cuya función de onda transforma bajo alguna representación de otros grupos continuos como SU(2) o SU(3) y, aplicando el principio gauge, ¡la interacción con unos nuevos campos, que generalizan al electromagnético, queda fijada! La interacción electromagnética no es más que el ejemplo más sencillo de interacción gauge. Tenemos unas interacciones distintas en función del grupo gauge escogido y, además, éstas quedan determinadas por éste. Este principio supuso durante la segunda mitad del siglo pasado una auténtica revolución en la física de partículas. La elección del grupo U(1)xSU(2)xSU(3) nos ha fijado todas las interacciones del exitoso modelo estándar de las partículas elementales (menos los Yukawas), y las teorías de gran unificación también se basan en este principio, utilizando grupos más grandes.

Conclusiones

El estudio de la mecánica cuántica de una partícula cargada que se mueve en el seno de un campo electromagnético nos ha enseñado que:

Dadas dos configuraciones distintas de potenciales electromagnéticos, $(\vec{A},\phi)$, y $(\vec{A}^\prime,\phi^\prime)$, que dan lugar a los mismos campos $\vec{B}$ y $\vec{E}$, pero que no están relacionadas entre ellas mediante transformaciones gauge, estas dos configuraciones deben considerarse como no equivalentes físicamente. Esto se debe a que dan lugar a lazos de Wilson distintos, que afectan a las interfencias entre caminos de forma diferente (efecto Bohm-Aaronov), hecho que afecta a las probabilidades mecanocuánticas de los distintos sucesos en los experimentos.
Dada una configuración de los campos $\vec{B}$ y $\vec{E}$ que satisface las ecuaciones de Maxwell, pero que es imposible construir mediante potenciales $\vec{A}$ y $\phi$ ni siquiera a trozos (con funciones de transición que sean transformaciones gauge y que den lugar a un fibrado no trivial), entonces esta configuración de $\vec{B}$ y $\vec{E}$ no puede existir en la naturaleza. Esto se debe a que no es posible que a través de estos campos se pueda mover mecanocuánticamente ninguna partícula cargada. Un ejemplo de estas configuraciones prohibidas en la naturaleza son los flujos de campo magnético (o los monopolos magnéticos) que no cumplan la condición de cuantización de Dirac.

Por tanto, podemos concluir que las magnitudes físicas fundamentales que caracterizan al campo electromagnético no son ni los campos $\vec{B}$ y $\vec{E}$, ni los potenciales $\vec{A}$ y $\phi$, sino los lazos de Wilson. Todo campo electromagnético está representado, por tanto, mediante los potenciales $\vec{A}$ y $\phi$ módulo transformación gauge, es decir, mediante las clases de equivalencia de los potenciales, donde dentro de cada clase de equivalencia están todas las configuraciones que están relacionadas entre ellas mediante una transformación gauge, es decir, todas las configuraciones que dan lugar a los mismos lazos de Wilson, siendo cualquier elemento de la clase un representante tan válido como otro cualquiera.

Las soluciones a las ecuaciones de Maxwell ya no son representativas de todas las posibles configuraciones de campo electromagnético que puedan existir, y esto abre las puertas a la posible existencia de monopolos magnéticos (siempre que se cumpla la condición de cuantización de Dirac), cuyo campo magnético asociado no es solución de las ecuaciones de Maxwell, debido a la singularidad en el mismo punto donde está el monopolo. De hecho, es posible encontrar soluciones suaves de tipo monopolo magnético que evitan esta singularidad si consideramos que el grupo U(1) del electromagnetismo es un subgrupo de un grupo semisimple más grande, por ejemplo, SU(N), si este grupo más grande está roto espontáneamente mediante un mecanismo de Higgs. El ejemplo más famoso es el monopolo de t'Hooft Polyakov, que es indistinguible de un monopolo de Dirac si estamos lo suficientemente lejos del centro. De hecho, tanto en las teorías de gran unificación como en teoría de cuerdas los monopolos magnéticos surgen de forma natural, aunque éstos podrían tener una masa tan alta que sería difícil detectarlos.

Todos los desarrollos de las últimas décadas nos han llevado a los físicos teóricos a estar bastante convencidos de que en la física de altas energías existen los monopolos magnéticos [Polchinski2004], aunque probablemente éstos tienen una masa muy superior a la de las partículas elementales que somos capaces de crear con los aceleradores actuales. Si existen los monopolos, entonces las cargas eléctricas deben estar cuantizadas. El hecho de que todas las cargas eléctricas de partículas elementales que conocemos sean múltiplos de una carga fundamental es también un indicio a favor de que los monopolos magnéticos existen.

La única posibilidad teórica de que no existan los monopolos es que el grupo U(1) del electromagnetismo está decompactificado (que la fibra del recubrimiento sea en realidad un círculo de radio infinito). La carga fundamental entonces tendería a cero, pero las partículas cargadas tendrían carga finita porque poseerían un número infinito de cuantos de la carga fundamental. No obstante, esto es imposible que ocurra si este grupo U(1) es un subgrupo de un grupo más grande, ya que todos estos grupos más grandes que se pueden usar en gran unificación son compactos.

La última lección que nos ha enseñado la mecánica cuántica sobre las transformaciones gauge es el principio gauge: la elección del grupo gauge nos fija las interacciones de las partículas, camino seguido por los físicos de partículas para desarrollar el modelo estándar y las teorías de gran unificación. Sin embargo, es importante señalar aquí que en las últimas décadas los físicos teóricos hemos cambiado un poco nuestro punto de vista sobre el principio gauge. En teoría de cuerdas las elección del grupo gauge, como ocurre con la elección de la topología del espaciotiempo, ya no es fundamental, sino que los grupos gauge se derivan de las propiedades geométricas de la compactificación. Muchas de estas compactificaciones en las que aparecen grupos gauge distintos en el fondo describen la misma física porque están relacionadas mediante dualidades, con lo que es posible pasar de una topología y de un grupo gauge concreto ¡a otra topología distinta con otro grupo gauge! Aunque suene sorprendente, no lo es tanto. El espaciotiempo no tiene por qué ser un ente primario de la naturaleza, y la invariancia gauge no es en realidad una simetría real, sino una redundancia en nuestra descripción de la naturaleza. Y creo que ya he escrito suficiente.

Sobre el autor: Sergio Montañez Naz es doctor en física y profesor de secundaria de la enseñanza pública en la Comunidad de Madrid.

Referencias bibliográficas

Aitchison I.J.R. and Hey A.J.G. (2012) Gauge Theories in Particle Physics: A Practical Introduction: From Relativistic Quantum Mechanics to QED, Fourth Edition, Volume 1. CRC Press, 2012. ISBN 1466512997, 978146651299.
Dirac P. (1931), "Quantised Singularities in the Electromagnetic Field". Proc. Roy. Soc. (London) A 133, 60 (1931).
Healey, Richard (2001) On the Reality of Gauge Potentials. [Preprint] URL: http://philsci-archive.pitt.edu/id/eprint/328 (accessed 2019-09-12).
Landau L.D. y Lifshitz E.M. (1992): Teoría Clásica de los Campos, Barcelona, Volumen 2 del Curso de Física Teórica (1992).
Nakahara N. (1990), Geometry, Topology and Physics.
Polchinski J., (2004) "Monopoles, duality, and string theory,'' Int. J. Mod.Phys. A 19S1 (2004) 145. doi:10.1142/S0217751X0401866X [hep-th/0304042].
Rosenfelder R. : “Path integrals for potential scattering,” Phys. Rev. A 79 (2009) 012701 [arXiv:0806.3217[nucl-th]].
Wu T.T. and Yang C.N. (1975) , Concept of non-integrable phase factors and global formulation of gauge fields, Phys. Rev. D 12 (1975) 3845. Wu T.T. and Yang C.N (1976), Dirac Monopole without Strings: Classical Lagrangian theory, Phys. Rev. D 14 (1976) 437.
Zwiebach B. (2009), A First Course in String Theory (Second Edition), Cambridge University Press, 2009

Páginas

15 sept 2019

Lo que la mecánica cuántica nos enseñó acerca de la invariancia gauge