4 dic 2019

¿Dónde se esconden las relaciones de indeterminación en la integral de camino de Feynman?


En las formulaciones de Heisenberg y de Schrödinger de la mecánica cuántica, los observables están representados por operadores hermíticos en el espacio de Hilbert de todos los posibles estados cuánticos. Sus autovalores son los posibles resultados al realizar la medición del observable, y sus autovectores son los estados cuánticos en los que ese observable toma un valor bien definido. Si llamamos $\hat{A}$ a uno de estos operadores, el estado cuántico $|\psi\rangle$ en el que se encuentra el sistema será, en general, una superposición de autoestados correspondientes a diferentes autovalores de $\hat{A}$, de tal manera que, en ese estado cuántico, el observable correspondiente a $\hat{A}$ no toma un valor bien definido. Es importante remarcar que lo que ocurre no es que el sistema cuántico sí tiene un valor de $\hat{A}$, pero que está oculto para nosotros. Lo que pasa en este caso es que, en ese estado cuántico, entre las propiedades del sistema no está el tomar un valor de $\hat{A}$ bien determinado.

Cualquier estudiante que esté en el ecuador de sus estudios universitarios de Física sabe que el grado de indeterminación del observable $\hat{A}$ en ese estado cuántico $|\psi\rangle$ se puede cuantificar como el módulo de un vector $|\psi_A\rangle$ $$
\Delta A = | |\psi_A\rangle | \>,
$$ donde $|\psi_A\rangle$ es un vector que se obtiene, a partir de $|\psi\rangle$, realizando la operación $$
|\psi_A\rangle= (\hat{A}-\langle A\rangle \hat{I})|\psi\rangle \>.
$$ Aquí $\hat{I}$ es el operador identidad, y$$
\langle A\rangle = \langle \psi | \hat{A} |\psi \rangle
$$ es el valor esperado de $\hat{A}$ en el estado $|\psi\rangle$. Es sencillo comprobar que, si realizamos muchas mediciones de $\hat{A}$, estando en todas ellas el sistema previamente en el estado $|\psi\rangle$, entonces $\Delta A$ coincide con la desviación típica de los resultados $$
\Delta A= \sqrt{\langle A^2\rangle-\langle A\rangle^2}
$$

La característica principal que tiene la mecánica cuántica, que la hace completamente diferente a la física anterior, es que los operadores que se utilizan para describir los observables físicos en general no conmutan. Si llamamos $\hat{B}$ a uno de los operadores que no conmuta con $\hat{A}$ $$
[\hat{A},\hat{B}]\neq 0
$$ entonces se puede ver que la desigualdad de Schwarz, aplicada a los estados $| \psi_A\rangle$ y $| \psi_B\rangle$, $$
\langle \psi_A | \psi_A \rangle \langle \psi_B | \psi_B \rangle \geq  | \langle \psi_A | \psi_B \rangle |^2 \geq (\operatorname{Im} \langle \psi_A | \psi_B \rangle )^2 \>,
$$ conduce a la relación de indeterminación $$
\Delta A \Delta B \geq \frac{1}{2} |\langle  \psi | [\hat{A},\hat{B}]   |\psi  \rangle|
$$
El significado físico de esta relación es que, si el conmutador es no nulo, es imposible encontrar algún estado cuántico en el que ambos observables estén bien determinados y, cuanto más determinado esté el observable $\hat{A}$ en un estado cuántico, más indeterminado estará $\hat{B}$ en ese estado, ya que el producto de las indeterminaciones no puede ser inferior a $\frac{1}{2} |\langle  \psi | [\hat{A},\hat{B}]   |\psi  \rangle|$. Por ejemplo, si tomamos $\hat{A}=\hat{x}$ y $\hat{B}=\hat{p}$, como el conmutador entre la coordenada $\hat{x}$ y su momento correspondiente $\hat{p}$ es $$
[\hat{x}, \hat{p}] = i\hbar \hat{I}
$$ lo que se obtiene es la famosa relación de indeterminación de Heisenberg $$
\Delta x \Delta p \geq \frac{\hbar}{2}
$$
Sin embargo, hay otra formulación de la mecánica cuántica, equivalente a la de Heisenberg y a la de Schrödinger, en la que los observables no entran como operadores en el espacio de Hilbert de estados cuánticos. Se trata de la formulación de la integral de camino de Feynman. Para una persona que no conozca esta formulación de la mecánica cuántica, puede ser conveniente estudiar qué ocurre en un caso sencillo, como el interferómetro de Mach-Zehnder, donde se produce interferencia entre dos caminos. Para saber si esta interferencia es constructiva o destructiva hay que estudiar la diferencia entre las fases asociadas a cada camino, teniendo cuidado de no equivocarnos en el cálculo de cada una de las fases. Con este ejemplo sencillo se puede ver con claridad que, para que las probabilidades de que el fotón llegue a los distintos detectores sumen uno, lo que hay que sumar de cada camino para calcular la interferencia no es la probabilidad, sino la amplitud de probabilidad.



Dado que los dos caminos en el interferómetro contribuyen al patrón de interferencias, tenemos que admitir que el fotón que es detectado por el detector en el que hay interferencia constructiva no ha seguido ninguno de los dos camino de forma bien definida: entre las propiedades del fotón no está el haber seguido una trayectoria bien determinada. Podemos colocar los detectores de otra manera, para comprobar si el fotón se refleja o no en el primer espejo semireflector, pero entonces el observable que antes sí tomaba un valor bien definido (el que decía que el fotón acabará con probabilidad 1 en el detector donde se producía interferencia constructiva), ahora ya no toma ningún valor bien definido. Tenemos así un ejemplo sencillo de dos observables incompatibles, como $\hat{A}$ y $\hat{B}$ en el ejemplo anterior.

De todo esto se deduce que, para poder calcular la amplitud de probabilidad de que el fotón llegue, desde la fuente $a$ hasta un detector $b$ que haya en el interferómetro de Mach-Zehnder, hay que sumar las amplitudes de probabilidad asociadas a cada camino. $$
\Phi(a,b)=\Phi_1+\Phi_2
$$
Pero, ¿qué ocurre si vamos modificando el experimento poco a poco para que cada vez sean más los caminos accesibles al fotón? En ese caso tenemos $$
\Phi(a, b) = \sum _{{\rm todos \>  los \>caminos \> desde} \> a \> {\rm hasta} \> b} \>
\Phi_i \>.
$$ Todos los caminos tienen que contribuir con una amplitud de probabilidad $\Phi_i$ del mismo módulo, pero con argumentos (fases) distintos, para que pueda haber interferencias. Como, además, estos $\Phi_i$ tienen que ser funcionales del camino $x(t)$, podemos escribir $$
\qquad \Phi(a, b) = \sum _{{\rm todos \>  los \>caminos \> desde} \> a \> {\rm hasta} \> b} \> e^{i S [x (t)] / \hbar} \>, \qquad
$$ donde $S[x(t)]$ es la fase asociada al camino $x(t)$, multiplicada por $\hbar$ para que tenga unidades de acción. Al tratarse de un continuo de caminos, este sumatorio tiene que ser, en realidad una especia de integral, $$
\Phi(a, b) = \int_{x(t_a)=x_a}^{x(t_b)=x_b} {\cal D}x(t) \> e^{i S[x(t)]/\hbar}\>,
$$ y este es el motivo por el que se le denomina integral de camino de Feynman.

Una de las ventajas que tiene la formulación de la integral de camino de Feynman es que en ella se ve con claridad por qué los números complejos son necesarios en mecánica cuántica. Es el hecho de que la fase asociada a cada camino sea el argumento de un número complejo lo que hace que pueda haber interferencias, ya que, al crecer ésta, la dirección a la que apunta ese número complejo va girando sin que por ello éste cambie de módulo.

Aquellos caminos cuyas amplitudes asociadas sean números complejos de argumento similar dan lugar a interferencia constructiva, de la misma manera que las fuerzas que se aplican sobre un objeto en una misma dirección colaboran para acelerar ese objeto en esa dirección.
En cambio, aquellos caminos cuyas amplitudes tengan argumentos que difieran en $\pi$ radianes darán contribuciones a la amplitud de probabilidad opuestas y se cancelarán, dando interferencia destructiva, de la misma manera que fuerzas del mismo módulo que se aplican en sentidos opuestos sobre un cuerpo no contribuyen a acelerarlo.

Otra de las ventajas de esta formulación es que con ella el límite clásico ($ \hbar \to 0 $) se puede hacer de forma inmediata, ya que, cuando las acciones de todos los caminos son mucho mayores que $\hbar$ ($ S \gg \hbar $), lo que tenemos son giros muy rápidos de los números complejos, incluso aunque correspondan a trayectorias muy parecidas. Se puede decir que cada camino da lugar a un número complejo del mismo módulo, pero de dirección aleatoria.
Al sumar todos estos números complejos que apuntan en todas direcciones se obtiene cero (interferencia destructiva al sumar todos esos caminos), salvo para aquellos caminos cuya fase sea estacionaria  $$
\delta S = 0 \>,
$$ ya que entonces los caminos cercanos a ellos tiene una fase muy parecida, con lo que no hay cancelación. Es decir, en este límite los únicos caminos que contribuyen son los que está muy cerca del camino que hace extrema a S. Vemos, por tanto, que en el límite clásico $S$ se comporta como la acción, y por eso la podemos identificar como la acción de la teoría clásica que surge como el límite $ \hbar \to 0 $ de la teoría cuántica con la que estamos trabajando. En este límite sí podemos decir que la partícula ha seguido una trayectoria más o menos bien definida: la que hace a la acción extremal.

Pero volviendo a las condiciones en las que las acciones no son mucho más grandes que $\hbar$, es decir, a las condiciones en las que los efectos cuánticos sí son importantes, nos surge la siguiente pregunta. Dado que la formulación de Feynman de la mecánica cuántica es equivalente a las de Heisenberg y Schrödinger, las relaciones de indeterminación tienen que estar escondidas en algún sitio. Una característica sorprendente de las integrales de camino es que con ellas se trabaja con números reales y complejos, en vez de con operadores que no conmutan. ¿Dónde están escondidas, por tanto, las relaciones de indeterminación en esta formulación? Eso es lo que vamos a analizar en este artículo.

6 nov 2019

El anumerismo de la verdadera derechita cobarde

Vamos a empezar una clase de 3° de ESO. Si escribimos la masa de la Tierra en kilogramos y en notación científica$$
5,972 × 10^{24}
$$¿cuál de todos estos números es el más importante? Para los lectores de este blog esta pregunta puede parecer demasiado básica, pero la realidad es que es muy fácil encontrar personas a las que esta pregunta les supone un reto. Si os encontráis en la tesitura de tener que explicarle la respuesta a alguna de estas personas o a algún estudiante de ESO, os recomiendo que deis una pista. Imaginad que todos los seres vivos de la Tierra se cambian de planeta. La masa de todos ellos, de nuevo en kilogramos, es de unos$$
5,5 × 10^{14}
$$¿Cuál sería la nueva masa del planeta Tierra? Para poder apreciar la diferencia te tienes que ir a 10 cifras significativas. El motivo es que estamos restando dos números de órdenes de magnitud, 24 y 14, muy distintos. $10^{24} - 10^{14}$ es prácticamente $10^{24}$.

Ahora pensad en el cuñado que en la cena de Nochebuena te cuenta que se ha comprado un BMW de alta gama por $10^5$ euros y que está muy contento porque le han dado un vale para que haga la primera recarga de gasolina gratis. ¿Alguien sería capaz de tomar la decisión de aceptar determinada oferta en un concesionario porque te regalan la primera recarga de gasolina? Una cosa es no entender bien el concepto de orden de magnitud, y otra que esta ignorancia te lleve a tomar decisiones irracionales con tu propio dinero. Si encontramos a alguien así, y no le tenemos demasiado aprecio, parece que este asunto es para tomárselo a cachondeo, ¿verdad?

La cosa ya no hace tanta gracia cuando escuchas en los medios de comunicación declaraciones de los políticos de ultraderecha como ésta:

30 oct 2019

Vídeo de la conferencia. "Agujeros Negros en Nuestros Superconductores". Prof. Daniel Areán

  Viernes 15 de Noviembre 2019
  19:30
  Residencia de Estudiantes del CSIC
 Organiza Instituto de Física Teórica UAM-CSIC
 Tipo de evento Conferencia de divulgación
 Título "Agujeros Negros en Nuestros Superconductores"
 Ponente Prof. Daniel Areán
 Institución Instituto de Física Teórica UAM-CSIC
 ¿Necesario confirmación? No
 Más información https://workshops.ift.uam-csic.es/horizonte/Programa


La Teoría de Cuerdas nos ha proporcionado una nueva herramienta para entender sistemas en la frontera de la física teórica: la Correspondencia Holográfica. Esta teoría quizá nos permita describir sistemas tan interesantes como los superconductores de alta temperatura en términos de ... agujeros negros!

Vídeo de la conferencia. "El origen de la materia oscura". Prof. Guillermo Ballesteros

  Viernes 15 de Noviembre 2019
  18.00
  Residencia de Estudiantes del CSIC
 Organiza Instituto de Física Teórica UAM-CSIC
 Tipo de evento Conferencia de divulgación
 Título "El origen de la materia oscura"
 Ponente Prof. Guillermo Ballesteros
 Institución Instituto de Física Teórica UAM-CSIC
 ¿Necesario confirmación? No
 Más información https://workshops.ift.uam-csic.es/horizonte/Programa


¿Qué es la materia oscura? La respuesta más breve y sencilla es que no lo sabemos. Sin embargo, sí que sabemos algunas cosas sobre ella; por ejemplo, que es unas seis veces más abundante en el Universo que la materia de la que estamos hechos nosotros. En esta charla hablaremos de cómo podemos desvelar las propiedades de esta materia (que tal vez deberíamos llamar "invisible") y de las ideas básicas existentes para explicar su origen.


29 oct 2019

Vídeo de la conferencia. "De los lápices a las antipartículas". Prof. Ángel Uranga

  Jueves 14 de Noviembre 2019
  19:30
  Residencia de Estudiantes del CSIC
 Organiza Instituto de Física Teórica UAM-CSIC
 Tipo de evento Conferencia de divulgación
 Título "De los lápices a las antipartículas".
 Ponente Prof. Ángel Uranga
 Institución Instituto de Física Teórica UAM-CSIC
 ¿Necesario confirmación? No
 Más información https://workshops.ift.uam-csic.es/horizonte/Programa


En esta charla realizaremos un viaje desde experiencias muy cotidianas como la imagen un lápiz distorsionada por la refracción de la luz hasta el mundo subatómico de las partículas y antipartículas, pasando por los extraños fenómenos en Mecánica Cuántica, como en el experimento de la doble rendija.

Vídeo de la conferencia. "¿Dónde y cómo buscar a la materia oscura?". Prof. Ángeles Moliné.

  Jueves 14 de Noviembre 2019
  18.00
  Residencia de Estudiantes del CSIC
 Organiza Instituto de Física Teórica UAM-CSIC
 Tipo de evento Conferencia de divulgación
 Título "¿Dónde y cómo buscar a la materia oscura?
 Ponente Prof. Ángeles Moliné.
 Institución Instituto de Física Teórica UAM-CSIC
 ¿Necesario confirmación? No
 Más información https://workshops.ift.uam-csic.es/horizonte/Programa


Una gran cantidad de evidencia sobre la existencia de la materia oscura se ha acumulado a partir de observaciones astrofísicas y cosmológicas. En las últimas décadas, un gran esfuerzo se ha centrado en la comprensión de su naturaleza así como en su detección. En esta charla, daré una breve descripción sobre cómo y dónde buscar esta misteriosa materia de nuestro universo.

28 oct 2019

Vídeo de la conferencia. "¿Es la gravedad una interacción fundamental?". Prof. Enrique Álvarez

  Viernes 8 de Noviembre 2019
  19:30
  Residencia de Estudiantes del CSIC
 Organiza Instituto de Física Teórica UAM-CSIC
 Tipo de evento Conferencia de divulgación
 Título ¿Es la gravedad una interacción fundamental?
 Ponente Prof. Enrique Álvarez
 Institución Instituto de Física Teórica UAM-CSIC
 ¿Necesario confirmación? No
 Más información https://workshops.ift.uam-csic.es/horizonte/Programa


Se discutirán los argumentos en favor de que la gravitación es una teoría emergente a distancias macroscópicas desde una teoría desconocida que determina la dinámica a distancias muy pequeñas.

Vídeo de la conferencia "Invisibles en el Cosmos....e Invisibles en la Ciencia". Prof. Olga Mena

  Viernes 8 de Noviembre 2019
  18.00
  Residencia de Estudiantes del CSIC
 Organiza Instituto de Física Teórica UAM-CSIC
 Tipo de evento Conferencia de divulgación
 Título "Invisibles en el Cosmos....e Invisibles en la Ciencia"
 Ponente Prof. Olga Mena 
 Institución (U. Valencia & IFIC)
 ¿Necesario confirmación? No
 Más información https://workshops.ift.uam-csic.es/horizonte/Programa


En esta charla aprenderemos sobre los "Invisibles" de nuestro Cosmos,
como la materia y energía oscuras, y cómo estudiar las huellas que han
dejado para que pasen a ser, no visibles, pero al menos, más
conocidos. ¡Es sólo así cómo podremos descifrar el futuro de nuestro
universo! "Invisible" ha sido el papel de ciertas astrónomas cuyo
legado científico también compartiremos.

27 oct 2019

Vídeo de la conferencia. "Lo grande y lo pequeño: ¿Hay realmente diferencia?". Prof. Antonio González-Arroyo

  Jueves 7 de Noviembre 2019
  19:30
  Residencia de Estudiantes del CSIC
 Organiza Instituto de Física Teórica UAM-CSIC
 Tipo de evento Conferencia de divulgación
 Título "Lo grande y lo pequeño: ¿Hay realmente diferencia?"
 Ponente Prof. Antonio González-Arroyo
 Institución Instituto de Física Teórica UAM-CSIC
 ¿Necesario confirmación? No
 Más información https://workshops.ift.uam-csic.es/horizonte/Programa


Un paseo poco convencional por el mundo de las escalas. ¿Qué significan a la luz de la fisica clasica, las matemáticas, y la física moderna? Eso nos permitirá descubrir su relevancia y sus misterios.

 

Conferencia. "Partículas fantásticas y dónde encontrarlas: Buscando al bosón de Higgs en el LHC" Prof. José Miguel No.

  Jueves 7 de Noviembre 2019
  18.00
  Residencia de Estudiantes del CSIC
 Organiza Instituto de Física Teórica UAM-CSIC
 Tipo de evento Conferencia de divulgación
 Título "Partículas fantásticas y dónde encontrarlas: Buscando al bosón de Higgs en el LHC"
 Ponente  Prof. José Miguel No
 Institución Instituto de Física Teórica UAM-CSIC
 ¿Necesario confirmación? No
 Más información https://workshops.ift.uam-csic.es/horizonte/Programa


El acelerador LHC (por Large Hadron Collider) del CERN es la mayor máquina construida por el ser humano, con el objeto de explorar las propiedades básicas de la naturaleza, la posible existencia de nuevas partículas y sus interacciones con las ya conocidas. En 2012, tras muchos años de búsqueda experimental, se descubrió el bosón de Higgs en el LHC, y ahora se estudian sus características. Os propongo un viaje (imaginario!) al LHC para entender como sabemos de la existencia del bosón de Higgs, y como se investiga la posibilidad de que existan otros “Higgses”.

23 oct 2019

"Divulgación científica" que confunde en The Conversation

The Conversation es una plataforma de divulgación en la que el contenido lo producen expertos vinculados a universidades y centros de investigación. Esta plataforma trabaja con medios de referencia que utilizan las publicaciones elaboradas por estos expertos como necesario complemento para las informaciones elaboradas por los periodistas. Está gestionada por The Conversation Media Group, que es una organización sin ánimo de lucro del sector de la educación que recibe dinero de gobiernos, universidades, centros de investigación y empresas privadas.

La sección española nació en 2018, y está dirigida por el periodista Rafael Sarralde (@rafasarralde). En su primer año de vida ha publicado más de 880 artículos que han superado los 10 millones de lecturas. Sale a una media de más de 10000 lecturas por artículo. He leído algunos de estos artículos y muchos son de calidad, aunque hay algunos bastante malos.

Hoy me he encontrado precisamente con uno que, además de no tener la calidad que debería caracterizar a este tipo de plataformas, considero que su lectura hace más mal que bien a los estudiantes universitarios y de bachillerato que todavía no dominan la física moderna. Se trata del artículo "La relatividad de Einstein también obliga a redefinir el concepto de masa" de Manuel D. Barriga-Carrasco, profesor del Área de Mecánica de Fluidos de la Escuela Técnica Superior de Ingenieros Industriales en la Universidad de Castilla-La Mancha, según esta misma plataforma.



El artículo, a pesar de ser corto, está plagado de párrafos que inducen a la confusión a los estudiantes, algunos de ellos rotundamente falsos. Voy a intentar explicar, punto por punto, por qué estos párrafos, que constituyen la mayor parte del artículo, no deberían formar parte de un artículo de divulgación científica.

20 oct 2019

El impacto de la relatividad en el pensamiento


1919 eclipse positive.jpg

En educación se denomina cambio conceptual al cambio de cosmovisión que experimentan los estudiantes cuando aprenden un nuevo contenido científico sobre algún fenómeno que echa por tierra las ideas previas que tenían sobre ese fenómeno. Un ejemplo sencillo lo tenemos cuando enseñamos a los alumnos que no se pueden separar los polos de un imán. Si partimos un imán en dos trozos, el resultado no es dos monopolos magnéticos separados, sino dos nuevos imanes, cada uno de ellos con su polo norte y su polo sur. Este hecho, que les parece "mágico" a los estudiantes cuando tienen una visión del imán como si fuera una especie de dipolo eléctrico, se vuelve natural cuando los estudiantes aprenden que las líneas de campo magnético son cerradas. El polo sur no es más que la parte del imán por donde entran las líneas. Si partimos el imán, hay una nueva zona por donde entran las líneas, con lo que podemos decir que se ha "creado" un nuevo polo sur. Y lo mismo podemos decir del nuevo polo norte, es una nueva zona por donde salen las líneas de campo. Una vez el estudiante ha experimentado ese cambio conceptual que le lleva a ver al imán como un conjunto de líneas de campo cerradas, las propiedades de éstos se entienden mucho mejor.
Magnetic dipole moment.jpg


Este cambio conceptual es algo que tienen que experimentar los alumnos por ellos mismos. Es un paso que no pueden dar los profesores por ellos. Este es el motivo por el que, en muchas de las metodologías constructivistas que los profesores ponemos en práctica en la escuela, la acción de los profesores pasa fundamentalmente por provocar en los alumnos conflictos cognitivos que les generen motivación intrínseca. Resolviendo esos conflictos cognitivos es como los estudiantes experimentan el cambio conceptual que les lleva a aprender ese nuevo contenido científico.

Como señalaron los historiadores de la ciencia A. Koyré y T. Kuhn, el mismo desarrollo histórico de loa ciencia está lleno de cambios conceptuales profundos que experimentaron los científicos. Se trata de las revoluciones científicas que, en la terminología kuhniana, implican cambios de paradigmas que redefinen de nuevo lo que se considera científico y lo que no.

Un ejemplo clásico lo podemos encontrar en el paso de la física aristotélica a la mecánica newtoniana. Para los aristotélicos, que creían que un cuerpo pesado se desplazaba, por su propia naturaleza, de una posición superior a una más baja hasta llegar a un estado de reposo natural, un cuerpo que se balanceaba simplemente estaba cayendo con dificultad. Desde este punto de vista, de los infinitos experimentos que se pueden hacer con un péndulo, a uno se le ocurre medir, por ejemplo, el tiempo que éste tarda en pararse. Dado que sabemos hoy que este tiempo depende del rozamiento que experimente el péndulo, difícilmente podemos obtener una ley física interesante de este dato. Galileo, por otra parte, al observar el cuerpo que se balanceaba, vio un movimiento periódico, un cuerpo que casi lograba repetir el mismo movimiento, una y otra vez. Este cambio conceptual hace que a uno se le ocurra medir el periodo del péndulo, que, sabemos hoy en día, está relacionado con la intensidad del campo gravitatorio en el lugar donde se encuentra el péndulo. Gracias a este nuevo punto de vista, Galileo observó también otras propiedades del péndulo y construyó muchas de las partes más importantes y revolucionarias de su nueva mecánica. Por tanto, es a Galileo a quien hay que atribuir el mérito de conseguir este original cambio de visión. Pero nótese que este mérito no se manifiesta en este caso como observación más exacta u objetiva del cuerpo que se balancea. En cuanto a la capacidad descriptiva se puede decir que la percepción aristotélica tenía la misma exactitud. El mérito de Galileo en este caso radica en ser capaz de mirar al péndulo como nadie lo había visto antes.

Sin embargo, estos cambios de paradigmas no son exactamente iguales a los cambios conceptuales que experimentan los estudiantes cuando aprenden ciencia. En primer lugar, en muchos casos la revolución científica ocurre muchas veces sin que muchos científicos e intelectuales experimenten el cambio conceptual. Un ejemplo clásico es el de los astrónomos geocentristas que murieron sin aceptar el uso del telescopio como instrumento útil para la astronomía, instrumento cuyo uso se acabó imponiendo porque los jóvenes abrazaron el uso de esta nueva tecnología. En segundo lugar, porque en el desarrollo real de la ciencia no hay siempre una figura clara de autoridad, como ocurre en el aula con el profesor, que orienta las actividades con el objetivo de llegar a ese cambio conceptual. Para que el nuevo paradigma triunfe entre la comunidad científica son necesarias fuertes discusiones científicas que duran varios años y nuevos datos experimentales que requieren tiempo. A su vez, para que este nuevo paradigma llegue al resto del mundo intelectual y al resto de los ciudadanos hace falta una divulgación científica de calidad que raramente se da.

En este artículo vamos a analizar cómo fue el cambio de paradigma de la física newtoniana a la física relativista, estudiando el impacto que tuvo sobre el pensamiento tanto el surgimiento de la Teoría Especial de la Relatividad (TER), en 1905, como la Teoría General de la Relatividad (TGR), en 1915. Sin embargo, para ello es importante dar primero algunas pinceladas sobre cómo fue el proceso de difusión de estas dos teorías, ya que éste condicionó las distintas opiniones y comentarios que sobre ellas se hicieron. Debido a la primera guerra mundial (1914-1918), la difusión de la relatividad especial, sobre todo entre los no-científicos, se vio retrasada, coincidiendo con la difusión de la relatividad general, de forma que las dos teorías se discutieron prácticamente al mismo tiempo.

23 sept 2019

TÉCNICAS EXPERIMENTALES: Ajuste por el método gráfico

Si sospechamos que las magnitudes físicas $x$ e $y$ está correlacionadas mediante la función $y=f(x)$, podemos representar en una gráfica el valor de $y$ que hemos medido para cada valor de $x$. ¿Cómo podemos saber si los puntos obtenidos en esa gráfica, con sus rectángulos de error, se ajustan a la curva que predice la ley $y=f(x)$?

17 sept 2019

La mayoría de la población no tiene motivos para idolatrar a los grandes científicos


Solvay conference 1927.jpg


El Proyecto de Genealogía de Matemáticas (Math Genealogy Project) es un proyecto muy ambicioso del Departamento de Matemáticas de la Universidad de Dakota del Norte, en colaboración con la American Mathematical Society, que pretende recopilar información sobre todos los científicos de todo el mundo y de todas las épocas que han recibido un doctorado en matemáticas.

Además del título de la tesis, la universidad y el año, uno de los datos más interesantes que se puede analizar en esta base de datos es quién dirigió la tesis a quién. Así, el proyecto permite construir el árbol genealógico de todos los matemáticos.

La idea de escribir este post me ha venido cuando me han regalado el póster con mi árbol genealógico:



Como indica la misma página del proyecto, es cierto que la relación entre el director de tesis y sus doctorandos no siempre ha sido tan formal como lo es ahora, pero este árbol sí nos da una idea de una cierta relación mentor/discípulo que nos permite trazar la historia intelectual de los proyectos de investigación en matemáticas.

Lo primero que llama la atención del póster es que entre los ancestros de Werner Heisenberg, el científico más brillante de todos los que desarrollaron la mecánica cuántica, podemos encontrar un porcentaje importante de los grandes físicos y matemáticos de la historia, desde Copérnico, Huygens y Leibniz, hasta Sommerfeld y Klein, pasando por Gauss, Pfaff, Dirichlet, Fourier, Poisson, Lagrange, Laplace, Euler, D'Alembert, Bernoulli entre muchos otros. Científicamente hablando, ¡todos son familia! ¿Es casualidad? Es evidente que no. Los avances en matemáticas no son tan dependientes de poder trabajar en una universidad con caros equipos de laboratorio, como ocurre en otras disciplinas más experimentales. Tiene que haber un motivo.

Un gran científico no le dirige la tesis a cualquiera, así que la primera hipótesis es que, de todos los candidatos, sólo a los mejores, a los que superan unas duras pruebas, se les permite formar parte de esa familia científica. Como sólo los mejores entran, está más o menos garantizado que la mayor parte de los grandes avances en matemáticas que se van a hacer van a ser realizados por miembros de esa familia.

15 sept 2019

TÉCNICAS EXPERIMENTALES: Medida múltiple y su aplicación al cálculo de errores.

Ya hemos visto que, cuando estamos realizando una medición de una magnitud física $x$ y el error aleatorio no es despreciable, lo que debemos hacer es tomar varias medidas y quedarnos con el valor medio de todas ellas. Pero, ¿qué incertidumbre experimental debemos asignarle a ese resultado?

Lo que la mecánica cuántica nos enseñó acerca de la invariancia gauge

De todas las interacciones de la naturaleza, la que se estudia en mayor detalle en la universidad en los denominados grados STEM (Ciencia, Tecnología, Ingeniería y Matemáticas) es la electromagnética. Todos los estudiantes que entran en estos grados saben ya desde Bachillerato que sobre toda partícula con carga $q$ y velocidad $\vec{v}$ sometida a un campo electromagnético se ejerce siempre una fuerza (denominada fuerza de Lorentz) de valor $$
\vec{F}=q\vec{E}+q\vec{v}\times \vec{B}
$$ donde $\vec{E}$ es valor del campo eléctrico en el punto donde está situada la partícula y $\vec{B}$ el campo magnético. Esto implica que, en el caso de que la partícula sea no relativista, la ecuación diferencial que describe su movimiento es, si la fuerza de Lorentz es la única que actúa:
$$
m\vec{a}=q\vec{E}+q\vec{v}\times \vec{B}
$$ donde $m$ es la masa de la partícula y $\vec{a}$ es su aceleración.

Por otro lado, ya en la universidad los estudiantes aprenden que esta ecuación de movimiento se puede obtener imponiendo que el camino que tiene que seguir la partícula entre los puntos espaciotemporales $(t_i, \vec{r}_i)$ y $(t_f, \vec{r}_f)$ sea aquel que minimiza la acción
$$
S=\int \left(  \frac{1}{2} m v^2 -q\phi \right)dt+  q\int \vec{A}\cdot d\vec{r} =
$$ $$
=\int \left(  \frac{1}{2} m v^2 -q\phi +q\vec{A}\cdot\vec{v}\right)dt
$$ (donde las integrales se realizan entre esos dos puntos espaciotiemporales) siempre que identifiquemos a $\vec{E}$ y $\vec{B}$ con
$$
\vec{E}=-\vec{\nabla} \phi - \frac{\partial \vec{A}}{\partial t}
$$ $$
\vec{B}=\vec{\nabla} \times \vec{A}
$$ Aquí $\phi$ es el potencial eléctrico y $\vec{A}$ es el potencial vector magnético.

Sin embargo, aunque aparecen en la acción, en mecánica clásica tanto $\phi$ como $\vec{A}$ no representan entes reales, no tienen ningún significado físico. Son simplemente campos auxiliares matemáticos que se introducen por pura utilidad para poder calcular mejor los campos $\vec{E}$ y $\vec{B}$. Estos últimos sí tienen significado físico, ya que ejercen fuerzas que podemos medir sobre las partículas cargadas.

Dada una configuración concreta de $\phi$ y $\vec{A}$, si hacemos la transformación (denominada transformación gauge)
$$
\phi^\prime=\phi - \frac{\partial \chi}{\partial t}
$$ $$
\vec{A}^\prime=\vec{A} + \vec{\nabla} \chi
$$ (donde $\chi$ es una función diferenciable arbitraria de $\vec{r}$ y $t$) los campos $\vec{E}$ y $\vec{B}$ se mantienen invariantes y la acción $S$ de la partícula cargada sólo cambia en la cantidad $q(\chi_f-\chi_i)$, que es una constante que no afecta a las ecuaciones de movimiento. Además, las ecuaciones de Maxwell son invariantes bajo una transformación gauge, ya que en ellas parecen $\vec{E}$ y $\vec{B}$, y no los potenciales $\vec{A}$ y $\phi$. Es decir, la nueva configuración que se obtiene al hacer una transformación gauge describe exactamente la misma física que la configuración inicial, con los mismos campos $\vec{E}$ y $\vec{B}$ evolucionando igual y ejerciendo la misma fuerza sobre las partículas cargadas. A esta invariancia que tiene la teoría del campo electromagnético se la denomina invariacia gauge [Landau1992].

Algunas configuraciones gauge son más convenientes que otras para realizar ciertos cálculos, pero es muy importante tener esta invariancia gauge presente para distinguir las cosas que ocurren físicamente en la realidad de lo que son simplemente elementos matemáticos sin existencia física que nos ayudan a hacer los cálculos. La realidad no es lo que los matemáticos y los físicos escribimos en nuestros papeles, y los procesos físicos no son los pasos que realizamos cuando hacemos cálculos. En la teoría clásica del electromagnetismo lo que existe en realidad son los campos $\vec{E}$ y $\vec{B}$ y las partículas cargadas que interaccionan con ellos. Los valores concretos de $\vec{A}$ y $\phi$ no tienen existencia real. Esto lo sabe cualquier estudiante de los grados STEM cuando asigna arbitrariamente el valor de $\phi$ igual a cero voltios al punto que quiere a la hora de resolver los problemas de electrostática. En estos problemas sólo las diferencias de potencial eléctrico entre distintos puntos tienen significado físico, pero no su valor concreto, ya que estas diferencias son las que determinan el campo eléctrico $\vec{E}$.

Sin embargo, el universo en el que vivimos no es clásico. Es cuántico. ¿Siguen siendo en mecánica cuántica las leyes de la física invariantes ante una transformación gauge? ¿Siguen siendo los campos $\vec{E}$ y $\vec{B}$ los que tienen significado físico frente a $\vec{A}$ y $\phi$? Para entender en su totalidad qué ocurre con la invariancia gauge en mecánica cuántica habría que irse al formalismo de la teoría cuántica de campos. Sin embargo, muchas de las ideas cruciales ya se pueden discutir en el contexto de una partícula cuántica no relativista que interacciona con un campo electromagnético clásico. Y eso es lo que vamos a hacer en el presente artículo.



La ecuación de Schrödinger y la integral de camino de la partícula cargada


En mecánica cuántica las probabilidades de cada posible resultado a la hora de realizar una medición se calculan mediante el módulo al cuadrado de la amplitud de probabilidad asociada a ese suceso. Esta amplitud de probabilidad se puede calcular mediante una integral de camino de Feynman. Por ejemplo, en el cálculo de la amplitud de probabilidad de que una partícula situada en $\vec{r}_i$ en el instante $t_i$ acabe en el punto $\vec{r}_f$ en un instante posterior $t_f$, hay que sumar las amplitudes de probabilidad asociadas a cada camino posible, siendo cada una de éstas un número complejo de módulo 1 y cuya fase viene dada por la acción $S$ dividida entre $\hbar$:
$$
U(\vec{r}_f , t_f ; \vec{r}_i, t_i)=\langle \vec{r}_f | \hat{U}(t_f-t_i) | \vec{r}_i \rangle = \int D\vec{r}(t) e^{i\frac{S}{\hbar}}
$$ donde $\hat{U}$ es el operador unitario de evolución del estado de la partícula. A la función $U(\vec{r}_f , t_f ; \vec{r}_i, t_i)$ se la denomina propagador de la partícula cargada en el espacio de posición.

Ya hemos visto que el lagrangiano de la partícula cargada incluye, además del término de la energía cinética, el término de interacción con el campo electromagnético, y que éste no sólo depende de la posición de la partícula, sino también de su velocidad. Esto nos da lugar a una ambigüedad en cuanto a cómo ordenar los productos de operadores posición y velocidad, ya que en mecánica cuántica la posición $\hat{\vec{r}}$ y la velocidad $\hat{\vec{v}}$ de una partícula no conmutan. Como hemos explicado en otro post, este problema de ordenamiento queda oculto en la notación simplificada de la integral de camino que acabamos de utilizar. Como se trata de una cuestión técnica que no afecta a lo que vamos a discutir aquí, remitimos al lector a este otro post, donde se demuestra que el orden en el término de interacción $q\vec{A}(\vec{r})\cdot \vec{v}$ que se tiene que establecer en la integral de camino de Feynman es el correspondiente a la regla del punto medio [Rosenfelder2009]. Al hacer esto la evolución temporal que se obtiene para la partícula cargada es equivalente a la que genera el hamiltoniano $$
\hat{H}=
\frac{1}{2m} \left( \frac{\hbar}{i} \nabla
- q \vec{A}(\vec{r}) \right)^2  + q\phi(\vec{r}),
$$ Este hamiltoniano no es más que el resultado de realizar la sustitución minimal en el hamiltoniano de la partícula libre del operador momento $\hat{\vec{p}}$ por el operador $$
\hat{\vec{p}}_F=\hat{\vec{p}}-q\vec{A}(\hat{\vec{r}})
$$ (añadiendo también el sumando correspondiente a la energía potencial eléctrica). La correspondiente ecuación de Schrödinger que se obtiene en la representación de coordenadas es $$
i \hbar \, \frac{\partial \psi(\vec{r},t)}{\partial t} = \left[ - \frac{\hbar^2}{2 m} \Delta +
q\phi(\vec{r})
+ \frac{i \hbar q}{m }
\vec{A}(\vec{r}) \cdot \nabla + \frac{i \hbar q}{2m c} \, \left( \nabla \cdot \vec{A}(\vec{r})\right) +
\frac{q^2}{2 m } \vec{A}^2(\vec{r}) \right] \, \psi(\vec{r},t)
$$

Covariancia gauge


Aquí es donde nos damos cuenta de que en mecánica cuántica ocurre algo distinto con la invariancia gauge que en mecánica clásica. La acción $S$ no depende de los campos $\vec{E}$ y $\vec{B}$, que son los que clásicamente tienen sentido físico, sino de los potenciales $\vec{A}$ y $\phi$. Esto hace que estos potenciales también aparezcan en la ecuación de Schrödinger, que nos dice cómo evoluciona con el tiempo la función de onda de la partícula cargada. Al contrario de lo que le ocurre a las ecuaciones de Maxwell, la ecuación de Schrödinger no es invariante gauge. Es decir, el operador unitario de evolución $\hat{U}$ depende de los potenciales electromagnéticos. Si estos potenciales tomaran un valor distinto, entonces la amplitud de probabilidad de que la partícula acabe en el punto $\vec{r}_f$ sería distinta, la función de onda de la partícula evolucionaría de forma distinta, con lo que podríamos detectar experimentalmente este cambio en los potenciales. ¿Significa eso que, al contrario de lo que ocurre en mecánica clásica, en mecánica cuántica los potenciales electromagnéticos sí tienen sentido físico? Vamos a verlo en detalle.

Como al realizar una transformación gauge la acción cambia de la forma
$$
S^\prime=S+q(\chi_f-\chi_i)
$$ la amplitud de probabilidad de que la partícula vaya desde $\vec{r}_i$ hasta $\vec{r}_f$ cambia en un factor de fase, de tal forma que el operador unitario de evolución cambia de la forma
$$
\hat{U}^\prime(t_f-t_i)= e^{\frac{i}{\hbar}q\chi(\hat{\vec{r}}_f, t_f)}\hat{U}(t_f-t_i) e^{-\frac{i}{\hbar}q\chi(\hat{\vec{r}}_i, t_i)}
$$ Esto hace que, si redefinimos el estado inicial como
$$
|\psi^\prime(t_i)\rangle=   e^{\frac{i}{\hbar}q\chi(\hat{\vec{r}}_i, t_i)} |\psi(t_i)\rangle
$$ entonces el nuevo operador evolución $\hat{U}^\prime$ convierte este estado inicial en el estado final
$$
|\psi^\prime(t_f)\rangle=   e^{\frac{i}{\hbar}q\chi(\hat{\vec{r}}_f, t_f)} |\psi(t_f)\rangle
$$
Nos damos cuenta así de que en cualquier instante de tiempo el estado cuántico de la partícula ante una transformación gauge sufre una transformación unitaria
$$
|\psi^\prime(t_f)\rangle=   \Lambda (\chi(\hat{\vec{r}},t_f)) |\psi(t_f)\rangle
$$ donde
$$
\Lambda (\chi(\hat{\vec{r}},t))=e^{\frac{i}{\hbar}q\chi(\hat{\vec{r}}, t_f)}
$$
La conclusión es que, al hacer una transformación gauge, la evolución temporal de la función de onda de la partícula cargada va a ser distinta, pero acaba teniendo exactamente la misma forma funcional que antes de la transformación si hacemos, simultáneamente a la transformación gauge, un cambio de fase en la función de onda: $$
\phi^\prime=\phi - \frac{\partial \chi}{\partial t}
$$ $$
\vec{A}^\prime=\vec{A} + \vec{\nabla} \chi
$$ $$
\psi^\prime(\vec{r},t)=   e^{\frac{i}{\hbar}q\chi(\hat{\vec{r}}, t)} \psi(\vec{r},t)
$$ Es decir, la invariacia gauge de las ecuaciones del electromagnetismo clásico emerge de nuevo en mecánica cuántica sólo si, simultáneamente con la transformación de los potenciales $\vec{A}$ y $\phi$, transformamos también la función de onda mediante un factor de fase. Nótese que, al tratarse de un factor de fase que no afecta al módulo de la función de onda, la probabilidad de encontrar a la partícula en un $\vec{r}$ y un $t$ concretos no depende de la elección del gauge.

En matemáticas, al conjunto de todos los despazamientos de la fase de un número complejo se le denomina grupo U(1). Es el grupo de rotaciones del plano complejo en torno al origen.
En este caso tenemos una transformación U(1) distinta en cada punto del espaciotiempo, y este es el motivo por el que esta transformación gauge U(1) se dice que no es global, sino local. Al contrario que el grupo global U(1), que tiene dimensión real 1, el grupo gauge U(1) tiene infinitas dimensiones, ya que está formado por todas las funciones $$
\Lambda=e^{\frac{i}{\hbar}q\chi}
$$ con dominio en todo el espacio-tiempo y que toman valores en la circunferencia unidad (la operación del grupo aquí es simplemente la multiplicación de estas funciones $\Lambda$). Las funciones $\chi$, que los físicos denominamos generadores de la transformación gauge, son matemáticamente los vectores (en este caso de una dimensión real) del álgebra de Lie asociada al grupo gauge U(1) solo que en este caso, por tratarse de un grupo abeliano, los corchetes de Lie son nulos. Nótese también que esta acción del grupo gauge U(1) sobre la función de onda no se corresponde con la acción de ningún grupo actuando sobre el espacio de fases de coordenadas y momentos de la partícula. No tiene, por tanto, interpretación clásica.

Por todo esto, no podemos decir que la mecánica cuántica de una partícula cargada sometida a un campo electromagnético sea invariante gauge. No lo es. Lo que sí se puede decir es que es covariante, es decir, que las ecuaciones en esta teoría, por ejemplo, la ecuación de Schrödinger, que nos dice cómo es la evolución temporal de la función de onda, tienen exactamente la misma forma tras una transformación gauge que las ecuaciones originales pero con todos los elementos (función de onda y potenciales electromagnéticos) con primas. $$
i \hbar \, \frac{\partial \psi^\prime(\vec{r},t)}{\partial t} = \left[ - \frac{\hbar^2}{2 m} \Delta +
q\phi^\prime(\vec{r})
+ \frac{i \hbar q}{m }
\vec{A}^\prime(\vec{r}) \cdot \nabla + \frac{i \hbar q}{2m c} \, \left( \nabla \cdot \vec{A}^\prime(\vec{r})\right) +
\frac{q^2}{2 m } \vec{A}^{\prime 2}(\vec{r}) \right] \, \psi^\prime(\vec{r},t)
$$ Todos estos elementos cambian coordinados para dar las mismas predicciones físicas. ¿Verdad?


Observables físicos


Aunque la probabilidad de encontrar a la partícula en un punto $\vec{r}$ concreto no depende del gauge, es fácil comprobar que la probabilidad asociada a otros observables, distintos de $\hat{\vec{r}}$, sí puede depender del gauge.

Por ejemplo, el momento canónico en la dirección X, que se denota mediante $\hat{p}_x$ (el que cumple con la relaciones de conmutación $[\hat{x}_i, \hat{p}_j]=i\hbar \delta_{ij} $ y $[\hat{p}_i, \hat{p}_j]=0$) tiene autoestados $|p_x\rangle$ con autovalor $p_x$. Ya sabemos que esto significa que en los estados $|p_x\rangle$ el observable $\hat{p}_x$ toma un valor bien definido $p_x$. Este operador es invariante ante una trasformación gauge. Sin embargo, tras una trasformación gauge, los estados $|p_x\rangle^\prime=\hat{\Lambda}|p_x\rangle$ ya no son autovectores de $\hat{p}_x$. En efecto:
$$
\hat{p}_x|p_x\rangle^\prime=\hat{p}_x\hat{\Lambda}|p_x\rangle \neq p_x |p_x\rangle^\prime
$$ ya que $\hat{p}_x$ no conmuta con $\hat{\Lambda}$, al ser $\hat{\Lambda}$ función de $\hat{x}$. Es decir, los estados transformados bajo una transformación gauge $|\vec{p_x}\rangle^\prime$ son estados en los que el momento canónico ya no toma un valor bien definido.

La única forma de que la teoría tenga las mismas predicciones físicas tras una transformación gauge es asumir que no todos los operadores hermíticos que podemos construir son realmente observables físicos que se pueden medir. La condición que debe cumplir un operador hermítico para representar un observable físico de la teoría es que al conmutar con el operador $\hat{\Lambda}$ el operador tenga la misma dependencia funcional de los potenciales $\vec{A}$ y $\vec{\phi}$, pero cambiando éstos por $\vec{A}^\prime$ y $\vec{\phi}^\prime$. Sin embargo $\hat{p_x}$ no cumple esa condición. Por ello $\hat{p_x}$ no representa ningún observable físico.

¿A qué se debe esto? Ya en mecánica clásica sabíamos que el momento canónico de una partícula cargada sometida a un campo electromagnético no coincide con el momento físico $\vec{p}_F$ (el que es igual a $m\vec{v}$). La relación entre estos dos momentos lineales
$$
\vec{p}=m\vec{v}+q\vec{A}
$$ se traduce en mecánica cuántica en la relación entre los operadores
$$
\hat{\vec{p}}=\hat{\vec{p}}_F+q\vec{A}(\hat{\vec{r}},t)
$$ A partir de las relaciones de conmutación $[\hat{x}_i, \hat{p}_j]=i\hbar\delta{ij}$ es fácil comprobar que $$
(\hat{\vec{p}}-q\hat{\vec{A}}^\prime ) \hat{\Lambda} =  \hat{\Lambda} ( \hat{\vec{p}}-q\hat{\vec{A}} )
$$ de donde se ve que $\hat{\vec{p}}_F=\hat{\vec{p}}-q\vec{A}(\hat{\vec{r}},t)$ sí es un observable físico. Además, se puede probar fácilmente que en la imagen de Heisenberg el operador que es igual a la derivada del operador $\hat{\vec{r}}$ respecto del tiempo no es $\hat{\vec{p}}/m$, sino $\hat{\vec{p}}_F/m$.


¿Qué tipo de objeto matemático es la función de onda de una partícula cargada?


Nos encontramos así con que los elementos matemáticos necesarios para describir la mecánica cuántica de una partícula sometida a un campo electromagnético tienen que sofisticarse respecto a los que se usaban en mecánica cuántica sin campos electromagnéticos. En la representación de coordenadas la función de onda ya no es simplemente un número complejo asociado a cada punto del espaciotiempo. Al cambiar mediante una trasformación gauge con un factor de fase, la función de onda tiene que ser ahora lo que los matemáticos denominan una sección de un recubrimiento fibrado vectorial U(1) de dimensión compleja 1 sobre el espaciotiempo. Este fibrado vectorial se construye asociando un espacio vectorial de dimensión compleja 1 a cada punto del espaciotiempo de forma que estos espacios vectoriales varíen suavemente a medida que nos movemos por el espaciotiempo. Para ello, lo que se hace es realizar una asignación distinta en cada abierto, y dar una serie de funciones de transición que nos dicen cómo están relacionados los distintos espacios vectoriales en las intersecciones de estos abiertos. Estas funciones de transición son transformaciones gauge U(1) en este caso.

Por ejemplo, en el espaciotiempo de Minkowski, de topología trivial, nos basta con sólo un abierto, pero podemos tener distintas formas de asignar el espacio vectorial a cada punto de ese abierto. Si tomamos como funciones de transición entre esas distintas formas las transformaciones U(1) $\psi^\prime=\Lambda \psi$, entonces tenemos un fibrado vectorial U(1) sobre el espacio de Minkoswki. Se trata de una extensión del espaciotiempo en la que a cada punto del espaciotiempo le asociamos un número complejo al que podemos someter a las transformaciones U(1) que queramos (al que podemos cambiar su fase). Una especificación de qué número complejo concreto debe cogerse en cada punto del espaciotiempo es lo que se denomina una sección de ese fibrado, y eso es lo que es en realidad la función de onda de la partícula cargada. El operador unitario $\hat{\Lambda}$ no es más que la representación de la acción del grupo gauge U(1) sobre ese número complejo, es decir, sobre la función de onda en ese punto espaciotemporal.

De la misma manera que en la representación de coordenadas el operador $\hat{\vec{p}}$ actúa como el operador gradiente $-i\hbar \vec{\nabla}$, cuyas componentes son derivadas parciales, el operador momento físico $\hat{\vec{p}}_F$ actúa como el operador gradiente que se construye a partir de derivadas covariantes, en vez de parciales:
$$
-i\hbar \vec{D}=-i\hbar \vec{\nabla}-q\vec{A}
$$ Estas derivadas covariantes nos permiten comparar los valores de la función de onda en distintos puntos espaciotemporales. Se dice entonces que $\vec{A}$ nos da una conexión para el fibrado. Como veremos más adelante, $\phi$ nos da la parte temporal de esa conexión.

Toda conexión en un fibrado nos permite transportar paralelamente a sí mismo un vector de la fibra a medida que nos movemos por el espaciotiempo. Sin embargo, para poder hacer esto de forma global por todo el espaciotiempo es necesario que este transporte paralelo entre dos puntos del espaciotiempo no dependa del camino seguido para ir del primer punto al segundo. En los casos en los que sí hay dependencia del camino se dice que la conexión tiene curvatura.

Los potenciales electromagnéticos nos dan una conexión para el fibrado vectorial U(1). ¿Tiene curvatura esta conexión? ¿Obtenemos el mismo resultado cuando trasladamos paralelamente la función de onda si primero avanzamos en el ele X y luego en el Y, que si lo hacemos primero en el Y y luego en el X? Son los operadores momento los que generan en mecánica cuántica las traslaciones espaciales. Y resulta que, aunque los momentos canónicos $\hat{p}_x$ y $\hat{p}_y$ conmutan entre ellos, los momentos físicos $\hat{p}_{Fx}$ y $\hat{p}_{Fy}$ no conmutan entre ellos. Esto se debe a que las componentes de $\hat{\vec{p}}_F$ dependen de las coordenadas a través de su dependencia en $\vec{A}$, con lo que el conmutador entre estas componentes va a depender de las derivadas de $\vec{A}$. En concreto:
$$
[\hat{p}_{Fx}, \hat{p}_{Fy}]=i\hbar q \hat{B}_z $$
Llegamos así al sorprendente resultado de que, cuando hay campo magnético en el eje Z, las traslaciones en el eje $X$, realizadas con derivadas covariantes, no conmutan con las traslaciones en el eje $Y$. Cuando el campo magnético en el eje Z no es nulo la conexión del fibrado tiene curvatura, lo que quiere decir físicamente que ¡las componentes $X$ y $Y$ del momento físico no pueden tomar valores bien definidos simultáneamente!


El efecto Aharonov-Bohm


Esto es algo que podemos entender mejor con la integral de camino de Feynman. El campo $\vec{A}$ es responsable de que cada una de las amplitudes asociada a cada camino adquiera una fase distinta
$$
\frac{1}{\hbar}q\int \vec{A}\cdot d\vec{r}
$$ de tal manera que la diferencia de fase entre las amplitudes asociadas a dos caminos concretos es la integral de camino a lo largo de un camino cerrado $C$ que recorre el primer camino y luego en sentido contrario el segundo camino
$$
\frac{1}{\hbar}q\oint_C \vec{A}\cdot d\vec{r}=\frac{1}{\hbar}q\int_S \vec{B}\cdot d\vec{S}
$$ donde la segunda integral es una integral de superficie a lo largo de una superficie $S$ cuya frontera es el contorno cerrado $C$. Es decir, la diferencia de fase entre las amplitudes de probabilidad asociadas a dos caminos distintos depende del flujo de campo magnético a lo largo de la superficie encerrada entre esos dos caminos.

Vemos por tanto que la presencia del campo magnético tiene efectos observables sobre los patrones de interferencia entre estos dos caminos, a no ser que dé la casualidad de que esta diferencia de fases sea un múltiplo de $2\pi$. La conclusión es que todo flujo de campo magnético a lo largo de una superficie va a tener consecuencias observables sobre la interferencia entre los dos caminos que limitan a la superficie. A este efecto se le conoce como efecto Aharonov-Bohm.

Lo más llamativo es que este efecto ocurre incluso en el caso en el que el que el flujo de campo magnético esté confinado dentro de una pequeña región de la superficie $S$ muy alejada de su borde $C$. Por ejemplo, el campo magnético podría estar confinado en el interior de un solenoide largo y estrecho, como indica la figura:
Incluso en aquellos casos en los que la amplitud de probabilidad de que la partícula pase por la zona donde hay campo magnético sea prácticamente nula, aun así el campo magnético tiene un efecto medible en el patrón de interferencia de esos caminos $C_1$ y $C_2$. Hay quién pretende darle un halo de misterio a este hecho insinuando que éste es un efecto no local en el que el campo magnético afecta instantáneamente a distancia a la partícula cuántica, lo cuál supone una violación del principio de localidad de la relatividad especial. Por supuesto, esto no es así. La mecánica cuántica es perfectamente compatible con la relatividad especial. Lo que está provocando un cambio en el patrón de interferencia es el campo $\vec{A}$ y no $\vec{B}$. Nos vemos, por tanto, obligados a admitir que en mecánica cuántica, al contrario de lo que ocurre en mecánica clásica, de alguna manera el campo $\vec{A}$ sí tiene significado físico. Un razonamiento similar puede hacerse con el campo $\phi$. No obstante, hay que aclarar que se trata de un significado físico muy especial, ya que todas la configuraciones de los campos $\vec{A}$ y $\phi$ relacionados entre sí mediante una transformación gauge son equivalentes desde el punto de vista físico, ya que $$
\oint \vec{A}^\prime \times d \vec{r}=\oint \vec{A}\times d \vec{r}+\oint \vec{\nabla}\chi\times d \vec{r}=\oint \vec{A}\times d \vec{r}
$$ $$
\oint \phi^\prime d t=\oint \phi d t-\oint \frac{\partial \chi}{\partial t}d t=\oint \phi d t
$$ ¿Cuál es ese significado de los potenciales electromagnéticos? Ya estamos cerca de descubrirlo.


Los lazos de Wilson


El lector que no le convenza el argumento anterior puede probar a imaginar la siguiente situación: ¿qué pasaría si el eje $Y$ fuese una circunferencia, compacta mediante la identificación $y\equiv y+ L_y$, y hacemos que el contorno $C$ sea precisamente un contorno que da una vuelta en esta dimensión compacta? En este caso, la superficie $S$ cuya frontera es $C$ no existe. No hay nada interior al contorno.
A lo largo del eje $Y$ podría haber perfectamente un campo $A_y$ constante. Esta configuración sería solución de las ecuaciones de Maxwell sin fuentes porque corresponde a un $\vec{B}$ nulo en todo es espacio. Sin embargo, esto hace que haya una diferencia de fase entre los caminos que van desde $y=0$ hasta el extremo opuesto del círculo $y=L_y/2$ (uno viajando en un sentido y el otro en sentido contrario) de valor
$$
w=\frac{1}{\hbar}q\oint_C \vec{A}\cdot d\vec{r}=\frac{qA_yL_y}{\hbar}
$$ Esta diferencia de fase se puede medir experimentalmente módulo $2\pi$, ya que es un ángulo. Por ello, lo que tiene significado físico no es w, sino el número complejo de módulo 1
$$
W=e^{iw}
$$ que se denomina lazo de Wilson.

En lenguaje matemático decimos que los lazos de Wilson son las holonomías de la conexión gauge. En el caso de que haya también campo $\phi$ en el contorno, el lazo de Wilson se define mediante una integral de contorno cerrado en el espaciotiempo
$$
W=e^{\frac{i}{\hbar}q\oint_C ( \vec{A}\cdot d\vec{r}-\phi dt)}
$$
Con este ejemplo se ve claro que lo que tiene existencia real, lo que se puede medir, no son sólo los campos $\vec{B}$ y $\vec{E}$, sino los lazos de Wilson a los que dan lugar los campos $\vec{A}$ y $\vec{\phi}$. De hecho, los lazos de Wilson en cierto sentido generalizan a $\vec{B}$ y $\vec{E}$ ya que estos últimos pueden entenderse como aquellas cantidades que especifican el valor de los lazos de Wilson asociados a contornos infinitesimales. $\vec{B}$ y $\vec{E}$ son los valores que especifican la curvatura de la conexión en cada punto.

Nótese que bajo una transformación gauge $w$ cambia de la forma
$$
w^\prime=w+\frac{q}{\hbar}(\chi_f-\chi_i)
$$ Al tratarse de un contorno cerrado uno estaría tentado a pensar que, el ser el punto final igual al punto inicial, $\chi_f=\chi_i$. Sin embargo, como $w$ sólo tiene significado físico módulo $2\pi$, al ser un ángulo, es perfectamente posible hacer transformaciones gauge en las que
$$
\chi_f=\chi_i+\frac{2\pi \hbar n}{q}
$$ (con $n$ un número entero) ya que éstas dejan invariante el lazo de Wilson. Además, a cada una de estas transformaciones gauge le corresponde un operador unitario $\Lambda(\hat{y})$ que está bien definido en todo el círculo, ya que
$$
\Lambda_f=e^{2\pi n i}\Lambda_i=\Lambda_i
$$ Esto nos deja claro que el verdadero parámetro que implementa las transformaciones gauge no es $\chi$ sino $\Lambda$. Además, los lazos de Wilson son invariantes ante cualquier función $\Lambda$ (de la posición y del tiempo) que está bien definida en toda la circunferencia. Los valores de $w$ que difieren en un múltiplo de $2\pi$ son equivalentes gauge, y dan lugar a las mismas holonomías.

Es posible construir explícitamente esas funciones $\chi(y)$ que no están bien definidas en toda la circunferencia, pero que sí dan lugar a a una transformación gauge $\Lambda$ que sí lo está. La opción más sencilla es que $\chi$ sea proporcional a $y$:
$$
\chi=\frac{2\pi \hbar n y}{L_y q}
$$ Esta transformación gauge hace que a $A_y$ se le sume una constante
$$
A_y^\prime=A_y+\frac{2\pi \hbar n}{L_yq}
$$ Con lo que
$$
w^\prime=w+2 \pi n
$$ y $W$ se mantiene invariante.

Nótese que estas transformaciones gauge en las que $\chi_i$ no coincide con $\chi_f$ son transformaciones gauge largas. No están continuamente conectadas con la identidad (el elemento neutro del grupo aplicado a todos los puntos del espaciotiempo). Estas trasformaciones largas están bien definidas en este ejemplo, pero no lo estarían si existiese el interior del círculo. Por ejemplo, no estarían bien definidas en el interior del solenoide en el experimento del efecto Aharonov-Bohm. Se trataría de transformaciones gauge que cambiarían el valor del flujo de $\vec{B}$, con lo que sí tendrían consecuencias medibles si hacemos pasar a la partícula por el interior del solenoide.

Para explicar cómo el hecho de que la partícula cargada se mueva sometida a un lazo de Wilson no trivial $W \neq 1$ cambia de forma importante el comportamiento de la partícula cargada, vamos a calcular los estados estacionarios y sus correspondientes energías. El hamiltoniano clásico de la partícula cargada es
$$
H=\frac{p_F^2}{2m}+ q\phi=\frac{(\vec{p}-q\vec{A})^2}{2m}+ q\phi
$$ con lo que en mecánica cuántica podemos escribir
$$
\hat{H}=\frac{\hat{p}_F^2}{2m}+ q\phi(\hat{\vec{r}},t)=\frac{(\hat{\vec{p}}-q\vec{A}(\hat{\vec{r}},t))^2}{2m}+ q\phi(\hat{\vec{r}},t)
$$ En nuestro ejemplo, en el que el único potencial no nulo es $A_y$, que es constante en toda la circunferencia, los autoestados de este operador son los mismos que si $A_y$ fuese cero:
$$
\varphi_{\vec{p}}(\vec{r})=\exp \left[ \frac{i}{\hbar}(p_x x+ p_y y+p_z z ) \right]
$$ donde $p_x$ y $p_z$ son números reales, pero $p_y$ toma los valores discretos
$$
p_y=\frac{2 \pi \hbar \ell}{L_y}
$$ con $\ell$ un número entero. Sin embargo, los correspondientes autovalores sí dependen de $A_y$ y están desplazados con respecto a los de la partícula libre:
$$
E_{\vec{p}}=\frac{\hbar^2}{2m} \left( \frac{2\pi\ell }{ L_y}-\frac{w}{L_y}\right)^2
$$ Nótese que cuando $w$ no es ni nulo ni múltiplo de $2\pi$, entonces los niveles de energía están desplazados con respecto a los de la partícula libre, de forma que el nivel $\ell$ tiene una energía distinta del nivel $-\ell$. Es decir, una partícula con un momento canónico $p_y$ va a tener una energía distinta a otra con momento canónico $-p_y$. Esto se debe a que el momento canónico $p_y$ no coincide con el momento físico $p_y-qA_y$.

Este ejemplo nos sirve para ilustrar con mayor claridad el concepto de covariancia gauge. Ante una transformación gauge $w^\prime=w+2\pi n$ el estado estacionario $\varphi_{\vec{p}}(\vec{r})$, al que corresponde un número cuántico $\ell$, se mantiene invariante, pero su energía y su cantidad de movimiento física pasan a ser las que tenía el estado estacionario de número cuántico $\ell + n$. Es decir, ante una transformación gauge el espectro de momentos lineales físicos y de energías de la partícula sigue siendo el mismo, lo que cambia es qué asignación de estado estacionario corresponde a cada valor del momento lineal físico y de la energía. Distintas configuraciones de $w$ que son equivalentes gauge dan lugar a modelos mecanocuánticos para la partícula que son indistinguibles experimentalmente.

El ángulo $w$ tiene una interpretación geométrica bastante bonita en teoría de cuerdas. En los volúmenes de mundo de las Dp-branas hay campos gauge U(1). Si la Dp-brana está enrollada en la dirección compacta $y$ con valor pequeño de $L_y$, y el campo gauge que vive en su interior tiene holonomía dada por el ángulo $w$, esta configuración es T-dual a otra en la que el tamaño de la circunferncia $L_y$  es grande y hay una D(p-1)-brana en una posición angular concreta dentro de esa circunferencia. ¡En la descripción T-dual el ángulo $w$ no es más que la posición angular de esa D(p-1)-brana en esa circunferencia! [Zwiebach2009] Es decir, en la descripción T-dual queda claro que $w$ sí es una magnitud con significado físico, que se puede medir, ya que es la posición de un objeto físico.

Por otro lado, en este ejemplo de teoría de cuerdas la partícula cargada es una cuerda abierta cuyo extremo acaba en la Dp-brana y que se mueve en la dirección $y$ con momento generalizado $p_y=\frac{\hbar 2 \pi \ell}{L_y}$. Pero en la descripción T-dual sería una cuerda abierta cuyo extremo acaba en la D(p-1)-brana y que está enrollada $\ell$ veces en la circunferencia. Al hacer una transformación gauge  $w^\prime=w+2\pi n$, hacemos que este extremo dé $n$ vueltas a la circunferencia, con lo que el número de enrollamientos $\ell$ de la cuerda aumenta en un valor de $n$, pasando a tener esta misma cuerda más energía. Este es el motivo por el que ante una transformación gauge el estado estacionario $\ell$ pasa a tener la energía y el momento físico que tenía el estado estacionario $\ell+n$, pero el espectro de $\hat{p}_{yF}$ y $\hat{H}$ y el conjunto de los estados estacionarios sigue siendo el mismo. Es decir, la covariancia de la teoría bajo trasformaciones gauge largas tiene un origen geométrico que viene del hecho de que la posición de la D(p-1)-brana en la descripción dual es una posición angular en vez de lineal. En esa descripción dual el ángulo $\ell$ está ligado al número de vueltas que da el ángulo $w$ sobre la circunferencia. En cambio, en la descripción inicial $\ell$ y $w$ parecían parámetros físicamente desligados.

Lo que acabamos de indicar en estos dos párrafos es una característica general de la teoría de cuerdas: en esta teoría típicamente todos los elementos algebraicos que utilizamos para describir los fenómenos físicos, como en este caso los lazos de Wilson y las transformaciones gauge, acaban teniendo una interpretación geométrica sencilla en alguna descripción dual que nos hace entender los fenómenos físicos en mayor profundidad. La teoría de cuerdas ha cambiado ya para siempre nuestra forma de entender los fenómenos físicos. Se trata de un cambio irreversible que todo estudiante de física teórica tiene que conocer.

Si $A_y$ fuera puro gauge
$$
A_y=\frac{2\pi \hbar n}{L_yq}
$$ entonces $W=1$, con lo que, aunque $A_y$ no fuera nulo, no podríamos decir que la partícula está sometida a ningún campo magnético, ya que este $A_y$ no tendría ningún efecto observable. Esta es otra forma de ver que lo que tiene existencia física no son los potenciales $\vec{A}$ y $\phi$, sino los lazos de Wilson. Siempre podríamos eliminar ese $A_y$ simplemente redefiniendo el operador momento canónico $p_y$ para que el número entero $n$ quede absorbido por $\ell$.


La cuantización del flujo magnético


Para profundizar todavía más en el significado de los lazos de Wilson, compliquemos un poco el ejemplo anterior y hagamos que $A_y$, que es constante a lo largo de la dimensión compacta $Y$, varíe a medida que nos movemos en el eje $X$. En el caso más sencillo, esta variación es
$$
A_y=Bx
$$ Es inmediato ver que la constante de proporcionalidad entre $A_y$ y $x$ coincide con el valor del campo magnético en el eje $Z$, y este es el motivo por el que hemos denotado esta constante mediante la letra $B$.

Ahora lo que tenemos es una partícula cargada que se mueve en presencia de un campo magnético uniforme y constante en el eje $Z$. En este caso el cálculo del espectro de $\hat{H}$ da lugar a los denominados niveles de Landau.

Pero en lo que nos vamos a detener aquí es que el hecho de que los valores de $A_y$ sólo tengan significado físico salvo múltiplo de $\frac{2\pi \hbar n}{L_yq}$ nos permite hacer también que la dimensión $X$ sea compacta mediante la identificación $x\equiv x+ L_x$, de forma que lo que tenemos ahora es que el plano $XY$ es un 2-toro, y que este 2-toro está siendo atravesado por un flujo magnético de valor $BL_xL_y$.
Pero esto sólo lo podemos hacer de forma consistente si, cuando $x=L_x$, el potencial $A_y$ difiere de cero en $\frac{2\pi \hbar n}{L_yq}$. Como los potenciales  $\vec{A}$ y $\phi$ nos dan la conexión del fibrado, una configuración de estos potenciales en un espaciotiempo arbitrario es una en la que podemos tener diferentes expresiones para $\vec{A}$ y $\phi$ en distintas regiones (abiertos), siempre que en la intersección de esas regiones esos potenciales difieran sólo en una transformación gauge. Es decir, estamos hablado de introducir un fibrado no trivial en el que las funciones de transición al dar la vuelta en el círculo $X$ son
$$
A_y(x=L_x)=A_y(x=0) + \frac{2\pi \hbar n}{L_yq}
$$ $$
w(x=L_x)=w(x=0)+2\pi n
$$ $$
\psi(x=L_x, y)=\psi(x=0, y)
$$
Como en este ejemplo tenemos que $A_y(x=L_x))=BL_x$ y que $A_y(x=0)=0$, la conclusión a la que llegamos es que la mecánica cuántica impide que pueda haber un flujo de campo magnético arbitrario atravesando el 2-toro. Los únicos valores permitidos del flujo son
$$
BL_xL_y=\frac{2\pi \hbar n}{q}
$$ donde recordamos que $n$ es un número entero.

Es importante señalar aquí que el motivo por el que el resto de valores del flujo de campo magnético no están permitidos en la naturaleza es porque darían lugar a un campo $\vec{A}$ que no estaría bien definido en todo el toro. Es decir, aunque una configuración concreta de los campos $\vec{E}$ y $\vec{B}$ satisfaga las ecuaciones de Maxwell, si no existen ninguna configuración de potenciales $\vec{A}$ y $\phi$ que la origine, esa configuración de $\vec{E}$ y $\vec{B}$ no puede darse en la naturaleza. Esto nos deja claro que no son los campos $\vec{E}$ y $\vec{B}$ los que caracterizan al campo electromagnético. El comportamiento mecanocuántico de las partículas cargadas que se mueven en su seno nos indica que son los lazos de Wilson (que, al contrario que $\vec{A}$ y $\phi$, sí son invariantes gauge) las magnitudes físicas que realmente caracterizan al campo electromagnéitco [Healey2001].


Cuantización de la carga eléctrica


Es interesante ver que podemos entender esta cuantización del flujo de campo magnético como una condición sobre las posibles cargas eléctricas que pueden existir. Dada una carga $q$, podemos definir el conjunto $S(q)$ de todos los flujos de campo magnético en los que esta carga se puede mover mecanocuánticamente de forma consistente. Se trata de todos los flujos que son múltiplos de $\frac{2\pi \hbar }{q}$. Si, además de $q$, existe otra carga de valor $q^\prime$ en la naturaleza, entonces los únicos flujos de campo magnético posibles son los que pertenecen a la intersección de los conjuntos $S(q)$ y $S(q^\prime)$. Es decir, los únicos flujos posibles son aquellos que son, a la vez, múltiplos de $\frac{2\pi \hbar }{q}$ y de $\frac{2\pi \hbar }{q^\prime}$. Esto implica que si el cociente $q/q^\prime$ es irracional, no habría ningún flujo de campo magnético consistente en el toro. Asumiendo que hay flujos consistentes, concluimos que las únicas cargas que pueden existir deben estar relacionadas entre ellas mediante números racionales. Reduciendo a común denominador, vemos que todas las cargas que existen en la naturaleza han de ser múltiplos de una carga fundamental, aunque esta carga fundamental podría no existir.

Vamos a llamar a esta carga fundamental $q_f$. Podemos identificar la acción del grupo U(1) sobre la función de onda de esta carga como el mismo grupo U(1) en abstracto. Así, el fibrado asociado a esta carga es lo que se denomina fibrado principal. El resto de cargas poseen funciones de onda que transforman de acuerdo a distintas representaciones de ese grupo U(1), representaciones que vienen especificadas por el valor del número entero $q/q_f$. De esta forma, cualquier flujo de campo magnético sobre el 2-toro que sea múltiplo de $\frac{2\pi \hbar }{q_f}$ también va a ser múltiplo de $\frac{2\pi \hbar }{q}$, con lo que va a ser posible describir mecanocuánticamente el movimiento de todas las cargas de forma consistente.

El motivo por el que las funciones de onda de las partículas con carga $q$ que es múltiplo de la carga fundamental $q_f$ transforman de acuerdo a representaciones del grupo gauge $U(1)$ es porque las transformaciones $$
\Lambda_q(\chi) = e^{\frac{i}{\hbar}q\chi}
$$ preservan la estructura del grupo U(1) $$
\Lambda_q(\chi_1)\Lambda_q(\chi_2)=\Lambda_q(\chi_1+\chi_2)
$$ pero sólo si cumplen la condición de periodicidad $$
\Lambda_q(\chi+2\pi\hbar/q_f)=\Lambda_q(\chi)
$$ y esto sólo ocurre si $q$ es múltiplo de $q_f$. Por tratarse de un grupo abeliano, el lema de Schur nos dice que todas las representaciones irreducibles tienen que ser como éstas, de dimensión compleja 1. La conclusión es que las representaciones $\Lambda_q(\chi)$, con $q$ múltiplo de $q_f$, son todas las representaciones irreducibles que hay del grupo U(1) del fibrado principal y se denotan por el número entero $q/q_f$, que se denomina peso (weight) de la representación.

Si el fibrado principal es no trivial, como en el caso que acabamos de ver del 2-toro, entonces todos los fibrados asociados a todas las cargas $q$ tampoco van a ser triviales, ya que tendrán funciones de transición que no son más que la representación $q/q_f$ de las funciones de transición del fibrado principal. Esto refleja el hecho de que el campo electromagnético, que viene dado por al conexión del fibrado principal a través de los lazos de Wilson, es único. Simplemente lo que tenemos son distintas cargas que, al pertenecer a distintas representaciones del grupo U(1), se mueven bajo la acción del mismo campo electromagnético.


La primera clase de Chern


Es interesante ver que la condición de cuantización del flujo que acabamos de obtener no depende de la conexión escogida, sino de la topología del fibrado no trivial escogido, ya que sólo depende de las funciones de transición del fibrado principal. En efecto, sea cual sea la conexión escogida, en el abierto compuesto por todo el círculo X menos $x=0$ el lazo de Wilson viene representado por una función $w(x)$, mientras que en el abierto compuesto por todo el círculo menos $x=L_x/2$ viene dado por la función $w^\prime(x^\prime)$. Estos dos abiertos intersecan en los dos abiertos $x\in (0,L_x/2)$ y $x\in (L_x/2,L_x)$. En el primero de ellos las funciones de transición son $$
w^\prime(x^\prime)=w^\prime(x+L_x/2)=w(x)
$$ En cambio, en el abierto $x\in (L_x/2,L_x)$ las funciones de transición son no triviales $$
w^\prime(x^\prime)=w^\prime(x-L_x/2)=w(x)+2 \pi n
$$

Por tanto, el flujo de campo magnético a lo largo de todo el 2-toro es $$
\int_{T^2} \vec{B} \cdot d\vec{S}=\int_{U_1} \vec{B} \cdot d\vec{S}+\int_{U_2} \vec{B}\cdot d\vec{S}
$$ donde $U_1$ es el abierto $x\in (L_x/2,L_x)$ y $U_2$ es el resto del 2-toro. La primera integral es igual, por el teorema de Stokes, a la cantidad $\hbar w^\prime/q_f$ evaluada en la frontera de $U_1$, mientras que la segunda integral es igual $\hbar w/q_f$ evaluada en esa misma frontera, pero con sentido inverso. Por tanto $$
\int_{T^2} \vec{B} \cdot d\vec{S}=(w^\prime-w)\hbar/q_f
$$ Y aquí se ve claro que esta diferencia depende sólo de las funciones de transición. En este caso $$
\int_{T^2} \vec{B} \cdot d\vec{S}=2 \pi \hbar n /q_f
$$
Es por ello que la cantidad $$
n=\frac{q_f}{2 \pi \hbar}\int_{T^2} \vec{B} \cdot d\vec{S}
$$
es un invariante topológico del fibrado escogido sobre el 2-toro. A este invariante topológico se le denomina primera clase de Chern del fibrado [Nakahara1990].

Análogamente, si en vez de un 2-toro tuvieramos una 2-esfera, entonces también necesitaríamos dos abiertos para definir al fibrado sobre esa 2-esfera. Por ejemplo, podemos coger un abierto $U^+$ que contenga a toda la esfera menos el polo sur y otro $U^-$ que contenga a toda la esfera menos el polo norte.

Azimuthal and polar spherical coordinates ϕ and θ of a point P on the spherical surface of the Earth: θ = 0 and θ = π correspond to the North and South Pole, respectively, while θ = π/2 corresponds to the Equator.

La conexión vendrá entonces especificada por las funciones $w^+(\theta)$ en $U^+$ y $w^-(\theta)$ en $U^-$ (siendo $\theta$ la latitud) y por la función de transición $$
w^+(\theta)=w^-(\theta)+2 \pi n
$$ en el entorno del ecuador, ya que, como hemos visto, las transformaciones gauge U(1) siempre cambian el valor de $w$ en un múltiplo de $2 \pi$. Si descomponemos la integral del campo magnético a lo largo de la superficie de toda la esfera como suma de las integrales sobre el hemisferio norte y sobre el hemisferio sur, y aplicamos el teorema de Stokes a cada hemisferio (utilizando para cada uno la expresión de $w$ que sí cubra la totalidad del hemisferio) vemos que se obtiene exactamente la misma condición de cuantización para el flujo magnético a lo largo de toda la 2-esfera que en el caso del 2-toro, y esto, de nuevo, independientemente de la conexión concreta escogida. Este resultado es general. No puede haber cualquier flujo de campo magnético a lo largo de una superficie bidimensional compacta y orientable. Éste tiene siempre que ser múltiplo de un flujo fundamental. La primera clase de Chern siempre es un número entero.

Pero, ¿cuál es el significado físico de este flujo fundamental? Para ello supongamos ahora que el interior de la esfera sí existe, es decir, que la 2-esfera que acabamos de considerar sería una superficie cerrada, una esfera real en nuestro espacio tridimensional. En ese caso ese flujo de campo magnético nos estaría diciendo que hay líneas de campo magnético que salen de la 2-esfera pero que no vuelven a entrar. Esto lo que quiere decir es que hay fuentes del campo magnético en el interior de la 2-esfera, es decir, que hay ¡monolopos magnéticos!


Monopolos magnéticos


En efecto, por analogía con la ley de Gauss para el campo eléctrico tendríamos $$
\oint \vec{B}\cdot d\vec{S}=q_m
$$
donde $q_m$ es la carga magnética que hay en el interior de la esfera. Igualando con la condición de cuantización del flujo se tiene
$$
q_mq=2 \pi \hbar n
$$
A esta relación se la conoce como condición de cuantización de Dirac. Esta condición lo que nos dice es que basta con que exista en la naturaleza un sólo monopolo magnético de carga magnética $q_m$ para que, por consistencia de la teoría cuántica, las cargas eléctricas en el universo tengan necesariamente que estar cuantizadas, tengan que ser múltiplos de $2 \pi \hbar /q_m$.

Pero, ¿es posible encontrar una solución de las ecuaciones del electromagnetismo que represente un monopolo magnético? La respuesta que encontró Dirac [Dirac1931], cuyo trabajo fue aclarado décadas más tarde por Wu y Yang [Wu1975], es que sí. Para construir el monopolo de Dirac basta con interpretar las coordenadas esféricas $\theta$ y $\varphi$ de la 2-esfera anterior como la parte angular de las coordenadas esféricas tridimensionales $(r, \theta, \varphi)$ y con poner una conexión en el fibrado U(1) sobre el espacio tridimensional dada, en cada abierto, por $$
A_\varphi^+=\frac{q_m}{4 \pi r \sin \theta} (+1 -\cos \theta)
$$ $$
A_\varphi^-=\frac{q_m}{4 \pi r \sin \theta} (-1 -\cos \theta)
$$
En la intersección de los abiertos $U^+$ y $U^-$ los dos potenciales magnéticos $\vec{A}^+$ y $\vec{A}^-$ están relacionados mediante la transformación gauge $$
\chi=q_m\frac{\varphi}{2 \pi}
$$
con lo que ambos dan lugar al mismo campo magnético $$
B_r=\frac{q_m}{4 \pi r^2}
$$

Es importante darse cuenta de que $A_\varphi^+$ no está bien definida en el complementario de $U^+$, que es la semirrecta $\theta=\pi$, que va desde el origen hasta $z \to- \infty$, denominada cuerda de Dirac. Sin embargo, esta cuerda de Dirac no tiene ningún significado físico, ya que en esa semirrecta debemos usar la función $A_\varphi^-$ para describir la conexión del fibrado. Análogamente, $A_\varphi^-$ no está bien definida en la cuerda de Dirac $\theta=0$, que va desde el origen hasta $z \to + \infty$, pero ahí hay que usar $A_\varphi^+$. Eso sí, el único punto el espacio tridimensional que estos abiertos no cubren es justamente el origen de coordenadas, que es donde está situado el monopolo magnético puntual. Es evidente que ahí no puede haber ningún potencial vector que describa el campo magnético, ya que ahí la divergencia de $\vec{B}$ no se anula, con lo que es imposible que $\vec{B}=\vec{\nabla} \times \vec{A}$.

Otra forma de entender este monopolo magnético puntual es considerarlo un solenoide infinitamente largo y estrecho con un extremo en $z \to- \infty$ y el otro en el origen de coordenadas, de tal forma que las líneas de campo magnético suben desde $-\infty$ a través de la cuerda de Dirac y luego salen radialmente desde el origen de coordenadas hacia todas las direcciones. Parece que esta configuración no es físicamente equivalente al monopolo, por el efecto Aharonov-Bohm que tendría el solenoide sobre las partículas cargadas. No obstante, el flujo del campo magnético que viajaría por el interior del solenoide, al ser de valor $q_m$, daría lugar a unos lazos de Wilson $w=qq_m/\hbar=2 \pi n$ que, al ser múltiplos de $2 \pi$, no serían observables. En cambio, lo lazos de Wilson a los que daría lugar al campo $\vec{B}$ que sale radialmente del origen, en las circunferencias definidas por $\theta$ constante (los paralelos de la esfera), sí son observables, ya que son $$
w^+=\frac{q_mq}{2 \hbar } (+1 -\cos \theta)
$$ $$
w^-=\frac{q_mq}{2\hbar } (-1 -\cos \theta)
$$
Como en la intersección $$
w^+=w^-+\frac{q_mq}{ \hbar }=w^-+2\pi n
$$
da igual que los describamos como $w^+$ o como $w^-$. Ambos tienen los mismos efectos físicos sobre las partículas cargadas.

La ventaja de utilizar la descripción del monopolo mediante la cuerda de Dirac como si fuera un solenoide es que en este caso no necesitamos el concepto de fibrado no trivial, ya que, fuera de la cuerda de Dirac, podemos trabajar con un potencial vector $\vec{A}$ bien definido en todas partes y con las ecuaciones de Maxwell ordinarias del electromagnetismo. En este escenario las transformaciones gauge cambian la orientación de la cuerda de Dirac. Esta fue la idea original de Dirac en 1931.

No obstante, aunque las conclusiones físicas son las mismas, desde el punto de vista matemático es mucho más elegante utilizar el formalismo de fibrados no triviales que introdujeron Wu y Yang en 1975, en el que, como hemos explicado, se evita la presencia de la cuerda de Dirac utilizando potenciales definidos sólo localmente y relacionados entre ellos mediante funciones de transición, que son transformaciones gauge, que implementan una topología no trivial en el fibrado U(1) sobre el espaciotiempo.

Vamos a detenernos en analizar lo que hemos aprendido. Por un lado, acabamos de ver que, al contrario de lo que ocurre en mecánica clásica, en mecánica cuántica ya no podemos caracterizar al campo electromagnético mediante los campos vectoriales $\vec{B}$ y $\vec{E}$, ya que hay valores de estos campos a los que no les corresponde ninguna configuración de los potenciales $\vec{A}$ y $\phi$, con lo que serían inconsistentes con que las partículas cargadas puedan moverse mecanocuánticamente a través de ellos, por ejemplo, los valores de $B$ en el 2-toro o en la 2-esfera que hacen que el flujo no sea múltiplo de $\frac{2\pi \hbar }{q_f}$. Esto hace que sea imposible que en el universo puedan convivir cargas eléctricas y magnéticos que no satisfagan la condición de cuantización de Dirac.

Por otro lado, hemos visto que configuraciones de $\vec{A}$ y $\phi$ que están relacionadas bajo una transformación gauge dan lugar a la misma física, con lo que físicamente describen al mismo campo electromagnético. Es decir, no son los potenciales $\vec{A}$ y $\phi$ los que caracterizan al campo electromagnético, sino los lazos de Wilson. Esto es lo mismo que decir que el campo electromagnético es el conjunto de las holonomías de la conexión en el fibrado principal U(1) sobre el espaciotiempo. Las transformaciones gauge no son más que transformaciones U(1) definidas en cada punto del espaciotiempo, con lo que son secciones del fibrado principal U(1). En lo que queda vamos a profundizar sobre el papel que juega este grupo de transformaciones U(1) en la estructura de la interacción electromagnética.

El principio gauge


La ecuación de Schrödinger de una partícula libre
$$
\frac{1}{2m}\hat{p}^2 |\psi\rangle=i\hbar\frac{d | \psi\rangle}{d t}
$$ es invariante bajo la transformación U(1)
$$
|\psi^\prime\rangle=   \Lambda (\chi ) |\psi\rangle
$$ sólo si es global, es decir, si afecta por igual a todos los puntos espaciotemporales (sólo si $\chi$ es una constante). Podemos hacer esta transformación sin que cambien las predicciones físicas de la teoría, ya que lo que hace esta trasformación es cambiar por igual las fases de todas las amplitudes de probabilidad, y esto no afecta, ni a las probabilidades asociadas a esas amplitudes, ni a posibles efectos de interferencia entre esas amplitudes al hacer la suma de caminos de Feynman, ya que la interferencia depende de las diferencia de fase entre los caminos (de los lazos de Wilson), pero no de sus valores absolutos.

Si, en cambio, hacemos una transformación local, es decir, si $\chi$ es una función de la posición y del tiempo, entonces la ecuación de Schrödinger ya no se mantendría invariante. Al hacer la suma de caminos de Feynman tendríamos que la fase asociada a unos caminos que pasan por un sitio ha cambiado en un valor distinto a la fase asociada por otros caminos que pasan por otro sitio, lo que tendría consecuencias observables. Es decir, si la partícula no interacciona con el campo electromagnético (es decir, si no tiene carga), entonces no tenemos libertad de hacer una transformación gauge local.

Pero si la partícula está cargada, entonces la ecuación de Schrödinger queda
$$
[ \frac{1}{2m}(\hat{\vec{p}}-q\vec{A}(\hat{\vec{r}},t))^2  +q\phi(\hat{\vec{r}},t)  ]   |\psi\rangle=i\hbar\frac{d | \psi\rangle}{d t}
$$ En la representación de coordenadas esta sustitución es equivalente a cambiar las derivadas por derivadas covariantes
$$
-i\hbar \vec{D}=-i\hbar \vec{\nabla}-q\vec{A}
$$ $$
i\hbar D^0=i\hbar \frac{\partial}{\partial t}-q\phi
$$ y, dado que
$$
(i\hbar \frac{\partial}{\partial t}-q\phi^\prime)\hat{\Lambda}=\hat{\Lambda}(i\hbar \frac{\partial}{\partial t}-q\phi)
$$ $$
(-i\hbar \vec{\nabla}-q\vec{A}^\prime)\hat{\Lambda}=\hat{\Lambda}(-i\hbar \vec{\nabla}-q\vec{A})
$$ la ecuación de Schrödinger que se obtiene es covariante gauge. De hecho, cualquier ecuación de evolución para la función de onda que tenga derivadas temporales y espaciales se puede hacer covariante gauge si cambiamos las derivadas por derivadas covariantes.

Por tanto, si lo que queremos es obligar a la teoría a ser invariante bajo transformaciones U(1) locales de la función de onda (es decir, obligar a la función de onda a ser una sección de un fibrado vectoral U(1) de dimensión compleja 1), esto nos obliga a cambiar en las ecuaciones las derivadas espaciotemporales por las derivadas covariantes asociadas al fibrado princial U(1). Pero al hacer esto, la partícula ya no va a ser una partícula libre, sino que va a interaccionar con los campos $\vec{A}$ y $\phi$. Es decir, el modo en que la partícula interacciona con esos campos queda fijado una vez imponemos que la simetría U(1) sea local, en vez de global [Aitchison2012].

Esta es la base del denominado principio gauge. Podemos describir modelos en los que tengamos partículas cuya función de onda transforma bajo alguna representación de otros grupos continuos como SU(2) o SU(3) y, aplicando el principio gauge, ¡la interacción con unos nuevos campos, que generalizan al electromagnético, queda fijada! La interacción electromagnética no es más que el ejemplo más sencillo de interacción gauge. Tenemos unas interacciones distintas en función del grupo gauge escogido y, además, éstas quedan determinadas por éste. Este principio supuso durante la segunda mitad del siglo pasado una auténtica revolución en la física de partículas. La elección del grupo U(1)xSU(2)xSU(3) nos ha fijado todas las interacciones del exitoso modelo estándar de las partículas elementales (menos los Yukawas), y las teorías de gran unificación también se basan en este principio, utilizando grupos más grandes.


Conclusiones


El estudio de la mecánica cuántica de una partícula cargada que se mueve en el seno de un campo electromagnético nos ha enseñado que:
  • Dadas dos configuraciones distintas de potenciales electromagnéticos, $(\vec{A},\phi)$, y $(\vec{A}^\prime,\phi^\prime)$, que dan lugar a los mismos campos $\vec{B}$ y $\vec{E}$, pero que no están relacionadas entre ellas mediante transformaciones gauge, estas dos configuraciones deben considerarse como no equivalentes físicamente. Esto se debe a que dan lugar a lazos de Wilson distintos, que afectan a las interfencias entre caminos de forma diferente (efecto Bohm-Aaronov), hecho que afecta a las probabilidades mecanocuánticas de los distintos sucesos en los experimentos.
  • Dada una configuración de los campos $\vec{B}$ y $\vec{E}$ que satisface las ecuaciones de Maxwell, pero que es imposible construir mediante potenciales $\vec{A}$ y $\phi$ ni siquiera a trozos (con funciones de transición que sean transformaciones gauge y que den lugar a un fibrado no trivial), entonces esta configuración de $\vec{B}$ y $\vec{E}$ no puede existir en la naturaleza. Esto se debe a que no es posible que a través de estos campos se pueda mover mecanocuánticamente ninguna partícula cargada. Un ejemplo de estas configuraciones prohibidas en la naturaleza son los flujos de campo magnético (o los monopolos magnéticos) que no cumplan la condición de cuantización de Dirac.
Por tanto, podemos concluir que las magnitudes físicas fundamentales que caracterizan al campo electromagnético no son ni los campos $\vec{B}$ y $\vec{E}$, ni los potenciales $\vec{A}$ y $\phi$, sino los lazos de Wilson. Todo campo electromagnético está representado, por tanto, mediante los potenciales $\vec{A}$ y $\phi$ módulo transformación gauge, es decir, mediante las clases de equivalencia de los potenciales, donde dentro de cada clase de equivalencia están todas las configuraciones que están relacionadas entre ellas mediante una transformación gauge, es decir, todas las configuraciones que dan lugar a los mismos lazos de Wilson, siendo cualquier elemento de la clase un representante tan válido como otro cualquiera.

Las soluciones a las ecuaciones de Maxwell ya no son representativas de todas las posibles configuraciones de campo electromagnético que puedan existir, y esto abre las puertas a la posible existencia de monopolos magnéticos (siempre que se cumpla la condición de cuantización de Dirac), cuyo campo magnético asociado no es solución de las ecuaciones de Maxwell, debido a la singularidad en el mismo punto donde está el monopolo. De hecho, es posible encontrar soluciones suaves de tipo monopolo magnético que evitan esta singularidad si consideramos que el grupo U(1) del electromagnetismo es un subgrupo de un grupo semisimple más grande, por ejemplo, SU(N), si este grupo más grande está roto espontáneamente mediante un mecanismo de Higgs. El ejemplo más famoso es el monopolo de t'Hooft Polyakov, que es indistinguible de un monopolo de Dirac si estamos lo suficientemente lejos del centro. De hecho, tanto en las teorías de gran unificación como en teoría de cuerdas los monopolos magnéticos surgen de forma natural, aunque éstos podrían tener una masa tan alta que sería difícil detectarlos.

Todos los desarrollos de las últimas décadas nos han llevado a los físicos teóricos a estar bastante convencidos de que en la física de altas energías existen los monopolos magnéticos [Polchinski2004], aunque probablemente éstos tienen una masa muy superior a la de las partículas elementales que somos capaces de crear con los aceleradores actuales. Si existen los monopolos, entonces las cargas eléctricas deben estar cuantizadas. El hecho de que todas las cargas eléctricas de partículas elementales que conocemos sean múltiplos de una carga fundamental es también un indicio a favor de que los monopolos magnéticos existen.

La única posibilidad teórica de que no existan los monopolos es que el grupo U(1) del electromagnetismo está decompactificado (que la fibra del recubrimiento sea en realidad un círculo de radio infinito). La carga fundamental entonces tendería a cero, pero las partículas cargadas tendrían carga finita porque poseerían un número infinito de cuantos de la carga fundamental. No obstante, esto es imposible que ocurra si este grupo U(1) es un subgrupo de un grupo más grande, ya que todos estos grupos más grandes que se pueden usar en gran unificación son compactos.

La última lección que nos ha enseñado la mecánica cuántica sobre las transformaciones gauge es el principio gauge: la elección del grupo gauge nos fija las interacciones de las partículas, camino seguido por los físicos de partículas para desarrollar el modelo estándar y las teorías de gran unificación. Sin embargo, es importante señalar aquí que en las últimas décadas los físicos teóricos hemos cambiado un poco nuestro punto de vista sobre el principio gauge. En teoría de cuerdas las elección del grupo gauge, como ocurre con la elección de la topología del espaciotiempo, ya no es fundamental, sino que los grupos gauge se derivan de las propiedades geométricas de la compactificación. Muchas de estas compactificaciones en las que aparecen grupos gauge distintos en el fondo describen la misma física porque están relacionadas mediante dualidades, con lo que es posible pasar de una topología y de un grupo gauge concreto ¡a otra topología distinta con otro grupo gauge! Aunque suene sorprendente, no lo es tanto. El espaciotiempo no tiene por qué ser un ente primario de la naturaleza, y la invariancia gauge no es en realidad una simetría real, sino una redundancia en nuestra descripción de la naturaleza. Y creo que ya he escrito suficiente.


Sobre el autor: Sergio Montañez Naz es doctor en física y profesor de secundaria de la enseñanza pública en la Comunidad de Madrid.


Referencias bibliográficas

  • Aitchison I.J.R. and Hey A.J.G. (2012) Gauge Theories in Particle Physics: A Practical Introduction: From Relativistic Quantum Mechanics to QED, Fourth Edition, Volume 1. CRC Press, 2012. ISBN 1466512997, 978146651299.
  • Dirac P. (1931), "Quantised Singularities in the Electromagnetic Field". Proc. Roy. Soc. (London) A 133, 60 (1931).
  • Healey, Richard  (2001) On the Reality of Gauge Potentials.  [Preprint]     URL: http://philsci-archive.pitt.edu/id/eprint/328 (accessed 2019-09-12).
  • Landau L.D. y Lifshitz E.M. (1992): Teoría Clásica de los Campos, Barcelona, Volumen 2 del Curso de Física Teórica  (1992).
  • Nakahara N. (1990), Geometry, Topology and Physics.
  • Polchinski J., (2004) "Monopoles, duality, and string theory,'' Int. J. Mod.Phys. A 19S1 (2004) 145. doi:10.1142/S0217751X0401866X [hep-th/0304042].
  • Rosenfelder R. : “Path integrals for potential scattering,” Phys. Rev. A 79 (2009) 012701 [arXiv:0806.3217[nucl-th]].
  • Wu T.T. and Yang C.N. (1975) , Concept of non-integrable phase factors and global formulation of gauge fields, Phys. Rev. D 12 (1975) 3845. Wu T.T. and Yang C.N (1976), Dirac Monopole without Strings: Classical Lagrangian theory, Phys. Rev. D 14 (1976) 437.
  • Zwiebach B. (2009), A First Course in String Theory (Second Edition), Cambridge University Press, 2009