Hay muchas formas de derivar las transformaciones de Lorentz utilizando una variedad de principios físicos, que van desde las ecuaciones de Maxwell hasta los postulados de la relatividad especial de Einstein y herramientas matemáticas , que abarcan desde el álgebra elemental y las funciones hiperbólicas hasta el álgebra lineal y la teoría de grupos .
Este artículo proporciona algunos de los más fáciles de seguir en el contexto de la relatividad especial , para el caso más simple de un impulso de Lorentz en configuración estándar, es decir, dos marcos inerciales que se mueven uno respecto del otro a una velocidad relativa constante (uniforme) menor que la velocidad. de luz , y utilizando coordenadas cartesianas de modo que la x y x ejes 'son colineales .
Transformación de Lorentz
En las ramas fundamentales de la física moderna , a saber, la relatividad general y su subconjunto de la relatividad especial ampliamente aplicable , así como la mecánica cuántica relativista y la teoría de campos cuánticos relativistas , la transformación de Lorentz es la regla de transformación bajo la cual los cuatro vectores y tensores que contienen cantidades físicas se transforman de un marco de referencia a otro.
Los principales ejemplos de estos cuatro vectores son las cuatro posiciones y los cuatro momentos de una partícula , y para los campos, el tensor electromagnético y el tensor de tensión-energía . El hecho de que estos objetos se transformen según la transformación de Lorentz es lo que matemáticamente los define como vectores y tensores; ver tensor para una definición.
Dados los componentes de los cuatro vectores o tensores en algún marco, la "regla de transformación" permite determinar las componentes alteradas de los mismos cuatro vectores o tensores en otro marco, que podrían ser reforzados o acelerados, en relación con el marco original. Un "impulso" no debe combinarse con la traducción espacial , sino que se caracteriza por la velocidad relativa entre fotogramas. La propia regla de transformación depende del movimiento relativo de los fotogramas. En el caso más simple de dos marcos inerciales, la velocidad relativa entre entra en la regla de transformación. Para los marcos de referencia giratorios o los marcos de referencia generales no inerciales , se necesitan más parámetros, incluida la velocidad relativa (magnitud y dirección), el eje de rotación y el ángulo girado.
Antecedentes históricos
El tratamiento habitual (por ejemplo, el trabajo original de Albert Einstein ) se basa en la invariancia de la velocidad de la luz. Sin embargo, este no es necesariamente el punto de partida: de hecho (como se expone, por ejemplo, en el segundo volumen del Curso de Física Teórica de Landau y Lifshitz ), lo que realmente está en juego es la localidad de las interacciones: se supone que la La influencia que, digamos, ejerce una partícula sobre otra no puede transmitirse instantáneamente. Por tanto, existe una velocidad máxima teórica de transmisión de información que debe ser invariante, y resulta que esta velocidad coincide con la velocidad de la luz en el vacío. El propio Newton había llamado filosóficamente "absurda" la idea de acción a distancia, y sostenía que la gravedad tenía que ser transmitida por algún agente de acuerdo con ciertas leyes. [1]
Michelson y Morley en 1887 diseñaron un experimento, empleando un interferómetro y un espejo medio plateado, que era lo suficientemente preciso como para detectar el flujo de éter. El sistema de espejos reflejó la luz de regreso al interferómetro. Si hubiera una deriva del éter, produciría un cambio de fase y un cambio en la interferencia que se detectaría. Sin embargo, nunca se encontró ningún cambio de fase. El resultado negativo del experimento de Michelson-Morley dejó el concepto de éter (o su deriva) socavado. En consecuencia, hubo perplejidad en cuanto a por qué la luz se comporta evidentemente como una onda, sin ningún medio detectable a través del cual se pueda propagar la actividad de las ondas.
En un artículo de 1964, [2] Erik Christopher Zeeman mostró que la propiedad de preservación de causalidad , una condición que es más débil en un sentido matemático que la invariancia de la velocidad de la luz, es suficiente para asegurar que las transformaciones de coordenadas son las transformaciones de Lorentz. El artículo de Norman Goldstein muestra un resultado similar usando la inercia (la preservación de líneas similares al tiempo) en lugar de la causalidad . [3]
Principios fisicos
Einstein basó su teoría de la relatividad especial en dos postulados fundamentales . Primero, todas las leyes físicas son las mismas para todos los marcos de referencia inerciales, independientemente de su estado relativo de movimiento; y en segundo lugar, la velocidad de la luz en el espacio libre es la misma en todos los marcos de referencia inerciales, nuevamente, independientemente de la velocidad relativa de cada marco de referencia. La transformación de Lorentz es fundamentalmente una consecuencia directa de este segundo postulado.
El segundo postulado
Suponga el segundo postulado de la relatividad especial que establece la constancia de la velocidad de la luz, independiente del marco de referencia, y considere una colección de sistemas de referencia que se mueven entre sí con velocidad constante, es decir , sistemas inerciales , cada uno dotado de su propio conjunto de cartesianos. coordenadas que rotulan los puntos, es decir, eventos del espacio-tiempo. Para expresar la invariancia de la velocidad de la luz en forma matemática, fije dos eventos en el espacio-tiempo, para que se registren en cada marco de referencia. Sea el primer evento la emisión de una señal luminosa y el segundo sea la absorción.
Elija cualquier marco de referencia de la colección. En sus coordenadas, al primer evento se le asignarán coordenadas., y el segundo . La distancia espacial entre emisión y absorción es, pero esta es también la distancia viajado por la señal. Por lo tanto, se puede establecer la ecuación
Todos los demás sistemas de coordenadas registrarán, en sus propias coordenadas, la misma ecuación. Ésta es la consecuencia matemática inmediata de la invariancia de la velocidad de la luz. La cantidad de la izquierda se llama intervalo espaciotemporal . El intervalo es, para eventos separados por señales luminosas, el mismo (cero) en todos los marcos de referencia y, por lo tanto, se denomina invariante .
Invarianza de intervalo
Para que la transformación de Lorentz tenga el significado físico realizado por la naturaleza, es crucial que el intervalo sea una medida invariante para dos eventos cualesquiera , no solo para aquellos separados por señales de luz. Para establecer esto, se considera un intervalo infinitesimal , [4]
como se registra en un sistema . Dejar ser otro sistema que asigne el intervalo a los mismos dos sucesos infinitesimalmente separados. Ya que si, entonces el intervalo también será cero en cualquier otro sistema (segundo postulado), y dado que y son infinitesimales del mismo orden, deben ser proporcionales entre sí,
En lo que puede ¿depender? Puede que no dependa de las posiciones de los dos eventos en el espacio-tiempo, porque eso violaría la homogeneidad postulada del espacio-tiempo . Podría depender de la velocidad relativa Entre y , pero solo en la velocidad, no en la dirección, porque esta última violaría la isotropía del espacio .
Ahora trae sistemas y ,
De estos se sigue,
Ahora, se observa que en el lado derecho que depende de ambos y ; así como en el ángulo entre los vectores y . Sin embargo, también se observa que el lado izquierdo no depende de este ángulo. Por lo tanto, la única forma de que la ecuación sea verdadera es si la funciónes una constante. Además, por la misma ecuación, esta constante es la unidad. Por lo tanto,
para todos los sistemas . Dado que esto se aplica a todos los intervalos infinitesimales, se aplica a todos los intervalos.
La mayoría, si no todas, las derivaciones de las transformaciones de Lorentz dan esto por sentado [No está claro qué es "esto". ¿Es "esto" que los intervalos espacio-temporales son iguales? ¿O es "esto" que lo que se aplica a todos los intervalos infinitesimales también se aplica a todos los intervalos? ]. En esas derivaciones, usan la constancia de la velocidad de la luz (invariancia de eventos separados similares a la luz) solamente. Este resultado asegura que la transformación de Lorentz sea la transformación correcta [De nuevo, no está claro a qué se refiere 'Esto'].
Declaración rigurosa y prueba de proporcionalidad de ds 2 y ds ′ 2
Teorema: Sea ser enteros, y un espacio vectorial sobrede dimensión . Dejar ser un producto interior indefinido en con tipo de firma . Suponer es una forma bilineal simétrica en tal que el conjunto nulo de la forma cuadrática asociada de está contenido en el de (es decir, supongamos que para cada , Si luego ). Entonces, existe una constante tal que . Además, si asumimos y eso también tiene tipo de firma , entonces nosotros tenemos .
Observaciones.
- En la sección anterior , el término "infinitesimal" en relación conen realidad se refiere (puntualmente) a una forma cuadrática sobre un espacio vectorial real de cuatro dimensiones (es decir, el espacio tangente en un punto de la variedad espaciotiempo). El argumento anterior se copia casi literalmente de Landau y Lifshitz, donde la proporcionalidad de y se enuncia simplemente como un hecho "obvio" aunque el enunciado no esté formulado de una manera matemáticamente precisa ni probado. Este es un hecho matemático no obvio que debe justificarse; afortunadamente, la demostración es relativamente simple y equivale a observaciones y manipulaciones algebraicas básicas.
- Los supuestos anteriores sobre significa lo siguiente: es una forma bilineal que es simétrica y no degenerada , de modo que existe una base ordenada de para cual Una forma equivalente de decir esto es que tiene la representación matricial relativo a la base ordenada .
- Si consideramos el caso especial donde entonces estamos tratando con la situación de la firma de Lorentz en 4 dimensiones, que es en lo que se basa la relatividad (o se podría adoptar la convención opuesta con un signo menos general; pero esto claramente no afecta la verdad del teorema) . Además, en este caso, si asumimos y ambos tienen formas cuadráticas con el mismo conjunto nulo (en terminología física, decimos que y dar lugar al mismo cono de luz) entonces el teorema nos dice que hay una constante tal que . Modulo algunas diferencias en notación, esto es precisamente lo que se usó en la sección anterior .
Prueba del teorema.
Por conveniencia, estemos de acuerdo en esta prueba en que los índices griegos como rango sobre mientras que los índices latinos como rango sobre . Además, usaremos la convención de suma de Einstein en todo momento.
Fijar una base de relativo a cual tiene la representación matricial . Además, para cada y teniendo norma euclidiana unitaria, considere el vector. Entonces, por bilinealidad tenemos, por lo tanto, por nuestra suposición, tenemos también. Usando bilinealidad y simetría de, esto es equivalente a
Dado que esto es cierto para todos de norma de unidad, podemos reemplazar con Llegar
Ahora, restamos estas dos ecuaciones y dividimos por 4 para obtener eso para todos de la norma de la unidad,
Entonces, al elegir y (es decir, con 1 en el índice especificado y 0 en cualquier otro lugar), vemos que Como resultado de esto, nuestra primera ecuación se simplifica a
Esto es una vez más cierto para todos y de norma de la unidad. Como resultado, todos los términos fuera de la diagonal desaparecen; con más detalle, supongason índices distintos. Considerar. Entonces, dado que el lado derecho de la ecuación no depende de, vemos eso y por lo tanto . Por un argumento casi idéntico deducimos que si son índices distintos entonces .
Finalmente, dejando sucesivamente rango sobre y luego dejar rango sobre , vemos eso
- ,
o en otras palabras, tiene la representación matricial , que es equivalente a decir . Entonces, la constante de proporcionalidad afirmada en el teorema es. Finalmente, si asumimos que ambos tienen tipos de firma y luego (no podemos tener porque eso significaría , lo cual es imposible ya que tiene el tipo de firma significa que es una forma bilineal distinta de cero. También si, entonces significa posee entradas diagonales positivas y entradas diagonales negativas; es decir, es de firma, ya que asumimos , por lo que esto tampoco es posible. Esto nos deja concomo única opción). Esto completa la demostración del teorema.
Configuración estándar
El intervalo invariante puede verse como una función de distancia definida no positiva en el espacio-tiempo. El conjunto de transformaciones buscadas debe dejar invariable esta distancia. Debido a la naturaleza cartesiana del sistema de coordenadas del sistema de referencia, se concluye que, al igual que en el caso euclidiano, las posibles transformaciones se componen de traslaciones y rotaciones, donde se debe permitir un significado ligeramente más amplio para el término rotación.
El intervalo es trivialmente invariante bajo traducción. Para las rotaciones, hay cuatro coordenadas. Por tanto, hay seis planos de rotación. Tres de ellos son rotaciones en planos espaciales. El intervalo también es invariante en rotaciones ordinarias. [4]
Queda por encontrar una "rotación" en los tres planos de coordenadas restantes que deje el intervalo invariante. De manera equivalente, encontrar una forma de asignar coordenadas para que coincidan con las coordenadas correspondientes a un marco en movimiento.
El problema general es encontrar una transformación tal que
Para resolver el problema general, se puede utilizar el conocimiento sobre la invariancia del intervalo de traslaciones y rotaciones ordinarias para suponer, sin pérdida de generalidad, [4] que los marcos F y F ′ están alineados de tal manera que sus ejes de coordenadas todos se reúnen en t = t '= 0 y que la x y x ' ejes están alineados de forma permanente y el sistema de F ' tiene una velocidad V a lo largo del positivo x eje x . Llame a esto la configuración estándar . Reduce el problema general a encontrar una transformación tal que
La configuración estándar se utiliza en la mayoría de los ejemplos siguientes. Una solución lineal del problema más simple
resuelve el problema más general ya que las diferencias de coordenadas luego se transforman de la misma manera. La linealidad a menudo se asume o argumenta de alguna manera en la literatura cuando se considera este problema más simple. Si la solución al problema más simple no es lineal, entonces no resuelve el problema original debido a los términos cruzados que aparecen al expandir los cuadrados.
Las soluciones
Como se mencionó, el problema general se resuelve mediante traducciones en el espacio-tiempo. Estos no aparecen como una solución al problema más simple planteado, mientras que los refuerzos sí (y algunas veces rotaciones dependiendo del ángulo de ataque). Existen aún más soluciones si uno solo insiste en la invariancia del intervalo para eventos separados como la luz. Se trata de transformaciones conformes no lineales ("conservación de ángulos"). Uno tiene
- Transformaciones de Lorentz ⊂ Transformaciones de Poincaré ⊂ Transformaciones de grupos conformes .
Algunas ecuaciones de la física son invariantes conforme, por ejemplo, las ecuaciones de Maxwell en el espacio libre de fuentes, [6] pero no todas. La relevancia de las transformaciones conformales en el espacio-tiempo no se conoce en la actualidad, pero el grupo conformal en dos dimensiones es muy relevante en la teoría de campos conformales y la mecánica estadística . [7] Es, pues, el grupo de Poincaré el que es señalado por los postulados de la relatividad especial. Es la presencia de refuerzos de Lorentz (para el que la suma de velocidades es diferente de la adición simple vector que permita velocidades superiores a la velocidad de la luz) en contraposición a aumentos ordinarios que la separa de la grupo galileo de galileo relatividad . Las rotaciones espaciales, las inversiones y traslaciones espaciales y temporales están presentes en ambos grupos y tienen las mismas consecuencias en ambas teorías (leyes de conservación del momento, la energía y el momento angular). No todas las teorías aceptadas respetan la simetría bajo las inversiones.
Usando la geometría del espacio-tiempo
Solución Landau & Lifshitz
El problema planteado en la configuración estándar para un impulso en la dirección x , donde las coordenadas primarias se refieren al sistema en movimiento , se resuelve encontrando una solución lineal al problema más simple.
La solución más general es, como se puede verificar mediante sustitución directa usando (H1), [4]
( 1 )
Para encontrar el papel de Ψ en el entorno físico, registre la progresión del origen de F ′ , es decir, x ′ = 0, x = vt . Las ecuaciones se vuelven (usando primero x ′ = 0 ),
Ahora divide:
donde x = vt se usó en el primer paso, (H2) y (H3) en el segundo, que, cuando se vuelve a conectar ( 1 ), da
o, con las abreviaturas habituales,
Este cálculo se repite con más detalle en la sección Rotación hiperbólica .
Rotación hiperbólica
Las transformaciones de Lorentz también pueden derivarse mediante la simple aplicación de los postulados de la relatividad especial y utilizando identidades hiperbólicas . [8]
- Postulados de la relatividad
Comience con las ecuaciones del frente de onda esférica de un pulso de luz, centrado en el origen:
que toman la misma forma en ambos marcos debido a los postulados especiales de la relatividad. A continuación, considere el movimiento relativo a lo largo de los ejes x de cada cuadro, en la configuración estándar anterior, de modo que y = y ′, z = z ′, que se simplifica a
- Linealidad
Ahora suponga que las transformaciones toman la forma lineal:
donde A , B , C , D se encuentran. Si fueran no lineales, no tomarían la misma forma para todos los observadores, ya que se producirían fuerzas ficticias (por lo tanto, aceleraciones) en un marco incluso si la velocidad fuera constante en otro, lo cual es inconsistente con las transformaciones inerciales del marco. [9]
Sustituyendo en el resultado anterior:
y comparando coeficientes de x 2 , t 2 , xt :
- Rotación hiperbólica
Las ecuaciones sugieren la identidad hiperbólica
La introducción del parámetro de rapidez ϕ como un ángulo hiperbólico permite las identificaciones consistentes
donde los signos después de las raíces cuadradas se eligen de manera que x y t aumento. Se han resuelto las transformaciones hiperbólicas para:
Si las señales se eligieron de manera diferente necesitarían las coordenadas de posición y tiempo para ser reemplazado por - x y / o - t modo que x y t aumento no disminuye.
Para encontrar cómo ϕ se relaciona con la velocidad relativa, a partir de la configuración estándar, el origen del marco con imprimación x ′ = 0 se mide en el marco sin imprimación para ser x = vt (o la forma equivalente y opuesta; el origen de la trama sin imprimación es x = 0 y en el marco cebado está en x ′ = - vt ):
y la manipulación de identidades hiperbólicas conduce a las relaciones entre β , γ y ϕ ,
De principios físicos
El problema generalmente se limita a dos dimensiones mediante el uso de una velocidad a lo largo de la x eje de tal manera que las Y y Z coordenadas no intervienen, como se describe en configuración estándar anteriormente.
Dilatación del tiempo y contracción de la longitud
Las ecuaciones de transformación pueden derivarse de la dilatación del tiempo y la contracción de la longitud , que a su vez pueden derivarse de los primeros principios. Con O y O ′ representando los orígenes espaciales de las tramas F y F ′ , y algún evento M , la relación entre los vectores de posición (que aquí se reducen a segmentos orientados OM , OO ′ y O′M ) en ambas tramas viene dada por : [10]
- OM = OO ' + O'M .
Usando las coordenadas ( x , t ) en F y ( x ′, t ′) en F ′ para el evento M, en el marco F los segmentos son OM = x , OO ′ = vt y O′M = x ′ / γ (ya que x ′ Es O′M medido en F ′ ):
Asimismo, en el marco F ′ , los segmentos son OM = x / γ (ya que x es OM medido en F ), OO ′ = vt ′ y O′M = x ′ :
Al reorganizar la primera ecuación, obtenemos
que es la parte espacial de la transformación de Lorentz. La segunda relación da
que es la inversa de la parte del espacio. La eliminación de x ′ entre las dos ecuaciones de la parte espacial da
que es la parte temporal de la transformación, la inversa de la cual se encuentra mediante una eliminación similar de x :
Frentes de onda esféricos de luz
Lo siguiente es similar al de Einstein. [11] [12] Como en la transformación de Galileo , la transformación de Lorentz es lineal ya que la velocidad relativa de los marcos de referencia es constante como un vector; de lo contrario, aparecerían fuerzas inerciales . Se denominan marcos de referencia inerciales o galileanos. Según la relatividad, ningún marco de referencia galileano es privilegiado. Otra condición es que la velocidad de la luz debe ser independiente del marco de referencia, en la práctica de la velocidad de la fuente de luz.
Considere dos marcos de referencia inerciales O y O ′, suponiendo que O está en reposo mientras O ′ se mueve con una velocidad v con respecto a O en la dirección x positiva . Los orígenes de O y O ′ coinciden inicialmente entre sí. Se emite una señal de luz desde el origen común y viaja como un frente de onda esférico. Considere un punto P en un esférica de frente de onda a una distancia r y r 'de los orígenes de O y O ', respectivamente. Según el segundo postulado de la teoría especial de la relatividad, la velocidad de la luz es la misma en ambos marcos, por lo que para el punto P :
La ecuación de una esfera en el marco O viene dada por
Para el frente de onda esférico que se convierte en
De manera similar, la ecuación de una esfera en el marco O ′ está dada por
para que el frente de onda esférico satisfaga
El origen O ′ se mueve a lo largo del eje x . Por lo tanto,
x ′ debe variar linealmente con x y t . Por tanto, la transformación tiene la forma
Para el origen de O ′ x ' y x están dados por
entonces, para todo t ,
y por lo tanto
Esto simplifica la transformación a
donde se va a determinar γ. En este punto, γ no es necesariamente una constante, pero se requiere que se reduzca a 1 para v ≪ c .
La transformación inversa es la misma excepto que el signo de v se invierte:
Las dos ecuaciones anteriores dan la relación entre t y t ′ como:
o
Reemplazando x ′, y ′, z ′ y t ′ en la ecuación de frente de onda esférica en el marco O ′,
con sus expresiones en términos de x , y , z y t produce:
y por lo tanto,
lo que implica,
o
Comparando el coeficiente de t 2 en la ecuación anterior con el coeficiente de t 2 en la ecuación de frente de onda esférico para el marco O produce:
Se pueden obtener expresiones equivalentes para γ haciendo coincidir los coeficientes x 2 o estableciendo el coeficiente tx en cero. Reorganizando:
o, eligiendo la raíz positiva para asegurar que los ejes xyx 'y los ejes de tiempo apunten en la misma dirección,
que se llama factor de Lorentz . Esto produce la transformación de Lorentz a partir de la expresión anterior. Es dado por
La transformación de Lorentz no es la única transformación que deja invariante la forma de ondas esféricas, ya que existe un conjunto más amplio de transformaciones de ondas esféricas en el contexto de la geometría conforme , dejando invariante la expresión. Sin embargo, las transformaciones conformes de cambio de escala no se pueden utilizar para describir simétricamente todas las leyes de la naturaleza, incluida la mecánica , mientras que las transformaciones de Lorentz (la única que implica) representan una simetría de todas las leyes de la naturaleza y se reducen a transformaciones galileanas en .
La relatividad de Galileo y Einstein
Marcos de referencia galileanos
En cinemática clásica, el desplazamiento total x en el marco R es la suma del desplazamiento relativo x ′ en el marco R ′ y de la distancia entre los dos orígenes x - x ′. Si v es la velocidad relativa de R ′ relativa a R, la transformación es: x = x ′ + vt , o x ′ = x - vt . Esta relación es lineal para una constante v , es decir, cuando R y R ′ son marcos de referencia galileanos.
En la relatividad de Einstein, la principal diferencia con la relatividad galileana es que las coordenadas espaciales y temporales están entrelazadas, y en diferentes marcos inerciales t ≠ t ′.
Dado que se supone que el espacio es homogéneo, la transformación debe ser lineal. La relación lineal más general se obtiene con cuatro coeficientes constantes, A , B , γ yb :
La transformación lineal se convierte en la transformación de Galileo cuando γ = B = 1, b = - v y A = 0.
Un objeto en reposo en el marco R ′ en la posición x ′ = 0 se mueve con velocidad constante v en el marco R. Por tanto, la transformación debe producir x ′ = 0 si x = vt . Por lo tanto, b = - γv y la primera ecuación se escribe como
Usando el principio de relatividad
Según el principio de relatividad, no existe un marco de referencia galileano privilegiado: por lo tanto, la transformación inversa de la posición del marco R ′ al marco R debe tener la misma forma que el original pero con la velocidad en la dirección opuesta, reemplazando v con -v :
y por lo tanto
Determinando las constantes de la primera ecuación
Dado que la velocidad de la luz es la misma en todos los marcos de referencia, para el caso de una señal luminosa, la transformación debe garantizar que t = x / c cuando t ′ = x ′ / c .
La sustitución de t y t ′ en las ecuaciones anteriores da:
Multiplicar estas dos ecuaciones juntas da,
En cualquier momento después de t = t ′ = 0, xx ′ no es cero, por lo que dividir ambos lados de la ecuación por xx ′ da como resultado
que se llama el "factor de Lorentz".
Cuando se requieren las ecuaciones de transformación para satisfacer las ecuaciones de la señal luminosa en la forma x = ct y x ′ = ct ′, sustituyendo los valores x y x ' , la misma técnica produce la misma expresión para el factor de Lorentz. [13] [14]
Determinando las constantes de la segunda ecuación
La ecuación de transformación para el tiempo se puede obtener fácilmente considerando el caso especial de una señal luminosa, satisfaciendo nuevamente x = ct y x ′ = ct ′, sustituyendo término por término en la ecuación obtenida anteriormente para la coordenada espacial
donación
así que eso
que, cuando se identifica con
determina los coeficientes de transformación A y B como
Entonces A y B son los coeficientes constantes únicos necesarios para preservar la constancia de la velocidad de la luz en el sistema de coordenadas primado.
La derivación popular de Einstein
En su popular libro [15] Einstein derivó la transformación de Lorentz argumentando que debe haber dos constantes de acoplamiento distintas de cero λ y μ tales que
que corresponden a la luz que viaja a lo largo del eje x positivo y negativo, respectivamente. Para luz x = ct si y solo si x ′ = ct ′ . Sumar y restar las dos ecuaciones y definir
da
Sustituyendo x ′ = 0 correspondiente ax = vt y observando que la velocidad relativa es v = bc / γ , esto da
La constante γ se puede evaluar exigiendo c 2 t 2 - x 2 = c 2 t ′ 2 - x ′ 2 según la configuración estándar .
Usando la teoría de grupos
De los postulados del grupo
Lo que sigue es una derivación clásica (ver, por ejemplo, [1] y las referencias allí) basada en postulados de grupo e isotropía del espacio.
- Coordinar transformaciones como grupo
Las transformaciones de coordenadas entre marcos inerciales forman un grupo (llamado el grupo de Lorentz adecuado ) con la operación de grupo siendo la composición de transformaciones (realizando una transformación tras otra). De hecho, se satisfacen los cuatro axiomas de grupo:
- Cierre : la composición de dos transformaciones es una transformación: considere una composición de transformaciones del marco inercial K al marco inercial K ′, (denotado como K → K ′), y luego de K ′ al marco inercial K ′ ′, [ K ′ → K ′ ′], existe una transformación, [ K → K ′] [ K ′ → K ′ ′], directamente de un marco inercial K al marco inercial K ′ ′.
- Asociatividad : las transformaciones ([ K → K ′] [ K ′ → K ′ ′]) [ K ′ ′ → K ′ ′ ′] y [ K → K ′] ([ K ′ → K ′ ′] [ K ′ ′ → K ′ ′ ′]) son idénticos.
- Elemento de identidad : hay un elemento de identidad, una transformación K → K .
- Elemento inverso : para cualquier transformación K → K 'existe una transformación inversa K ' → K .
- Matrices de transformación consistentes con axiomas de grupo
Considere dos marcos inerciales, K y K ′, el último moviéndose con velocidad v con respecto al primero. Por rotaciones y desplazamientos podemos elegir la x y x 'a lo largo del vector velocidad relativa y también que los eventos ejes ( t , x ) = (0,0) y ( t ', x ') = (0,0) coinciden. Dado que el aumento de velocidad está a lo largo de los ejes x (y x ′ ), no sucede nada con las coordenadas perpendiculares y podemos simplemente omitirlas por brevedad. Ahora, dado que la transformación que estamos buscando conecta dos marcos inerciales, tiene que transformar un movimiento lineal en ( t , x ) en un movimiento lineal en coordenadas ( t ′, x ′) . Por tanto, debe ser una transformación lineal. La forma general de una transformación lineal es
donde α , β , γ y δ son algunas funciones aún desconocidas de la velocidad relativa v .
Consideremos ahora el movimiento del origen del marco K ′. En el marco K ′ tiene coordenadas ( t ′, x ′ = 0) , mientras que en el marco K tiene coordenadas ( t , x = vt ) . Estos dos puntos están conectados por la transformación
de donde obtenemos
- .
De manera análoga, considerando el movimiento del origen del cuadro K , obtenemos
de donde obtenemos
- .
La combinación de estos dos da α = γ y la matriz de transformación se ha simplificado,
Ahora considere el elemento inverso del postulado de grupo . Hay dos formas en que podemos pasar del sistema de coordenadas K ′ al sistema de coordenadas K. La primera es aplicar la inversa de la matriz de transformación a las coordenadas K ′:
La segunda es que, considerando que el sistema de coordenadas K ′ se mueve a una velocidad v relativa al sistema de coordenadas K , el sistema de coordenadas K debe moverse a una velocidad - v relativa al sistema de coordenadas K ′. Reemplazando v con - v en la matriz de transformación da:
Ahora bien, la función γ no puede depender de la dirección de v porque aparentemente es el factor que define la contracción relativista y la dilatación del tiempo. Estos dos (en un mundo isotrópico nuestro) no pueden depender de la dirección del v . Por lo tanto, γ (- v ) = γ ( v ) y comparando las dos matrices, obtenemos
Según el postulado del grupo de cierre , una composición de dos transformaciones de coordenadas también es una transformación de coordenadas, por lo que el producto de dos de nuestras matrices también debería ser una matriz de la misma forma. Transformar K a K ′ y de K ′ a K ′ ′ da la siguiente matriz de transformación para ir de K a K ′ ′:
En la matriz de transformación original, los elementos diagonales principales son iguales a γ , por lo tanto, para que la matriz de transformación combinada anterior tenga la misma forma que la matriz de transformación original, los elementos diagonales principales también deben ser iguales. Al equiparar estos elementos y reorganizarlos se obtiene:
El denominador será distinto de cero para v distinto de cero , porque γ ( v ) siempre es distinto de cero;
- .
Si v = 0 tenemos la matriz identidad que coincide con poner v = 0 en la matriz que obtenemos al final de esta derivación para los otros valores de v , haciendo que la matriz final sea válida para todas las v no negativas .
Para la v distinta de cero , esta combinación de función debe ser una constante universal, una y la misma para todos los marcos inerciales. Defina esta constante como δ ( v ) / v γ ( v ) = κ , donde κ tiene la dimensión de 1 / v 2 . Resolviendo
finalmente conseguimos
y así la matriz de transformación, consistente con los axiomas de grupo, está dada por
Si κ > 0 , entonces habría transformaciones (con κv 2 ≫ 1 ) que transforman el tiempo en una coordenada espacial y viceversa. Excluimos esto por motivos físicos, porque el tiempo solo puede correr en la dirección positiva. Por tanto, dos tipos de matrices de transformación son consistentes con los postulados de grupo:
- con la constante universal κ = 0 , y
- con κ <0 .
- Transformaciones galileanas
Si κ = 0 entonces obtenemos la cinemática galileana-newtoniana con la transformación galileana,
donde el tiempo es absoluto, t ′ = t , y la velocidad relativa v de dos marcos inerciales no está limitada.
- Transformaciones de Lorentz
Si κ <0 , establecemosque se convierte en la velocidad invariante , la velocidad de la luz en el vacío. Esto produce κ = −1 / c 2 y, por lo tanto, obtenemos la relatividad especial con la transformación de Lorentz
donde la velocidad de la luz es una constante universal finita que determina la velocidad relativa más alta posible entre marcos inerciales.
Si v ≪ c, la transformación de Galileo es una buena aproximación a la transformación de Lorentz.
Solo el experimento puede responder a la pregunta de cuál de las dos posibilidades, κ = 0 o κ <0 , se realiza en nuestro mundo. Los experimentos que miden la velocidad de la luz, realizados por primera vez por un físico danés Ole Rømer , muestran que es finita, y el experimento de Michelson-Morley mostró que es una velocidad absoluta y, por tanto, κ <0 .
Impulso de generadores
Usando rapidez ϕ para parametrizar la transformación de Lorentz, el impulso en la dirección x es
igualmente para un impulso en la dirección y
y la dirección z
donde e x , e y , e z son los vectores base cartesianos , un conjunto de vectores unitarios mutuamente perpendiculares a lo largo de sus direcciones indicadas. Si un fotograma se incrementa con una velocidad v relativa a otro, es conveniente introducir un vector unitario n = v / v = β / β en la dirección del movimiento relativo. El impulso general es
Observe que la matriz depende de la dirección del movimiento relativo, así como de la rapidez, en los tres números (dos para la dirección, uno para la rapidez).
Podemos convertir cada una de las matrices de refuerzo en otra forma de la siguiente manera. Primero considere el impulso en la dirección x . La expansión de Taylor de la matriz de refuerzo sobre ϕ = 0 es
donde las derivadas de la matriz con respecto a ϕ se dan diferenciando cada entrada de la matriz por separado, y la notación | ϕ = 0 indica que ϕ se pone a cero después de evaluar las derivadas. Expandirse al primer orden da la transformación infinitesimal
lo cual es válido si ϕ es pequeño (por lo tanto, ϕ 2 y las potencias superiores son despreciables), y puede interpretarse como sin refuerzo (el primer término I es la matriz de identidad 4 × 4), seguido de un pequeño refuerzo. La matriz
es el generador del impulso en la dirección x , por lo que el impulso infinitesimal es
Ahora, ϕ es pequeño, por lo que dividir por un entero positivo N da un incremento aún menor de rapidez ϕ / N , y N de estos impulsos infinitesimales darán el impulso infinitesimal original con rapidez ϕ ,
En el límite de un número infinito de pasos infinitamente pequeños, obtenemos la transformación de impulso finito
que es la definición límite de la exponencial debida a Leonhard Euler , y ahora es cierta para cualquier ϕ .
Repitiendo el proceso para los refuerzos en los Y y Z direcciones obtiene los otros generadores
y los impulsos son
Para cualquier dirección, la transformación infinitesimal es ( ϕ pequeña y expansión a primer orden)
dónde
es el generador del impulso en la dirección n . Es el generador de impulso completo, un vector de matrices K = ( K x , K y , K z ) , proyectado en la dirección del impulso n . El impulso infinitesimal es
Luego, en el límite de un número infinito de pasos infinitamente pequeños, obtenemos la transformación de impulso finito
que ahora es cierto para cualquier ϕ . Expandiendo la matriz exponencial de - ϕ ( n ⋅ K ) en su serie de potencias
ahora necesitamos los poderes del generador. La plaza es
pero el cubo ( n ⋅ K ) 3 vuelve a ( n ⋅ K ) , y como siempre la potencia de orden cero es la identidad 4 × 4, ( n ⋅ K ) 0 = I . En general, las potencias impares n = 1, 3, 5,… son
mientras que las potencias pares n = 2, 4, 6,… son
por lo tanto, la forma explícita de la matriz de refuerzo depende solo del generador y su cuadrado. Al dividir la serie de potencias en una serie de potencia impar y una serie de potencia par, utilizando las potencias pares e impares del generador, y la serie de Taylor de sinh ϕ y cosh ϕ aproximadamente ϕ = 0 se obtiene una forma más compacta pero detallada de la matriz de impulso
donde 0 = −1 + 1 se introduce para la serie de potencias pares para completar la serie de Taylor para cosh ϕ . El impulso es similar a la fórmula de rotación de Rodrigues ,
Negar la rapidez en el exponencial da la matriz de transformación inversa,
En mecánica cuántica , mecánica cuántica relativista y teoría cuántica de campos , se utiliza una convención diferente para los generadores de impulso; todos los generadores de impulso se multiplican por un factor de la unidad imaginaria i = √ −1 .
De experimentos
Howard Percy Robertson y otros demostraron que la transformación de Lorentz también se puede derivar empíricamente. [16] [17] Para lograr esto, es necesario escribir transformaciones de coordenadas que incluyan parámetros comprobables experimentalmente. Por ejemplo, que se le dé un único marco inercial "preferido"en el que la velocidad de la luz es constante, isótropa e independiente de la velocidad de la fuente. También se supone que la sincronización de Einstein y la sincronización por transporte de reloj lento son equivalentes en este marco. Entonces asume otro cuadroen movimiento relativo, en el que relojes y varillas tienen la misma constitución interna que en el marco preferido. Sin embargo, las siguientes relaciones quedan sin definir:
- diferencias en las mediciones de tiempo,
- diferencias en las longitudes longitudinales medidas,
- diferencias en las longitudes transversales medidas,
- depende del procedimiento de sincronización del reloj en la trama móvil,
entonces las fórmulas de transformación (que se supone que son lineales) entre esos marcos vienen dadas por:
depende de la convención de sincronización y no se determina experimentalmente, obtiene el valor utilizando la sincronización de Einstein en ambos marcos. La relación entre y está determinada por el experimento de Michelson-Morley , la relación entre y está determinada por el experimento de Kennedy-Thorndike , ysolo está determinado por el experimento de Ives-Stilwell . De esta forma, se han determinado con gran precisión para y , que convierte la transformación anterior en la transformación de Lorentz.
Ver también
- Grupo Lorentz
- Teorema de noether
- Grupo Poincaré
- Momento apropiado
- Métrica relativista
- Spinor
Notas
- ^ "Filosofía de Newton" . stanford.edu .
- ^ Zeeman, Erik Christopher (1964), "La causalidad implica el grupo de Lorentz", Journal of Mathematical Physics , 5 (4): 490–493, Bibcode : 1964JMP ..... 5..490Z , doi : 10.1063 / 1.1704140
- ^ Goldstein, Norman (2007). "Inercialidad implica el grupo de Lorentz" (PDF) . Revista Electrónica de Física Matemática . 13 . ISSN 1086-6655 . Consultado el 14 de febrero de 2016 .
- ↑ a b c d ( Landau y Lifshitz 2002 )
- ↑ University Physics - With Modern Physics (12a edición), HD Young, RA Freedman (edición original), Addison-Wesley (Pearson International), 1a edición: 1949, 12a edición: 2008, ISBN 978-0-321-50130-1
- ^ Greiner y Bromley 2000 , Capítulo 16
- ^ Weinberg 2002 , nota al pie p. 56
- ^ Relatividad desmitificada, D. McMahon, Mc Graw Hill (Estados Unidos), 2006, ISBN 0-07-145545-0
- ^ Una introducción a la mecánica, D. Kleppner, RJ Kolenkow, Cambridge University Press, 2010, ISBN 978-0-521-19821-9
- ^ Levy, Jean-Michel (2007). "Una derivación simple de la transformación de Lorentz y de las fórmulas de velocidad y aceleración relacionadas" (PDF) . pag. 2 . Consultado el 11 de enero de 2017 .
- ^ Einstein, Albert (1916). "Relatividad: la teoría general y especial" (PDF) . Consultado el 23 de enero de 2012 .
- ^ Stauffer, Dietrich; Stanley, Harry Eugene (1995). De Newton a Mandelbrot: una introducción a la física teórica (segunda edición ampliada). Springer-Verlag . pag. 80,81. ISBN 978-3-540-59191-7.
- ^ Nacido, Max (2012). Teoría de la relatividad de Einstein (edición revisada). Publicaciones de Courier Dover . págs. 236-237. ISBN 978-0-486-14212-8. Extracto de la página 237
- ^ Gupta, SK (2010). Física de la ingeniería: Vol. 1 (18a ed.). Krishna Prakashan Media. págs. 12-13. ISBN 978-81-8283-098-1. Extracto de la página 12
- ^ Einstein, Albert (1916). "Relatividad: la teoría general y especial" (PDF) . Consultado el 23 de enero de 2012 .
- ^ Robertson, HP (1949). "Postulado versus observación en la teoría especial de la relatividad" (PDF) . Reseñas de Física Moderna . 21 (3): 378–382. Código Bibliográfico : 1949RvMP ... 21..378R . doi : 10.1103 / RevModPhys.21.378 .
- ^ Mansouri R., Sexl RU (1977). "Una teoría de prueba de la relatividad especial. I: Simultaneidad y sincronización de reloj". Gen. Rel. Gravit . 8 (7): 497–513. Código Bibliográfico : 1977GReGr ... 8..497M . doi : 10.1007 / BF00762634 . S2CID 67852594 .
Referencias
- Greiner, W .; Bromley, DA (2000). Mecánica cuántica relativista (3ª ed.). saltador. ISBN 9783540674573.
- Landau, LD ; Lifshitz, EM (2002) [1939]. La teoría clásica de los campos . Curso de Física Teórica. 2 (4ª ed.). Butterworth – Heinemann . ISBN 0-7506-2768-9.
- Weinberg, S. (2002), La teoría cuántica de los campos , 1 , Cambridge University Press , ISBN 0-521-55001-7