Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
Teoria Clássica de Campos Mario C. Bertin 29 de agosto de 2015 2 Sumário 1 Transformações de Lorentz 5 1.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.2 Postulados fundamentais da relatividade restrita . . . . . . . . . . . . . . . . . . . 6 1.3 Transformações de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.4 Composição de velocidades, contração de Lorentz e dilatação do tempo . . . . . . . 9 1.5 O espaço-tempo de Minkowski . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.6 A partícula livre relativística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2 Transformações infinitesimais 15 2.1 Transformações infinitesimais em Rn . . . . . . . . . . . . . . . . . . . . . . . . . . 15 2.2 Evolução temporal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 2.3 Translações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.4 Rotações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 3 A geometria de Minkowski 21 3.1 Vetores e covetores de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 3.2 Tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 3.3 Ortogonalidade e os grupos de Lorentz e Poincaré . . . . . . . . . . . . . . . . . . . 23 3.4 Álgebra de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 3.5 A representação adjunta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 3.6 Invariantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 4 O formalismo lagrangiano para campos 29 4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 4.2 Variações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 4.3 A primeira variação da ação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 4.4 Os termos de fronteira . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 4.5 Os princípios de Hamilton e Weiss e as equações de campo . . . . . . . . . . . . . . 36 5 Os teoremas de Noether 39 5.1 Simetrias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 5.2 A equação de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 5.3 O primeiro teorema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 5.4 Cargas conservadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 5.5 Translações e a conservação de energia e momento . . . . . . . . . . . . . . . . . . . 44 5.6 Rotações, momento angular e spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 5.7 O segundo teorema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 5.8 Invariantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 6 O campo escalar 57 6.1 O campo escalar real . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 6.2 O campo escalar complexo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 6.3 Simetrias internas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 6.4 Simetrias de gauge locais e interação . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 3 7 O campo eletromagnético 63 7.1 O campo vetorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 7.2 O campo eletromagnético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 7.3 Liberdade de gauge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 8 Campos espinoriais 73 8.1 A álgebra de Clifford relativística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 8.2 Rotações: a representação espinorial das transformações de Lorentz . . . . . . . . 77 8.3 Representações de spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 8.4 Espinores de Weyl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 8.5 A ação de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 8.6 Aplicando o princípio de Weiss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 9 Campos de Gauge 89 9.1 Revisitando o campo escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 9.2 Transformações de gauge globais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 9.3 Transformações de gauge locais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 9.4 A lagrangiana invariante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 Referências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 4 Capítulo 1 Transformações de Lorentz 1.1 Introdução Na mecânica clássica, a trajetória de uma partícula é descrita a partir da segunda lei de Newton F = dp dt , (1.1) em que p = mv, sendo m a massa e v = x˙ = dx/dt a velocidade da partícula, definida a partir da escolha de um sistema de coordenadas no espaço retangular R3. A posição da partícula pode ser representada por um vetor posição x = (x, y, z), em que x, y e z são número reais relacionados a três eixos cartesianos ex, ey e ez. A escolha de um sistema de coordenadas que descreve o movimento de uma partícula em R3 é o equivalente físico à escolha de um sistema de referência a partir do qual qualquer medida sobre o sistema pode ser tomada. Segundo a primeira lei de Newton, se a força resultante que age sobre uma partícula é nula, existe sempre um sistema referencial para o qual a velocidade da partícula é constante em sentido, direção e módulo. Um referencial que obedece a essa propriedade é chamado referencial inercial, e uma das proprieda- des mais importantes da dinâmica de um sistema clássico é que (1.1) continua vális ou, dito de outra forma, é covariante em qualquer desses referenciais. Dizemos, assim, que o sistema físico é invariante sob a escolha entre referenciais inerciais. Esta invariância retira do espaço o caráter absoluto que lhe havia atribuído a mecânica de Aristóteles. Por outro lado, outra suposição fundamental da mecânica newtoniana é sobre a natureza imutável do tempo. Para qualquer referencial inercial, a passagem do tempo deve ser a mesma, o que implica que se dois referenciais inerciais são usados para descrever um mesmo sistema, intervalos de tempo medidos por ambos possuem o mesmo valor absoluto. Vamos supor uma partícula de massa m de força resultante nula, que se move com velocidade v com relação a um determinado referencial inercial O, cujo sistema de coordenadas seja dado por x = (x, y, z). Agora vamos supor um segundo referencial inercial O′. Por simplicidade vamos escolher este segundo referencial de modo que seus eixos cartesianos sejam paralelos aos eixos cartesianos de O e que, em t = 0, a origem dos dois sistemas coincida. O sistema de coordenadas de O′ é dado por x′ = (x′, y′, z′) e sua origem move-se com velocidade u, constante, com relação a O. Ambos os sistemas de coordenadas estão relacionados por x′ = x− ut. (1.2) Lembremos que, segundo o caráter absoluto do tempo, t′ = t. Se x (t) representa a trajetória da partícula sob o ponto de vista de O, (1.2) também resulta na trajetória da partícula x′ (t) medida pelo referencial O′. Neste caso, a velocidade da partícula medida por O′ é dada por v′ = dx′ dt′ = dx′ dt = d dt (x− ut) = dx dt − u = v − u. (1.3) Esta é a lei de composição de velocidades na mecânica newtoniana. Note que p′ = mv′ =⇒ dp ′ dt = m dv′ dt = m dv dt = dp dt , (1.4) 5 desde que a massa seja constante. Este resultado implica que a aceleração de um sistema é invariante sob a escolha de referenciais inerciais. Para que a segunda lei (1.1) seja covariante, uma força F que age sobre a partícula também não pode depender da escolha do referencial inercial. Outro invariante sob a transformação (1.2) vem a ser a quantidade ds2 = dx2 + dy2 + dz2 = dx · dx, (1.5) que é a métrica euclidiana do espaço cartesiano R3. Tomando-se (1.2), temos (ds′)2 = dx′ · dx′ = dx · dx = ds2. (1.6) Dada a invariância da métrica, é imediato notar que a norma dos vetores em R3 também é preservada, o que implica que distâncias medidas por O devem ser as mesmas medidas por O′. Portanto, os sistemas físicos descritos pela mecânica clássica são invariantes pelas transfor- mações x′ = x− ut, (1.7a) t′ = t, (1.7b) que são chamadas transformações de Galilei. 1.2 Postulados fundamentais da relatividade restrita Até o século XIX, a relatividade de Galilei era considerada uma propriedade dos sistemas físi- cos, em razão do grande sucesso da mecânica clássica. Contudo, na segunda metade do século XIX as bases matemáticas do eletromagnetismo clássico foram reunidas em forma final, através das equações de Maxwell. Foi uma grande surpresa quando os estudos de Lorentz e Poincaré revelaram que tais equações não eram covariantes às transformações (1.7), ou seja, o eletro- magnetismo não obedecia à relatividade galileana. Este fato tornou-se um problema teórico fundamental, visto que a lei de força de Lorentz é baseada na mecânica newtoniana e, portanto, uma incompatibilidade entre a teoria de Maxwell e a mecânica surgiu em nível formal. Esta incompatibilidade não foi, contudo, observada imediatamente nas experiências em ele- trodinâmica clássica (as trajetórias de partículas carregadas que se movem em campos eletro- magnéticos, por exemplo, são bem descritas desde que as velocidades das partículas sejam ti- picamente pequenas). Contudo, experimentos como o de Michelson e Morley (1989) mostraram que a velocidade da luz no vácuo independe do movimento relativo entre a fonte e o observador, em clara violação da relatividade de Galilei. Einstein observou que a incompatibilidade entre o eletromagnetismo e a mecânica newtoni- ana deveria ser corrigida modificando-se a mecânica, de modo que os sistemas físicos obedeces- sem dois postulados fundamentais: 1. Todo sistema físico é invariante pela escolha de referencial inercial; 2. A velocidade da luz é uma constante independente do movimento relativo entre fonte e observador. Vamos supor que uma fonte de luz seja ligada na origem de um dado referencial inercial O, que é munido de um sistema de coordenadas x = (x, y, z) e, também, de um relógio cujo instante t = 0 marca o instante em que a fonte de luz é ligada. A frente de onda se move à velocidade da luz, que denominaremos como c (tem o valor de exatamente 299.792.458 metros por segundo no vácuo), e é descrita pela equação x2 + y2 + z2 = c2t2, neste referencial. Agora, consideremos um segundo referencial inercial O′, não rotacionado com relação a O. O sistema de coordenadas x′ = (x′, y′, z′) relativo a O′ tem origem coincidente com a origem de O no instante em que a fonte é ligada, ou seja, quando t = 0 em O. Contudo, consideraremos que 6 O′ possui seu próprio relógio e que, neste, o intervalo de tempo medido não coincide necessari- amente com o relógio carregado por O. Ou seja, t′ 6= t. Mas podemos definir o tempo em O′ de modo que t′ = 0 quando t = 0. Isto é possível visto que as coordenadas da fonte são as mesmas em ambos os referenciais quando esta é ligada, ou seja, o evento que deu origem ao pulso de luz é simultâneo em ambos os referenciais. Se a velocidade da frente de onda é a mesma para ambos os referenciais, temos x′2 + y′2 + z′2 = c2t′2, ou seja, c2t′2 − r′2 = c2t2 − r2, (1.8) em que r2 = x2 +y2 + z2, o mesmo para r′. Para simplificar o sistema, vamos supor que O′ mova- se com velocidade constante u = uex com relação a O, em que u seja constante, real e positivo. Assim, c2t′2 − x′2 = c2t2 − x2. (1.9) Esta configuração é chamada configuração padrão. 1.3 Transformações de Lorentz Para que o postulado 1 seja válido, a transformação (t, x) → (t′, x′) deve ser linear. Portanto vamos considerar x′ = Ax+ cBt, ct′ = Cx+ cDt. Em (1.9), temos c2t2 − x2 = (Cx+ cDt)2 − (Ax+ cBt)2 = C2x2 + c2D2t2 + 2cCDxt−A2x2 − c2B2t2 − 2cABxt = ( C2 −A2)x2 + (D2 −B2) c2t2 + 2c (CD −AB)xt. Ao igualar os coeficientes, C2 −A2 = −1, D2 −B2 = 1, CD = AB. Vamos supor a seguinte solução: A = D = coshφ, B = C = − sinhφ, em que o ângulo φ é chamado rapidez. Esta solução não é única, mas é escolhida por requeri- mentos físicos. Em primeiro lugar, a configuração padrão implica que x′ e t′ crescem com x e t, por isso a escolha do sinal negativo em B e C. Em segundo lugar, as transformações resultantes devem levar às transformações de Galilei para |u| � c. Levando em conta esses critérios, temos x′ = x coshφ− ct sinhφ, ct′ = −x sinhφ+ ct coshφ, ou em forma matricial,( ct′ x′ ) = ( coshφ − sinhφ − sinhφ coshφ )( ct x ) . (1.10) 7 Podemos, também, colocar o sistema na forma x′ = coshφ (x− tanhφct) , ct′ = coshφ (ct− tanhφx) . Para interpretar o significado físico de φ, vamos observar a origem de O′, ou seja, x′ = 0. Isto implica em x− tanhφct = 0 =⇒ tanhφ = x ct . Contudo, u = x/t, portanto tanhφ = u c ≡ β. (1.11) Vamos definir, também, γ ≡ coshφ. (1.12) Assim, temos tanhφ = β =⇒ γ = sinhφ β , enquanto cosh2 φ− sinh2 φ = 1 =⇒ sinh2 φ = γ2 − 1. Comparando-se as duas equações, temos γ2 = γ2 − 1 β =⇒ γ2 (1− β2) = 1 =⇒ γ = √ 1 1− β2 . Portanto, a transformação pode ser colocada também nas formas mais conhecidas x′ = γ (x− βct) , t′ = γ ( t− β c x ) , ou x′ = x− ut√ 1− u2/c2 , (1.13a) t′ = t− (u/c2)x√ 1− u2/c2 . (1.13b) Nesta configuração, as direções y e z ficam inalteradas, de modo que a forma completa é dada por x′ = x− ut√ 1− u2/c2 , (1.14a) y′ = y, (1.14b) z′ = z, (1.14c) t′ = t− (u/c2)x√ 1− u2/c2 , (1.14d) ou nas duas formas de notação matricial, ct′ x′ y′ z′ = coshφ − sinhφ 0 0 − sinhφ coshφ 0 0 0 0 1 0 0 0 0 1 ct x y z , (1.15) ct′ x′ y′ z′ = γ −γβ 0 0 −γβ γ 0 0 0 0 1 0 0 0 0 1 ct x y z , (1.16) 8 As transformações (3.12), ou mesmo na forma (1.15) são chamadas transformações de Lorentz, ou simplesmente boosts de Lorentz. É imediato observar que as transformações de Lorentz in- versas são dadas substituindo-se u por −u, β por −β ou φ por −φ nessas transformações. As transformações de Lorentz são precisamente as transformações que deixam a teoria eletromag- nética de Maxwell invariante. A forma mais geral das transformações de Lorentz, usadas quando os referenciais O e O′ movem-se com uma velocidade u = uxex + uyey + uzez, mas ainda mantêm a mesma orientação, é dada por( ct′ r′ ) = ( γ −γBT −γB (γ − 1) BBT /β2 )( ct r ) , (1.17) em que B é o vetor coluna B ≡ βxβy βz = 1 c uxuy uz = u c , e BT é o vetor linha BT ≡ ( βx βy βz ) = 1 c ( ux uy uz ) = uT c . O produto BBT é dado por BBT = β2x βxβy βxβzβyβx β2y βyβz βzβx βzβy β 2 z , e β2 = BTB = |u|2 /c2. Observando-se a forma (1.15), é imediato calcular o limite não relativístico, ou seja, a baixas velocidades das transformações de Lorentz. Observemos que este limite é dado por u� c =⇒ β � 1 =⇒ φ� 1. Neste caso, temos sinhφ→ φ, coshφ→ 1, tanhφ→ φ = β = u/c. Então, ct′ x′ y′ z′ = 1 −β 0 0 −β 1 0 0 0 0 1 0 0 0 0 1 ct x y z , ou seja, x′ = x− βct = x− ut, t′ = t− β c x = t− u c2 x ≈ t, que são as transformações de Galilei na configuração padrão. 1.4 Composição de velocidades, contração de Lorentz e di- latação do tempo Vamos verificar como um objeto, que se move a uma velocidade v com relação a O, move-se com relação ao referencial O′. Por simplicidade vamos utilizar a configuração padrão, neste caso, vx = dx dt . 9 Vamos utilizar a transformação de Lorentz inversa dada por x = γ (x′ + βct′) . Temos, considerando-se γ e β constantes, vx = dx dt = γ ( dx′ dt + βc dt′ dt ) = γ ( dx′ dt + βc dt′ dt ) = γ ( dx′ dt′ + βc ) dt′ dt . Agora, temos a transformação t′ = γ ( t− β c x ) =⇒ dt ′ dt = γ ( 1− βvx c ) . Portanto, vx = γ 2 ( 1− βvx c ) (v′x + βc) = 1− βvx/c 1− β2 (v ′ x + βc) . v′x = vx ( 1− β2)− βc (1− βvx/c) 1− βvx/c = vx − vxβ2 − βc+ β2vx 1− βvx/c = vx − βc 1− βvx/c , ou seja, v′x = vx − u 1− uvx/c2 . (1.18) Para as demais componentes, temos vy = dy dt = dy′ dt = dy′ dt′ dt′ dt = v′y dt′ dt = γv′y ( 1− βvx c ) , ou v′y = vy γ (1− uvx/c2) . (1.19) Ainda, v′z = vz γ (1− uvx/c2) . (1.20) Essas são as equações para composição de velocidades na relatividade restrita. Através essas, podemos mostrar que a velocidade da luz é a mesma para ambos os referenciais. Um raio de luz disparado em (x = 0, t = 0) no referencial O tem velocidade vx = c. Portanto, temos v′x = c− u 1− uc/c2 = c− u 1− u/c = c ( 1− u/c 1− u/c ) = c, em concordância com o segundo postulado. Vamos supor uma régua de comprimento l com relação a um sistema referencial em repouso O. Neste caso, temos l = x2 − x1, em que x2 é a posição de uma das extremidades da régua, enquanto x1 < x2 é a posição da outra extremidade, ambas com relação a O. Supondo um segundo referencial O′ que se move com velocidade u = uex com relação a O, em uma configuração padrão, temos x(2,1) = γ ( x′(2,1) + ut ′ (2,1) ) , 10 em que t′(2,1) são os instantes de tempo medidos por O′ em que as medidas de posição da régua são tomadas. Para que O′ tome uma medida do comprimento da régua, as medidas de x′1 e x′2 devem ser sincronizadas, ou seja, tomadas considerando-se ∆t′ = t′2 − t′1 = 0. Neste caso, l = γ [x′2 − x′1 + u (t′2 − t′1)] = γ [l′ + u∆t′] = γl′, ou seja, l′ = 1 γ l = l √ 1− u2/c2. (1.21) Como γ é sempre maior que 1, toda medida de comprimento na direção do movimento do ob- servador é sempre menor que a mesma medida feita por um observador em repouso com relação ao objeto. Este fenômeno é conhecido como contração de Lorentz. Agora, vamos supor um relógio em repouso com relação a um referencial O. Vamos ver como um intervalo de tempo, digamos ∆t′ = t′2 − t′1 é medido por um referencial O′ com velocidade u = uex com relação ao relógio, em uma configuração padrão. A transformação de Lorentz relevante é dada por t′ = γ [ t− (u/c2)x] , portanto, ∆t′ = γ [ t2 − t1 − ( u/c2 ) (x2 − x1) ] = γ [ ∆t− (u/c2)∆x] . Contudo, como o relógio está em repouso com relação a O, temos que ∆x = 0, então, ∆t′ = γ∆t = ∆t√ 1− u2/c2 . (1.22) Como γ é sempre maior que 1, qualquer observador mede intervalos de tempos dilatados com relação a um observador em repouso com relação ao relógio. Este fenômeno é conhecido como dilatação do tempo. Portanto, o intervalo de tempo medido por um relógio depende do observador, e não consiste mais em uma medida absoluta. Quanto mais rápido se move o relógio, maior o intervalo de tempo medido pelo observador. Para todo observador inercial, existe um relógio para o qual os intervalos de tempo são mínimos. Segundo (1.22), este relógio é aquele que encontra-se em repouso com relação ao observador, e o tempo medido por este é chamado tempo próprio τ . 1.5 O espaço-tempo de Minkowski De forma análoga à relatividade de Galilei, existe uma medida invariante às transformações de Lorentz. Ela é definida pela métrica de Minkowski ds2 = ( dx0 )2 − (dx1)2 − (dx2)2 − (dx3)2 , em que renomeamos as coordenadas xi = ( x1 = x, x2 = y, x3 = z ) , e definimos uma quarta coor- denada x0 = ct. A métrica de Minkowski é uma métrica do espaço-tempo de MinkowskiM4, que é um espaço plano pseudo-riemanniano de quatro dimensões. Um sistema de coordenadas em M4 consiste em quatro coordenadas xµ = (x0, x1, x2, x3), que também distinguem entre diferen- tes eventos no espaço-tempo. A métrica de Minkowski é escrita por ds2 = 3∑ µ,ν=0 ηµνdx µdxν , µ, ν = 0, 1, 2, 3. (1.23) A partir de agora, usaremos a notação de Einstein, para a qual a repetição de dois índices implica em soma sobre todos os valores deste índice, ou seja, escreveremos simplesmente ds2 = ηµνdx µdxν . (1.24) 11 ηµν são as componentes da métrica de Minkowski no sistema de coordenadas xµ. Em notação matricial, se este sistema de coordenadas for ortogonal, temos ηµν = 1 0 0 0 0 −1 0 0 0 0 −1 0 0 0 0 −1 . (1.25) Podemos, também, escrever uma transformação de Lorentz com esta notação. Ela é dada por x′µ = Λµνx ν . (1.26) Na configuração padrão, temos em representação matricial Λµν = γ −γβ 0 0 −γβ γ 0 0 0 0 1 0 0 0 0 1 = coshφ − sinhφ 0 0 − sinhφ coshφ 0 0 0 0 1 0 0 0 0 1 . (1.27) A métrica de Minkowski não é um métrica propriamente dita. A razão é a presença dos sinais negativos em (1.25), que resultam no fato de que dois eventos distintos em R4 podem ter distância nula. Note que ds2 = ηµνdx µdxν = ( dx0 )2 − (dx1)2 − (dx2)2 − (dx3)2 = c2 (dt)2 − (dx1)2 − (dx2)2 − (dx3)2 é nulo sempre que c2 (dt) 2 = ( dx1 )2 + ( dx2 )2 + ( dx3 )2 , que é a equação que representa a frente de uma onda que se desloca com velocidade c. No espaço-tempo de Minkowski, esta equação demarca o cone de luz, ou seja, a região na qual todos os corpos com velocidade c se deslocam. Todos os pontos no cone de luz estão a uma distância nula com relação à métrica de Minkowski. 1.6 A partícula livre relativística Ação S = −mc ˆ s1 s0 ds, ds2 = ηµνdx µdxν . (1.28) Variações δxµ = x¯µ − xµ, δxµ (s0) = δxµ (s1) = 0. (1.29) Primeira variação da ação δS = −mcδ ˆ s1 s0 ds = −mc ˆ s1 s0 δds. (1.30) De (1.28), temos δ ( ds2 ) = δ (ηµνdx µdxν) = δηµνdx µdxν + ηµνδ (dx µ) dxν + ηµνdx µδ (dxν) = δηµνdx µdxν + 2ηµνdx µδ (dxν) = δηµν dxµ ds dxν ds (ds) 2 + 2ηµν dxµ ds dsδ (dxν) uµ = dxµ/ds, = δηµνu µuν (ds) 2 + 2ηµνu µdsδ (dxν) . 12 Por outro lado, δ ( ds2 ) = 2dsδ (ds) , assim, 2dsδ (ds) = δηµνu µuν (ds) 2 + 2ηµνu µdsδ (dxν) , que torna-se δ (ds) = 1 2 δηµνu µuνds+ ηµνu µδ (dxν) , (1.31) Com δdxµ = dx¯µ − dxµ = d (x¯µ − xµ) = d (δxµ) e integrando por partes, δ (ds) = 1 2 δηµνu µuνds+ ηµνu µδ (dxν) = 1 2 δηµνu µuνds+ ηµνu µd (δxν) = 1 2 δηµνu µuνds− d (ηµνuµ) δxν + d (ηµνuµδxν) . (1.32) O termo de diferencial total será nulo quando na integral (1.30), pois torna-se um temo de fron- teira ˆ s1 s0 d (ηµνu µδxν) = ηµνu µδxν |s1s0 = 0, devido a (1.29). Assim, δ (ds) = 1 2 δηµνu µuνds− d (ηµνuµ) δxν = 1 2 δηµνu µuνds− dηµνuµδxν − ηµνduµδxν = 1 2 δηµνu µuνds− dηµνuµδxν − ηµν du µ ds dsδxν . (1.33) Temos δηµν = ∂ηµν ∂xα δxα, dηµν = ∂ηµν ∂xα dxα. (1.34) Assim, δ (ds) = 1 2 ∂ηµν ∂xα uµuνdsδxα − ∂ηµν ∂xα dxαuµδxν − ηµν du µ ds dsδxν = 1 2 ∂ηµν ∂xα uµuνdsδxα − ∂ηµν ∂xα uαuµdsδxν − ηµν du µ ds dsδxν = 1 2 ∂ηµν ∂xα uµuνdsδxα − ∂ηµα ∂xν uνuµdsδxα − ηµα du µ ds dsδxα = [ 1 2 ∂ηµν ∂xα uµuν − ∂ηµα ∂xν uµuν − ηµα du µ ds ] dsδxα. (1.35) Vamos simetrizar o termo ∂ηµα ∂xν uµuν = 1 2 ∂ηµα ∂xν uµuν + 1 2 ∂ηνα ∂xµ uµuν . Assim, δ (ds) = [ 1 2 ∂ηµν ∂xα uµuν − 1 2 ∂ηµα ∂xν uµuν − 1 2 ∂ηνα ∂xµ uµuν − ηµα du µ ds ] dsδxα = − [ ηµα duµ ds + 1 2 ( ∂ηµα ∂xν + ∂ηνα ∂xµ − ∂ηµν ∂xα ) uµuν ] dsδxα. (1.36) 13 Vamos definir os símbolos de Christoffel do primeiro tipo: γαµν ≡ 1 2 ( ∂ηµα ∂xν + ∂ηνα ∂xµ − ∂ηµν ∂xα ) . Assim, δ (ds) = − [ ηµα duµ ds + γαµνu µuν ] dsδxα. (1.37) Com (1.37) em (1.30), δS = −mc ˆ s1 s0 δds = mc ˆ s1 s0 ds [ ηµα duµ ds + γαµνu µuν ] δxα. (1.38) A condição de extremo δS = 0 resulta em mcηµα duµ ds +mcγαµνu µuν = 0. Com a métrica inversa à esquerda, temos 0 = mc ( ηλαηαµ duµ ds + ηλαγαµνu µuν = δλµ duµ ds + ηλαγαµνu µuν ) = mc ( duλ ds + ηλαγαµνu µuν ) . Vamos definir os símbolos de Christoffel do segundo tipo Γµαβ ≡ ηµλγλαβ = 1 2 ηµλ ( ∂ηαλ ∂xβ + ∂ηβλ ∂xα − ∂ηαβ ∂xλ ) . (1.39) Então, temos como resultado a equação geodésica mcaµ +mcΓµαβu αuβ = 0, aµ = duµ/ds = d2xµ/ds2. (1.40) 14 Capítulo 2 Transformações infinitesimais 2.1 Transformações infinitesimais em Rn Vamos supor um espaço euclidiano de n dimensões Rn com um sistema de coordenadas { xi } . A forma mais geral de uma transformação contínua em Rn é definida por um conjunto de m+ 1 pa- râmetros (�, λa), em que a = 1, · · · ,m. Com estes, definimos as transformações nas coordenadas e no tempo, t→ t¯ = t¯ (�) , xi → x¯i (t¯, λa) = x¯i (�, λa) , (2.1) com as seguintes condições: 1. As funções t¯ (�) e x¯i (�, λa) devem ser analíticas nas variáveis independentes. 2. As transformações devem ser conexas à identidade, ou seja, (�, λa)→ 0 =⇒ t¯→ t e x¯i (t¯)→ xi (t) . (2.2) Se as variáveis transformadas são analíticas, podem ser expandidas em séries de Taylor: t¯ = t+ dt¯ d� ∣∣∣∣ �=0 �+O (�2) , (2.3a) x¯i = xi + dx¯i d� ∣∣∣∣ �,λ=0 �+ dx¯i dλa ∣∣∣∣ �,λ=0 λa +O (�2, λ2) . (2.3b) Considerando apenas termos de primeira ordem, temos t¯ = t+ dt¯ d� ∣∣∣∣ �=0 �, (2.4a) x¯i = xi + dx¯i dt¯ dt¯ d� ∣∣∣∣ �,λ=0 �+ dx¯i dλa ∣∣∣∣ �,λ=0 λa (2.4b) = xi + x˙i dt¯ d� ∣∣∣∣ �=0 �+ dx¯i dλa ∣∣∣∣ �,λ=0 λa (2.4c) Nestas, definimos δt ≡ dt¯ d� ∣∣∣∣ �=0 �, δ¯xi ≡ dx¯ i dλa ∣∣∣∣ �,λ=0 λa. (2.5) Assim, x¯i = xi + x˙iδt+ δ¯xi. (2.6) 15 Neste caso, vemos que a forma final da transformação é dada por δxi = δ¯xi + δt dxi dt , (2.7) com x¯i = xi + δxi, t¯ = t+ δt. (2.8) Portanto, transformações contínuas infinitesimais possuem a mesma forma analítica de primei- ras variações. Neste caso, variações que dependem de um conjunto de parâmetros contínuos. 2.2 Evolução temporal Vamos supor a transformação t¯ = t+ δt, (2.9) mas que nenhuma transformação seja definida em qi. Ainda assim, (2.9) implica em x¯i = xi + δtx˙i, (2.10) ou seja, δxi = δtx˙i. (2.11) Se δt = dt, então temos dt = t¯ − t e δxi = dtx˙i = dxi, que determina a evolução temporal dos pontos em Rn em função do tempo. Desejamos estudar as propriedades de composição de evoluções temporais. Primeiro, da equa- ção (2.10) temos x¯i = xi + δtx˙i = xi + δt d dt xi = ( 1 + δt d dt ) xi. (2.12) Assim, podemos realizar uma evolução temporal ao atuar o operador diferencial gt ≡ 1 + δt d dt (2.13) em xi, ou seja, x¯i = gtx i. (2.14) Sejam gt1 e gt2 dois operadores de evolução temporal. Notemos que 1. A composição de duas evoluções temporais é uma evolução temporal: xi (t0) → xi (t1)→ xi (t2) = gt2xi (t1) = gt2gt1xi (t0) = ( 1 + δt2 d dt )( 1 + δt1 d dt ) xi (t0) = x i (t0) + δt1 d dt xi (t0) + δt2 d dt xi (t0) +δt2 d dt ( δt1 d dt xi (t0) ) . O último termo é quadrático em δt, portanto ficamos apenas com os primeiros termos xi2 = x i 0 + δt1 d dt xi0 + δt2 d dt xi0 = x i 0 + (δt1 + δt2) x˙ i 0 = x i 0 + δtx˙ i 0, (2.15) em que δt = δt1 + δt2. 2. A ordem da composição não altera o resultado final: gt2gt1q i = gt1gt2q i =⇒ [gt1 , gt2 ] = 0. (2.16) 16 3. A composição de k evoluções temporais é dada por Gt = k∏ p=1 gtp = (gt) k = ( 1 + δt d dt )k , quando todos os δt′s forem iguais. No limite para k →∞, temos Gt = lim k→∞ ( 1 + ∆t k d dt )k = exp [ ∆t d dt ] , ∆t = t− t0. (2.17) Neste caso, dizemos que gt é membro de uma álgebra de Lie, enquanto Gt é membro de um grupo de Lie. Este processo é conhecido como exponenciação da álgebra da evolução temporal, e dá origem a uma transformação finita, com ∆t finito, e não infinitesimal. Gt é simplesmente o operador que carrega a evolução temporal de um tempo t0 a t. Em função de (2.16), a álgebra é dita abeliana, ou comutativa. No argumento da exponencial, há o campo vetorial Xt = d dt = q˙i∂i, (2.18) que acompanha o termo ∆t. Na forma infinitesimal, temos gt = 1 + δtXt = 1 + δtq˙ i∂i = 1 + δq i∂i. (2.19) O campo vetorial Xt é denominado gerador da evolução temporal. 2.3 Translações Vamos supor a transformação xi (t)→ x¯i (t) = xi (t) + ai, ai ∈ R. (2.20) Esta operação é chamada translação, pois translada um ponto a outro de Rn a tempo constante. Neste caso, δt = 0, δxi = ai. (2.21) Duas translações resultam em uma translação, ou seja, xi → x¯i = xi + ai → x˜i = x¯i + bi = xi + ai + bi = qi + ci, em que ci = ai + bi. Portanto, translações também formam um grupo. A natureza do grupo é a mesma da evolução temporal: a ordem da composição não altera a translação total. Dizemos que um grupo cuja ordem da composição não importa é um grupo abeliano. O operador infinitesimal que carrega a operação de translação pode ser deduzido pela igual- dade x¯i = xi + ai = xi + aj ∂xi ∂xj = ( 1 + aj ∂ ∂xj ) xi, ou seja, gx ≡ 1 + ai ∂ ∂xi = 1 + δxi ∂ ∂xi , (2.22) que tem a mesma forma da evolução temporal, exceto que neste caso, δxi = ai. O operador gx é um elemento da álgebra de translações, que também é abeliana, ou seja, [gx1 , gx2 ] = 0. 17 A composição de k translações iguais resulta em x¯i = ( 1 + δxj ∂ ∂xj )k xi, que no limite k →∞ torna-se x¯i = lim k→∞ ( 1 + ∆xj k ∂ ∂xj )k xi = exp [ ∆xj ∂ ∂xj ] xi = Gxx i, (2.23) em que Gx = exp [ ∆xj ∂ ∂xj ] (2.24) é o elemento do grupo de translações. Os operadores diferenciais Pi ≡ ∂ ∂xi (2.25) são os geradores de translações, denominados momentos conjugados. 2.4 Rotações O grupo de rotações, por ser um exemplo não abeliano, merece uma atenção especial. Toda rotação pode ser descrita pela relação x¯i = Rijx j , (2.26) em que R é uma matriz ortogonal n× n de determinante 1. O grupo de rotações em n dimensões é chamado SO (n), o grupo ortogonal especial, que é isomórfico ao espaço das matrizes ortogonais de determinante unitário. É uma propriedade das transformações ortogonais a preservação da norma de vetores e da métrica de Rn. Vamos tomar o exemplo tridimensional, em que consideraremos primeiro uma rotação pas- siva no eixo zˆ com ângulo θ. A matriz desta transformação é dada por Rz (θ) = cos θ − sin θ 0sin θ cos θ 0 0 0 1 . (2.27) Para θ � 1, podemos aproximar esta matriz pela sua forma infinitesimal de primeira ordem rz (θ) = 1 −θ 0θ 1 0 0 0 1 = 1 0 00 1 0 0 0 1 + 0 −θ 0θ 0 0 0 0 0 ≡ 1 + θJz, (2.28) em que Jz ≡ 0 −1 01 0 0 0 0 0 . (2.29) Nos outros eixos, temos rx (θ) = 1 + θJx, ry (θ) = 1 + θJy, (2.30) em que Jx ≡ 0 0 00 0 −1 0 1 0 , Jy ≡ 0 0 10 0 0 −1 0 0 . (2.31) 18 As matrizes Ja são os geradores de rotações em três dimensões. Uma rotação geral em três dimensões contém três parâmetros independentes, que podem ser colecionados em um vetor θ ≡ (θ1, θ2, θ3). Na forma infinitesimal, temos r (θ) = 1 + θ · J = 1 + θaJa = 1 + θ1J1 + θ2J2 + θ3J3. (2.32) Dizemos que o objeto W = θaJa = 0 −θ3 θ2θ3 0 −θ1 −θ2 θ1 0 , (2.33) é um elemento da álgebra de Lie de SO (3), denotado pelo símbolo so (3). A identidade 1, em conjunto com os geradores Ja, formam uma base para a álgebra so (3). A relação de comutação de so (3) é facilmente calculada por [Ja,Jb] = � c ab Jc, (2.34) o que caracteriza a álgebra como não abeliana. A exponenciação da álgebra é direta, dada por R (θa) = exp [−θaJa] . (2.35) Agora, vamos definir θ ≡ √ θ2 = |θ| , u ≡ θ/ |θ| . (2.36) A forma geral de um elemento do grupo é dada por R = c+ (1− c)u1u1 (1− c)u1u2 − su3 (1− c)u1u3 − su2(1− c)u1u2 − su3 c+ (1− c)u2u2 (1− c)u2u3 − su1 (1− c)u1u3 − su2 (1− c)u2u3 − su1 c+ (1− c)u3u3 , (2.37) em que c ≡ cos θ, s ≡ sin θ. (2.38) Em componentes, temos Rij = δ i j − �ijkuk sin θ + ( uiuj − δij ) (1− cos θ) (2.39) Vamos atuar a matriz R no vetor u: Riju j = [ δij − �ijkuk sin θ + ( uiuj − δij ) (1− cos θ)]uj = δiju j − �ijkukuj sin θ + ( uiuju j − δijuj ) (1− cos θ) = ui − �ijkukuj sin θ + ( uiuju j − δijuj ) (1− cos θ) = ui + ( u2 − 1)ui (1− cos θ) = (1)ui, ou seja, u é um autovetor de R cujo autovalor é 1. Este é o denominado eixo de rotação. Quando atua em um vetor posição x, temos Rijx j = xi − �ijkukxj sin θ + ( uiujx j − xi) (1− cos θ) = xi − �ijkukxj sin θ + uiujxj − uiujxj cos θ − xi + xi cos θ = −�ijkukxj sin θ + uiujxj − uiujxj cos θ + xi cos θ = (u× x)i sin θ + ui (u · x) + [xi − ui (u · x)] cos θ. Nesta equação,( x‖ )i ≡ ui (u · x) 19 é a componente de x paralela a u e( x⊥ )i ≡ xi − ui (u · x) é sua componente ortogonal. Assim, Rx = x‖ + x⊥ cos θ + (u× x) sin θ. Agora, vamos voltar ao espaço Rn. Uma rotação finita é descrita por x¯i = Rijx j , enquanto a infinitesimal tem forma x¯i (ω) = xi + δxi (ω) = xi + 1 2 ∂x¯i ∂ωab ∣∣∣∣ ω=0 δωab, (2.40) em que ωab são as componentes de uma matriz n × n antissimétrica, com m = (n2 − n) /2 com- ponentes independentes. Dizemos que m é o número de parâmetros independentes necessários para parametrizar a transformação infinitesimal, que deve ter a forma x¯i (ω) = xi + δωijx j . (2.41) Neste caso, δxi = 1 2 ∂x¯i ∂ωab ∣∣∣∣ ω=0 δωab = 1 2 ∂x¯i ∂ωab∂xj ∣∣∣∣ ω=0 xjδωab, considerando linearidade em x¯. Assim, definimos (Jab) i j ≡ ∂x¯i ∂ωab∂xj ∣∣∣∣ ω=0 , (2.42) de modo que 1 2 (Jab) i j x jδωab = 1 2 ∂x¯i ∂ωab∂xj ∣∣∣∣ ω=0 xjδωab = xjδωij . (2.43) A solução para a equação anterior é dada por (Jab) i j ≡ δajδib − δbjδia. (2.44) A relação destes objetos com os geradores Ja é dada por (Ja) i j = 1 2 � bca (Jbc) i j , (2.45) e, assim, (Ja)ij = −�aij . (2.46) Dizemos que os geradores na forma (2.46) estão na representação adjunta do grupo de rotações, pois são representados por matrizes que possuem a mesma dimensão do grupo. 20 Capítulo 3 A geometria de Minkowski 3.1 Vetores e covetores de Lorentz Agora, vamos considerar um espaço-tempo de Minkowski M4 com um sistema de coordenadas cartesiano {xµ}. Como vimos, este espaço é caracterizado pela métrica ds2 = ηµνdx µdxν = ( dx0 )2 − (dx1)2 − (dx2)2 − (dx3)2 . (3.1) Uma transformação de Lorentz é dada por uma matriz Λ na forma x¯ = Λx ←→ x¯µ = Λµνxν . (3.2) A métrica deve ser preservada por transformações de Lorentz. Definição 1. Um vetor de Lorentz, ou vetor de Lorentz contravariante, consiste em um objeto u = uµ∂µ = uµ (∂/∂xµ) invariante por transformações de Lorentz, ou seja, x¯ = Λx =⇒ u¯ (x¯) = u (x) . Note que, dado (3.2), ∂µ = ∂ ∂xµ = ∂x¯ν ∂xµ ∂ ∂x¯ν = ∂ ∂x¯ν Λνµ = Λ ν µ∂¯ν . Se a matriz Λ tem uma inversa Λ−1, então multiplicamos a expressão anterior por Λ−1:( Λ−1 )µ λ ∂µ = ( Λ−1 )µ λ Λνµ∂¯ν = Λ ν µ ( Λ−1 )µ λ ∂¯ν = δ ν λ∂¯ν , ou seja, ∂¯µ = ( Λ−1 )ν µ ∂ν . (3.3) Aplicando-se a invariância em u, temos u = uµ∂µ = u µΛνµ∂¯ν = u¯ ν ∂¯ν . Portanto, u¯µ = Λµνu ν . (3.4) Assim, se um vetor u = uµ∂µ é invariante de Lorentz, suas componentes se transformam com a mesma forma do sistema de coordenadas. Dizemos que componentes de vetores que se transfor- mam como (3.4) transformam-se contravariantemente. 21 A métrica (3.1) naturalmente implica em uma métrica para os vetores de Lorentz, de modo que o produto escalar é dado por u · v = ηµνuµvν . (3.5) Se a métrica é invariante, este produto também o é. Neste caso, u · v = u¯ · v¯ e u¯ · v¯ = η¯µν u¯µu¯ν = η¯µνΛµαuαΛνβuβ = ( η¯µνΛ µ αΛ ν β ) uαuβ = ηαβu αuβ . Assim, ηαβ = Λ µ αη¯µνΛ ν β = ( ΛT ) µ α η¯µνΛ ν β e η¯µν = (( Λ−1 )T) α µ ηαβ ( Λ−1 )β ν . (3.6) Em notação matricial, η¯ = ( Λ−1 )T η ( Λ−1 ) . (3.7) Definição 2. Todo vetor de Lorentz u possui um dual uT , denominado covetor, ou vetor de Lorentz covariante. Este objeto é um funcional linear, ou seja, age em vetores e resulta em um escalar real tendo como regra o produto escalar, de modo que uT [u] ≡ u2 = ηµνuµuν . (3.8) A regra (3.8) define um isomorfismo entre vetores e covetores, de modo que uma base {∂µ} de vetores induz uma base para os covetores. Esta base é naturalmente tomada como as diferenciais {dxµ}, e toda 1-forma α pode ser escrita como α = αµdxµ. Cada elemento da base é um covetor que, ao agir sobre um elemento da base de vetores, resulta na operação dxµ [∂ν ] = δ µ ν . (3.9) Portanto, a ação de um covetor α em um vetor u é dada por α [u] = αµdx µ [uν∂ν ] = αµu νdxµ [∂ν ] = αµu νδµν = αµu µ. Da mesma forma, uT [u] = uµdx µ [uν∂ν ] = uµu νdxµ [∂ν ] = uµu µ = ηµνu µuν . Então, uµ = ηµνu ν , (3.10) ou seja, a métrica é a matriz jacobiana do isomorfismo entre vetores e covetores. Dizemos assim que a métrica "baixa" índices de componentes de vetores e os transforma em componentes de covetores. Seja η−1 a inversa da matriz métrica, de modo que suas componentes sejam dadas por ηµν , de modo que ηµληλν = δµν . Podemos mostrar que uµ = ηµνuν , (3.11) ou seja, a métrica inversa "levanta" índices de componentes de covetores, transformando-os em componentes contravariantes. 22 Covetores também são invariantes por transformações de Lorentz, ou seja, x¯ = Λx =⇒ α¯ (x¯) = α (x) . Então, u¯T [u¯] = u¯µu¯ µ = u¯µΛ µ νu ν = uνu ν , de modo que uν = u¯µΛµν , ou, u¯µ = uν ( Λ−1 )ν µ . (3.12) Assim, componentes de covetores se transformam com a inversa da transformação. Dizemos que esta transformação é covariante. 3.2 Tensores Definição 3. Um tensor do tipo (p, q) é um objeto geométrico invariante de Lorentz com a forma T = Tµν···λαβ···γ p vezes︷ ︸︸ ︷ (∂µ∂ν · · · ∂λ) ( dxαdxβ · · · dxγ)︸ ︷︷ ︸ q vezes . (3.13) As leis de transformação das componentes de base são dadas por ∂¯µ = ( Λ−1 )ν µ ∂ν , trans. covariante, dx¯µ = Λµνdx µ, trans. contravariante. Portanto, T¯ δ�···ρτψ···φ = ( Λ−1 ) α τ ( Λ−1 ) β ψ · · · (Λ−1) γ φ︸ ︷︷ ︸ q trans. covariantes Tµν···λαβ···γ p trans. contravariantes︷ ︸︸ ︷ ΛδµΛ � ν · · ·Λρλ . (3.14) Por exemplo, a métrica é um tensor do tipo (0, 2) ds2 = ηµνdxµdxν . Então, suas componentes se transformam por η¯µν = ( Λ−1 ) α µ ( Λ−1 ) β ν ηαβ . 3.3 Ortogonalidade e os grupos de Lorentz e Poincaré A invariância do produto escalar resulta na expressão ηαβ = Λ µ αη¯µνΛ ν β = ( ΛT ) µ α η¯µνΛ ν β . Se η é a métrica de Minkowski, temos δαβ = Λ α µ δ µ νΛ ν β = Λ α µ Λ µ β = ( ΛT )α µ Λµβ , ou seja, ΛTΛ = 1 ⇐⇒ Λ−1 = ΛT . (3.15) 23 Portanto, transformações de Lorentz são ortogonais. Tomando-se o determinante de (3.15), obtemos det ( ΛTΛ ) = 1 =⇒ (det Λ)2 = 1, ou seja, det Λ = ±1. (3.16) Definição 4. O grupo de Lorentz é definido pelo conjunto de transformações lineares ortogonais que preserva a métrica de Minkowski. O sinal do determinante define se a transformação é conexa à identidade ou à anti-identidade. Por enquanto, estamos interessados em transformação conexas à identidade, pois elas deixam invariante a orientação do sistema de coordenadas local {xµ}. A dimensão deste conjunto de transformações é 4 (quatro), de modo que este é isomórfico ao conjunto das matrizes ortogonais 4× 4 de determinante unitário. Este conjunto forma um grupo com a operação de multiplicação matricial, denominado SO (1, 3). O grupo de Lorentz SO (1, 3) é, portanto, o grupo de pseudo-rotações emM4. A denominação entre parênteses caracteriza o fato de que um elemento do grupo é uma pseudo-rotação: (1, 3) indica que a direção temporal x0 é diferente das 3 direções espaciais. Neste caso, dizemos que SO (1, 3) é um grupo pseudo-ortogonal, e é obviamente distinto do grupo de rotações em quatro dimensões SO (4). Este último consiste no grupo que deixa invariante uma métrica euclidiana em R4. O grupo de Poincaré é o grupo que inclui pseudo-rotações e translações e, como vimos, cons- titui um grupo de dimensão 5. É possível mostrar que um espaço invariante por um grupo ortogonal também é invariante pelo seu respectivo grupo inomogêneo, que inclui translações. Este grupo também é chamado grupo de Lorentz inomogêneo ISO (1, 3). 3.4 Álgebra de Lorentz Vamos nos ater ao grupo de Lorentz por enquanto. Este grupo é um grupo de Lie, ou seja, possui uma estrutura diferenciável. Na prática, isto significa que toda transformação de Lorentz pode ser "expandida em série de Taylor" ao redor da identidade do grupo: Λ = 1 + ∂Λ ∂�a ∣∣∣∣ �=0 δ�a + 1 2 ∂2Λ ∂�a∂�b ∣∣∣∣ �=0 δ�aδ�b + · · · , em que �a é um conjunto de parâmetros linearmente independentes que caracteriza uma repre- sentação do grupo. Se o grupo age em vetores e covetores, por exemplo, estes parâmetros serão em número seis, mas podem ser colocados sob a forma de uma matriz 4 × 4 antissimétrica de traço nulo. Se tomarmos a expansão até o termo de ordem 1, temos gΛ ≡ 1 + ∂Λ ∂�a ∣∣∣∣ δ�a = 1 + �aJa. (3.17) Esta é a forma geral de um elemento da álgebra de Lie de SO (1, 3), que denominados a álgebra so (1, 3). Ja formam um conjunto de operadores também linearmente independentes, que são os geradores da álgebra. A forma explícita de Ja depende do objeto geométrico no qual o grupo atua, portanto, de sua representação. Por enquanto, vamos supor que Λ seja uma matriz real. Se o grupo é ortogonal, temos ΛTΛ = 1 =⇒ (gΛ)T gΛ = 1. 24 Assim, 1 = (1 + �aJa) T ( 1 + �bJb ) = 1 + �aJa + (� aJa) T , ou seja, �aJa = − (�aJa)T . Se �a são parâmetros reais, temos Ja = −JTa , (3.18) ou seja, os operadores Ja são antissimétricos. Por outro lado, é fácil verificar que se det Λ = 1, det Ja = 0. Por outro lado, consideremos W = �aJa. Temos η¯ = ΛT ηΛ = ( 1 +WT ) η (1 +W ) , que resulta em η¯ = η + ηW +WT η em primeira ordem. Se Λ preserva a métrica, η¯ = η e então, ηW +WT η = 0, ou WT = −ηWη−1. (3.19) Vamos tomar o traço desta expressão: trWT = tr [−ηWη−1] = −tr [ηWη−1] = −tr [η−1ηW ] = −trW. Contudo, trWT = trW , então devemos ter que trW = 0. Portanto, cada elemento do grupo de Lorentz SO (1, 3) é conectado a um elemento da álgebra so (1, 3), que formam o conjunto das matrizes antissimétricas de traço nulo com base no espaço de Minkowski. A relação álgebra-grupo de Lie se dá através da operação de exponenciação da álgebra: Se W é um elemento genérico da álgebra de Lie, seu respectivo elemento de grupo é dado por Λ = exp (W ) . (3.20) 3.5 A representação adjunta Uma representação pode ser compreendida intuitivamente como uma realização de um grupo abstrato através de um grupo matricial. Quando atuamos um elemento do grupo de Lorentz em um vetor de Lorentz, por exemplo, os geradores J são realizados por um conjunto de matrizes Jab de elementos (Jab) µ ν , com a, b = 1, 2, 3, 4. Neste caso, um elemento da álgebra é dado por gΛ = 1 + ω abJab, (3.21) em que ωab forma uma matriz antissimétrica de traço nulo nos índices ab. Eles são, portanto, seis parâmetros independentes. O grupo SO (1, 3) é um subgrupo de GL (1, 3), ou seja, é um subgrupo de todas as matrizes 4 × 4 de determinante não nulo. O grupo GL (1, 3) forma um espaço vetorial, cuja base mais simples consiste no conjunto de matrizes (∆ab) µ ν = δ µ aηbν . (3.22) 25 Por exemplo, ∆11 = 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 , ∆12 = 0 −1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 , ∆13 = 0 0 −1 0 0 0 0 0 0 0 0 0 0 0 0 0 , · · · . Toda matriz de GL (1, 3) pode ser escrita por A = Aab∆ab. (3.23) Esta base, denominada base canônica, é completa e linearmente independente. De fato, nesta base uma matriz tem componentes iguais ao seus elementos, ou seja, Aab = Aµν . Vamos tomar a multiplicação matricial ∆ab∆dc (∆ab) µ λ (∆cd) λ ν = δ µ aηbλδ λ c ηdν = ηbcδ µ a δdν = ηbc (∆ad) µ ν . O colchete de Lie é dado por[ (∆ab) µ λ , (∆cd) λ ν ] = (∆ab) µ λ (∆cd) λ ν − (∆cd)µλ (∆ab)λν , que resulta em[ (∆ab) µ λ , (∆cd) λ ν ] = [ δeaηbcδ f d − δecηdaδfb ] (∆ef ) µ ν . Portanto, a álgebra é caracterizada pelos colchetes [∆ab,∆cd] = C (ef) (ab)(cd) ∆ef , (3.24) com constantes de estrutura C (ef) (ab)(cd) = δ e aηbcδ f d − δecηdaδfb . (3.25) Portanto, de (3.24) vemos que gl (1, 3) é uma álgebra de Lie não abeliana. Note que as matrizes Jab = ∆ab −∆ba (3.26) são antissimétricas, possuem traço nulo e são linearmente independentes. Neste caso, elas for- mam uma base para um subespaço de matrizes: são os geradores da álgebra so (1, 3). Suas componentes são dadas por (Jab) µ ν = δ µ aηbν − δµb ηaν . (3.27) Note que [Jab, Jcd] = [∆ab −∆ba,∆cd −∆dc] = [∆ab,∆cd]− [∆ab,∆dc]− [∆ba,∆cd] + [∆ba,∆dc] = ( C (ef) (ab)(cd) − C (ef)(ab)(dc) − C (ef)(ba)(cd) + C (ef)(ba)(dc) ) ∆ef( δeaηbcδ f d − δecηdaδfb − δeaηbdδfc + δedηcaδfb ) ∆ef + ( −δebηacδfd + δecηdbδfa + δebηadδfc − δedηcbδfa ) ∆ef = ( δeaηbcδ f d − δedηcbδfa + δebηadδfc − δecηdaδfb ) ∆ef + ( +δedηcaδ f b − δebηacδfd + δecηdbδfa − δeaηbdδfc ) ∆ef = ( δeaηbcδ f d − δfaηbcδed ) ∆ef + ( δebηadδ f c − δecηdaδfb ) ∆ef + ( δedηcaδ f b − δebηacδfd ) ∆ef + ( δecηdbδ f a − δeaηbdδfc ) ∆ef = δeaηbcδ f d (∆ef −∆fe) + δebηadδfc (∆ef −∆fe) +δedηcaδ f b (∆ef −∆fe) + δecηdbδfa (∆ef −∆fe) . 26 Com (3.26) temos [Jab, Jcd] = ( δeaηbcδ f d + δ e bηadδ f c + δ e dηcaδ f b + δ e cηdbδ f a ) Jef = ( δebηadδ f c + δ e aηbcδ f d − δeaηbdδfc − δebηacδfd ) Jef = f (ef) (ab)(cd) Jef , (3.28) em que as constantes de estrutura são f (ef) (ab)(cd) = δ e bηadδ f c + δ e aηbcδ f d − δeaηbdδfc − δebηacδfd . (3.29) Em forma explícita, temos a álgebra [Jab, Jcd] = ηadJbc + ηbcJad − ηdbJac − ηacJbd. (3.30) Definição 5. A realização de uma álgebra e seu respectivo grupo de Lie abstratos como uma álgebra e grupo de Lie matricial é denominada representação. Definição 6. A representação na qual os geradores da álgebra possuem a mesma di- mensão dos elementos do grupo é denominada representação adjunta. Neste caso, os geradores Jab, definidos por (3.26) e (3.27), da álgebra de pseudo-rotações em quatro dimensões são os geradores da representação adjunta deste grupo. A representação adjunta também é chamada, em física, de representação vetorial, porque esta representação realiza o grupo de pseudo-rotações em vetores deM4. 3.6 Invariantes Uma álgebra de Lie é um espaço vetorial com uma base completa {Ja}, o conjunto de geradores da álgebra. Neste caso, podemos definir um produto interno. Sejam dois elementos A = AaJa e B = BaJa da álgebra, temos A ·B ≡ tr (AaBbJaJb) = 1 2 ( AaBb +AbBa ) tr (JaJb) ≡ γabAaBb. (3.31) Nesta expressão, tr (JaJb) = (JaJb) µ µ = (Ja) µ ν (Jb) ν µ . Os objetos γab ≡ 1 2 tr (JaJb) (3.32) são componentes da denominada métrica de Killing. Se a métrica de Killing tem sinal definido e é não degenerada, ela define um bom produto interno. Neste caso, uma álgebra de Lie é também um espaço de Hilbert. Elementos do grupo de Lie podem agir em elementos da álgebra. Por exemplo, uma rotação em R3 age sobre um gerador Ja na forma Ja −→ R−1JaR. 27 Neste caso, tr (JaJb) −→ tr ( R−1JaRR−1JbR ) = tr ( R−1JaJbR ) = tr ( RR−1JaJb ) = tr (JaJb) , ou seja, a métrica de Killing é invariante por rotações: R−1γabR = γab. (3.33) Tratando-se de transformações infinitesimais, R = 1 + ωaJa, R−1γR = ( 1 + ωaJTa ) γ ( 1 + ωbJb ) = γ + ωaγJa + ω aJTa γ + ω aωbJTa γJb ≈ γ + ωa (γJa + JTa γ) = γ, portanto, γJa + J T a γ = γJa − Jaγ = [γ,Ja] = 0. (3.34) A métrica de Killing, então, comuta com os geradores. Neste caso, todo escalar construído com a métrica de Killing é um invariante. Contudo, em um sistema dinâmico de dimensão finita, somente um número finito desses invariantes são linearmente independentes. No caso de rotações em três dimensões, há apenas um invariante J2 = γabJ aJb, (3.35) que é o quadrado do momento angular. Este tipo de invariante é denominado invariante de Casimir da álgebra. Para cada representação do grupo de rotações, o problema de autovalores J2uj = αjuj indica um espectro de autovalores de J2. Como J2 é um invariante, o espectro também é invari- ante. No caso do momento angular, é sempre possível escrever J2uj = j (j + 1)uj . (3.36) Neste caso, dizemos que j é o spin da representação. É fácil verificar para o grupo de rotações que, na representação adjunta, j = 1 quando os autovetores são vetores euclidianos. Para grupos de álgebras de Lie mais gerais, é possível encontrar outros invariantes de Ca- simir, cada um deles uma forma multilinear invariante, como (3.35). O número maximal de invariantes independentes é denominado rank da álgebra de Lie. O grupo de rotações tem rank 1: apenas J2 é invariante. Em uma determinada representação, os autovalores desses operado- res de Casimir também são invariantes pela ação do grupo, portanto o espectro é invariante. O resultado é que uma representação é completamente determinada pelos espectros dos operado- res de Casimir do grupo, então as quantidades físicas relevantes quando há uma simetria sob determinado grupo de Lie são dadas pelos objetos geométricos que são autovetores simultâneos dos operadores de Casimir. 28 Capítulo 4 O formalismo lagrangiano para campos 4.1 Introdução Agora, vamos nos voltar à análise do problema variacional de se encontrar condições necessá- rias e suficientes para que uma dada integral fundamental tome um valor extremo (máximo ou mínimo) local. Este problema variacional é comum em diversas áreas da física e da matemática que compartilham de quantidades geométricas que assumam, por requerimentos físicos ou pu- ramente matemáticos, um valor máximo ou mínimo. Por exemplo, o problema variacional que descreve fenômenos da ótica geométrica consiste em encontrar a trajetória do raio de luz para a qual o tempo de propagação seja mínimo (princípio de Fermat). A dinâmica de partículas relati- vísticas, como outro exemplo, refere-se ao problema de se encontrar trajetórias no espaço-tempo que maximizem o tempo próprio. Problemas variacionais na mecânica clássica [12, 13], disciplina na qual o cálculo variacional encontrou seu maior terreno de desenvolvimento, precisam ser definidos com base em espaços não tão facilmente intuídos. Um sistema físico neste cenário é descrito por uma trajetória em um espaço de configuração Qn formado por suas coordenadas generalizadas qa, em que a = 1, . . . , n e n indica a dimensão de Qn. Tal trajetória é definida pelas equações paramétricas γ : qa = qa (t) , (4.1) em que t é um parâmetro relacionado univocamente com o tempo. O problema variacional con- siste em encontrar condições necessárias e suficientes para que a integral fundamental A [γ] ≡ ˆ t1 t0 L (t, qa, q˙a) dt, (4.2) em que q˙a ≡ dqa/dt, assuma um valor extremo sobre C, fornecida uma função Lagrangiana L que dependa do tempo, das coordenadas e de suas velocidades. Neste caso, precisamos que as funções qa (t) sejam pelo menos de classe C2. Este problema variacional recebe o nome de princípio de Hamilton quando a primeira variação das coordenadas generalizadas em t = t0 e t = t1 é nula. A aplicação direta do princípio de Hamilton leva às equações de Euler-Lagrange d dt ∂L ∂q˙a − ∂L ∂qa = 0, (4.3) que são as equações diferenciais que ditam a dinâmica da teoria. O caráter do tempo como parâmetro de evolução nessas teorias é bastante especial. Em pri- meiro lugar, é um parâmetro de evolução único: a integral (4.2) é uma integral simples e as soluções das equações (4.3), se existirem, são famílias de curvas de 1-parâmetro que dependem de um conjunto de condições iniciais. Em segundo lugar, embora seja sempre possível um pro- cesso de reparametrização, a integral fundamental não é independente da escolha do parâmetro. Por isso, as equações de Euler-Lagrange não são apenas equações que descrevem uma dada 29 geometria no espaço de configuração, mas possuem também a interpretação de equações que caracterizam um sistema dinâmico finito. Por causa do papel especial do tempo, o formalismo Hamiltoniano pode ser naturalmente introduzido e a mecânica clássica pode ser analisada através do espaço de fase T ∗Qn, onde as equações de movimento tomam a forma de um conjunto de equações de primeira ordem. No espaço de fase há a introdução de uma estrutura simplética natural, através da qual é possível conhecer a forma da evolução de qualquer observável físico sem a necessidade da resolução das equações de movimento. Além disso, as propriedades geométricas do espaço de fase permitem que o efeito de transformações sobre observáveis sejam imediatamente reconhecidos, indepen- dentemente da dinâmica específica da teoria. Dentre as transformações mais importantes estão as transformações canônicas, que preservam o elemento de volume do espaço de fase. A impor- tância desse formalismo canônico para a física não pode ser subestimada, visto que a mesma estrutura formal está presente também na mecânica quântica. O cálculo variacional para a mecânica clássica envolve também os teoremas de Noether, que dizem respeito a identidades obedecidas quando a integral fundamental (4.2) é invariante por alguma classe de transformações, assim como o formalismo de Hamilton-Jacobi. O mesmo quadro para teorias de campos não pode ser traçado tão naturalmente. Como vere- mos, campos são sistemas que dependem de um conjunto de parâmetros, geralmente identifica- dos com as coordenadas cartesianas do espaço-tempo. A integral fundamental que caracteriza o problema variacional, análoga à integral (4.2), é uma integral múltipla. Além disso, os sistemas em campos mais importantes na física são invariantes por reparametrizações. Essas caracterís- ticas fazem desses sistemas essencialmente distintos dos sistemas clássicos, nos quais o tempo tem um papel privilegiado. Em especial, não há uma forma única de dinâmica Hamiltoniana e, tampouco, um único formalismo de Hamilton-Jacobi possível. Outro aspecto das teorias de cam- pos mais importantes para a física são as simetrias de gauge, que são características de sistemas singulares. 4.2 Variações Um campo pode ser descrito por um conjunto de n funções φi (x), em que x representa um ponto no espaço-tempo de 4 dimensões, localmente descrito por um sistema de coordenadas xµ = ( x0, x1, x2, x3 ) em um dado volume Ω. Todas as nossas considerações serão restritas ao sistema contido nesse volume. O índice i varia de 1 a n. Vamos trabalhar em um espaço de con- figuração construído da seguinte forma. Os campos φ são coordenadas de uma variedade Qn de dimensão n. Em conjunto com essa variedade, definimos também um espaço para os parâmetros, R4. O espaço de configuração vem a ser o produto direto definido por Q ≡ Qn × R4, de modo que o volume Ω, o qual será tratado também como o domínio dos campos φ, esteja imerso em Q. Vamos supor que os campos sejam funções de classe C∞, de modo que podemos definir todas as suas derivadas φiµ ≡ dφi dxµ ≡ ∂µφi, φiµν ≡ ∂µ∂νφi, . . . . (4.4) Uma configuração φ dos campos é definida como os valores dos campos e de suas derivadas primeiras, ou velocidades, em cada ponto do espaço-tempo: φ : { φi (x) , φiµ (x) } , ∀x ∈ R4. (4.5) Consideremos, agora, a existência de uma densidade Lagrangiana L ( xµ, φi, φiµ ) , contendo derivadas dos campos até primeira ordem. Com essa densidade Lagrangiana definimos a ação A [φ] ≡ ˆ Ω L ( xµ, φi, φiµ ) dω, (4.6) em que usamos a notação dω ≡ dx0dx1dx2dx3. Para definir o problema variacional, vamos considerar uma transformação ativa no espaço de configuração, que pode ser imaginada como um arraste suave dos campos e dos parâmetros. Existe uma configuração física φ (x), que será arrastada suavemente para uma configuração 30 φ′ (y), de modo que a topologia e geometria do espaço de configuração e, consequentemente do espaço de Minkowski, seja preservada. Isto significa que não serão permitidas transformações que envolvam "colar" e "furar" o espaço-tempo, nem transformações que mudem a métrica de Minkowski. A configuração física φ (x) deve ser um extremo da integral fundamental. Para realizar esta transformação, vamos fazer da configuração φi um membro de uma família de configurações de 1-parâmetro, definida por φ (u) : { φi = φi (xµ, u) ; φiµ = φ i µ (x µ, u) ; · · ·} , (4.7) pelo menos de classe C2 em u. Se uma dada configuração φ (u0) é um extremo da integral funda- mental (4.6), correspondendo à configuração física do sistema, A (u0) deve ser menor (ou maior) que um valor A (u) calculado em uma configuração φ (u), pertencente a uma vizinhança fechada |u− u0| de φ (u0). Supondo |u− u0| um número muito pequeno, desprezando termos de ordem maior ou igual a |u− u0|2, a expansão de φ (u) em série de Taylor ao redor da configuração φ (u0) pode ser escrita por φi (xα, u) ≈ φi (xα, u0) + dφ i (xα, u) du ∣∣∣∣ u=u0 δu, (4.8) e assim também para as derivadas dos campos, em que δu ≡ u − u0. Esta é a fórmula de primeira ordem para a comparação entre duas configurações φ (u0) e φ (u) para um conjunto fixo de parâmetros xµ. Ela nos permite definir a primeira variação dos campos a ponto fixo, dada pela expressão δ¯φi ≡ φi (xµ, u)− φi (xµ, u0) = dφ i du ∣∣∣∣ u=u0 δu. (4.9) A mesma expressão é válida para as derivadas. Por exemplo, temos a primeira variação de φaµ: δ¯φiµ ≡ φiµ (xα, u)− φiµ (xα, u0) = dφiµ du ∣∣∣∣∣ u=u0 δu = d2φi dxµdu ∣∣∣∣ u=u0 δu = d dxµ dφi du ∣∣∣∣ u=u0 δu = d dxµ ( δ¯φi ) . Na expressão acima, usamos a derivada total definida por d dxα ≡ ∂ ∂xα + ˆ Ω dωx [ φiα (x) δ δφi (x) + φiµα (x) δ δφiµ (x) + φiµνα (x) δ δφiµν (x) + · · · ] . (4.10) A integral que aparece na expressão acima atende ao fato de que campos são, de forma rigorosa, tratados como distribuições do espaço-tempo: as derivadas com relação aos campos são derivadas funcionais e não simples derivadas parciais. Por essa razão usamos o símbolo δF (x) /δφ (y) para caracterizar a derivada funcional de uma função F (x), aplicada em um ponto x do volume Ω, com relação a uma função φ (y), aplicada em um ponto y do mesmo domínio. A relação mais fundamental vem a ser δφi (x) δφj (y) = δijδ 4 (x− y) , (4.11) em que temos a delta de Dirac de dimensão 4: δ4 (x− y) = { 0 se x 6= y, ∞ se x = y. , ˆ M4 δ4 (x− y) d4x = 1. (4.12) No geral podemos ignorar a escrita das integrais, de modo a não sobrecarregar a notação, o que faremos em boa parte do trabalho. Contudo, quando somas em derivadas funcionais aparecem, integrais geralmente as acompanham e devemos ficar atentos a este fato. Por exemplo, usaremos 31 repetidamente expressões do tipo φiµ [ δL/δφi ] , com L sendo a densidade Lagrangiana, que devem ser lidas comoˆ Ω dωx [ φiµ (x) δL (y) δφi (x) ] . (4.13) A primeira variação (4.9), portanto, é o termo de primeira ordem da comparação entre duas configurações infinitesimalmente próximas, mantendo fixos o conjunto de parâmetros xµ e, por- tanto, o domínio Ω. Podemos generalizar este argumento e considerar também a comparação com configurações que variem os parâmetros. Basta considerarmos φ′ (u) : { φ′i = φ′i (yµ, u) ; φ′iµ = φ ′i µ (y µ, u) } , (4.14) em que os parâmetros yµ representam coordenadas de um volume Ω′ do espaço-tempo. Podemos escolher esta configuração de modo que yµ = xµ para u = u0 e, assim, ambos os conjuntos estão relacionados pela equação yµ = yµ (xν , u) ≈ yµ + dy µ du ∣∣∣∣ u=u0 δu, (4.15) em que, por último, tomamos a expansão até primeira ordem em δu. Com a variação dos parâmetros, temos a primeira variação total φ′i (yµ, u) ≈ φi (yµ, u0) + dφ i (yµ, u) du ∣∣∣∣ u=u0 δu+ dφi (yµ, u) dyβ dyβ du ∣∣∣∣ u=u0 δu = φi (xµ, u0) + δ¯φ i + ( φaβ ) u=u0 δxβ , ou seja, δφi ≡ δ¯φi + φiβδxβ , (4.16) em que δxβ ≡ dy β du ∣∣∣∣ u=u0 δu. (4.17) 4.3 A primeira variação da ação Vamos escrever a integral fundamental para a configuração φ (u0): A (u0) = ˆ Ω L ( xµ, φi, φaµ ) dω, (4.18) assim como para a configuração φ′ (u): A (u) = ˆ Ω′ L ( yµ, φ′a, φ′aµ ) dω′, (4.19) em que dω′ ≡ dy0dy1 . . . dyd. A primeira variação total da ação é definida por δA ≡ A (u)−A (u0) ≈ dA (u) du ∣∣∣∣ u=u0 δu. (4.20) O operador δ ≡ δu d du (4.21) é um operador diferencial de primeira ordem, que obedece às propriedades de uma derivada ordinária: é linear e obedece à regra de Leibniz. Neste caso, vamos calcular δA = δ [ˆ Ω L ( xµ, φi, φaµ ) dω ] = ˆ Ω (δLdω + Lδdω) . (4.22) 32 A variação total atua sobre o elemento de volume na seguinte forma: δ (dω) = dω′ − dω = det ( dyµ dxν ) dω − dω = [ det ( dyµ dxν ) − 1 ] dω. Note que yµ = xµ + δxµ, então dyµ dxν = δµν + d (δxµ) dxν . O determinante é dado por det ( dyµ dxν ) = det 1 + d(δx0) dx0 d(δx0) dx1 d(δx0) dx2 d(δx0) dx3 d(δx1) dx0 1 + d(δx1) dx1 d(δx1) dx2 d(δx1) dx3 d(δx2) dx0 d(δx2) dx1 1 + d(δx2) dx2 d(δx2) dx3 d(δx3) dx0 d(δx3) dx1 d(δx3) dx2 1 + d(δx3) dx3 . É fácil verificar que, em primeira ordem, o determinante é aproximado por det ( dyµ dxν ) = 1 + d (δxµ) dxµ . (4.23) Então, δ (dω) = [ 1 + d (δxµ) dxµ − 1 ] dω = d (δxµ) dxµ dω. (4.24) Na integral, temos δA = ˆ Ω (δLdω + Lδdω) = ˆ Ω ( δL+ L d (δxµ) dxµ ) dω. Note que L d (δxµ) dxµ = d dxµ (Lδxµ)− δxµ dL dxµ , e, neste caso, δA = ˆ Ω ( δL+ d dxµ (Lδxµ)− δxµ dL dxµ ) dω = ˆ Ω ( δL− δxµ dL dxµ ) dω + ˆ Ω dω d dxµ (Lδxµ) , ou, δA = ˆ Ω δ¯Ldω + ˆ Ω dω d dxµ (Lδxµ) , (4.25) em que δ¯L = δL− δxµ dL dxµ . (4.26) Primeiro, vamos calcular δL = δu dL du = δxµ ∂L ∂xµ + δφi δL δφi + δφiµ δL δφiµ . (4.27) Por outro lado, δxµ dL dxµ = δxµ ( ∂L ∂xµ + φiµ δL δφi + φiµν δL δφiν ) , (4.28) 33 de modo que δ¯L = δL− δxµ dL dxµ = δxµ ∂L ∂xµ + δφi δL δφi + δφiµ δL δφiµ − δxµ ( ∂L ∂xµ + φiµ δL δφi + φiµν δL δφiν ) = ( δφi − δxµφiµ ) δL δφi + ( δφiµ − δxµφiµν ) δL δφiν , ou, δ¯L = ( δ − δxµ d dxµ ) φi δL δφi + ( δ − δxµ d dxµ ) φiν δL δφiν = δ¯φi δL δφi + δ¯φiµ δL δφiµ . (4.29) Vamos calcular agora a variação δ¯φiµ = δφ i µ − δxνφiνµ. (4.30) Primeiro, δφiµ = δ ( dφi dxµ ) = dφ′i dyµ − dφ i dxµ = dxν dyµ dφ′i dxν − dφ i dxµ = dxν dyµ dφ′i dxν − dφ i dxµ . Note que xµ = yµ − δxµ. Portanto, δφiµ = d dyµ (yν − δxν) dφ ′i dxν − dφ i dxµ = ( δνµ − d (δxν) dyµ ) dφ′i dxν − dφ i dxµ = dφ′i dxµ − d (δx ν) dyµ dφ′i dxν − dφ i dxµ = d dxµ ( φ′i − φi)− d (δxν) dyµ dφ′i dxν = d ( δφi ) dxµ − d dyµ ( δxν dφ′i dxν ) + δxν d2φ′i dyµdxν . Em primeira ordem, δφiµ = d ( δφi ) dxµ − d dxµ ( δxν dφi dxν ) + δxν d2φi dxµdxν = d dxµ ( δφi − δxνφiν ) + δxν φiνµ = d dxµ ( δ¯φi ) + δxνφiνµ, (4.31) que resulta em δ¯φiµ = d dxµ ( δ¯φi ) + δxν φiνµ − δxνφiνµ = d dxµ ( δ¯φi ) . (4.32) Temos δ¯L = δ¯φi δL δφi + δ¯φiµ δL δφiµ = δ¯φi δL δφi + d dxµ ( δ¯φi ) δL δφiµ = δ¯φi [ δL δφi − d dxµ δL δφiµ ] + d dxµ ( δ¯φi δL δφiµ ) . (4.33) 34 Na integral, δA = ˆ Ω δ¯Ldω + ˆ Ω dω d dxµ (Lδxµ) = ˆ Ω δ¯φi [ δL δφi − d dxµ δL δφiµ ] dω + ˆ Ω dω d dxµ ( Lδxµ + δ¯φi δL δφiµ ) . (4.34) Vamos deixar a primeira integral como está, mas desejamos escrever a segunda integral como combinações lineares das variações totais dos campos. Vamos usar δ¯φ = δφ− δxµφµ: δA = ˆ Ω δ¯φi [ δL δφi − d dxµ δL δφiµ ] dω + ˆ Ω dω d dxµ [ Lδxµ − δxνφiν δL δφiµ + δφi δL δφiµ ] = ˆ Ω δ¯φi [ δL δφi − d dxµ ( δL δφiµ )] dω + ˆ Ω dω d dxµ [ δφi δL δφiµ − ( φiν δL δφiµ − δµνL ) δxν ] . Vamos definir Hµν ≡ δL δφiµ φiν − ηµνL, (4.35) assim, δA = ˆ Ω δ¯φi [ δL δφi − d dxµ δL δφiµ ] dω + ˆ Ω dω d dxµ ( δφi δL δφiµ −Hµνδxν ) . (4.36) 4.4 Os termos de fronteira A integralˆ Ω dω d dxµ ( δL δφiµ δφi −Hµνδxν ) é uma integral de uma divergência total no volume Ω. Segundo o teorema de Gauss, a integral de um divergente de um campo vetorial em um volume Ω deve ser igual à integral da projeção ortogonal do mesmo campo vetorial na fronteira ∂Ω de Ω, ou seja,ˆ Ω dω dFµ (x) dxµ = ˆ ∂Ω dσnµ (x)F µ (x) , em que nµ (x) são componentes de um vetor unitário tangente a ∂Ω em determinado ponto x. Neste caso,ˆ Ω dω d dxµ ( δL δφiµ δφi −Hµνδxν ) = ˆ ∂Ω dσnµ ( δL δφiµ δφi −Hµνδxν ) . (4.37) Por esta razão, integrais de divergentes em um problema variacional são denominados termos de fronteira, já que eles dependem apenas das configurações e variações dos campos na fronteira de Ω. O campo vetorial relevante é dado por Φµ ≡ δL δφµi δφi −Hµνδxν , (4.38) e é uma combinação linear de δφ e δx. Os coeficientes são Hµν = δL δφµi φiν − ηµνL, (4.39) que são as componentes de um objeto que recebe o nome de densidade de energia-momento. Há, também, os coeficientes piµi ≡ δL δφiµ , (4.40) que são denominados momentos conjugados covariantes. Veremos mais adiante que essas quan- tidades são fundamentais na definição de quantidades conservadas e invariantes do problema variacional. 35 4.5 Os princípios de Hamilton e Weiss e as equações de campo Um princípio físico é necessário para que se defina a configuração física dos campos. É usual, a princípio, a utilização do princípio de Hamilton: Proposição 1. O Princípio de Hamilton para campos. Seja uma configuração de campos φ e uma integral fundamental, ou ação A, definida a partir de uma densidade Lagrangiana L = L (x, φ, φµ). Considere, também, uma vari- ação dos campos δφ que não modifique o volume Ω ⊂ M4 e seja nula na fronteira ∂Ω. Neste caso, φ é uma configuração física do sistema se a ação for estacionária quando calculada nesta configuração, em comparação com a ação calculada sobre qualquer ou- tra configuração φ′ em uma vizinhança fechada de φ. A condição necessária, mas não necessariamente suficiente, para que a ação seja estacionária é dada por δA = 0, ou seja, a primeira variação da ação tendo como base a configuração esta- cionária deve ser nula. Nas condições do princípio de Hamilton, a variação δφ deve ser tal que δxµ = 0 e δφi (x) ∣∣ x∈∂Ω = 0. (4.41) Neste caso, a primeira variação da ação, (4.36), toma a forma δA = ˆ Ω δφi [ δL δφi − d dxµ δL δφiµ ] dω + ˆ Ω dω d dxµ ( piµi δφ i ) , visto que δ = δ¯ quando δx = 0. O termo de fronteira envolve o cálculo de δφ na fronteira de Ω, ˆ Ω dω d dxµ ( piµi δφ i ) = ˆ ∂Ω dσx nµ (x)pi µ i (x) δφ i (x) ∣∣ x∈∂Ω , que é nulo devido à segunda condição (4.41). Neste caso, δA = ˆ Ω δφi [ δL δφi − d dxµ δL δφiµ ] dω. (4.42) O volume Ω é fixado a priori. Contudo, o procedimento acima deve ser válido para qualquer volume no qual o sistema de coordenadas cartesiano {xµ} seja válido e, também, no qual os campos sejam bem definidos. Sem perda de generalidade, podemos considerar Ω arbitrário. Além disso, as variações δφi devem ser linearmente independentes: a variação de um campo φi não pode depender da variação de uma campo φj para j 6= i. A condição de extremo δA = 0 implica em que a integral (4.42) seja nula. Se Ω é arbitrário e δφi são LI, o termo entre colchetes deve ser nulo, ou seja, δL δφi − d dxµ δL δφiµ = 0. (4.43) Essas são as equações de campo, são as equações de Euler-Lagrange da ação (4.6). 36 Observação 1. O princípio de Hamilton pode ser flexibilizado na condição de que δφ seja nulo na fronteira. Ainda mantendo Ω fixo, é suficiente que os momentos covariantes sejam tangentes a ∂Ω na fronteira, ou seja, nµ (x)pi µ i (x)|x∈∂Ω = 0. (4.44) Isto implica na nulidade dos termos de fronteira e resulta nas mesmas equações de campo. Esta condição, contudo, restringe as configurações físicas àquelas que obede- cem ao vínculo (4.44), que se torna uma condição de contorno. Um segundo princípio é mais geral e permite variações no volume Ω: Proposição 2. O Princípio de Weiss. Seja uma configuração de campos φ e uma integral fundamental, ou ação A, definida a partir de uma densidade Lagrangiana L = L (x, φ, φµ). Sejam uma variação dos campos δφ = φ′ (y) − φ (x) e uma variação no volume δx = y − x, infinitesimais e arbitrários. Neste caso, φ (x) é uma configuração física do sistema se a primeira variação da ação depender apenas da fronteira de Ω. O princípio de Weiss permite, portanto, variações arbitrárias no espaço de configuração, ou seja, permite todo arraste de campos que respeite a topologia e a geometria do espaço-tempo, ao contrário do princípio de Hamilton. Se a primeira variação só depende da fronteira, existe pelo menos um conjunto de funções Fµ tais que δA = ˆ Ω dω dFµ dxµ = ˆ ∂Ω dσ |nµ (x)Fµ (x)|x∈∂Ω . Neste caso, δx 6= 0 e δφ = δ¯φ− δxµφµ, de modo que δA = ˆ Ω δ¯φi [ δL δφi − d dxµ δL δφiµ ] dω + ˆ Ω dω d dxµ ( δφi δL δφiµ −Hµνδxν ) = ˆ Ω dω dFµ dxµ . Para que δA não dependa do volume, temos a condição ˆ Ω δ¯φi [ δL δφi − d dxµ δL δφiµ ] dω = 0, que deve ser respeitada com Ω arbitrário e δ¯φi linearmente independentes. Neste caso, temos δL δφi − d dxµ δL δφiµ = 0, que são as equações de campo (4.43) da ação. No princípio de Weiss, não se exige que os termos de fronteira sejam nulos. Contudo, depen- dendo do volume Ω em consideração, condições de contorno nos campos e nas velocidades talvez sejam necessárias para garantir a existência das integrais. 37 38 Capítulo 5 Os teoremas de Noether 5.1 Simetrias Vamos supor uma transformação infinitesimal xµ → x¯µ = xµ + δxµ, φi (x)→ φ¯i (x¯) = φi (x) + δφi. (5.1) Um funcional de ação A é denominado invariante sob estas transformações se a ação calculada nas novas variáveis, A¯ [ φ¯ ] = ˆ Ω¯ dω¯L ( x¯, φ¯, φ¯µ ) , (5.2) for igual à ação calculada nas antigas variáveis A [φ] = ˆ Ω dωL (x, φ, φµ) , (5.3) ou seja, A¯ = A. (5.4) A condição (5.4) pode ser escrita através da diferença finita ∆A = A¯−A = 0. (5.5) Vamos supor que δxµ são funções analíticas de um conjunto de parâmetros aµ e que δφi são funções analíticas de um conjunto de m parâmetros λa, em que a toma os valores de 1 a m. Portanto, as transformações (5.1) fazem parte de uma classe de transformações contínuas. Além disso, temos a condição (aµ, λa)→ 0 =⇒ δx = δφ = 0 =⇒ x¯µ = xµ, φ¯i = φi, (5.6) para as quais dizemos que as transformações são conexas à identidade. Se as transformações são contínuas e conexas à identidade, podemos expandir A¯ em série de Taylor: A¯ ( λa ′) = A+ dA¯ daµ ∣∣∣∣ a,λ=0 aµ + dA¯ dλa ∣∣∣∣ a,λ=0 λa +O (λ2) . (5.7) Colecionando apenas termos até primeira ordem, temos A¯ ≈ A+ δA, (5.8) em que δA é uma primeira variação de A com relação às transformações (5.1), ou seja, ∆A ≈ δA, (5.9) 39 em primeira ordem da aproximação de Taylor. Uma condição necessária para que ∆A seja nulo é, claramente, que δA seja nulo para as transformações (5.1). É claro que esta condição não é suficiente, de modo que podemos definir o que denominamos invariância fraca. A ação A é fracamente invariante sob as transformações (5.1) se δA = 0. De agora em diante, sempre que nos referirmos a uma invariância, esta se refere a uma invariância fraca. Uma invariância forte, em que ∆A = 0 é, claramente, também uma invariância fraca. As transformações que deixam um funcional invariante são chamadas simetrias deste funci- onal. Simetrias contínuas e conexas à identidade, caracterizada pelos m + 4 parâmetros aµ e λa, podem ser explicitamente colocadas na forma δxµ = dx¯µ daν ∣∣∣∣ a,λ=0 aν δφi = dφ¯i daµ ∣∣∣∣ a,λ=0 aµ + dφ¯i dλa ∣∣∣∣ a,λ=0 λa = dφ¯i dx¯ν dx¯ν daµ ∣∣∣∣ a,λ=0 aµ + dφ¯i dλa ∣∣∣∣ a,λ=0 λa = φiν dxν daµ ∣∣∣∣ a,λ=0 aµ + dφ¯i dλa ∣∣∣∣ a,λ=0 λa = δxµφiµ + δ¯φ i, em que δ¯φi = dφ¯i dλa ∣∣∣∣ a,λ=0 λa. Nessas expressões, definimos Γµν ≡ dx¯µ daν ∣∣∣∣ a,λ=0 , Υia ≡ dφ¯i dλa ∣∣∣∣ a,λ=0 , (5.10) que são funções independentes dos parâmetros. Em resumo, δxµ = Γµνa ν , δφi = φiµδx µ + δ¯φi = φiµΓ µ νa ν + Υiaλ a. (5.11) 5.2 A equação de Lie A primeira variação de A sob uma transformação infinitesimal geral caracterizada pelas funções δxµ e δφi foi calculada em (4.36), resultando em δA = ˆ Ω dω [ δL δφi − d dxµ δL δφiµ ] δ¯φi + ˆ Ω dω d dxµ ( δφi δL δφiµ −Hµνδxν ) . (5.12) Com as definições (5.11), δA = ˆ Ω dω {( δL δφi − d dxµ δL δφiµ ) Υiaλ a + d dxµ ( piµi φ i λΓ λ νa ν + piµi Υ i aλ a −HµνΓνγaγ )} . Se δA = 0 em um volume Ω arbitrário, então( δL δφi − d dxµ δL δφiµ ) Υiaλ a = − d dxµ [( piµi φ i ν −Hµν ) Γνγa γ + piµi Υ i aλ a ] . (5.13) Esta é a equação diferencial de Lie. 5.3 O primeiro teorema Vamos separar, por conveniência, as transformações exclusivamente nos campos (δxµ = 0), das transformações exclusivamente no ponto do espaço-tempo (δφ = 0). No primeiro caso, temos δxµ = Γµνa ν = 0, portanto tomaremos Γ = 0 em (5.13). Então,( δL δφi − d dxµ δL δφiµ ) Υiaλ a = − d dxµ [ piµi Υ i aλ a ] . 40 Agora, vamos considerar os parâmetros λa independentes do ponto, ou seja, constantes em xµ. Neste caso, se λa são linearmente independentes, temos( δL δφi − d dxµ δL δφiµ ) Υia = − d dxµ ( piµi Υ i a ) . (5.14) Dizemos que essas são transformações internas globais. Internas, pois consistem em m trans- formações exclusivamente nos campos, sem mudança nas coordenadas deM4. Globais, pois são transformações a parâmetros constantes, que não dependem do ponto do espaço-tempo. Com (5.14), podemos enunciar a forma matemática do primeiro teorema de Noether: Teorema 1. Primeiro teorema de Noether (versão matemática). Para cada simetria da ação, existe uma combinação linear das equações de campo que é igual a uma divergência total. Este teorema também vale no segundo caso, em que δφ = 0, consistindo em transformações exclusivamente no espaço-tempo. Neste caso, temos δ¯φi = −δxµφiµ, resultando em Υiaλa = −φiµΓµνaν . Então, (5.13) torna-se( δL δφi − d dxµ δL δφiµ ) φiµΓ µ γ = − d dxµ ( HµνΓ ν γ ) , (5.15) com aµ constantes. Então, temos o caso em que quatro simetrias resultam em quatro combina- ções lineares das equações de Euler-Lagrange iguais a quatro divergências totais. Toda simetria global (com parâmetros constantes) pode ser separada em uma transformação interna e uma transformação no ponto, de modo que o caso misto não é de muito interesse. Simetrias internas possuem uma enorme relevância em teorias de campos, como por exemplo as transformações de gauge. Por outro lado, toda teoria de campo relativística é invariante pelo grupo de Poincaré, que consiste em translações e pseudo-rotações em M4. Transformações de Poincaré são transformações globais no ponto, portanto. Outra versão do primeiro teorema de Noether pode ser formulada a partir da equação de Lie( δL δφi − d dxµ δL δφiµ ) δ¯φi = − d dxµ ( piµi δφ i −Hµνδxν ) , (5.16) agora escrita na forma geral. Note que, se as equações de campo são satisfeitas, δL δφi − d dxµ δL δφiµ = 0, a seguinte divergência é nula: dΦµ dxµ = 0, Φµ ≡ piµi δφi −Hµνδxν . (5.17) No caso de transformações internas globais, temos Φµ = piµi δφ i = piµi Υ i aλ a, ou seja, dΦµ dxµ = 0 =⇒ d dxµ ( piµi Υ i a ) = 0. As funções Φµa ≡ piµi Υia são denominadas correntes próprias, e as equações dΦµa dxµ = 0 (5.18) 41 são denominadas equações de continuidade. No caso de transformações no ponto, temos Φµ = −Hµνδxν = −HµνΓνλaλ, que resulta em dΦµ dxµ = 0 =⇒ d dxµ (HµνΓ ν λ) = 0. (5.19) Neste caso, as correntes próprias são as funções Φµλ ≡ Hµν Γνλ, que obedecem às equações de continuidade dΦµν/dxµ = 0. Teorema 2. Primeiro teorema de Noether (versão física I). Para cada simetria da ação, existe uma equação de continuidade para um conjunto de correntes próprias. Equações de continuidade aparecem em toda teoria física com simetrias. Por exemplo, consi- dere as equações de Maxwell com fontes ∇ ·E = ρ ε0 , ∇×B = µ0j + µ0ε0 ∂E ∂t . Derivando a primeira equação parcialmente no tempo e tomando o divergente da segunda, temos ∂ ∂t (∇ ·E) = ∇ · ∂E ∂t = 1 ε0 ∂ρ ∂t , ∇ · ∇ ×B = µ0∇ · j + µ0ε0∇ ·
Compartilhar