Álgebra Amı́lcar Pacheco Universidade Federal do Rio de Janeiro (Universidade do Brasil), Departamento de Matemática Pura E-mail address: [email protected] Sumário Capı́tulo 1. Preliminares 1.1. Relação de equivalência 1.2. Lema de Zorn e aplicações 1 2 3 Parte 1. 5 Números Inteiros Capı́tulo 2. Algoritmos Euclideanos 2.1. O algoritmo euclideano para números inteiros 2.2. Máximo divisor comum 2.3. Anéis e ideais 7 7 8 9 Capı́tulo 3. Fatoração de inteiros 3.1. Existência 3.2. Unicidade 3.3. MDC e fatoração 3.4. Aplicações 3.5. Funções aritméticas elementares 11 11 11 12 13 15 Capı́tulo 4. Indução finita 4.1. Enunciados 4.2. Exemplos da indução na sua primeira forma 4.3. Exemplos da indução finita na sua segunda forma 19 19 19 20 Capı́tulo 5. Números primos 5.1. Infinidade de primos 5.2. Primos em progressões aritméticas 5.3. Infinidade de compostos por funções polinomiais 5.4. Números de Fermat e Mersenne 5.5. Contando números primos 5.6. Função zeta 23 23 24 26 27 27 30 Capı́tulo 6. Aritmética modular 6.1. Aritmética modular 6.2. Critérios de divisibilidade 6.3. Contando elementos inversı́veis 35 35 37 38 Capı́tulo 7. Sistemas de congruência 7.1. Equações diofantinas 7.2. Equações lineares 7.3. Sistemas de equações lineares 7.4. Teorema Chinês dos Restos 39 39 39 40 41 iii iv SUMÁRIO 7.5. Aplicação 41 Capı́tulo 8. Aplicações da teoria de grupos à teoria elementar dos números 8.1. Primalidade de números de Mersenne 8.2. Primalidade de números de Fermat 8.3. Números de Carmichael 8.4. Teorema da raiz primitiva 43 43 43 44 45 Parte 2. 47 Grupos Capı́tulo 9. Teoria de Grupos I 9.1. Definição e exemplos 9.2. Subgrupos 9.3. Classes Laterais e Teorema de Lagrange 9.4. Ordem de elemento e expoente de grupo abeliano 49 49 52 54 55 Capı́tulo 10.1. 10.2. 10.3. 10.4. 10.5. 10. Teoria de grupos II Subgrupos normais e grupos quocientes Homomorfismo de grupos Produtos de grupos Grupos metacı́clicos Classificação de grupos de ordem ≤ 11 59 59 61 64 68 70 Capı́tulo 11.1. 11.2. 11.3. 11. Teoremas de Sylow Represesentações de grupos Os teoremas de Sylow Exemplos 73 73 75 77 Capı́tulo 12. Grupos solúveis 12.1. Teorema de Jordan-Hölder 12.2. Grupos solúveis 79 79 81 Capı́tulo 13.1. 13.2. 13.3. 13.4. 85 85 86 87 89 Parte 3. 13. Grupos abelianos finitamente gerados Módulos sobre anéis Diagonalização de matrizes Geradores e relações para módulos O teorema de estrutura Anéis Capı́tulo 14.1. 14.2. 14.3. 14. Anéis de polinômios Algoritmo da divisão Máximo divisor comum de polinômios Fatoração única de polinômios Capı́tulo 15.1. 15.2. 15.3. 15.4. 15.5. 15. Anéis e domı́nios Domı́nios euclideanos Domı́nios fatoriais Fatores múltiplos e resultante Anéis quocientes e teorema chinês dos restos Aplicações 91 93 93 95 97 101 101 106 108 110 115 SUMÁRIO Parte 4. Corpos Capı́tulo 16. Capı́tulo 17.1. 17.2. 17.3. 17.4. Extensões finitas 17. Extensões algébricas Elementos algébricos e transcendentes Extensões algébricas Adjunção de raı́zes Fechos algébricos v 117 119 123 123 124 126 127 Capı́tulo 18. Extensões separáveis 18.1. Corpos Finitos 133 137 Capı́tulo 19. 139 Extensões puramente inseparáveis Capı́tulo 20. Corpos de decomposição e extensões normais 20.1. Exemplos 143 146 Capı́tulo 21.1. 21.2. 21.3. 149 149 152 153 21. Teoria de Galois Correspondência de Galois Extensões e subgrupos normais Coeficientes e raı́zes Capı́tulo 22. Extensões ciclotômicas 155 Capı́tulo 23. Extensões cı́clicas 159 Capı́tulo 24. Solubilidade por radicais 165 Parte 5. Tópicos adicionais 169 Capı́tulo 25.1. 25.2. 25.3. 25. O problema inverso de Galois Grupo Sn Grupo An Método geral 171 171 175 175 Capı́tulo 26.1. 26.2. 26.3. 26. Teoria de Galois infinita Limite inverso Completamento de um grupo Teoria de Galois infinita 177 177 178 179 Capı́tulo 27.1. 27.2. 27.3. 27.4. 27. Teoria de transcendência Bases de trasncendência Transcendência de e Transcendência de π Elementos de teoria de transcencência 181 181 181 181 181 Bibliografia - Livros 183 Bibliografia - Artigos 185 Índice Remissivo 187 CAPı́TULO 1 Preliminares Ao longo deste livro dentoraremos por N o conjunto dos números naturais, Z o conjunto dos números inteiros, Q o conjunto dos números racionais, R o conjunto dos números reais e C o conjunto dos números complexos. Para todo x ∈ C denotamos por √ |x| seu valor absoluto usual, i.e., se x = a + bi com a, b ∈ R, então |x| := a2 + b2 . Para todo x ∈ R denotamos seu valor absoluto usual por |x| := x, se x ≥ 0, e |x| := −x, se x < 0. Sejam S e T conjuntos. Uma função f : S → T é dita injetiva toda vez que x 6= y implicar f (x) 6= f (y). Isto também equivale a dizer que se f (x) = f (y), então x = y. A função f é dita sobrejetiva, se f (S) = T . Lema 1.1. Sejam S 0 e R conjuntos. Então existe um conjunto S10 e bijeção ϕ0 : S 0 → S10 tal que S10 ∩ R = ∅. Axioma 1.2 (axioma da boa ordenação). Todo subconjunto não vazio de N possui um menor elemento. Seja n ≥ 1 inteiro. Sejam x, y variáveis. Considere o produto notável xn − y n = (x − y)(xn−1 + xn−2 y + . . . + xy n−2 + y n−1 . Podemos obter dele a soma de n termos de uma progressão geométrica de razão q. n−1 Digamos que os termos sejam a, aq, · · · , aq . Assim, a + aq + . . . + aq n−1 = a qn − 1 . q−1 Basta na fórmula anterior tomar x = q e y = 1. Para inteiros 1 ≤ m ≤ n definimos o número binomial n n! := , m m!(n − m)! onde n! := n(n − 1) . . . 1. Lembre-se [Sp, p. 632] das seguintes expansões em séries 1 = 1 + x2 + x3 + . . . + xn + . . . ; 1−x x2 x3 xn log(1 − x) = x + + + ... + + ... . 2! 3! n! Dado um número real x denotamos por dxe a parte inteira de x, ou seja, o maior número inteiro menor ou igual a x. Para todo inteiro n ≥ 1 e número primo p, a ordem p-ádica ordp (n) de n é definida por pordp (n) é a potência exata de p que divide n. 1 2 1. PRELIMINARES 1.1. Relação de equivalência Seja X um conjunto. Uma relação binária R é um subconjunto de X × X. Dado um par (a, b) ∈ R dizemos que a é relacionado a b e denotamos por aRb. Por exemplo, podemos tomar como X o conjunto de retas do plano e como R a relação de ortogonalidade. Uma relação de equivalência em um conjunto X é uma relação binária ∼ satisfazendo às seguintes condições: (1) x ∼ x (reflexividade). (2) Se x ∼ y, então y ∼ x (simetria). (3) Se x ∼ y e y ∼ z, então x ∼ z (transitividade). Exemplo 1.3. Seja X = Z e ∼ a relação ≡ (mod n) definida por: dados a, b ∈ Z, a ≡ b (mod n) se e somente se n | (a − b), i.e., existe k ∈ Z tal que a − b = kn. Isto define uma relação de equivalência. De fato, (1) a − a = 0 = 0.n. (2) Se a ≡ b (mod n), então existe k ∈ Z tal que a−b = kn, logo b−a = (−k)n e b ≡ a (mod n). (3) Se a ≡ b (mod n) e b ≡ c (mod n), então existem k, l ∈ Z tais que a − b = kn e b − c = ln. Somando estas duas igualdades obtemos a − c = (k + l)n, logo a ≡ c (mod n). Exemplo 1.4. Seja X = Z × Z − {0}. Definimos dois pares (a, b), (c, d) ∈ X como equivalentes, denotando (a, b) ∼ (c, d) se e somente se ad = bc. Isto define uma relação de equivalência. De fato, (1) ab = ba, logo (a, b) ∼ (a, b). (2) Suponha que (a, b) ∼ (c, d), i.e., ad = bc. Logo cb = da, i.e., (c, d) ∼ (a, b). (3) Suponha que (a, b) ∼ (c, d) e (c, d) ∼ (e, f ), i.e., ad = bc e cf = de. Logo bcf bde af = bc d f = d = d = be, i.e., (a, b) ∼ (e, f ). Seja X um conjunto e ∼ uma relação de equivalência em X. Definimos a classe [a] de um elemento a ∈ X por [a] = {b ∈ X | b ∼ a}. Note que [a] é um conjunto. Lema 1.5. Seja X um conjunto e ∼ uma relação de equivalência em X. Dados a, b ∈ X, temos que a ∼ b se e somente se [a] = [b]. Demonstração. Suponha que [a] = [b]. Observe que a ∈ [a], pois a ∼ a. Logo a ∈ [b], i.e., b ∼ a, portanto a ∼ b. Reciprocamente, suponha a ∼ b e c ∈ [a], i.e., c ∼ a. Por transitividade, c ∼ b, i.e., c ∈ [b]. Suponha d ∈ [b], i.e., d ∼ b. Por simetria, b ∼ a, por transitividade, d ∼ a, i.e., d ∈ [a]. Corolário 1.6. Seja X um conjunto e ∼ um relação de equivalência em X. Então a b se e somente se [a] ∩ [b] = ∅. Demonstração. Note que se a ∼ b, então [a] ∩ [b] = [a] = [b] 6= ∅. Por outro lado, se existisse c ∈ [a] ∩ [b], então c ∼ a e c ∼ b. Por simetria, a ∼ c e por transitividade a ∼ b, o que é uma contradição. Corolário 1.7. Seja X um conjunto e e ∼ um relação de equivalência em X. · · S S Então X = a [a], onde a [a] denota a união disjunta das classes de equivalência em X. 1.2. LEMA DE ZORN E APLICAÇÕES 3 Demonstração. Observe que o lado direito está claramente contido no lado esquerdo. Reciprocamente, pelo corolário anterior dado x ∈ X existe uma única classe de equivalência [a] tal que x ∈ [a]. Seja X um conjunto e e ∼ um relação de equivalência em X. Definimos X := X/ ∼:= {[a] | a ∈ X} como o conjunto das classes de equivalência de ∼ em X. No caso particular em que X = Z e ∼ é ≡ (mod n), denotamos a classe [a] de a ∈ Z por a. Neste caso, X é denotado por Z/nZ. 1.2. Lema de Zorn e aplicações Definição 1.8. Um conjunto M é dito parcialmente ordenado, se existe uma relação ≤ em M satisfazendo às seguintes condições (1) (reflexividade) a ≤ a, para todo a ∈ M. (2) (Transitividade) Dados a, b, c ∈ M, se a ≤ b e b ≤ c, então a ≤ c. (3) (Anti-simetria) Dados a, b ∈ M, se a ≤ b e b ≤ a, então a = b. Esta ordem será dita total, se para quaisquer a, b ∈ M temos a ≤ b ou b ≤ a. Neste caso dizemos que M é um conjunto totalmente ordenado. Definição 1.9. Seja M um conjunto parcialmente ordenado. Um elemento m ∈ M é dito um elemento maximal de M, se dado a ∈ M tal que a ≤ m, então a = m. Um elemento c ∈ M é dito um limite superior para M, se para todo a ∈ M temos a ≤ c. O conjunto M é dito indutivo, se todo subconjunto totalmente ordenado L ⊂ M possui limite superior. Neste caso, M 6= ∅. Lema 1.10 (lema de Zorn). (ver [vWa, §69]) Todo conjunto parcialmente ordenado indutivo possui elemento máximo. Lema 1.11 (lema de Krull). Seja R um anel comutativo com unidade. Todo ideal não nulo a de R está contido em algum ideal maximal m de R. Demonstração. Considere o conjunto N de todos os ideais b ( R contendo a. É imediato que este conjunto é parcialmente ordenado com respeito à relação de inclusão de conjuntos. Seja L ⊂ N um subconjunto totalmente ordenado e [ C := b. b∈L Segue de um exercı́cio do capı́ulo de domı́nios euclideanos que C é um ideal de R. Além disto, este ideal é próprio, do contrário, existiria b ∈ L tal que 1 ∈ b, o que contradiria b ( R. Por construção, o ideal C é um limite superior para L. Em particular, pelo lema de Zorn, existe m elemento máximo de N. Novamente por construação m é maximal e contém a. Parte 1 Números Inteiros CAPı́TULO 2 Algoritmos Euclideanos O objetivo deste capı́tulo é descrever o algoritmo euclideano que permite dividir um número inteiro por outro, definir a noção de máximo divisor comum de números inteiros e provar o algoritmo euclideano estendido que dá uma relação de dependência linear entre o máximo divisor comum e os números inteiros através da noção de ideais. 2.1. O algoritmo euclideano para números inteiros Definição 2.1. Sejam a, b ∈ Z. Dizemos que a divide b ou que b é divisı́vel por a e denotamos a | b se existe c ∈ Z tal que ac = b. Proposição 2.2. A divisibilidade satisfaz as seguintes propriedades: (1) (Cancelamento). Se c 6= 0 e ac | bc, então a | b. (2) (Transitividade). Se a | b e b | c, então a | c. Demonstração. (1) Existe α ∈ Z tal que αac = bc, i.e., c(b − αa) = 0. Mas o produto de dois inteiros é igual a zero implica em que um dos inteiros é nulo. Observe que c 6= 0, assim b = ac, i.e., a | b. (2) Existem α, β ∈ Z tais que b = αa e c = βb, substituindo a primeira igualdade na segunda, obtemos c = βαa, i.e., a | c. Teorema 2.3 (algoritmo de Euclides). Sejam a, b ∈ Z com b 6= 0. Então existem q, r ∈ Z tais que a = bq + r, onde 0 ≤ |r| < |b|. Se a, b ≥ 0, então q e r são unicamente determinados por a e b. Demonstração. Suponha inicialmente que a, b ≥ 0. Se a < b tome q = 0 e r = a. Suponha que a ≥ b. Considere o conjunto S := {k ≥ 1 inteiro | kb > a}. Este conjunto é um subconjunto não vazio de N. Assim, pelo axioma da boa ordenação (axioma 1.2) existe q + 1 ∈ S tal que q + 1 ≤ x para todo x ∈ S. Logo q ∈ / S, i.e., a ≥ bq. Seja r := a − bq, portanto 0 ≤ r < (q + 1)b − b = b. • Se a < 0 e b > 0, divida a0 := −a por b com quociente q 0 e resto r0 e tome q := −q 0 e r := −r0 . • Se a < 0 e b < 0, divida a0 := −a por b0 := −b com quociente q 0 e resto r0 e tome q := q 0 e r := −r0 . • Se a > 0 e b < 0, divida a por b0 := −b com quociente q 0 e resto r0 e tome q := −q e r := r0 . Para provar a unicidade suponha que a = bq1 + r1 = bq2 + r2 , 7 onde 0 ≤ r1 , r2 < b. 8 2. ALGORITMOS EUCLIDEANOS Basta provar que r1 = r2 , pois neste caso bq1 = bq2 e como b 6= 0, pela propriedade do cancelamento, q1 = q2 . Suponha r1 < r2 . Neste caso, r2 − r1 = b(q1 − q2 ) ≥ b, mas r2 − r1 ≤ r2 < b. Similarmente, não podemos ter r1 > r2 . 2.2. Máximo divisor comum Definição 2.4. Sejam a, b ∈ Z. Dizemos que d ∈ Z é um máximo divisor comum de a e b, denotado por mdc(a, b) se (1) d | a e d | b; (por isto d é dito um divisor comum de a e b.) (2) Para todo d0 ∈ Z tal que d0 | a e d0 | b, d0 | d. Observação 2.5. • A noção de mdc está bem definida a menos de sinal. De fato se e for um outro mdc de a e b, então por (2) e | d e d | e, ou seja existem α, β ∈ Z tais que d = αe = αβd, portanto αβ = 1, i.e., α ∈ {±1}. Assim quando dizemos o mdc de a e b referimo-nos à escolha de d positiva. • mdc(a, b) = mdc(−a, −b) (exercı́cio). • Se b | a, então mdc(a, b) = b (idem). • Denote por Da,b o conjunto dos divisores comuns positivos de a e b. Note que para qualquer x ∈ Da,b temos que x ≤ min{a, b}. Assim, este conjunto é finito. Fica novamente como exercı́cio verificar que mdc(a, b) é justamente o elemento máximo de Da,b . Lema 2.6. Sejam a, b ≥ 1 inteiros e a = bq + r onde 0 ≤ r < b a divisão de a por b. Então mdc(a, b) = mdc(b, r). Demonstração. Basta mostrar que os conjuntos Da,b e Db,r são coincidem. De fato, neste caso seus elementos máximos são iguais, o que prova o lema. Seja e ∈ Da,b , digamos a = eα e b = eβ para α, β ∈ Z. Logo r = a − bq = e(α − βq), i.e., e | r, i.e., e ∈ Db,r , i.e., Da,b ⊂ Db,r . Seja f ∈ Db,r , digamos b = f β 0 e r = f γ para β 0 , γ ∈ Z. Então a = bq + r = f (β 0 q + γ), i.e., f | a, i.e., f ∈ Da,b , i.e., Db,r ⊂ Da,b . Teorema 2.7. Sejam a, b ≥ 1 inteiros. Consideremos a seqüência de divisões sucessivas: a = bq1 + r1 , 0 < r1 < b b = r1 q2 + r2 , 0 < r2 < r1 (2.1) .. . .. . rn−2 = rn−1 qn + rn , 0 < rn < rn−1 rn−1 = rn qn+1 , onde rn é o último resto não nulo na seqüência de divisões. Então mdc(a, b) = rn . Demonstração. Notemos inicialmente que em (2.1) terı́amos que ter um primeiro resto nulo, rn+1 , pois b > r1 > r2 > · · · ≥ 1 e não existe uma seqüência estritamente descendente infinita de números inteiros positivos. 2.3. ANÉIS E IDEAIS 9 Pelo lema anterior aplicado a cada linha de (2.1) obtemos mdc(a, b) = mdc(b, r1 ) = · · · = mdc(rn−1 , rn ). Mas rn | rn−1 , logo rn = mdc(rn , rn−1 ). A fortiori, rn = mdc(a, b). Teorema 2.8 (algoritmo euclideano estendido). Sejam a, b ≥ 1 inteiros e d = mdc(a, b). Existem s, t ∈ Z tais que d = sa + tb. Demonstração. Começamos com a penúltima linha de (2.1), rn = rn−2 + (−qn )rn−1 , tome A1 := −rn−1 e B1 := 1. Da linha seguinte temos rn−1 = rn−3 + (−qn−1 )rn−2 , assim rn = B1 rn−2 + A1 rn−1 = B1 rn−2 + A1 (rn−3 + (−qn−1 )rn−2 ). Tome A2 := B1 − A1 qn−1 e B2 := A1 . A linha seguinte nos dá rn−2 = rn−4 + (−qn−2 )rn−3 . Substituindo na fórmula anterior, rn = B2 rn−3 + A2 rn−2 = B2 rn−3 + A2 (rn−4 + (−qn−2 )rn−3 ) Tome A3 := B2 − A2 qn−2 e B3 := A2 . Repetindo o mesmo argumento obtemos rn = Bn−2 r1 + An−2 r2 . Mas r2 = b + (−q2 )r1 , donde rn = Bn−2 r1 + An−2 (b + (−q2 )r1 ), tome An−1 := Bn−2 − An−2 q2 e Bn−1 := An−2 . Finalmente a primeira divisão nos dá, r1 = a + (−q1 )b e sustituindo na fórmula anterior obtemos rn = Bn−1 b + An−1 (a + (−q1 )b). Basta tomar s := An−1 e t := Bn−1 − An−1 q1 . 2.3. Anéis e ideais Nesta seção daremos uma outra demonstração (conceitual) do algoritmo euclideano estendido. Para isto precisamos da noção de ideais no conjunto Z dos números inteiros. O conjunto Z dos números inteiros possui duas funções. A soma + : Z × Z → Z de números inteiros (a, b) 7→ a + b que associa ao par (a, b) sua soma a + b. E o produto de inteiros · : Z × Z → Z dada por (a, b) 7→ ab que associa ao par (a, b) o seu produto ab. Dados inteiros a, b, c as seguintes propriedades são satisfeitas: (1) (Associatividade da soma) a + (b + c) = (a + b) + c. (2) (Comutatividade da soma) a + b = b + a. (3) (Elemento neutro da soma) a + 0 = 0. (4) (Inverso da soma) Dado a ∈ Z existe b ∈ Z tal que a + b = 0 e denotamos b = −a. (5) (Associatividade do produto) a(bc) = (ab)c. (6) (Comutatividade do produto) ab = ba. (7) (Elemento neutro do produto) 1a = a. 10 2. ALGORITMOS EUCLIDEANOS (8) (Distributividade do produto em relação à soma) a(b + c) = ab + ac. Por satisfazer estas propriedades Z é dito um anel comutativo com unidade. Além disto a seguinte propriedade é satisfeita: (9) (Cancelamento) Se ab = 0, então a = 0 ou b = 0. Por satisfazer esta propriedade Z é dito um domı́nio de integridade. Observação 2.9. Poderı́amos perguntar sobre a existência do inverso em Z com relação ao produto. Ou seja, suponhamos que a, b ∈ Z são tais que ab = 1. Suponha a ≥ 1. Neste caso b = a1 ∈ Z também é um inteiro positivo, mas a única possibilidade destra fração ser um número inteiro é a = 1 e neste caso necessariamente b = 1. Se a < 0, seja a0 = −a e b0 = −b, logo ab = a0 b0 = 1 e pelo caso anterior a0 = 1 e b0 = 1, i.e., a = b = −1. Assim os únicos números inteiros que admitem inverso são ±1. Definição 2.10. Um subconjunto I ⊂ Z de Z é dito um ideal de Z, se as seguintes condições são satisfeitas: (1) 0 ∈ I. (2) (I é fechado com relação à soma) Dados a, b ∈ I, a + b ∈ I. (3) (I é estável com relação à multiplicação de elementos de Z) Dado a ∈ I e r ∈ Z, então ra ∈ I. Fica como exercı́cio mostrar que os seguintes conjuntos são ideais de Z : • I := 2Z = {2k | k ∈ Z} (o conjunto dos números pares). • Seja n ≥ 1 inteiro e I := nZ = {nk | k ∈ Z} o conjunto dos múltiplos de n. • Sejam n1 , · · · , nk ≥ 1 inteiros. Seja I := n1 Z + . . . + nk Z = {n1 a1 + . . . + nk ak | a1 , · · · , ak ∈ Z} o conjunto dos números que são somas de múltiplos de n1 com múltiplos de n2 , etc., com múltiplos de nk . Proposição 2.11. Todo ideal I 6= (0) de Z é da forma dZ para algum d ≥ 1. Por isto dizemos que I é um ideal principal e que Z é um domı́nio principal. Demonstração. Observemos que I ∩ N 6= ∅. Dado a ∈ I, se a ≥ 1 nada há a fazer. Senão, ou seja, dado a < 0 em I, então −a = (−1)a ∈ I pela propriedade (3) de ideais, mas −a ≥ 1. Pelo axioma da boa ordenação existe d ∈ I ∩ N tal que d ≤ k para todo k ∈ I ∩ N. Afirmamos que I = dZ. De um lado, como d ∈ I, pela propriedade (3) de ideais, para todo k ∈ Z, dk ∈ I, i.e., dZ ⊂ I. De outro lado, dado a ∈ I, digamos a ≥ 1, pelo algoritmo euclideano, existem q, r ∈ Z tais que a = qn + r, onde 0 ≤ r < n. Se r > 0, então r = a + (−q)n ∈ I, pois a, (−q)n ∈ I, mas isto contradiz o fato de d ser o menor inteiro positivo em I. Assim, r = 0 e n | a, portanto a ∈ nZ. Se a < 0, a mesma prova mostra que se a0 = −a, d | a0 , logo d | a, e assim I ⊂ nZ. CAPı́TULO 3 Fatoração de inteiros Neste capı́tulo mostramos que todo número inteiro fatora-se de forma única como produto de números primos 3.1. Existência Definição 3.1. Seja p ≥ 2 inteiro. Dizemos que p é um número primo, se para todo inteiro b ≥ 1 tal que b | p, então b = 1 ou b = p, i.e., os únicos divisores positivos de p são 1 e p. Os números inteiros que não primos são chamados de números compostos, i.e., n ≥ 1 é composto se e somente se existem 1 < a, b < n tais que n = ab. Teorema 3.2 (teorema fundamental da aritmética - primeira versão). Seja n ≥ 1 inteiro, existem p1 , · · · , pk números primos (não necessariamente distintos) tais que n = p1 · · · pk . Demonstração. Se n é primo nada há a fazer. Suponhamos que n seja composto. Todo divisor d de n satisfaz d ≤ n, assim o conjunto dos divisores positivos de n é finito. Seja p1 o menor divisor positivo de n. Afirmamos que p1 é primo. Se p1 não fosse primo, terı́amos que existem 1 < a, b < p1 tais que p1 = ab, em particular a | n, mas isto contradiz a minimalidade de p1 . Seja n1 := pn1 < n. Se n1 é igual a 1 ou primo, então n = n1 p1 já é a fatoração procurada. Senão, com o mesmo argumento anterior, o menor divisor positivo p2 de n1 é primo. Seja n2 := np21 = p1np2 < n1 . Se n2 é igual a 1 ou primo, então n = n2 p2 p1 é a fatoração procurada. Senão prosseguimos. Note que temos uma seqüência estritamente decrescente n > n1 > n2 > · · · de inteiros positivos, assim existe k ≥ 1 tal que nk = 1, i.e., n = p1 · · · pk . 3.2. Unicidade Lema 3.3. Seja p ≥ 2 um número primo e a, b ∈ Z \ {0}. Se p | ab, então p | a ou p | b. Demonstração. Note que dado um número primo p, então mdc(a, p) = 1 equivale a p - a, pois os únicos divisores positivos de p são 1 e p. Suponha que p - a, i.e., pelo algoritmo euclideano estendido, existem s, t ∈ Z tais que 1 = sa + tp. Multiplicando ambos os lados por b obtemos b = sab + tpb. Mas ab = αp, pois p | ab, para algum α ∈ Z. Logo b = p(sα + tb), i.e., p | b. Observação 3.4. O lema anterior pode ser estendido imediatamente para um produto qualquer de inteiros, i.e., se p | a1 · · · an , então existe 1 ≤ i ≤ n tal que p | ai . 11 12 3. FATORAÇÃO DE INTEIROS Teorema 3.5 (teorema fundamental da aritmética - segunda versão). Seja n ≥ 1 inteiro, então existem únicos números primos p1 < · · · < pr e inteiros e1 , · · · , er ≥ 1 tais que n = pe11 · · · perr . Demonstração. Já provamos anteriormente a existência da fatoração, agrupando os primos e colocando-os em ordem temos a expressão acima. Suponha que existam outros primos q1 < · · · < qs e inteiros f1 , · · · , fs ≥ 1 tais que n = pe11 · · · perr = q1f1 · · · qsfs . Pela observação anterior temos que existe algum 1 ≤ j ≤ s tal que p1 | qj . Mas ambos são primos, logo p1 = qj . O mesmo argumento acima mostra que existe 1 ≤ i ≤ r tal que q1 = pi . Afirmamos que j = 1. Caso contrário, ou seja j > 1, q1 = pi ≥ p1 = qj , o que contradiz a ordenação dos números primos q’s. Logo j = 1. Afirmamos também que e1 = f1 . Suponha, por exemplo, que e1 > f1 . Neste caso, cancelando pf11 dos dois lados da equação acima obtemos pe11 −f1 pe22 · · · perr = q2f2 · · · qsfs . Repetindo a argumentação anterior obtemos que q2 = pi para algum 1 < i ≤ r. Mas dessa forma, o fator primo p1 do lado esquerdo não cancelará com nenhum fator primo do lado direito. Portanto, e1 = f1 . Isto nos fornece a igualdade pe22 · · · perr = q2f2 · · · qsfs . Pelo mesmo argumento anterior, p2 = q2 e e2 = f2 . Assim sucessivamente concluimos que o número de fatores primos em ambos os lados é igual, i.e., r = s e para cada 1 ≤ i ≤ r, pi = qi e ei = fi . 3.3. MDC e fatoração Proposição 3.6. Sejam a, b ≥ 1 inteiros, a = pe11 · · · pekk e b = pf11 · · · pfkk suas fatorações, com ei , fi ≥ 0 para 0 ≤ i ≤ k. Seja gi = min{ei , fi } e d = pg11 · · · pgkk . Então d = mdc(a, b). Demonstração. Notemos que d é um divisor comum de a e b, pois a = dpe11 −g1 · · · pkek −gk e b = dpf11 −g1 · · · pfkk −gk , uma vez que para cada i, fi − gi , ei − gi ≥ 0. Seja d0 ≥ 1 um divisor comum de a e b, i.e., d = ph1 1 · · · phk k para 0 ≤ hi ≤ ei , fi . Em particular, hi ≤ gi . Assim, d = d0 p1g1 −h1 · · · pgkk −hk . 3.4. APLICAÇÕES 13 3.4. Aplicações Proposição 3.7. Seja p ≥ 2 um número primo. Então √ p∈ / Q. Demonstração. Seja x ∈ Q \ {0}. Então x = ab com a, b ∈ Z \ {0}. Note que a = da0 e b = db0 , onde d = mdc(a, b) e que mdc(a0 , b0 ) = 1. Simplificando d 0 obtemos que x = ab0 . Assim, dividindo pelo mdc, suporemos sempre que dado um número x ∈ Q \ {0}, x é da forma ab com mdc(a, b) = 1. √ √ Suponha que p ∈ Q, i.e., existem a, b ∈ Z tais que p = ab e mdc(a, b) = 1. Logo a2 = pb2 e p | a2 . Pelo lema 3.3 concluimos que p | a, digamos a = pα, para algum α ∈ Z. Substituindo na igualdade anterior concluimos que p2 α2 = pb2 , i.e., pα2 = b2 . Mas isto implica em p | b2 . Novamente, pelo lema 3.3, obtemos que p | b, mas isto é impossı́vel pois mdc(a, b) = 1. Definição 3.8. Seja n ≥ 1 inteiro. Dizemos que n é livre de quadrados se sua fatoração é da forma n = p1 · · · pk . Lema 3.9. Seja n ≥ 1 inteiro, então existem Q, a ≥ 1 inteiros tais que n = a2 Q, onde Q é livre de quadrados. Demonstração. Fatoramos n como n = pe11 · · · pekk . Pelo algoritmo euclideano, para cada 1 ≤ i ≤ k, existem qi , ri ∈ Z tais que ei = 2qi + ri , onde 0 ≤ ri < 2. Assim 2qk rk 1 r1 n = p2q 1 p1 · · · pk p k e tomando Q := pr11 · · · prkk , excluindo os primos com expoente zero, temos que Q é livre de quadrados. O que sobra é a2 com a := pq11 · · · pqkk , i.e., n = a2 Q. √ / Q. Proposição 3.10. Seja n ≥ 1 inteiro livre de quadrados, então n ∈ √ Demonstração. Suponha que n = ab com a, b ∈ Z e mdc(a, b) = 1. Seja n = p1 · · · p k a fatoração de n. Então a2 = p1 · · · pk b2 . Logo para cada 1 ≤ i ≤ r temos que pi | a2 . Pelo lema 3.3 concluimos que pi | a, digamos a = pi αi para αi ∈ Z. Substituindo na igualdade anterior obtemos p2i αi2 = p1 · · · pk b2 . Simplificando pi na igualdade acima, obtemos pi αi2 = p1 · · · pi−1 pi+1 · · · pk b2 = cb2 , onde c := p1 · · · pi−1 pi+1 · · · pk . Como pi - c, pois pi não pode dividir nenhum dos fatores de c uma vez que p1 < · · · < pk , ou seja são todos distintos, concluimos que pi | b2 . Novamente pelo lema 3.3 temos que pi | b, o que contradiz mdc(a, b) = 1. √ / Q. Proposição 3.11. Seja f ≥ 2 inteiro e p ≥ 2 primo. Então f p ∈ 14 3. FATORAÇÃO DE INTEIROS Demonstração. Suponha que √ f p= f a b com f a, b ∈ Z e mdc(a, b) = 1. Então a = pb e p | af . Pela observação 3.4 concluimos que p | a, digamos a = pα. Substituindo na igualdade anterior obtemos pf αf = pbf , simplificando a igualdade anterior por p, concluimos que pf −1 αf = bf . Como f ≥ 2 temos que p aparece na fatoração do lado esquerdo, em particular, p | bf . Novamente, pela observação 3.4 concluimos que p | b, mas isto contradiz mdc(a, b) = 1. Definição 3.12. Sejam n ≥ 1 e f ≥ 2 inteiros. Dizemos que n é livre de f -potências se a fatoração de n é da forma n = pe11 · · · pekk com 1 ≤ ei < f para todo 1 ≤ i ≤ k. Lema 3.13. Seja n ≥ 1 inteiro, então existem Q, a ≥ 1 inteiros tais que n = af Q com Q livre de f -potências. Demonstração. Seja n = pe11 · · · pekk a fatoração de n. Pelo algoritmo euclideano, para cada 1 ≤ i ≤ k, existem qi , ri ∈ Z tais que ei = f qi + ri , onde 1 ≤ ei < f . Assim escrevemos n = pf1 q1 pr11 · · · pfk qk prkk . Como anteriormente Q := pr11 · · · prkk é livre de f -potências e tomando a := pq11 · · · pfkk concluimos que n = af Q. Proposição 3.14. √ Sejam n ≥ 1 e f ≥ 2 inteiros. Suponhamos que n seja livre / Q. de f -potências. Então f n ∈ Demonstração. Seja n = pe11 · · · pekk √ a fatoração de n, onde 1 ≤ ei < f para todo i ≤ i ≤ k. Suponhamos que f n = com a, b ∈ Z e mdc(a, b) = 1. Então a b af = pe11 · · · pekk bf . Logo para cada 1 ≤ i ≤ k pi | af . Pela observação 3.4 concluimos que pi | a, digamos a = pi αi para αi ∈ Z. Substituindo na igualdade anterior obtemos pfi αif = pe11 · · · pekk bf . Cancelando pei i em ambos os lados da igualdade acima e denotando e e i−1 i+1 c := pe11 · · · pi−1 pi+1 · · · pekk , obtemos pif −ei αif = cbf . Como anteriormente pi - c uma vez que pi não divide nenhum fator de c. Logo pi | bf . Novamente pela observação 3.4 concluimos que pi | b, mas isto contradiz mdc(a, b) = 1. 3.5. FUNÇÕES ARITMÉTICAS ELEMENTARES 15 3.5. Funções aritméticas elementares Para todo número inteiro n ≥ 1 denotemos por ν(n) o número de divisores inteiros positivos de n e por σ(n) a soma de todos estes divisores, i.e., X ν(n) := #{d ≥ 1 | d | n} e σ(n) := d. d≥1,d|n Utilizaremos a fatoração única para obter fórmulas explı́citas para estes dois números. Proposição 3.15. Seja n = pa1 1 · · · par r a fatoração de n em números primos. Então pa1 +1 − 1 par +1 − 1 ν(n) = (a1 + 1) · · · (ar + 1) e σ(n) = 1 ··· r . p1 − 1 pr − 1 Demonstração. Note que d | n se e somente se d fatora-se como d = pb11 · · · pbrr com 0 ≤ bi ≤ ai para todo 1 ≤ i ≤ r. Assim, os divisores positivos de n correspondem bijetivamente as r-uplas (b1 , · · · , br ) satisfazendo a 0 ≤ bi ≤ ai para todo 1 ≤ i ≤ r. A quantidade destas r-uplas é exatamente (a1 + 1) · · · (ar + 1). Para a segunda igualdade observe que ! ! X X X b1 b1 br br σ(n) = p1 · · · pr = p1 · · · pr b1 (b1 ,··· ,br ) br e que cada soma no segundo membro é a soma dos termos de uma progressão geométrica, disto segue a fórmula para σ(n). 3.5.1. Função de Mœbius. Definimos a função de Mœbius µ : N \ {0} → Z por µ(1) := 1, µ(n) := 0, se n não é livre de quadrados, caso contrário, i.e., n = p1 · · · pr , onde os pi ’s são primos distintos definimos µ(n) := (−1)r . Proposição 3.16. Se n > 1, então X µ(d) = 0. d≥1,d|n Demonstração. Seja n = pa1 1 · · · par r a fatoração de n. Pela definição de µ temos que X X µ(d) = µ(p11 . . . prr ), d≥1,d|n (1 ,··· ,r ) onde os i ’s são 0 ou 1. Portanto, X r r µ(d) = 1 − r + − + . . . + (−1)r = (1 − 1)r = 0. 2 3 d≥1,d|n Para entender melhor a função de Mœbius precisamos introduzir a multiplicação de Dirichlet. Sejam f, g : N \ {0} → C, definimos X f ◦ g(n) := f (d1 )g(d2 ). d1 ,d2 ≥1,d1 d2 =n 16 3. FATORAÇÃO DE INTEIROS Este produto é associativo. Isto segue do seguinte exercı́cio X f ◦ (g ◦ h)(n) = (f ◦ g) ◦ h(n) = f (d1 )g(d2 )h(d3 ). d1 ,d2 ,d3 ≥1,d1 d2 d3 =n Definimos a função 1 : N \ {0} → Z por 1(1) := 1 e 1(n) := 0, se n > 1. Segue da definição que para toda função f : N \ {0} → C temos f ◦ 1 = 1 ◦f = f . Defina também a função I : N \ {0} → Z por I(n) P := 1 para todo n. Novamente, por esta definição obtemos f ◦ I(n) = I ◦ f (n) = d≥1,d|n f (d). Lema 3.17. I ◦ µ = µ ◦ I = 1. Demonstraç ão. É claro que µ ◦ I(1) = µ(1)I(1) = 1. Se n > 1, então P µ ◦ I(n) = d≥1,d|n µ(d) = 0. A prova para I ◦ µ é idêntica. Teorema 3.18 (teorema de inversão de Mœbius). Seja X F (n) := f (d). d≥1,d min d Então X f (n) = µ(d)F (n/d). d≥1,d|n Demonstração. Por definição F = f ◦I. Logo, F ◦µ = (f ◦I)◦µ = f ◦(I ◦µ) = f ◦ 1 = f , i.e., X f (n) = F ◦ µ(n) = µ(d)F (n/d). d≥1,d|n O teorema de inversão de Mœbius tem diversas aplicações, dentre elas a função φ de Euler definida da seguinte forma. Seja n ≥ 1 inteiro, φ(n) denota o número de inteiros positivos d ≤ n tais que mdc(d, n) = 1. É claro que se p for um número primo φ(p) = p − 1. Proposição 3.19. X φ(d) = n d≥1,d|n Demonstração. Consideremos as n frações 1/n, 2/n, · · · , (n−1)/n, n/n. Podemos reduzir cada uma delas a forma mı́nima cancelando os fatores primos comuns do numerador e denominador. Assim, cada uma delas será igual a uma fração a/b com mdc(a, b) = 1. Os denominadores serão sempre divisores de n. O número de frações na forma mı́nima com denominador d, pela definição da função φ, é igual a φ(d). Disto segue a proposição. Proposição 3.20. Se n = pa1 1 . . . par r , então 1 1 φ(n) = n 1 − ... 1 − . p1 pr − 1 Demonstração. Como n= X d≥1,d|n φ(d), 3.5. FUNÇÕES ARITMÉTICAS ELEMENTARES 17 pelo teorema de inversão de Mœbius temos X X n X n φ(n) = µ(d)n/d = n − + + ... pi i<j pi pj i d≥1,d|n 1 1 =n 1− ... 1 − p1 pr − 1 CAPı́TULO 4 Indução finita Neste capı́tulo apresentamos o método da indução finita. Este método é utilizado em diversas circunstâncias em matemáticas para provar afirmativas que dependem “indutivamente” dos números naturais. 4.1. Enunciados Axioma 4.1 (princı́pio da indução finita na sua primeira forma). Seja A(n) uma afirmativa sobre números naturais n ∈ N. Suponha que (1) exista n0 ∈ N tal que A(n0 ) seja verdadeira. (2) Dado k ≥ n0 , toda vez que A(k) for verdade, então A(k + 1) também o será. Então para todo n ≥ n0 a afirmativa A(n) é verdadeira. Axioma 4.2 (princı́pio da indução finita na sua segunda forma). Seja A(n) uma afirmativa sobre números naturais n ∈ N. Suponha que (1) exista n0 ∈ N tal que A(n0 ) seja verdadeira. (2) Se A(k) é verdadeira para todo n0 ≤ k < n então A(n) também é verdadeira. Logo para todo n ≥ n0 a afirmativa A(n) é verdadeira. 4.2. Exemplos da indução na sua primeira forma Exemplo 4.3. Para todo inteiro n ≥ 1 temos n X n(n + 1) . i= 2 i=1 Demonstração. (1) Para n = 1 temos que 1 = Pn (2) Suponha que i=1 i = n(n+1) . Então 2 n+1 X i=1 i= n X i=1 i + (n + 1) = 1.2 2 . n(n + 1) (n + 1)(n + 2) + (n + 1) = . 2 2 Lema 4.4. Seja p um número primo e 1 ≤ i < p inteiro, então o binomial é divisı́vel por p. Demonstração. Por definição p p(p − 1) · · · (p − i + 1) = ∈ Z. i i(i − 1) · · · 1 19 p i 20 4. INDUÇÃO FINITA Note que p não divide nenhum dos fatores do denominador, pois i < p. Logo podemos colocar p para fora da fração e o que sobra (p − 1) · · · (p − 1 + i) i(i − 1) · · · 1 também é inteiro. Exemplo 4.5. Seja p um número primo. Para todo inteiro n ≥ 1 temos que p divide np − n. Demonstração. (1) Para n = 1 temos que p divide 1p − 1 = 0. p (2) Suponha que p | (n − n). Então p−1 X p i p (n + 1) − (n + 1) = n + (np − n). i i=1 Pelo Lema 4.4 e pela hipótese de p | (np − n) concluimos que p | ((n + 1)p − (n + 1)). Teorema 4.6 (pequeno teorema de Fermat). Seja p um número primo e a ∈ Z. Então p | (ap − a). Demonstração. O exemplo mostra o teorema para inteiros positivos. Seja m < 0 inteiro, digamos m = −n para n ≥ 1. Suponha p > 2. Neste caso, mp − m = (−n)p − (−n) = −(np − n) que é divisı́vel por p. No caso de p = 2 temos que se n2 − n = 2α, então m2 − m = n2 + n = n + 2α + n = 2(α + 1). Observação 4.7. O teorema anterior é na verdade equivalente para um inteiro a não divisı́vel por p a p | (ap−1 −1). De fato, suponha que ap −a = a(ap−1 −1) = αp para α ∈ Z. Se p - a, então pelo Lema 3.3 concluimos que p | (ap−1 − 1). 4.3. Exemplos da indução finita na sua segunda forma Ordenamos os números primos p1 = 2 < p2 = 3 < p3 = 5 · · · < pn · · · , onde pn denota o n-ésimo número primo. Seja P o conjunto dos números primos. Teorema 4.8 (Euclides). O conjunto P é infinito. Demonstração. Suponhamos que P seja finito, digamos com k elementos, P = {p1 < · · · < pk }. Seja M := p1 · · · pk + 1. Notemos que M > p1 · · · pk ≥ 2pk > pk , logo M tem que ser um número composto. Pelo teorema fundamental da aritmética M é produto de números primos. Logo os únicos primos que podem aparecer na sua fatoração são p1 , · · · , pk , digamos que pi | M , i.e., existe αi ≥ 1 inteiro tal que M = αi pi . Retornando à definição de M obtemos pi (αi − p1 · · · pi−1 pi+1 · · · pk ) = 1. Os fatores do lado esquerdo são ambos inteiros, o primeiro é positivo e o produto é positivo. Logo a expressão entre parênteses é positiva. Por outro lado pi ≥ 2, logo 4.3. EXEMPLOS DA INDUÇÃO FINITA NA SUA SEGUNDA FORMA 21 o lado esquerdo é pelo menos 2, enquanto o lado direito é 1, o que é impossı́vel. A contradição vem do fato de termos suposto P finito, portanto P é infinito. No próximo capı́tulo daremos outras demonstrações deste teorema bem como discutiremos em maior profundidade os números primos. n Exemplo 4.9. Para todo inteiro n ≥ 1 temos pn ≤ 22 . Demonstração. (1) Observe que p1 = 2 ≤ 22 = 4. m (2) Suponha que para todo 1 ≤ m < n tenhamos pm ≤ 22 . A demonstração do teorema de Euclides mostra que M := p1 · · · pn−1 + 1 não pode ser divisı́vel por nenhum dos primos p1 , · · · , pn−1 . Logo M só pode ser divisı́vel por primos maiores que pn−1 , em particular, pn ≤ M . Assim, 2 pn ≤ p1 · · · pn−1 + 1 ≤ 22 + . . . 2n−1 + 1. n−1 Mas 22 + . . . + 2n−1 = 2(1 + . . . + 2n−2 ) = 2 2 2−1−1 = 2n − 2. Portanto, n n n n n pn ≤ 22 −2 +1. Basta mostrar que 22 −2 +1 ≤ 22 , i.e., 4 ≤ 22 +2 −22 = n 22 (4 − 1), o que é verdade. Exemplo 4.10 (algoritmo de Euclides). Seja b ≥ 1 inteiro. Para todo inteiro n ≥ 1 existem q, r ∈ Z tais que n = bq + r para 0 ≤ r < n. Demonstração. (1) Se n < b tome q = 0 e r = n. Se n = b tome q = 1 e r = 0. (2) Suponhamos que n > b. Então 1 ≤ n − b < n. Por hipótese de indução, para todo 1 ≤ m < n existem qm , rm ∈ Z tais que m = bqm + rm , onde 0 ≤ rm < n. Em particular, existem q 0 , r0 ∈ Z tais que n − b = q 0 b + r0 onde 0 ≤ r0 < b. Logo n = (q 0 + 1)b + r0 e basta tomar q = q 0 + 1 e r = r0 . CAPı́TULO 5 Números primos No capı́tulo anterior provamos que o conjunto dos números primos é infinito. Daremos 3 outras demonstrações para este fato. Cada qual tem seu mérito próprio. A prova apresentada no capı́tulo sobre indução finita é a original de Euclides. Provaremos também que existe uma infinidade de números primos em certas progressões aritméticas e que funções polinomiais não lineares produzem uma infinidade de números compostos. 5.1. Infinidade de primos Seja P o conjunto dos números primos. Teorema 5.1 (Euclides). O conjunto P é infinito. 2a. Demonstração. Suponhamos que P seja finito, digamos P = {p1 , · · · , pk }. Seja n ≥ 1 inteiro. Pelo Lema 3.9, n = mQ2 , com m, Q ≥ 1 inteiros e m livre de quadrados. Por um lado a quantidade de números inteiros positivos até n é exatamente n. Por outro, m = pe11 · · · pekk , onde ei ∈ {0, 1}, para 1 ≤ i ≤ k. Assim, escolher m é equivalente a escolher os expoentes ei , e como tenho duas escolhas para cada i, o número de escolhas possı́veis para m é no máximo 2k √ . Observemos √ n, √ portanto, também que Q ≤ n, logo o número de escolhas√para Q é no máximo √ o número de escolhas para n é no máximo 2k n, i.e., n ≤ 2k n, i.e., n ≤ 2k , i.e., n ≤ 22k . Mas k é fixo, é a cardinalidade do conjunto de números primos, e n é um inteiro qualquer, i.e., estamos mostrando que o conjunto dos inteiros positivos é limitado, o que é impossı́vel. Portanto, P é infinito. n 3a. Demonstração. Seja F (n) := 22 + 1 o n-ésimo número de Fermat. Mostramos anteriormente (exercı́cio do capı́tulo sobre algoritmo de Euclides) que se n > m ≥ 1, então mdc(F (n), F (m)) = 1. Começamos escolhendo um fator primo q1 de F (1). Pelo resultado anterior, todo fator primo de F (2) é distinto de q1 , escolhemos um destes fatores primos, digamos q2 . Suponhamos que para todo 1 ≤ m < n tenhamos escolhido para cada F (m) um fator primo distinto. Novamente pelo resultado anterior todo fator primo de F (n) é distinto de q1 , · · · , qn−1 , escolhemos um destes fatores primos, digamos qn . Provamos assim (via a Indução na sua segunda forma) que para todo n ≥ 1 temos um número primo qn fator de F (n) distinto de q1 , · · · , qn−1 . Produzimos assim um subconjunto infinito {q1 , · · · , qn , · · · } ⊂ P de P. Em particular, P é infinito. Uma quarta demonstração é conseqüência do seguinte teorema. Teorema 5.2 (*). A série X1 p p∈P 23 24 5. NÚMEROS PRIMOS diverge. Para a noção de divergência de série veja [Li, Capı́tulo IV]. Demonstração. Sejam n ≥ 1 inteiro e p1 , · · · , pl(n) os números primos menores ou iguais a n. Seja l(n) Y 1 λ(n) := . 1 − pi i=1 Segue das Preliminares que X 1 1 , = 1 − pi pai i ai ≥0 logo λ(n) = X pa1 (a1 ,··· ,al(n) ) 1 1 al(n) , . . . pl(n) onde a l(n)-upla (a1 , · · · , al(n) ) é formada de inteiros não negativos. Em particular, como 1 1 1 + + . . . + < λ(n), 2 n concluimos que λ(n) → ∞ quando n → ∞ (ver [Li, Capı́tulo IV, Exemplos 23]). Em particular, P é um conjunto infinito. Calculando o logartimo de λ(n) (ver Preliminares) obtemos log(λ(n)) = − l(n) X log(1 − pi ) = i=1 l(n) X X i=1 m≥1 1 mpm i l(n) = XX 1 1 1 + . + ... + p1 pl(n) i=1 mpm i m≥2 Note que X m≥2 X 1 1 1 2 1 < = 2 −1 ≤ p2 . m mpi pm p 1 − p i i i i m≥2 Logo, ! 1 1 1 1 log(λ(n)) < + ... + +2 + ... + 2 . p1 pl(n) p21 pl(n) P Segue de [Li, Capı́tulo IV, Exemplo 29] que n≥1 n−2 converge, a fortiori o mesmo P P −1 vale para i≥1 p−2 convergisse, existiria uma constante i . Dessa forma, se p∈P p M M tal que log(λ(n)) < M , i.e., λ(n) < e , mas λ(n) → ∞, quando n → ∞. Assim, P −1 p não pode convergir. p∈P 5.2. Primos em progressões aritméticas Nos próximos 3 parágrafos procuramos estudar fórmulas “simples” que “caracterizem” os números primos. Na verdade procuramos funções f : N → N cuja imagem contenha “muitos” números primos. Começaremos pela função linear, digamos f (n) = an + b com a, b ≥ 1 inteiros. Note que f (N) é uma progressão aritmética com primeiro elemento a + b e razão b. 5.2. PRIMOS EM PROGRESSÕES ARITMÉTICAS 25 Lema 5.3. Existem infinitos números primos da forma 4n + 3 com n ≥ 1 inteiro. Demonstração. Seja p > 2 um número primo. Comecemos analisando os possı́veis restos da divisão de p por 4. Pelo algoritmo da divisão existem q, r ∈ Z tais que p = 4q + r com 0 ≤ r < 4. Como p é primo as únicas possibilidades para r são 1 e 3. Seja P4,3 o conjunto dos números primos maiores ou iguais a 7 da forma 4n + 3. Suponha que P4,3 seja infinito, digamos P4,3 = {p1 < · · · < pk }. Seja M := 4p1 · · · pk + 3. Observe que M deixa resto 3 na divisão por 4. Observe também que M > 4p1 · · · pk > 4pk > pk , logo (como pk é o maior número primo que deixa resto 3 na divisão por 4) M é composto. Pelo teorema fundamental da aritmética M fatora-se em um produto de primos. Note que se a, b ≥ 1 são inteiros que deixam resto 1 na divisão por 4, então o mesmo ocorre para ab. De fato, se a = 4x + 1, b = 4y + 1, então ab = 4(4xy + x + y) + 1. Fica como exercı́cio verificar (utilizando a primeira forma da indução finita) que o mesmo vale para um produto finito a1 · · · an de inteiros positivos cada qual deixando resto 1 na divisão por 4. Assim, não é possı́vel que todo fator de M deixe resto 1 na divisão por 4, i.e., existe algum 1 ≤ i ≤ k tal que pi | M , i.e., M = pi αi para αi ≥ 1 inteiro. Retornando à definição de M obtemos pi (αi − 4p1 · · · pi−1 pi+1 · · · pk ) = 3. No lado esquerdo temos um produto de um número inteiro positivo por outro cujo produto também é um inteiro positivo, logo o número inteiro entre parentêses é um inteiro positivo. Como p1 ≥ 7, o lado esquerdo é pelo menos 7, o que é impossı́vel. Portanto P4,3 é infinito. Lema 5.4. Existem infinitos números primos da forma 6n + 5 com n ≥ 1 inteiro. Demonstração. Seja p > 2 um número primo. Pelo algoritmo da divisão existem q, r ∈ Z tais que p = 6q + r com 0 ≤ r < 6. Como p é primo, r só pode ser 1 ou 5. Seja P6,5 o conjunto dos números primos maiores ou iguais a 11 da forma 6n+5 para n ≥ 1 inteiro. Suponha que P6,5 seja finito, digamos P6,5 = {p1 < · · · < pk }. Seja M := 6p1 · · · pk + 5. Note que M deixa resto 5 na divisão por 6. Note também que M > 6p1 · · · pk > 6pk > pk . Como pk é o maior número primo que deixa resto 5 na divisão por 6 obtemos que M é composto. Observe que se a, b ≥ 1 são inteiros que deixam resto 1 na divisão por 6, então o mesmo ocorre com ab. De fato, se a = 6x + 1, b = 6y + 1, então ab = 6(6xy + x + y) + 1. Fica como exercı́cio mostrar que o mesmo vale para um produto finito a1 · · · an de inteiros positivos cada qual deixando resto 1 na divisão por 6. 26 5. NÚMEROS PRIMOS Assim não é possı́vel que todo fator de M deixe resto 1 na divisão por 6, i.e., existe 1 ≤ i ≤ k tal que pi | M , M = pi αi para αi ≥ 1 inteiro. Retornando à definição de M obtemos pi (αi − 6p1 · · · pi−1 pi+1 · · · pk ) = 5. No lado esquerdo temos um produto de um número inteiro positivo por outro cujo produto também é um inteiro positivo, logo o número inteiro entre parentêses é um inteiro positivo. Como p1 ≥ 11, o lado esquerdo é pelo menos 11, o que é impossı́vel. Portanto P6,5 é infinito. No parágrafo sobre função zeta a seguir enunciaremos um teorema devido a Dirichlet que generaliza os dois lemas anteriores. 5.3. Infinidade de compostos por funções polinomiais Queremos agora analisar o que ocorre se a função considerada anteriormente for polinomial. Veremos que em geral o fenômeno se contrapõe ao caso linear, ou seja, é possı́vel apenas garantir uma infinidade de números compostos na imagem de f . Teorema 5.5. Seja f (n) := ad n+ ad−1 nd−1 + . . . + a1 n + a0 , onde ad , · · · , a0 ∈ Z com ad > 0. Então existem infinitos números compostos da forma f (n). Demonstração. Se para todo n ≥ 1, f (n) for composto nada há a fazer. Caso contrário, seja n0 ∈ N tal que f (n0 ) = p número primo. Seja h ≥ 1 inteiro e f (n0 + hp) = ad (n0 + hp)d + ad−1 (n0 + hp)d−1 + . . . + a1 (n0 + hp) + a0 . Note que a soma dos termos constantes (considerando a expressão acima como um polinômio em h) é igual a ad nd0 + ad−1 n0d−1 + . . . + a1 n0 + a0 = p. Logo, f (n0 + hp) = p(1 + a1 h + a2 (2n0 h + h2 p) + . . . + ad−1 ((d − 1)n0d−2 h + . . . + (d − 1)n0 hd−2 pd−3 + hd−1 pd−2 ) + ad (dnd−1 h + . . . + dn0 hd−1 pd−2 + hd pd−1 )). 0 Observe que o termo lı́der da expressão acima como polinômio em h é igual a ad pd−1 p > 0. Assim para um inteiro h ≥ 1 suficiente grande a expressão entre parênteses do lado direito menos 1 é sempre positiva, portanto f (n0 +hp) = p(1+α) com α ≥ 1 inteiro. Em particular, f (n0 + hp) é sempre composto para todo h ≥ 1 suficientemente grande. Para o caso d = 2 a cota para h é h > −(2an0 + b)/(ap) (faça a conta neste caso!). 5.5. CONTANDO NÚMEROS PRIMOS 27 5.4. Números de Fermat e Mersenne Nesta seção apresentamos os números de Fermat e Mersenne e começamos a discussão de quando podem ser números primos. No capı́tulo subseqüente sobre aplicações da teoria de grupos à aritmética elementar descreveremos de forma mais precisa critérios para decidir quando estes números são primos. n Para todo n ≥ 1 inteiro seja F (n) := 22 + 1 o n-ésimo número de Fermat. Fermat afirmava que todo número desta forma era primo. Na verdade o que deve ter ocorrido é que ele calculou os quatro primeiros que realmente são. Entretanto, Euler mostrou que 641 | F (5). Daremos uma demonstração disto posteriormente. Para todo n ≥ 1 inteiro seja M (n) := 2n − 1 o n-ésimo número de Mersenne. Lema 5.6. Se n é composto, então M (n) também é composto. Demonstração. Suponha que n = ab com 1 < a, b < n. Então 2n − 1 = (2a )b − 1 = (2a − 1)(2a(b−1) + 2a(b−2) + . . . + 2a + 1) o que mostra que M (a) | M (n). Observação 5.7. Se quisermos que um número de Mersenne seja primo, devemos nos restringir àqueles números de Mersenne cujo ı́ndice n seja um número primo. Mersenne produziu uma lista incompleta e incorreta de M (p)’s para p primo tais que M (p) é primo. Novamente, produziremos a posteriori uma lista ocrreta, a menos da complexidade computacional, utilizando teoria de grupos. 5.5. Contando números primos Para todo número real x > 1 seja π(x) := #{p | número primo com p ≤ x}. O teorema de Euclides nos garante que limx→∞ π(x) = ∞ (para a noção de limite veja [Li, capı́tulo IV]). Nosso objetivo é determinar uma estimativa elementar para a função π(x) que conta a quantidade de números primos menores ou iguais a um dado número real maior que 1. Note que se 1 < x ≤ y, então π(x) ≤ π(y). Seja pn o n-ésimo número primo. Então π(pn ) = n. Proposição 5.8. Seja log(x) o logaritmo na base e. Então π(x) ≥ log(log(x)). Demonstração. Já obtivemos anteriormente (via indução finita) que pn ≤ n m 22 . Para todo x > 1 real fixado o conjunto {m ≥ 1 | inteiro, ee ≤ x} é finito. n−1 n Seja n − 1 seu maior elemento, i.e., ee ≤ x < ee . Observe que ee n−1 n ≥ 22 para n ≥ 4. De fato, basta mostrar que en−1 ≥ 2n log(2), ou seja , n − 1 ≥ n log(2) + log(log(2)), o que é verdade pois log(2) < 1. Logo π(x) ≥ π(ee n−1 n ) ≥ π(22 ) ≥ π(pn ) = n ≥ log(log(x)). Utilizaremos o método da segunda demonstração do teorema de Euclides para refinar à proposição anterior. Para todo inteiro n ≥ 1 seja γ(n) o conjunto dos divisores primos de n. 28 5. NÚMEROS PRIMOS Proposição 5.9. log(dxe) , 2 log(2) onde dxe denota a parte inteira de x (para a definição ver Preliminares). π(x) ≥ Demonstração. Para qualquer conjunto de números primos S denotamos por fS (x) o número de inteiros positivos n ≤ x tais que γ(n) ⊂ S. Suponha que S seja finito de √ cardinalidade t. Escrevemos n = m2 s com s livre de quadrados. Note que m√≤ x. Além disto temos no máximo 2t escolhas para s. Portanto, fS (x) ≤ 2t x. Seja m := π(x), assim pm+1 > x. Se S = {p1 , · · · , pm }, então √ fS (x) = dxe. Em particular, dxe ≤ 2π(x) x e disto segue a proposição. P O método acima nos dá uma nova demonstração do teorema 5.2. De fato, se p∈P 1/p fosse convergente, então existiria n ≥ 1 tal que X 1 1 < . p 2 j j>n Seja S := {p1 , · · · , pn } e x ≥ 1 inteiro. Então x−fS (x) é igual ao número de inteiros positivos m ≤ x tais que γ(m) 6⊂ S. Em outras palavras, contamos o número de inteiros 1 ≤ m ≤ x para os quais existe j > n tal que pj | m. Para cada primo pj existem dx/pj e múltiplos de pj menores ou iguais a x. Portanto, X x X x x x − fS (x) ≤ < . ≤ pj p 2 j>n j>n j √ √ A fortiori, fS (x) ≥ x/2. Mas, fS (x) ≤ 2n x. Logo, 2n ≥ x/2, o que é impossı́vel pois n é fixo e x é variável. Intimamente relacionada à função π(x) temos a seguinte função X θ(x) := log(p). p∈P,p≤x Utilizaremos θ(x) para limitar π(x). Seja θ(1) := 0. Proposição 5.10. θ(x) < (4 log(2))x. Demonstração. Considere o binomial 2n (n + 1) . . . 2n = . n 1.2 . . . n Este número é um inteiro divisı́vel por todo número primo n < p < 2n. Além disto, como 2n X 2n 2n (1 + 1)2n = , então 22n > . j n j=0 Em conseqüência, 2n 2 > 2n n > Y p. n<p<2n Calculando o logartimo, 2n log(2) > X n<p<2n log(p) = θ(2n) − θ(n). 5.5. CONTANDO NÚMEROS PRIMOS 29 Somando esta relação para n = 1, 2, 4, · · · , 2m−1 obtemos θ(2m ) < log(2)(2m+1 − 2) < log(2)2m+1 . Como na demonstração da proposição 5.8 existe m ≥ 1 tal que 2m−1 < x ≤ 2m , donde θ(x) ≤ θ(2m ) < log(2)2m+1 = (4 log(2))2m−1 < (4 log(2))x. Proposição 5.11. Existe um real c1 > 0 tal que x π1 (x) < c1 , para x ≥ 2. log(x) Demonstração. Observe que X √ √ √ √ √ θ(x) ≥ log(p) ≥ log( x)(π(x) − π( x)) ≥ log( x)π(x) − x log( x). √ x<p≤x Logo, √ 2θ(x) √ x + x ≤ (8 log(2)) + x, log(x) log(x) onde a última desigualdade segue da proposição anterior. O resultado segue da √ observação que x < 2x/ log(x) para x ≥ 2. π(x) ≤ Corolário 5.12. π(x) = 0. x Nosso objetivo agora é obter uma cota inferior para a função π(x). Para isto comecemos observando que 2n n+1 n+2 n+n = ... ≥ 2n . n 1 2 n lim x→∞ Por um exercı́cio deste capı́tulo temos X tp 2n (2n)! 2n n ordp = −2 j , = ordp 2 j (n!) p p n j=1 onde tp denota o maior inteiro tal que ptp ≤ 2n. Logo, tp = dlog(2n)/ log(p)e. Além disto, d2xe − 2dxe é sempre 0 ou 1, assim 2n log(2n) ordp ≤ . log(p) n Proposição 5.13 (*). Existe real c2 > 0 tal que x π(x) > c2 . log(x) Demonstração. Pelo que foi feito anteriormente, Y 2n 2n ≤ ≤ ptp . n p<2n Calculando o logaritmo obtemos, X X log(2n) n log(2) ≤ tp log(p) = log(p). log(p) p<2n p<2n 30 5. NÚMEROS PRIMOS √ Se log(p) > (1/2) log(2n), i.e., p > 2n, então dlog(2n)/ log(p)e = 1. Assim, X log(2n) X √ n log(2) ≤ log(p) + log(p) ≤ 2n log(2n) + θ(2n) log(p) √ √ p≤ 2n 2n<p<2n √ √ Portanto, θ(2n) ≥ n log(2) − 2n log(2n). Mas, limn→∞ ( 2n log(2n))/n = 0. Assim, existe uma constante real T > 0 tal que para n suficientemente grande θ(2n) > T n. Toamndo x suficientemente grande e tal que 2n ≤ x < 2n + 1 obtemos x−1 > Cx, 2 para algum real C > 0 conveniente. Portanto, existe real c2 > 0 tal que θ(x) > c2 x para todo x ≥ 2. Para completar a prova observamos que X log(p) ≤ π(x) log(x). θ(x) = θ(x) ≥ θ(2n) > T n > T p≤x Portanto, π(x) ≥ θ(x) x > c2 . log(x) log(x) 5.5.1. Comentários. As duas proposições anteriores são devidas a C̆ebychef (1852). O seguinte teorema suplanta ambas (cf. [Ap, chapter 4], este resultado depende de teoria analı́tica dos números). Teorema 5.14 (teorema dos números primos). x lim π(x) = . x→∞ log(x) O teorema dos números primos foi conjecturado por Gauss na idade de 15 ou 16 anos. A prova correta surgiu apenas em 1896 por Hadamard e de la Vallé Poussin utilizando a função zeta de Riemann, que introduziremos no parágrafo seguinte. Existem uma infinidade de problemas abertos sobre os números primos. Para mencionar apenas dois : • Existem infinitos números primos da forma n2 + 1? • (Primos gêmeos) Existem infinitos pares de números primos da forma (p, p + 2)? Para mais problemas abertos veja [Si] e [Sh]. 5.6. Função zeta Nesta seção descreveremos sem prova diversos fatos a respeito da função zeta de Riemann (para a prova destes fatos ver [IrRo, chapter 16]). Esta função é definida por X ζ(s) := n−s , onde s ∈ C, <(s) > 1. n≥1 Esta série converge em <(s) > 1 e converge uniformemente para <(s) ≥ 1 + δ para todo δ > 0 (para a noção de convergência ver [Li, cap’ıtulo IV]). A primeira propriedade é que ela admite uma expansão em produto euleriano. 5.6. FUNÇÃO ZETA 31 Proposição 5.15. Para <(s) > 1 temos Y 1 ζ(s) = . 1 − p−s p∈P Particularmente importante P é o comportamento assintótico desta função quando s → 1. Considerando que n≥1 1/n diverge suspeitamos que ζ(s) → ∞ quando s → 1. Lembre que ζ(s) é uma função de uma variável complexa. Proposição 5.16. Suponha que <(s) > 1. Então lim (s − 1)ζ(s) = 1. s→1 A proposição na verdade diz que ζ(s) é uma função meromorfa com um pólo simples em s = 1 (para mais detalhes ver [Ap, chapter 12]). Corolário 5.17. Quando s → 1 temos log(s) → 1. (log(s − 1))−1 Proposição 5.18. ζ(s) = X 1 + R(s), ps p∈P onde R(s) fica limitada quando s → 1. Dado um subconjunto S do conjunto dos números primos P, dizemos que S tem densidade de Dirichlet se o limite P −s p∈S p lim s→1 (log(s − 1))−1 existe. Neste caso este limite é denotado por d(S) e é chamado a densidade de Dirichlet de S. Esta densidade satisfaz as seguintes propriedades. Proposição 5.19. Seja S um subconjunto do conjunto P dos números primos. Então (1) Se S é finito, então d(S) = 0. (2) Se S contém todos os números primos, exceto um número finito deles, então d(S) = 1. (3) Se S = S1 ∪ S2 com S1 ∩ S2 = ∅, então d(S1 ∪ S2 ) = d(S1 ) + d(S2 ). Teorema 5.20 (teorema das progressões aritméticas de Dirichlet). Sejam a ∈ Z e m ≥ 1 inteiro tais que mdc(a, m) = 1. Seja P(a; m) o subconjunto do conjunto P dos números primos que contém os primos p tais que p ≡ a (mod m). Então d(P(a; m)) = 1/φ(m). A fortiori, P(a; m) é infinito. 5.6.1. Comentários (*). Riemann propôs a seguinte conjectura (que permanece em aberto até hoje). Conjectura 5.21 (hipótese de Riemann). Todos os zeros da função zeta de Riemann ζ(s) estão contidos na reta <(s) = 1/2. Sabe-se que na reta <(s) = 1/2 existe uma infinidade de zeros da função zeta e que estes são simétricos em relação à reta =(s) = 0. A veracidade da hipótese de Riemann implica em maiores informações sobre a distribuição dos números primos (para mais sobre isto ver [Ap, chapter13]). 32 5. NÚMEROS PRIMOS O inteiro positivo n nada mais é que a cardinalidade do anel Z/nZ da aritmética modular (a ser introducido no próximo capı́tulo). Esta analogia faz com que Dedekind considere a seguinte extensão da função zeta. Seja K uma extensão finita do corpo dos racionais Q (ver a parte referente à teoria de corpos). Existe um subconjunto OK de K que cumpre o mesmo papel de Z com relação a Q. Este conjunto é chamado o anel de inteiros de K. Ele tem (entre outras propriedades importantes) a caracterı́stica que o anel quociente OK /I (onde I é um ideal de OK , para mais sobre anel quocientes ver a parte de anéis) é um conjunto finito cuja cardinalidade é denotada por N (I). Assim, Dedekind define a função zeta de K por X ζK (s) := N (I)−s , onde <(s) > 1, I e I percorre todos os ideais de OK . Novamente conjectura-se que os zeros desta função estão na reta <(s) = 1/2, o que permanece em aberto. Note que ζQ nada mais é que a função zeta de Riemann. Nos anos 20 e 30 do século XX, E. Artin, H. Hasse e A. Weil consideraram um análogo “geométrico” desta situação. Nele o papel de Q era ocupado pelo corpo de funções racionais em uma variável Fq (τ ) sobre um corpo finito Fq de q elementos (ver parte de corpos). Neste contexto, L é uma extensão finita de Fq (τ ). O corpo L possui também um subanel com propriedades similares a OK (quando K é uma extensão finita de Q). Isto permite a construção de uma função zeta associada a L. Similarmente, pode-se formular como acima uma “hipótese de Riemann” para L. Esta é chamada uma “hipótese de Riemann para curvas” porque L nada mais é que o corpo de funções racionais de uma curva sobre um corpo finito (para mais sobre curvas sobre corpos finitos e a hipótese de Riemann neste contexto ver [Lo]). Após casos particulares da hipótese de Riemann para curvas terem sido tratados por Artin e Hasse, Weil utilizando variedades abelianas e representações `-ádicas obtém em 1948 a prova da “hipótese de Riemann para curvas” de forma geral. No ano seguinte (1949) Weil propõe uma vasta generalização deste resultado substituindo Fq (τ ) por um corpo de funções κ em n variáveis sobre Fq . Neste caso a extensão finita L de κ nada mais é que o corpo de funções de uma variedade algébrica sobre Fq (para variedades algébricas ver [Ha]). De maneira visionária Weil percebe que uma prova da hipótese de Riemann neste contexto mais geral seria conseqüência de uma teoria de cohomologia suficientemente “rica” para reproduzir as propriedades da cohomologia singular sobre os complexos. Segundo muitos, as conjecturas de Weil foram sem sobra de dúvida o problema matemático mais profundo após a segunda guerra mundial. Na busca da cohomologia perdida, os primeiros passos foram dados por J.-P. Serre introduzindo a cohomologia de feixes de vetores de Witt. Mas foi A. Grothendieck que compreendeu que a função zeta traz em si algo de novo que não havia sido percebido pelos gêometras algébricos, desde de os italianos do século XIX. Ela necessitava de uma base variável, ou seja, a variedade algébrica era considerada simultaneamente sobre todos os corpos finitos Fqn . Para isto introduziu o conceito que revoluciona completamente a geometria algébrica no século XX, a teoria de esquemas. Com a contribuição de inúmeros matemáticos além de Serre e Grothendieck, dentre eles M. Artin, J.-L. Verdier e L. Illusie, as teoria de esquemas e de cohomologia evoluiram, permitindo que se descobrisse que a “cohomologia apropriada”, a cohomologia étale (para mais sobre a cohomologia étale veja [Mi]), e que finalmente em 1973, um ex-aluno de 5.6. FUNÇÃO ZETA 33 Grothendieck, P. Deligne provasse finalmente as conjecturas de Weil (para os resultados de Deligne veja [We1] e [We2]). Entretanto, o mestre não ficou satisfeito. Na verdade Grothendieck havia formulado um programa muito mais amplo, “as conjecturas standard”, das quais as conjecturas de Weil eram um corolário. Infelizmente, este programa nunca foi atingido. CAPı́TULO 6 Aritmética modular 6.1. Aritmética modular Definimos uma função soma de classes ⊕ : Z/nZ × Z/nZ → Z/nZ por a ⊕ b := a + b. Lema 6.1. Esta função está bem definida, i.e., se a0 ≡ a (mod n) e b0 ≡ a (mod n), então a0 + b0 = a + b. Demonstração. Suponha a0 ≡ a (mod n) e b0 ≡ b (mod n), i.e., existem k, l ∈ Z tais que a0 − a = kn e b0 − b = ln. Somando estas igualdades, (a0 + b0 ) − (a + b) = (k + l)n, i.e., a0 + b0 ≡ a + b (mod n), i.e., a0 + b0 = a + b. Definimos também um função produto de classes : Z/nZ × Z/nZ → Z/nZ por a b := ab. Lema 6.2. Esta função também está bem definida, i.e., se a0 ≡ a (mod n) e b0 ≡ b (mod n), então a0 b0 = ab. Demonstração. Sejam k, l ∈ Z tais que a0 − a = kn e b0 − b = ln. Logo a b − ab = a0 b0 − a0 b + a0 b − ab = a0 (b0 − b) + b(a0 − a) = (a0 l + bk)n, i.e., a0 b0 ≡ ab (mod n), i.e., a0 b0 = ab. 0 0 Proposição 6.3. O conjunto Z/nZ munido das operações ⊕ e é um anel comutativo com unidade. Demonstração. Precisamos provar que as 8 propriedades de 2.3 são satisfeitas. Elas são herdadas das mesmas propriedades para inteiros como segue abaixo. (1) a ⊕ (b ⊕ c) = a ⊕ b + c = a + (b + c) = (a + b) + c = a + b ⊕ c = (a ⊕ b) ⊕ c. (2) a ⊕ b = a + b = b + a = b ⊕ a. (3) Note que 0 = n = {kn | k ∈ Z} = nZ é o conjunto dos inteiros que são múltiplos de n. Observe que a ⊕ 0 = a + 0 = a. (4) a ⊕ n − a = a + n − a = n = 0. (5) a (b c) = a bc = a(bc) = (ab)c = ab c = (a b) c. (6) a b = ab = ba = b a. (7) a 1 = a.1 = a. (8) a (b ⊕ c) = a b + c = a(b + c) = ab + ac = ab ⊕ ac = (a b) ⊕ (a c). A propriedade de cancelamento em um anel garante que este é um domı́nio de integridade. Nem sempre Z/nZ é um domı́nio de integridade. Para simplificar a notação escreveremos + no lugar de ⊕ e ab no lugar de a b. Proposição 6.4. Z/nZ é um domı́nio de integridade se e somente se n = p é um número primo. 35 36 6. ARITMÉTICA MODULAR Demonstração. Suponha que Z/nZ seja um domı́nio de integridade. Suponha que n = ab com 1 ≤ a, b ≤ n. Então n = 0 = ab = ab. Pela propriedade do cancelamento, a = 0 ou b = 0. No primeiro caso existe α ≥ 1 inteiro tal que a = nα, logo n = nαb, i.e., 1 = αb, i.e., b = 1 e a = n. No segundo caso existe β ≥ 1 inteiro tal que b = nβ, logo n = anβ, i.e., 1 = aβ, i.e., a = 1 e b = n. Portanto, n é primo. Suponha que n = p seja primo. Suponha ab = 0, i.e., ab = 0, i.e., p | ab. Pelo Lema 3.3, p | a ou p | b, i.e., a = 0 ou b = 0, i.e., vale a propriedade de cancelamento. Um elemento a ∈ Z/nZ é dito inversı́vel, se existe b ∈ Z/nZ tal que ab = 1. Denotamos por (Z/nZ)∗ o subconjunto de Z/nZ formado pelos elementos inversı́veis. Um domı́nio de integridade D é dito um corpo, se para todo a ∈ D\{0} existe b ∈ D tal que ab = 1. Assim, Z/nZ é um corpo se e somente se (Z/nZ)∗ = Z/nZ \ {0}. Proposição 6.5. Z/nZ é um corpo se e somente se n = p é um número primo. Demonstração. Suponha que Z/nZ seja um corpo. Seja n = ab com 1 ≤ a, b ≤ n inteiros. Suponha que a < n. Neste caso, a 6= 0. Por hipótese, existe c ∈ Z/nZ tal que ac = 1. Note que n = 0 = ab = ab. Multiplicando esta igualdade por c dos dois lados obtemos 0 = b, i.e., b = n. Neste caso a = 1. Se a = n, então necessariamente b = 1 e portanto n é primo. Reciprocamente, suponha que n = p seja primo. Seja a ∈ Z/nZ \ {0}, i.e., p - a. Logo mdc(a, p) = 1. Pelo algoritmo euclideano estendido, existem r, s ∈ Z tais que ra + sp = 1, i.e., ra ≡ 1 (mod p), i.e., ra = ra = 1, i.e., a ∈ (Z/nZ)∗ . A princı́pio Z/nZ é o conjunto de todas as classes a para a ∈ Z. Definido desta forma Z/nZ poderia ser infinito. Isto não ocorre. Proposição 6.6. Z/nZ = {0, · · · , n − 1} e #Z/nZ = n. Demonstração. Por definição o conjunto do lado direito está contido no conjunto do lado esquerdo. O que temos que provar é a inclusão oposta. Suponha que a ∈ Z/nZ. Note que podemos sempre supor que a ≥ 0, basta tomar um múltiplo kn de n suficientemente grande tal que a0 = a + kn ≥ 0, uma vez que a = a0 . Pelo algoritmo da divisão, existem q, r ∈ Z tais que a = qn + r com 0 ≤ r < n, i.e., a ≡ r (mod n), i.e., a = r ∈ {0, · · · , n − 1}. Mostraremos agora que quaisquer duas classes no conjunto da direita são distintas. Sejam 0 ≤ a < b < n inteiros. Logo 0 ≤ b − a < b < n, i.e., b 6≡ a (mod n), i.e., b 6= a. O conjunto (Z/nZ)∗ dos inversı́veis em Z/nZ pode ser caracterizado também da seguinte forma. Proposição 6.7. (Z/nZ)∗ = {a ∈ Z/nZ | mdc(a, n) = 1}. Demonstração. Seja a ∈ (Z/nZ)∗ , i.e., existe b ∈ Z/nZ tal que ab = ab = 1, i.e., existe k ∈ Z tal que ab − kn = 1. Seja d = mdc(a, n) ≥ 1. Logo d | 1, mas isto só é possı́vel se d = 1. Seja a ∈ Z/nZ tal que mdc(a, n) = 1. Pelo algoritmo euclideano estendido, existem r, s ∈ Z tais que ra + sn = 1, i.e., ra ≡ 1 (mod n), i.e., ra = r a = 1, i.e., a ∈ (Z/nZ)∗ . 6.2. CRITÉRIOS DE DIVISIBILIDADE 37 6.2. Critérios de divisibilidade Utilizaremos a aritmética modular para demonstrar critérios de divisibilidade. 6.2.1. Expansão de um inteiro em uma dada base. Sejam a ≥ 0 e b ≥ 1 inteiros. Seja n ≥ 1 inteiro tal que bn seja a maior potência positiva de b menor ou igual a a, i.e., bn ≤ a < bn+1 . Pelo algoritmo da divisão existem qn , rn ∈ Z tais que a = qn bn + rn , onde 0 ≤ rn < bn . Observemos que 0 ≤ qn < b. A primeira desigualdade é clara, porque qn bn é o maior múltiplo positivo de bn que é menor ou igual a a. Suponha que qn ≥ b. Logo a ≥ bn+1 + rn ≥ bn+1 , o que não é possı́vel. Em seguida, dividimos rn por q n−1 , i.e., existem qn−1 , rn−1 ∈ Z tais que rn = qn−1 bn−1 + rn−1 , onde 0 ≤ rn−1 < bn−1 . Novamente, 0 ≤ qn−1 < b. Não precisamos repetir o argumento da primeira desigualdade, pois é o mesmo. Para a segunda, se qn−1 ≥ b, terı́amos rn ≥ bn + rn−1 ≥ bn , o que não é possı́vel. Substituindo na primeira igualdade obtemos a = qn bn + qn−1 bn−1 + rn−1 . Novamente, pelo algoritmo da divisão existem qn−2 , rn−2 ∈ Z tais que rn−1 = qn−2 bn−2 + rn−2 , onde0 ≤ rn−2 < bn−2 . Se qn−2 ≥ b, então rn−1 ≥ bn−1 + rn−2 ≥ bn−1 , o que é impossı́vel. Portanto, 0 ≤ qn−2 < b. Prosseguindo sucessivamente obtemos (6.1) a = qn bn + qn−1 bn−1 + . . . + q1 b + q0 , onde 0 ≤ qi < b para todo 0 ≤ i ≤ n. A expressão (6.1) é chamada a expansão de a na base b. Denotamos esta expansão por ab := (qn · · · q0 )b . Seja a ≥ 0 inteiro e a = an .10n + . . . + a1 .10 + a0 sua expansão na base 10. Os elementos an , · · · , a0 são chamados os algarismos de a e a := (an · · · a0 )10 . Pn Exemplo 6.8. Um inteiro a ≥ 0 é divisı́vel por 3 se e somente se i=0 ai ≡ 0 (mod 3). De fato, 10 ≡ 1 (mod 3), pois − 1 = 9 = 3.3. Logo para todo n ≥ 0, P10 n 10n ≡ 1n =P 1 (mod 3). Portanto, a ≡ i=0 ai (mod 3). Logo a ≡ 0 (mod 3) se e n somente se i=0 ai ≡ 0 (mod 3). Pn Exemplo 6.9. Um inteiro a ≥ 0 é divisı́vel por 11 se e somente se i=0 (−1)ai ≡ 0 (mod 11). De fato, 10 ≡ −1 (mod 11), pois 10 (−1) = 11. Logo para todo P− n n ≥ 1, 10n ≡ (−1)n (mod 11) e portanto, aP≡ i=0 (−1)ai (mod 11). Consen quentemente, a ≡ 0 (mod 11) se e somente se i=0 (−1)ai ≡ 0 (mod 11). 38 6. ARITMÉTICA MODULAR Exemplo 6.10. O critério de divisibilidade por 7 é um pouco mais intrincado. A razão é a seguinte: 10 ≡ 3 (mod 7), pois 10 − 3 = 7. Logo 102 ≡ 32 ≡ 2 (mod 7), pois 9 − 2 = 7; 103 ≡ 3.2 = 6 (mod 7); 104 ≡ 6.3 ≡ 4 (mod 7), pois 18 − 4 = 14 = 2.7; 105 ≡ 4.3 ≡ 5 (mod 7), pois 12 − 5 = 7; 106 ≡ 5.3 ≡ 1 (mod 7), pois 15 − 1 = 14 = 2.7. Suponha para simplificar que n = 5, i.e., a tem apenas 6 algarismos. Aplicando o mesmo raciocı́nio acima obtemos que a ≡ 0 (mod 7) se e somente se 5a5 + 4a4 + 6a3 + 2a2 + 3a1 + a0 ≡ 0 (mod 7). 6.3. Contando elementos inversı́veis No capı́tulo de fatoração de inteiros introduzimos a função φ de Euler. Pela proposição 6.7 a definição dada anteriormente coincide com φ(n) := #(Z/nZ)∗ . Nesta seção vamos calcular no caso em que n é primo ou potência de primo. No capı́tulo seguinte, usando o teorema chinês dos restos, faremos o cálculo geral. Lema 6.11. Seja p um número primo. Então φ(p) = p − 1. Demonstração. Provamos anteriormente que quando n = p é primo (Z/pZ)∗ = Z/pZ \ {0}, logo φ(p) = #(Z/pZ) − 1 = p − 1. Lema 6.12. Seja p um número primo e r ≥ 1 inteiro. Então φ(pr ) = pr−1 (p − 1). Demonstração. Pela proposição 6.7, a ∈ (Z/pr Z)∗ se e somente se mdc(a, pr ) = 1, i.e., p - a. Ao invés de contarmos estes elementos contaremos aqueles que são divisı́veis por p e subtairemos do total pr este número. Expandimos a na base p, i.e., a = qr−1 pr−1 + . . . + q1 p + q0 , onde 0 ≤ qi < p é inteiro para todo 0 ≤ i ≤ r − 1. Assim, p | a se e somente se q0 = 0. Para cada qi com 1 ≤ i ≤ r − 1 temos exatamente p escolhas. Logo o total de escolhas para a tal que p | a é pr−1 . Portanto, φ(pr ) = pr − pr−1 = pr−1 (p − 1). CAPı́TULO 7 Sistemas de congruência 7.1. Equações diofantinas Uma equação diofantina é uma equação polinomial em um número finito de variáveis cujos coeficientes são números inteiros e/ou racionais e procuramos soluções inteiras e/ou racionais. Nesta seção daremos um exemplo de como utilizar a aritmética modular para provar que uma dada equação diofantina não tem soluções inteiras. Exemplo 7.1. Seja f (x, y) = x3 − 711y 3 = 5. Perguntamos se existem pares (a, b) ∈ Z × Z tais que f (a, b) = 0. Mostraremos que não pode existir um tal par (a, b). De fato, suponha que exista. Logo a3 ≡ 5 (mod 9). Calculemos os cubos 3 3 3 3 2 de todos os elementos de Z/9Z. 1 = 1; 2 = 8, 3 = 0, 4 = 4 4 = 74 = 1; 3 3 3 3 3 3 3 3 3 3 3 5 = −4 = −4 = 8; 6 = −3 = −3 = 0; 7 = −2 = −2 = 1; 8 = −1 = 8. 3 Portanto, não existe a ∈ Z tal que a ≡ 5 (mod 9), logo não pode existir (a, b) ∈ Z × Z tal que f (a, b) = 0. 7.2. Equações lineares Teorema 7.2. Sejam a, b ∈ Z, a 6= 0 e n ≥ 1 inteiro. A equação ax ≡ b (mod n) tem solução se e somente se d := mdc(a, n) | b. Demonstração. Suponha que x0 ∈ Z seja uma solução da equação. Como d divide a e n, denotamos a = a0 d e n = n0 d, onde n0 , a0 ∈ Z. Logo existe k ∈ Z tal que ax0 − b = kn, i.e., d(a0 x0 − kn0 ) = b, assim d | b. Reciprocamente, suponha que d | b, digamos b = db0 . Pelo algoritmo euclideano estendido, existem t, s ∈ Z tais que ta + sn = d. Multiplicando ambos os lados por b0 obtemos a(tb0 ) + snb0 = db0 = b, i.e., a(tb0 ) ≡ b (mod n), i.e., tb0 é uma solução da equação. Observação 7.3. Observe que se x0 ∈ Z é uma solução de ax ≡ b (mod n), então para todo y0 ≡ x0 (mod n), concluimos que y0 também é solução da equação (assim dizemos que a classe x0 de x0 é uma solução para ax = b). De fato, y0 = x0 +kn para algum k ∈ Z e ax0 = b+ln para algum l ∈ Z. Logo ay0 = b+ln+akn = b + (l + ak)n, i.e., ay0 ≡ b (mod n). Teorema 7.4. Suponha que a equação ax ≡ b (mod n) admita uma solução x0 ∈ Z. O número de soluções (módulo n) de ax ≡ b (mod n) é d e elas são dadas pelas classes cujos representantes são x0 , x0 + n0 , · · · , x0 + (d − 1)n0 . Demonstração. Provemos inicialmente que cada um desses elementos é solução. Escrevemos y0 = x0 + kn0 para algum 0 ≤ k ≤ d − 1 inteiro. Logo ay0 = ax0 + akn0 = b + ln + akn0 = b + ln + a0 dkn0 = b + ln + a0 kn = b + n(l + a0 k), i.e., ay0 ≡ b (mod n). Em seguida observemos que se 0 ≤ k < r ≤ d − 1 são números 39 40 7. SISTEMAS DE CONGRUÊNCIA inteiros, então x0 + kn0 6≡ x0 + rn0 (mod n). De fato, 0 < (x0 + rn0 ) − (x0 + kn0 ) = n0 (r − k) < n0 d = n, logo n - ((x0 + rn0 ) − (x0 + kn0 ) = n0 (r − k)). 7.3. Sistemas de equações lineares Teorema 7.5. Sejam m, n ≥ 1 inteiros tais que mdc(m, n) = 1 e a, b ∈ Z. Existe x ∈ Z tal que o sistema ( x ≡ a (mod m) x≡b (mod n) tenha solução. Demonstração. Pelo algoritmo euclideano estendido existem t, s ∈ Z tais que tm + sn = 1. Logo tm ≡ 1 (mod n) e sn ≡ 1 (mod m). Seja x0 := asn + btm. Observe que x0 ≡ asn (mod m) ≡ a (mod m) e x0 ≡ btm (mod n) ≡ b (mod n). Teorema 7.6. Sejam m1 , · · · , mr ≥ 1 inteiros tais que para todo 1 ≤ i 6= j ≤ r, mdc(mi , mj ) = 1. Sejam a1 , · · · , ar ∈ Z. Existe x ∈ Z tal que o sistema x ≡ a1 (mod m1 ) ··· (7.1) x ≡ a (mod m ) r r tenha solução. Demonstração. Seja m := m1 · · · mr e para todo 1 ≤ i ≤ r, seja ni := m = m1 · · · mi−1 mi+1 · · · mr . mi Como para cada j 6= i, mdc(mj , mi ) = 1, temos que mdc(ni , mi ) = 1. Pelo algoritmo euclideano estendido existem ti , si ∈ Z tais que ti ni + si mi = 1, i.e., ti n i ≡ 1 (mod mi ) e para todo j 6= i, como ni ≡ 0 (mod mj ), então ti ni ≡ 0 (mod mj ). Tome x0 := a1 t1 n1 + . . . + ar tr nr . De fato, para todo 1 ≤ i ≤ r, temos x0 ≡ ai ti ni (mod mi ) ≡ ai (mod mi ), uma vez que aj tj nj ≡ 0 (mod mi ) para i 6= j. 7.5. APLICAÇÃO 41 7.4. Teorema Chinês dos Restos Notação. Dado n ≥ 1 inteiro e a ∈ Z denotaremos nesta seção a classe de a módulo n por a + nZ. Isto é motivado pelo fato que um elemento é equivalente a a módulo n se e somente se ele difere de a por um múltiplo de n. Teorema 7.7. Sejam m1 , · · · , mr ≥ 1 inteiros tais que para todo 1 ≤ i 6= j ≤ r, mdc(mi , mj ) = 1. Seja m := m1 · · · mr . Existe uma bijeção ϕ: Z Z Z → × ... × mZ m1 Z mr Z definida por ϕ(a + mZ) = (a + m1 Z, · · · , a + mr Z). Seja ψ a restrição de ϕ a (Z/mZ)∗ , então ∗ ∗ ∗ Z Z Z ψ: → × ... × mZ m1 Z mr Z também é uma bijeção. Demonstração. Provemos inicialmente que ϕ está bem definida. De fato, se b ≡ a (mod m), então para todo 1 ≤ i ≤ r, mi | m | (b − a), logo b ≡ a (mod mi ), i.e., b + mi Z = a + mi Z. Provemos agora que ϕ é injetiva. Suponha que ϕ(a + mZ) = ϕ(b + mZ), i.e., para todo 1 ≤ i ≤ r, a ≡ b (mod mi ). Como para i 6= j, mdc(mi , mj ) = 1, concluimos que m | (a − b), i.e., a + mZ = b + mZ. Provar que ϕ é sobrejetiva equivale a dizer que para todo (a1 + m1 Z, · · · , ar + mr Z) ∈ Z/m1 Z × . . . × Z/mr Z é da forma ϕ(x + mZ) para algum x ∈ Z, i.e., que o sistema (7.1) tema solução, o que já foi provado. Provemos agora que um elemento inversı́vel módulo m tem imagem cujas componentes são inversı́veis com respeito aos respectivos módulos. Suponha que a + mZ ∈ (Z/mZ)∗ , i.e., mdc(a, m) = 1. Como m = m1 · · · mr , concluimos que para cada 1 ≤ i ≤ r, mdc(a, mi ) = 1, i.e., a + mi Z ∈ (Z/mi Z)∗ . Como ψ é obtida restringindo ϕ a um subconjunto do domı́nio, concluimos que ψ também é injetiva. Quanto a sobrejetividade, seja (a1 + m1 Z, · · · , ar + mr Z) ∈ (Z/m1 Z)∗ × . . . × (Z/mr Z)∗ . Pela parte anterior sabemos que existe x ∈ Z tal que ϕ(x+mZ) = (a1 + m1 Z, · · · , ar +mr Z). Observemos que na verdade x+mZ ∈ (Z/mZ)∗ . De fato, para cada 1 ≤ i ≤ r, x + mi Z = ai + mi Z, i.e., x ≡ ai (mod mi ), mas mdc(ai , mi ) = 1, logo mdc(x, mi ) = 1 para todo 1 ≤ i ≤ r. Como m = m1 · · · mr e mdc(mi , mj ) = 1 para i 6= j obtemos que mdc(x, m) = 1, i.e., x + mZ ∈ (Z/mZ)∗ . Corolário 7.8. Para todo n ≥ 1 inteiro seja φ(n) = #(Z/nZ)∗ . Então φ(m) = φ(m1 ) · · · φ(mr ). 7.5. Aplicação Seja n = pe11 · · · perr a fatoração do inteiro n ≥ 1. Pelo corolário 7.8 e pelo lema 6.12, (7.2) φ(n) = φ(pe11 ) · · · φ(perr ) = p1e1 −1 (p1 − 1) · · · prer −1 (pr − 1) Y 1 1 1 = pe11 1 − · · · perr 1 − =n 1− . p1 pr p p|n 42 7. SISTEMAS DE CONGRUÊNCIA Vamos utilizar a fórmula (7.2) para uma aplicação. Proposição 7.9. Suponha que φ(n) = p seja um número primo. Então n = 3, 4 ou 6. Qr Demonstração. Se r > 2, então ei = 1 para todo 1 ≤ i ≤ r. Logo φ(n) = i=1 (pi − 1). Como r > 2 existem pelo menos dois primos ı́mpares na fatoração, logo 4 | φ(n), o que não é possı́vel. Logo r ≤ 2. Suponhamos inicialmente r = 2, i.e., φ(n) = pe11 −1 (p1 − 1)pe22 −1 (p2 − 1). Se p1 , p2 > 2 então (novamente) 4 | φ(n). Logo p1 = 2 e φ(n) = 2e1 −1 p2e2 −1 (p2 − 1). Se e1 > 1, como p2 > 2, então 4 | φ(n). Assim, e1 = 1 e φ(n) = p2e2 −1 (p2 − 1). Se e2 > 1, então φ(n) tem 2 e p2 como fatores primos. Assim, e2 = 1 e φ(n) = pe22 −1 . Novamente, como este número é primo, e2 = 1 e φ(n) = p2 − 1. Mas este número é par e primo, logo p2 = 3 e n = 6. Suponhamos que r = 1, i.e., φ(n) = pe11 −1 (p1 − 1). Se p1 = 2, então φ(n) = 2e1 −1 . A única forma deste número ser primo é e1 = 2, logo n = 4. Suponha p1 > 2. Se e1 > 1, então φ(n) tem 2 fatores primos p1 e 2 (pois p1 − 1 é par), impossı́vel. Assim, e1 = 1 e φ(n) = p1 − 1. Isto já foi feito anteriormente, i.e., p1 = 3 e n = 3. CAPı́TULO 8 Aplicações da teoria de grupos à teoria elementar dos números Neste capı́tulo desenvolveremos aplicações da teoria de grupos à aritmética elementar. Utilizaremos os resultados do capı́tulo 9. 8.1. Primalidade de números de Mersenne Para todo inteiro n ≥ 1, seja Mn := 2n − 1 o n-ésimo número de Mersenne. Nosso objetivo é utilizar a teoria de grupos para determinar se Mn é primo ou obter seu menor fator primo. Já provamos anteriormente que se n é composto, então Mn também o é. Assim, consideraremos apenas Mp para p primo. Seja q um fator primo de Mp , i.e., 2p ≡ 1 (mod q). Portanto em (Z/qZ)∗ temos p 2 = 1, i.e., o(2) | p. Como p é primo temos que o(2) = 1 ou p. O primeiro caso não pode ocorrer, pois 2 6= 1. Logo o(2) = p. Pelo teorema de Lagrange, o(2) = p | #(Z/qZ)∗ = φ(q) = q − 1, i.e., existe k ≥ 1 inteiro tal que q = 1 + kp. Proposição 8.1. Todo fator primo de Mp é da forma 1+kp para algum inteiro k ≥ 1. Provamos√anteriormente que o menor fator primo de um número inteiro n ≥ 1 é no máximo n. Logo √ 2p/2 − 1 . q ≤ 2p − 1 < 2p/2 , i.e. , k < p Dessa forma para determinar um fator primo de Mp testamos para cada inteiro k tal que 2p/2 − 1 1≤k< p se 1 + kp é primo e se divide Mp . Se para cada k pelo menos um desses fatos não ocorrer então Mp é um número primo. 8.2. Primalidade de números de Fermat n Para todo inteiro n ≥ 1, seja Fn := 22 + 1 o n-ésimo número de Fermat. Seja n n+1 q um fator primo de Fn . Então 22 ≡ −1 (mod q), logo 22 ≡ 1 (mod q), i.e., 2 2n+1 = 1 em (Z/qZ)∗ . Neste caso o(2) | (2n+1 ), i.e. , o(2) = 2d para 1 ≤ d ≤ n + 1. Afirmamos que d = n + 1. De fato, se d < n + 1, então 2n 2 2d = (2 )2 43 n−d = 1, 44 8. APLICAÇÕES DA TEORIA DE GRUPOS o que é um absurdo, portanto o(2) = 2n+1 . Pelo teorema de Lagrange, o(2) = 2n+1 | #(Z/qZ)∗ = φ(q) = q − 1, i.e., existe k ≥ 1 tal que q = 1 + k2n+1 . Proposição 8.2. Todo fator primo de Fn é da forma 1 + k2n+1 para algum inteiro k ≥ 1. Como no caso dos números de Mersenne, temos que √ n p n 22 + 1 − 1 2 q ≤ 2 + 1, i.e. , k ≤ . 2n+1 Dessa forma para determinar um fator primo de Fn testamos para cada inteiro k tal que √ n 22 + 1 − 1 1≤k< 2n+1 n+1 se 1 + k2 é primo e se divide Fn . Se para cada k pelo menos um desses fatos não ocorrer então Fn é um número primo. 8.3. Números de Carmichael O pequeno teorema de Fermat afirma que se p é um número primo e a ∈ Z tal que p - a, então ap−1 ≡ 1 (mod p). Assim, isto funciona para todo 1 ≤ a < p inteiro. Isto motiva a seguinte definição. Definição 8.3. Seja n ≥ 3 inteiro ı́mpar e 1 ≤ b < n inteiro. Dizemos que n é pseudoprimo na base b se bn−1 ≡ 1 (mod n). Observação 8.4. Segue do pequeno teorema de Fermat que um número primo p é pseudoprimo em toda base 1 ≤ b < p. Observe que a princı́pio para um número composto n não podemos esperar que ele seja pseudoprimo em toda base. De fato, seja d = mdc(b, n). Suponha que d > 1 e que n seja pseudoprimo na base b, i.e., existe k ∈ Z tal que bn−1 − 1 = kn. Logo d | 1, o que não é possı́vel. Assim verificaremos a congruência apenas para as bases b tais que mdc(b, n) = 1, i.e., b ∈ (Z/nZ)∗ . Definição 8.5. Seja n ≥ 3 ı́mpar composto. Suponha que para todo inteiro 1 ≤ b < n tal que mdc(b, n) = 1 tenhamos bn−1 ≡ 1 (mod n). Dizemos que n é um número de Carmichael. Exemplo 8.6. 561 é o menor número de Carmichael. É claro que provar isto diretamente é trabalhoso, precisamos para cada inteiro 1 ≤ b < 561 tal que mdc(b, 561) = 1 verificar que b560 ≡ 1 (mod 561). Ao invés disto observemos que 561 = 3.11.17. Dizer que b560 ≡ 1 (mod 561) 8.4. TEOREMA DA RAIZ PRIMITIVA 45 equivale a dizer que 561 | (b560 − 1), i.e., que 3 | (b560 − 1), 11 | (b560 − 1) e 17 | (b560 − 1). Como mdc(b, 561) = 1, concluimos que mdc(b, 3) = mdc(b, 11) = mdc(b, 17) = 1. Aplicando o pequeno teorema de Fermat concluimos que b2 ≡ 1 b10 ≡ 1 b 16 ≡1 (mod 3), logo b560 = (b2 )280 ≡ 1 (mod 3); (mod 11), logo b560 = (b10 )56 ≡ 1 (mod 11); (mod 17), logo b560 = (b16 )35 ≡ 1 (mod 17). Generalizaremos agora o procedimento do exemplo, de forma a provar, a partir da fatoração de n, que n é um número de Carmichael. Teorema 8.7 (teorema de Korselt). Seja n ≥ 3 ı́mpar composto. n é um número de Carmichael se e somente se (1) n é livre de quadrados. (2) Para todo fator primo p de n, (p − 1) | (n − 1). Demonstração. Suponha que as 2 condições acima sejam satisfeitas. Seja 1 ≤ b < n inteiro tal que mdc(b, n) = 1. Afirmamos que para todo fator primo p de n, temos bn−1 ≡ 1 (mod p). De fato, como mdc(b, n) = 1, então mdc(b, p) = 1. Pelo pequeno teorema de Fermat, bp−1 ≡ 1 (mod p). Por hipótese, existe k ∈ Z tal que n − 1 = k(p − 1), logo bn−1 = (bp−1 )k ≡ 1 (mod p). Além disto temos que n fatora-se n = p1 · · · pr . Como os pi ’s são distintos e para todo 1 ≤ i ≤ r, pi | (bn−1 − 1), concluimos que n | (bn−1 − 1), i.e., bn−1 ≡ 1 (mod n). Reciprocamente, seja p um fator primo de n e suponhamos que p2 | n. Observe que n−1 X n − 1 n−1 (p − 1) = (−1)n−1−i pi ≡ (n − 1)(−1)n−2 p + 1 6≡ 1 (mod p2 ), i i=0 logo (p − 1)n−1 6≡ 1 (mod n), portanto n não pode ser um número de Carmichael. Observe que efetivamente, mdc(p − 1, n) = 1, pois se este mdc fosse igual a d, concluiriamos que d | 1, assim d = 1. Para provar a validade da segunda condição precisamos do teorema da raiz primitiva que provaremos na seção seguinte. Ele afirma que se p é um número primo, então o grupo (Z/pZ)∗ é um grupo cı́clico. De fato, seja a um gerador de (Z/pZ)∗ . Então mdc(a, n) = 1 e uma vez que n é um número de Carmichael, temos an−1 ≡ 1 (mod n). A fortiori, an−1 ≡ 1 (mod p). Ou seja, an−1 = 1 em (Z/pZ)∗ . Logo, pelo lema chave, p − 1 = o(a) | (n − 1). 8.4. Teorema da raiz primitiva Seja n ≥ 3 inteiro ı́mpar. Provamos anteriormente que φ(n) < n, i.e., φ(n) ≤ n − 1. Note que φ(n) conta exatamente a quantidade de classes a ∈ (Z/nZ)∗ tais que mdc(a, n) = 1. Assim, φ(n) = n − 1 se e somente se n é primo. Se existir uma classe a ∈ (Z/nZ)∗ tal que o(a) = n − 1, então (pelo teorema de Lagrange) (n − 1) | φ(n), logo vale n − 1 = φ(n). Portanto, se (Z/nZ)∗ for cı́clico, então n é primo. O objetivo deste capı́tulo é mostrar a recı́proca deste resultado. Teorema 8.8 (teorema da raiz primitiva). Se p é primo, então (Z/pZ)∗ é cı́clico. 46 8. APLICAÇÕES DA TEORIA DE GRUPOS Note que (Z/4Z)∗ é cı́clico de ordem 2. Utilizando o teorema chinês dos restos temos (como conseqüência do teorema da raiz primitiva) que (Z/2pZ)∗ também é cı́clico para p primo. Demonstração. Seja a1 ∈ (Z/pZ)∗ e d1 := o(a1 ). Se d1 = p − 1, acabou. Senão, seja H1 o subgrupo cı́clico de (Z/pZ)∗ gerado por a1 . Temos que H1 $ (Z/pZ)∗ . Note que H1 coincide exatamente com as soluções de xd1 − 1 em (Z/pZ)∗ . Seja b1 ∈ (Z/pZ)∗ \ H1 . Pelo mesmo argumento da prova da proposição 9.36 temos que existe a2 ∈ (Z/pZ)∗ tal que o(a2 ) = mmc(o(a1 ), o(b1 )) > o(a1 ). Se o(a2 ) = p−1 acabou. Senão repetimos o argumento acima obtendo um elemento a3 cuja ordem é estritamente maior que o(a2 ). Como todas essas ordens são no máximo p − 1 não podemos ter uma seqüência estritamente crescente infinita de números menores que p − 1. Portanto existe i tal que o(bi ) = p − 1. Parte 2 Grupos CAPı́TULO 9 Teoria de Grupos I 9.1. Definição e exemplos Definição 9.1. Um grupo é um conjunto G munido de uma operação ∗ : G × G → G dada por (x, y) 7→ x ∗ y satisfazendo às seguintes propriedades: (1) (associatividade) para todo x, y, z ∈ G, x ∗ (y ∗ z) = (x ∗ y) ∗ z. (2) (Elemento neutro) existe e ∈ G tal que e ∗ x = x ∗ e = x para todo x ∈ G. (3) (Inverso) para todo x ∈ G existe y ∈ G tal que x ∗ y = y ∗ x = e. O grupo G é dito abeliano ou comutativo se além disto x ∗ y = y ∗ x para todo x, y ∈ G. Em seguida daremos exemplos de grupos. Para fixar a notação suponha que a operação seja de “multiplicação” e que o inverso de um elemento x ∈ G seja denotado por x−1 . Observação 9.2. Seja G um grupo e x, y ∈ G. Afirmamos que (xy)−1 = y −1 x−1 . De fato, xy(y −1 x−1 ) = x(yy −1 )x−1 = xx−1 = 1 y −1 x−1 (xy) = y −1 (x−1 x)y = y −1 y = 1. Definição 9.3. Um grupo G é dito finito se possui um número finito de elementos, caso contrário é dito infinito. Se G for um grupo finito, o número de elementos de G é chamado a ordem de G e denotado por #G. Exemplo 9.4 (grupos abelianos infinitos). Z, Q, R, C e ∗ = +. Exemplo 9.5 (grupos abelianos infinitos). Q \ {0}, R \ {0}, C \ {0} e ∗ = . . Exemplo 9.6. Seja M2 (R) := a b c d | a, b, c, d ∈ R o conjunto das matrizes 2 × 2 com entradas reais. Este conjunto é um grupo com a operação sendo a soma de matrizes. Seja a b GL2 (R) := ∈ M2 (R) | ad − bc 6= 0 . c d Todas estas matrizes são inversı́veis com respeito à multiplicação de matrizes. Assim GL2 (R) munido do produto de matrizes é um grupo chamado grupo linearem 49 50 9. TEORIA DE GRUPOS I dimensão 2 sobre os reais. Ambos os grupos são infinitos. O primeiro é abeliano. Notemos que GL2 (R) não é comutativo. De fato, 0 1 1 0 1 1 = e 1 0 1 1 1 0 1 0 0 1 0 1 = . 1 1 1 0 1 1 Exemplo 9.7. Seja G = Z/nZ e ∗ = ⊕. Este é um grupo abeliano de ordem n. Seja G = (Z/nZ)∗ e ∗ = . Este é um grupo de ordem φ(n). Exemplo 9.8. Denotamos por S∆ o grupo das simetrias do triângulo equilátero. A operação será ◦, a composição de funções. Fixemos os vértices do triângulo no cı́rculo unitário S1 := {z ∈ C | |z| = 1} por V1 = e2πi , V2 = e2πi/3 e V3 = e4πi/3 . Cada simetria será uma função bijetiva f : {V1 , V2 , V3 } → {V1 , V2 , V3 } dada por f (Vi ) = Vσ(i) , onde denotamos f na forma matricial por 1 2 3 . σ(1) σ(2) σ(3) Denotamos α := R2π/3 a rotação de 2π/3 que é dada por 1 2 3 α= . 2 3 1 A rotação de 4π/3, R4π/3 = R2π/3 ◦ R2π/3 que será denotada por α2 é dada por 1 2 3 2 . α = 3 1 2 Finalmente a rotação de 2π = 6π/3 nada mais é que id e é denotada por α3 , assim α3 = id. Além disto temos as simetrias em relação às retas que passam pelos vértices e pelo centro do lado oposto, denotamos estas retas por li para i = 1, 2, 3. Seja β := Sl3 a simetria em relação à reta l3 , 1 2 3 β= . 2 1 3 Note que β 2 = id. Seja Sl1 a simetria em relação à reta l1 , 1 2 3 Sl1 = . 1 3 2 Novamente Sl23 = id. Finalmente, Sl2 = 1 3 2 1 3 2 e Sl22 = id. Assim, S∆ = {id, α, α2 , β, Sl1 , Sl2 }. Para provar que S∆ é um grupo precisamos verificar as 3 propriedades da definição. A associatividade segue do fato de composição de funções ser associativa. O elemento neutro segue do fato que a composição da identidade com qualquer função ser a qualquer função. Basta portanto verificar os inversos. De α3 = αα2 = id 9.1. DEFINIÇÃO E EXEMPLOS 51 concluimos que α−1 = α2 e que (α2 )−1 = α. De β 2 = ββ = id, concluimos que β −1 = β. Antes de verificarmos os dois restantes calculemos 1 2 3 1 2 3 1 2 3 αβ = = = Sl 1 e 2 3 1 2 1 3 1 3 2 1 2 3 1 2 3 1 2 3 2 α β= = = Sl 2 . 3 1 2 2 1 3 3 2 1 Geometricamente já verificamos que (αβ)2 = (α2 β)2 = id, logo (αβ)−1 = αβ e (α2 β)−1 = α2 β. Dessa forma S∆ é um grupo de ordem 6. Vamos ver isto de forma puramente algébrica e aproveitar para mostrar que S∆ não é abeliano. Calculemos, 1 2 3 1 2 3 1 2 3 (9.1) βα = = = α2 β. 2 1 3 2 3 1 3 2 1 Pela observação 9.2 e por (9.1) temos que (αβ)−1 = β −1 α−1 = βα2 = α2 βα = α4 β = αβ e (α2 β)−1 = β −1 (α2 )−1 = βα = α2 β. Exemplo 9.9. O grupo S das simetrias do quadrado. Denotamos os vértices por V1 = e2πi , V2 = eπi/2 , V3 = eπi e V4 = e3πi/2 . Seja α := Rπ/2 a rotação por π/2 que é dada por 1 2 3 4 α= , 2 3 4 1 a rotação de π é dada por Rπ := α2 = 1 3 2 4 4 , 2 3 1 a rotação de 3π/2 é dada por R3π/2 := α3 = 1 4 2 1 3 2 4 3 e a rotação de 2π é dada por R2π := α4 = id. Temos também a simetria em relação às retas l1 , respectivamente l3 , passando por divindo ao meio os lados V1 V4 e V2 V3 , respectivamente V1 V2 e V3 V4 . Assim, 1 2 3 4 β := Sl3 = 2 1 4 3 e 1 2 3 4 Sl1 = . 4 3 2 1 52 9. TEORIA DE GRUPOS I Notemos que geometricamente β 2 = Sl21 = id. Finalmente temos as simetrias em relação às diagonais d1 , respectivamente d2 , dada por V1 V3 , respectivamente V2 V4 . Assim, 1 2 3 4 Sd1 = 1 4 3 2 e 1 2 3 4 Sd2 = . 3 2 1 4 Novamente, geometricamente Sd21 = Sd22 = id. O conjunto S fica portanto dado por S = {id, α, α2 , α3 , β, Sl1 , Sd1 , Sd2 }. Como no exemplo anterior, para provar que é um grupo basta calcular os inversos. Inicialmente, α4 = αα3 = α2 α2 = id, logo α−1 = α3 , (α3 )−1 = α e (α2 )−1 = α2 . Os demais já foram calculados geometricamente. Mostraremos que este grupo não é abeliano e refaremos os cálculos algebricamente. Calculemos, 1 2 3 4 1 2 3 4 1 2 3 4 αβ = = = Sd1 , 2 3 4 1 2 1 4 3 1 4 3 2 1 2 3 4 1 2 3 4 1 2 3 4 α2 β = = = Sl1 e 3 4 1 2 2 1 4 3 4 3 2 1 1 2 3 4 1 2 3 4 1 2 3 4 3 α β= = = Sd2 . 4 1 2 3 2 1 4 3 3 2 1 4 A primeira observação é que 1 2 3 4 1 βα = 2 1 4 3 2 2 3 3 4 4 1 = 1 3 2 2 3 1 4 = α3 β. 4 Logo, (αβ)−1 = β −1 α−1 = βα3 = α3 βα2 = α6 βα = α2 α3 β = αβ, (α2 β)−1 = β −1 (α2 )−1 = βα2 = α3 βα = α6 β = α2 β 3 −1 (α β) =β −1 3 −1 (α ) e 3 = βα = α β. 9.2. Subgrupos Definição 9.10. Seja G um grupo, um subconjunto H de G é dito um subgrupo de G, se 1 ∈ H, dados x, y ∈ H, xy ∈ H e dado x ∈ H, x−1 ∈ H. Exemplo 9.11. Seja G = Z e n ≥ 1. Note que nZ é um subgrupo de Z. De fato, 0 = n.0 ∈ nZ, x = nk, y = nl, k, l ∈ Z, então x + y = n(k + l) ∈ nZ e −x = n(−k) ∈ nZ. Afirmamos mais, que todo subgrupo de Z é da forma nZ para algum n ≥ 1. De fato, seja H ⊂ Z um subgrupo. Por definição H ∩ N 6= ∅. Seja n o menor elemento de H ∩ N. É claro que nZ ⊂ H, pela definição de H. Reciprocamente, se x ∈ H ∩ N. Pelo algoritmo da divisão existem q, r ∈ Z tais que x = nq + r com 0 ≤ r < n. Note que r = x − nq ∈ H. Assim r = 0 e x ∈ nZ. Se x ∈ H e x < 0, seja y = −x ∈ H ∩ N. Pelo que foi feito anteriormente, y = kn, em particular x = −y = (−k)n ∈ nZ. 9.2. SUBGRUPOS 53 Exemplo 9.12. Seja n ≥ 1 inteiro e µn := {z ∈ C | z n = 1}. Afirmamos que este é um subgrupo de C \ {0}. De fato, 1n = 1, logo 1 ∈ µn , se x, y ∈ µn , então (xy)n = xn y n = 1, logo xy ∈ µn e se x ∈ µn , então x−1 C \ {0}, logo (x−1 )n = (xn )−1 = 1 e x−1 ∈ µn . Este é um grupo abeliano chamado o grupo das raı́zes n-ésimas da unidade. Seja ζ := e2πi/n , ζ ∈ µn e o menor inteiro positivo m ≥ 1 tal que ζ m = 1 é n. Afirmamos que µn = {1, ζ, · · · , ζ n−1 }. De fato, a inclusão ⊃ é clara. Se z ∈ µn , então |z| = 1 e z = eiθ , onde θ = k2π para k ∈ Z. Se k ≥ 1, então, pelo algoritmo da divisão, existem q, r ∈ Z tais que k = qn + r com 0 ≤ r < n. Logo z = ζ k = (ζ n )q ζ r = ζ r e z ∈ {1, ζ, · · · , ζ n−1 }. Se k < 0, digamos k = −l, então ζ l ∈ {1, ζ, · · · , ζ n−1 }, e z = ζ k = ζ −l = ζ n−l ∈ {1, ζ, · · · , ζ n−1 }. Finalmente, temos uma bijeção µn → Z/nZ dada por ζ k 7→ k. De fato, a sobrejetividade segue da definição de Z/nZ. E a injetividade uma vez que se k = l, então n | (k − l), o que só é possı́vel se k = l. Exemplo 9.13. Seja G := GL2 (R) e a 0 D2 (R) := | ad 6= 0 0 d o conjunto das matrizes diagonais. Este é um subgrupo de GL2 (R), pois 1 0 ∈ D2 (R), 0 1 se A, B ∈ D2 (R), digamos A= a 0 0 d eB= a0 0 0 , d0 então aa0 0 0 dd0 a−1 0 0 AB = −1 A = d−1 ∈ D2 (R), ∈ D2 (R). Exemplo 9.14. Seja G := S , então {1, α, α2 , α3 } é um subgrupo de S , como também {1, β}. 54 9. TEORIA DE GRUPOS I 9.3. Classes Laterais e Teorema de Lagrange Definição 9.15. Seja G um grupo e H um subgrupo de G. Dados x, y ∈ G definimos x ∼D y se e somente se x = yα, para algum α ∈ H. Definimos também x ∼E y se e somente se x = αy para algum α ∈ H. Observação 9.16. As relações binárias ∼E e ∼D são relações de equivalência. De fato, x = x.1, logo x ∼D x. Se x ∼D y, então x = yα, para algum α ∈ H, logo y = xα−1 e como H é um subgrupo de G, α−1 ∈ H, portanto y ∼D x. Se x ∼D y e y ∼D z, então x = yα e y = zβ, para α, β ∈ H. Logo x = zβα e βα ∈ H, pois H é um subgrupo de G, donde x ∼D z. Fica como exercı́cio fazer a mesma demonstração para ∼E . Definição 9.17. Dado x ∈ G denotamos por xH := {xα | α ∈ H} sua classe de equivalência com relação a ∼D , esta é chamada de classe lateral a direita de x em H. Seja CLD := {xH | x ∈ G} o conjunto das classes laterais a direita de H em G. Similarmente, definimos a classe lateral a esquerda de x em H por Hx := {αx | α ∈ H} e CLE := {Hx | x ∈ G} o conjunto das classes laterais a esquerda de H em G. Lema 9.18. Existe uma bijeção ϕ : CLD → CLE dada por ϕ(xH) = Hx−1 . Demonstração. Dado y ∈ G, existe x ∈ G tal que y = x−1 , logo Hy = Hx = ϕ(xH) e ϕ é sobrejetiva. Se ϕ(xH) = ϕ(yH), então Hx−1 = Hy −1 , i.e., existe α ∈ H tal que x−1 = αy −1 , i.e., x = yα, i.e., x ∼D y, i.e., xH = yH, portanto ϕ é injetiva. −1 A partir de agora nesta seção suponhamos que G seja um grupo finito. Observe que (9.2) G= · [ x∈G xH = · [ Hx. x∈G Concluimos que o número de classes laterais (a direita ou a esquerda) de H em G também é finito. Denotamos este número por (G : H) e chamamos o ı́ndice de H em G. Lema 9.19. Para todo x ∈ G, existe uma bijeção ψ : H → xH dada por α 7→ xα. Demonstração. Pela definição de xH concluimos que ψ é sobrejetiva. Se ψ(α) = ψ(β), i.e., xα = xβ, multiplicando os dois lados por x−1 a esquerda, obtemos que α = β, portanto, ψ é injetiva. 9.4. ORDEM DE ELEMENTO E EXPOENTE DE GRUPO ABELIANO 55 Teorema 9.20 (teorema de Lagrange). Seja G um grupo finito e H um subgrupo de G. Então #G = (G : H)|H|. Demonstração. Segue imediatamente de (9.2) e do lema 9.19. Corolário 9.21. Seja H um grupo finito e H um subgrupo de G. Então |H| divide |G|. 9.4. Ordem de elemento e expoente de grupo abeliano Definição 9.22. Seja G um grupo e x ∈ G. Definimos o(x) := min{n ≥ 1 | xn = 1, n ∈ Z} ou o(x) = ∞ caso não exista n ≥ 1 inteiro satisfazendo xn = 1. O número o(x) é chamado a ordem de x. Exemplo 9.23. Seja G = Z e x = 1. Como para todo n ≥ 1, nx 6= 0, concluimos que o(1) = ∞. Lema 9.24 (lema chave). Seja x ∈ G de ordem n. Suponha que exista t ≥ 1 tal que xt = 1. Então n | t. Demonstração. Pelo algoritmo de euclides existem q, r ∈ Z tais que t = qn + r com 0 ≤ r < n. Logo 1 = xt = xqn xr = xr , assim pela definição da ordem de x concluimos que r = 0. Exemplo 9.25. Seja G := µn para n ≥ 1 inteiro e x := ζ = e2πi/n . Então o(ζ) = n. Afirmamos mais ainda que o(ζ i ) = n se e somente se mdc(i, n) = 1 para 0 ≤ i < n. De fato, se mdc(i, n) = d > 1, então i = di0 e n = dn0 com n0 < n. Por outro lado 0 0 0 0 0 0 (ζ i )n = ζ in = ζ i dn = ζ i n = (ζ n )i = 1, mas isto contradiz o(ζ i ) = n. Reciprocamente, suponha que 1 ≤ o(ζ i ) = m < n. Então ζ im = 1, i.e., pelo lema chave im = kn para algum k ≥ 1 inteiro. Como m < n, então existe algum fator primo p de n tal que p | i, logo mdc(i, n) > 1. Além disto temos uma bijeção entre Pn := {ζ i | mdc(i, n) = 1} e (Z/nZ)∗ dada por ζ i 7→ i. Por definição de (Z/nZ)∗ esta aplicação é sobrejetiva e a injetividade segue de i = j implicar em n | (i − j) o que apenas ocorre se i = j. O conjunto Pn é chamado o conjunto das raı́zes primitivas n-ésimas da unidade. Mostramos em particular que #Pn = φ(n). Exemplo 9.26. Seja G = GL2 (R) e 0 x= 1 1 . 0 É imediato verificar que o(x) = 2. Exemplo 9.27. Seja G := S e x = α, então o(α) = 4. 56 9. TEORIA DE GRUPOS I Observação 9.28. Seja G um grupo e suponha que para todo x ∈ G, o(x) = 2. Então G é abeliano. De fato, o(x) = 2 significa que x2 = 1, i.e., x−1 = x. Assim, xy = x−1 y −1 = (yx)−1 = yx. Definição 9.29. Seja G um conjunto e S um subonjunto de G contendo 1. Seja hSi := {x1 · · · xr | ai ∈ S ou a−1 ∈ S}. i Lema 9.30. hSi é um subgrupo de G. Demonstração. De fato, 1 ∈ hSi. Se x, y ∈ hSi, então x = x1 · · · xr com xi ∈ S ou x−1 ∈ S e y = y1 · · · ys tal que jj ∈ S ou yj−1 ∈ S. Logo xy ∈ hSi. i Finalmente, se x ∈ S, então −1 x−1 = x−1 r · · · x1 −1 e x−1 ∈ S ou (x−1 = xi ∈ S. Logo x−1 ∈ hSi. i i ) Definição 9.31. O subgrupo hSi é chamado o subgrupo de G gerado por S. Estamos particularmente interessados no caso em que S = {α}. Neste caso dizemos que o grupo hSi é um grupo cı́clico. Distinguimos duas situações. Na primeira o(α) = n < ∞. Neste caso, hαi = {1, α, · · · , αn−1 } e este conjunto corresponde bijetivamente a Z/nZ por αi 7→ i. O segundo caso é aquele no qual o(α) = ∞. Neste caso hαi = {αr | r ∈ Z} e corresponde bijetivamente a Z por αr 7→ r. Corolário 9.32 (corolário 2 do teorema de Lagrange). Seja G um grupo finito e x ∈ G. Então o(x) | #G. Demonstração. Pelo exemplo anterior, o(x) < ∞ e o(x) = #hxi. Pelo teorema de Lagrange #hxi | #G. Definição 9.33. Seja G um grupo abeliano. Definimos o expoente de G por exp(G) := mmc{o(z) | z ∈ G} ou ∞, se existir z ∈ G tal que o(z) = ∞. Observação 9.34. É claro que se G é finito, então exp(G) < ∞. Mas a recı́proca não é verdade. Por exemplo se G = Z/2Z × . . . Z/2Z × . . ., então para cada x ∈ G \ {1}, onde 1 = (0, · · · , 0, · · · ), o(x) = 2, logo exp(G) = 2, mas G é infinito. Proposição 9.35. Seja G um grupo abeliano e z1 , · · · , zr ∈ G tais que o(zi ) < ∞ para todo i. Então (i) o(z1 · · · zr ) | mmc{o(z1 ), · · · , o(zr )} | o(z1 ) · · · o(zr ). (ii) Se para todo i 6= j, mdc(o(zi ), o(zj )) = 1, então o(z1 · · · zr ) = o(z1 ) · · · o(zr ). Demonstração. (i) Seja M := mmc{o(z1 ), · · · , o(zr )}. Então, (z1 · · · zr )M = · · · zrM = 1, pelo lema chave concluimos que o(z1 · · · zr ) | M . A outra divisibilidade é imediata. (ii) A segunda igualdade é uma propriedade dos inteiros positivos (basta lembrar que o mmc é obtido tomando o maior expoente na fatoração em números primos). Vamos provar a primeira igualdade por indução em r. A primeira etapa é provar para r = 2. z1M 9.4. ORDEM DE ELEMENTO E EXPOENTE DE GRUPO ABELIANO 57 Seja N := o(z1 z2 ). Como G é abeliano, então 1 = (z1 z2 )N = z1N z2N , i.e. , z1−N = z2N . Mas isto significa que z1−N = z2N ∈ hz1 i ∩ hz2 i, mas esta interseção é igual a {1}, pois mdc(o(z1 ), o(z2 )) = 1. Portanto, z1N = z2N = 1, mas isto implica que M | N . Suponhamos que tenhamos provado que o(z1 · · · zr−1 ) = o(z1 ) · · · o(zr−1 ) com mdc(o(zi ), o(zj )) = 1 para i 6= j. Utilizando que G é abeliano, e estendo a definição de N para r fatores, temos que 1 = (z1 . . . zr−1 )N zrN , i.e. , (z1 . . . zr−1 )N = zr−N . Mas isto significa que (z1 . . . zr−1 )N = zr−N ∈ hz1 , · · · , zr−1 i ∩ hzr i, mas este grupo é trivial pois a ordem do primeiro grupo é igual a o(z1 ) . . . o(zr−1 ) e a ordem do segundo é igual a o(zr ) e mdc(o(zi ), o(zj )) = 1, se i 6= j. Assim, (z1 . . . zr−1 )N = zrN = 1, donde M | N . Observe que pelo teorema de Lagrange, se G for finito, então exp(G) | #G. Proposição 9.36. Seja G um grupo abeliano tal que exp(G) < ∞. Então (a) Existe y ∈ G tal que exp(G) = o(y). (b) G é cı́clico se e somente se exp(G) = #G. Demonstração. (a) Seja exp(G) = pe11 · · · perr a fatoração de exp(G). Por definição para todo i = 1, · · · , r existe yi ∈ G tal que o(yi ) = pei i qi tal que pi - qi . Note que se zi = yiqi , então o(zi ) = pei i . Neste caso, pelo ı́tem (ii) da proposição 9.35 temos que se y = z1 · · · zr , então o(y) = exp(G). (b) Se G for cı́clico, então existe x ∈ G tal que hxi = G e o(x) = #G. Por outro lado, pelo ı́tem anterior, existe y ∈ G tal que o(y) = exp(G). Mas, exp(G) | #G e o(x) | exp(G), logo exp(G) = #G. Reciprocamente, se vale a igualdade, pelo ı́tem anterior existe y ∈ G tal que o(y) = exp(G) = #G, logo G é cı́clico. CAPı́TULO 10 Teoria de grupos II 10.1. Subgrupos normais e grupos quocientes Seja G um grupo e H um subgrupo de G. Seja G/H := {xH | x ∈ G} o conjunto das classes laterais a direita de H em G. Analogamente ao caso em que G = Z e H = nZ, para n ≥ 1 inteiro, queremos definir em G/H uma estrutura de grupo. Para isto precisamos de uma propriedade adicional de H. Se copiarmos o que foi feito anteriormente a idéia é definir a função ψ : G/H × G/H → G/H dada por (xH, yH) 7→ xyH. O problema é verificar que ψ está bem definida. Sejam x0 , y 0 ∈ G tais que x0 H = xH e y 0 H = yH, i.e., x0 = xα e y 0 = yβ para α, β ∈ H. Assim x0 y 0 = xαyβ. Mas a princı́pio G não é comutativo e não podemos trocar y com α para concluir que ψ está bem definida. Definição 10.1. Um subgrupo H de um grupo G é dito normal se e somente se para todo x ∈ G temos xHx−1 ⊂ H. Denotamos H C G. Lema 10.2. Seja G um grupo e H um subgrupo de G. As seguintes condições são equivalentes: (i) H C G. (ii) Para todo x ∈ G, xHx−1 = H. (iii) Para todo x ∈ G, xH = Hx. Demonstração. Suponha que H CG. A inclusão ⊂ já está feita por definição. Uma vez que (x−1 )−1 = x, segue também da definição que x−1 Hx ⊂ H, i.e., H ⊂ xHx−1 . Assim vale (ii). Suponha que para todo x ∈ G, xHx−1 = H. Seja α ∈ H. Por hipótese −1 xαx = β ∈ H, logo xα = βx ∈ Hx. Reciprocamente, como x−1 αx = γ ∈ H, então αx = xγ ∈ xH. Disto segue (iii). Suponha que para todo x ∈ G, xH = Hx. Por hipótese para todo α ∈ H existe β ∈ H tal que xαx−1 = βxx−1 = β. Donde (i). Suponhamos que H C G, pelo lema 10.2, existe γ ∈ H tal que x0 y 0 = xαyβ = xyγβ ∈ xyH, pois γβ ∈ H. Assim x0 y 0 H = xyH e ψ está bem definida. 59 60 10. TEORIA DE GRUPOS II Definição 10.3. Seja G um grupo e H C G um subgrupo de normal de G. O conjunto G/H e a função ψ definem uma estrutura de grupo em G/H chamado o grupo quociente. Exemplo 10.4. Seja G um grupo finito e H um subgrupo de G. Suponha que (G : H) = 2. Afirmamos que H C G. De fato, como (G : H) = 2, isto significa que temos apenas suas classes laterais a direita, a saber, H e xH para x ∈ / H. Também sabemos que o número de elementos de CLD é igual ao de CLE, logo as únicas classes laterais a direita são H e Hx, como Hx 6= H e xH 6= H, concluimos que xH = Hx, para todo x ∈ G − H. Esta igualdade também é imediata se x ∈ H. Logo H C G. Exemplo 10.5. Seja G = S e H = {1, α, α2 , α3 }. Temos que H C G, pois (G : H) = |G|/|H| = 2, pelo teorema de Lagrange e pelo exemplo anterior. Exemplo 10.6. Seja G um grupo. Definimos por Z(G) := {x ∈ G | xy = yx para todo y ∈ G}, o centro de G. Afirmamos que Z(G) C G. Primeiro temos que verificar que Z(G) é realmente um subgrupo de G. De fato, 1.y = y.1 = y para todo y ∈ G, logo 1 ∈ Z(G). Se x, z ∈ Z(G) e y ∈ G, então xzy = xyz = yxz, i.e., xz ∈ Z(G). Se x ∈ Z(G), então para todo y ∈ G, x−1 y = (y −1 x)−1 = (xy −1 )−1 = yx−1 , i.e., x−1 ∈ Z(G). Finalmente, dado x ∈ G e y ∈ Z(G), temos que xyx−1 = yxx−1 = y ∈ Z(G), i.e., Z(G) C G. Podemos ainda dizer mais, se H é um subgrupo de Z(G) então H C G. De fato, automaticamente H é um subgrupo de G, além disto como para todo x ∈ G e y ∈ H temos que xyx−1 = yxx−1 = y ∈ H, pois H ⊂ Z(G). Note que G é abeliano se e somente se Z(G) = G. Assim, o quanto maior for o centro de G, mais G estará próximo a ser abeliano. Exemplo 10.7. Seja G um grupo. Denotamos por [G, G] o subgrupo de G gerado pelo conjunto {xyx−1 y −1 | x, y ∈ G}. Este grupo é chamado o subgrupo dos comutadores. Note que G é abeliano se e somente se [G, G] = {1}. Assim, o quanto menor for o subgrupo dos comutadores, mais G estará próximo a ser abeliano. Afirmamos também que [G, G] C G. Seja α ∈ [G, G], digamos α = α1 · · · αr , onde para todo i, −1 −1 αi = xi yi x−1 ou αi−1 = xi yi x−1 i yi i yi , para xi yi ∈ G. A última igualdade se reescreve como αi = yi xi yi−1 x−1 i . Seja z ∈ G, então zyz −1 = zα1 z −1 · · · zαr z −1 e observe que para cada i temos −1 −1 zαi z −1 = zxi yi x−1 ∈ {xyx−1 y −1 | x, y ∈ G} ou i yi z −1 zαi z −1 = zyi xi yi−1 x−1 ∈ {xyx−1 y −1 | x, y ∈ G}. i z 10.2. HOMOMORFISMO DE GRUPOS 61 Observação 10.8. Observe também que G/[G, G] é um grupo abeliano. Além disto, se H C G for tal que G/H é abeliano, então H contém [G, G]. De fato, se dados x, y ∈ G temos xyH = xHyH = yHxH = yxH, então existe α ∈ H tal que x−1 y −1 xy ∈ H. Consequentemente, todo elemento de [G, G] está contido em H. 10.2. Homomorfismo de grupos Sejam G e G dois grupos. O objetivo é compará-los e verificar que suas estruturas são as mesmas. Definição 10.9. Um homomorfismo de grupos é uma função f : G → G tal que f (xy) = f (x)f (y). Observação 10.10. (a) Seja 1G o elemento neutro de G e 1G o elemento neutro de G. Então f (1G ) = 1G . De fato, f (1G ) = f (1G 1G ) = f (1G ) f (1G ), logo f (1G ) = 1G . (b) Para todo x ∈ G temos que f (x−1 ) = f (x)−1 . De fato, f (x)f (x−1 ) = f (xx−1 ) = f (1G ) = 1G e f (x−1 )f (x) = f (x−1 x) = f (1G ) = 1G . Exemplo 10.11. (1) Seja G = G = Z, n ≥ 1 inteiro e f : Z → Z definida por f (x) = nx. f é um homomorfismo. De fato, f (x + y) = n(x + y) = nx + ny = f (x) + f (y). (2) Seja G um grupo e H um subgrupo normal de G e f : G → G/H definida por f (x) = xH é um homomorfismo. De fato, f (xy) = (xy)H = (xH)(yH) = f (x)f (y), por definição de produto de classes. (3) Seja G um grupo e fixemos a ∈ G. Consideremos a função Ia : G → G definida por Ia (x) = axa−1 . Esta função é um homomorfismo. De fato, Ia (xy) = a(xy)a−1 = (axa−1 )(aya−1 ) = Ia (x)Ia (y). A partir de agora deixaremos ao cargo do leitor identificar quando a unidade referida por 1 está em G ou em G. Proposição 10.12. Seja f : G → G um homomorfismo de grupos e ker(f ) := {x ∈ G | f (x) = 1} o núcleo (i) (ii) (iii) (iv) (v) (vi) (vii) de f . ker(f ) C G. f é injetiva se e somente se ker(f ) = {1}. f (G) é um subgrupo de H. f −1 (f (H)) = H ker(f ). Seja H < G tal que f −1 (H) ⊃ ker(f ). Então f (f −1 (H)) = H ∩ f (G). Se x ∈ G é tal que o(x) < ∞ então o(f (x)) < ∞ e o(f (x)) | o(x). Se H C G, então f (H) C f (G). Se H C f (G), então f −1 (H) C G. Demonstração. (i) Seja a ∈ G e x ∈ ker(f ), então f (axa−1 ) = f (a)f (x) f (a ) = f (a)f (a)−1 = 1, i.e., axa−1 ∈ ker(f ). (ii) Suponha que f seja injetiva e x ∈ ker(f ). Logo f (x) = 1 = f (1), i.e., x = 1. Reciprocamente, se ker(f ) = {1} e se f (x) = f (y), então f (x)f (y)−1 = f (xy −1 ) = 1, i.e., xy −1 ∈ ker(f ), logo xy −1 = 1, i.e., x = y. (iii) É claro que 1 = f (1) ∈ f (G). Sejam x, y ∈ f (G), i.e., existem a, b ∈ G tais que x = f (a) e y = f (b). Logo xy = f (a)f (b) = f (ab) ∈ f (G). Se x ∈ f (G), digamos x = f (a) para a ∈ G, então x−1 = f (a)−1 = f (a−1 ) ∈ f (G). −1 62 10. TEORIA DE GRUPOS II Para provar a propriedade (iv) precisamos do seguinte lema. Lema 10.13. Sejam H e K subgrupos de um grupo G. Definimos HK := {ab | a ∈ H, b ∈ K}. Então HK < G se e somente se HK = KH. Além disto, se H C G ou K C G, então HK < G. Demonstração. Suponha que HK < G. Seja α ∈ HK. Então α−1 ∈ HK, digamos α−1 = ab. Assim α = (α−1 )−1 = b−1 a−1 ∈ KH, i.e., HK ⊂ KH. Seja α ∈ KH, digamos α = ab. Logo α−1 = b−1 a−1 ∈ HK. Como HK < G, então α = (α−1 )−1 ∈ HK, i.e., KH ⊂ HK. Reciprocamente, suponha que HK = KH. Então 1 = 1.1 ∈ HK. Se x, y ∈ HK, digamos x = ab e y = cd, então xy = abcd = ac0 b0 d ∈ HK, onde bc = c0 b0 ∈ HK, uma vez que HK = KH. Se x = ab ∈ HK, então x−1 = b−1 a−1 = a0 b0 ∈ HK, pela mesma razão. Suponha que H C G (o outro caso é análogo). Seja x = ab ∈ HK. Então x = bb−1 ab = b(b−1 ab) = ba0 ∈ KH, logo HK ⊂ KH. Se x = ab ∈ KH, então x = abaa−1 = (aba−1 )a = b0 a ∈ HK, i.e., KH ⊂ HK. Continuação da prova da proposição. (iv) Notemos inicialmente que como ker(f ) C G, H ker(f ) < G. Seja a ∈ f −1 (f (H)), i.e., f (a) = f (b) ∈ f (H). Logo f (a)f (b)−1 = f (ab−1 ) = 1, i.e., ab−1 = c ∈ ker(f ), i.e., a = bc = c0 b0 ∈ H ker(f ). Reciprocamente, se x = ab ∈ H ker(f ), então f (x) = f (ab) = f (a)f (b) = f (a) ∈ f (H), i.e., x ∈ f −1 (f (H)). (v) Seja x ∈ f (f −1 (H)), i.e., x = f (a) para a ∈ f −1 (H), i.e., f (a) = y ∈ H. Portanto, x ∈ H ∩ f (G). Reciprocamente, suponha que x ∈ H ∩ f (G). Logo x = f (a) ∈ H, i.e., a ∈ f −1 (H), logo x ∈ f (f −1 (H)). (vi) Seja d = o(x), logo xd = 1 e f (xd ) = f (x)d = f (1) = 1, pelo lema chave, o(f (x)) | o(x), em particular o(f (x)) < ∞. (vii) Suponha que H C G e sejam a ∈ G e x ∈ H. Logo axa−1 ∈ H. Por outro lado, f (x) ∈ f (H) e f (a) ∈ f (G) ⊂ G. Assim, f (axa−1 ) = f (a)f (x)f (a)−1 ∈ f (H). Suponha que H C f (G). Sejam x ∈ f −1 (H) e a ∈ G, i.e., f (x) = y ∈ H. Como H C f (G), então f (a)yf (a)−1 ∈ H, mas f (a)yf (a)−1 = f (axa−1 ), i.e., axa−1 ∈ f −1 (H). Definição 10.14. Seja f : G → G um homomorfismo de grupos. Se f é bijetivo dizemos que f é um isomorfismo de grupos. Teorema 10.15 (teorema do isomorfismo de grupos). Seja f : G → G um homomorfismo de grupo. Então f induz um isomorfismo de grupos ϕ : G/ ker(f ) → f (G) definido por ϕ(x ker(f )) := f (x). Além disto existe uma bijeção entre os seguintes conjuntos {H < G | H ⊃ ker(f )} e {H < f (G)}. Demonstração. Notemos inicialmente que ϕ está bem definido. De fato, se x = ya para a ∈ ker(f ), então ϕ(x ker(f )) = f (x) = f (ya) = f (y)f (a) = f (y) = ϕ(y ker(f )). Além disto, pela sua própria definição ϕ é sobrejetivo. Quanto a 10.2. HOMOMORFISMO DE GRUPOS 63 injetividade, se ϕ(x ker(f )) = ϕ(y ker(f )), então f (x) = f (y), i.e., f (x)f (y)−1 = f (xy −1 ) = 1, i.e., xy −1 ∈ ker(f ), logo x ker(f ) = y ker(f ). A bijeção entre os dois conjuntos é dada pelas funções ψ1 : H 7→ f (H) e ψ2 : H 7→ f −1 (H). De fato, ψ2 ◦ ψ1 (H) = ψ2 (f (H)) = f −1 (f (H)) = H ker(f ) = H, pois H ⊃ ker(f ). Reciprocamente, ψ1 ◦ ψ2 (H) = ψ1 (f −1 (H)) = f (f −1 (H)) = H ∩ f (G) = H, pois H < f (G). Corolário 10.16. Seja f : G → G um homomorfismo de grupos e H < G. Então existe um isomorfismo de grupos ψ: H → f (H) dado por ψ(x(H ∩ ker(f ))) := f (x). (H ∩ ker(f )) Demonstração. É imediato verificar que ker(f ) ∩ H C H. Logo o grupo quociente faz sentido. A função ψ está bem definida, pois se x = ya para a ∈ H ∩ ker(f ), então ψ(x(ker(f ) ∩ H)) = f (x) = f (ya) = f (y)f (a) = f (y) = ψ(y(ker(f ) ∩ H)). Por definição ψ é sobrejetiva. Se ψ(x(ker(f ) ∩ H)) = ψ(y(ker(f ) ∩ H)), então f (x) = f (y), i.e., f (xy −1 ) = f (x)f (y)−1 = 1, i.e., xy −1 ∈ ker(f ) ∩ H. Proposição 10.17. Seja H C G e G o homomorfismo quociente f (x) := xH. H Existe uma bijeção entre os conjuntos f :G→ {K C G | K ⊃ H} e {H C G/H}. Demonstração. Definimos as funções que dão a bijeção por ψ1 : K 7→ K/H e ψ2 : H 7→ f −1 (H). De fato, ψ2 ◦ψ1 (K) = ψ2 (K/H) = f −1 (K/H) = f −1 (f (K)) = K ker(f ) = KH = K, pois K ⊃ H e ψ1 ◦ ψ2 (H) = ψ1 (f −1 (H)) = f (f −1 (H)) = H ∩ f (G) = H ∩ G/H = H. Proposição 10.18. Sejam G um grupo, H C G e K < G. Então existe um isomorfismo de grupos K KH ϕ: → . (K ∩ H) H Demonstração. Seja f : K → KH/H o homomorfismo quociente f (x) := xH. Afirmamos que f é sobrejetivo. De fato, se abH ∈ KH/H, então abH = aH = f (a). Afirmamos também que ker(f ) = H ∩ K. De fato, se a ∈ ker(f ), então f (a) = aH ∈ H, i.e., a ∈ H ∩ K. Portanto, o resultado é uma conseqüência do teorema do isomorfismo. Proposição 10.19. Sejam K < H < G grupos com H C G e K C G (em particular K C H). Então existe um isomorfismo de grupos ϕ: G/K G → . H/K H Demonstração. Seja f : G/K → G/H definida por f (xK) := xH. Observemos que f está bem definida. Seja x = ya para a ∈ K. Então f (xK) = xH = (ya)H = (yH)(aH) = yH, pois a ∈ K ⊂ H. ker(f ) = {xK | xH = H} = {xK | x ∈ H} = H/K. f é sobrejetiva por definição. Assim o resultado segue do teorema do isomorfismo. 64 10. TEORIA DE GRUPOS II Definição 10.20. Seja G um grupo. Um homomorfismo de grupos f : G → G é chamado um endomorfismo de grupos e denotamos por End(G) o conjunto dos endomorfismos de G que é um monóide com respeito à composição de funções. Um monóide tem todas as propriedades de grupo exceto a existência do inverso. Se f for bijetivo então dizemos que f é um automorfismo de G e denotamos por Aut(G) o conjunto dos automorfismos de G. Este é um grupo com respeito à composição de funções. Observação 10.21. Para todo a ∈ G, Ia : G → G definida por Ia (x) := axa−1 é um automorfismo de G chamado um automorfismo interno de G. O conjunto G := {Ia | a ∈ G} dos automorfismos internos de G também é um grupo com respeito à composição de funções. Fica como exercı́cio mostrar que I(G) C Aut(G). Definição 10.22. Seja G um grupo e H < G. Dizemos que H é um subgrupo caracterı́stico de G se para todo σ ∈ Aut(G) temos σ(H) ⊂ H, i.e., para todo x ∈ H, σ(x) ∈ H. Observação 10.23. Notemos que se H for subgrupo caracterı́stico de G, então H C G, pois a última afirmativa equivale a dizer que Ia (H) ⊂ H para todo a ∈ H. Proposição 10.24. Se K for subgrupo caracterı́stico de H e H C G, então K C G. Demonstração. Queremos mostrar que para todo a ∈ G, Ia (K) ⊂ K. A restrição de Ia a H nos dá uma função Ja : H → G definida por Ja (x) := axa−1 . Por hipótese H C G, logo axa−1 ∈ H e Ja ∈ Aut(H) (não podemos garantir que Ja ∈ I(H), pois não necessariamente a ∈ H). Por hipótese, K é caracterı́stico em H, logo Ja (K) = Ia|H (K) = K. 10.3. Produtos de grupos 10.3.1. Produto direto. Sejam G1 , · · · , Gn grupos. Definimos no produto cartesiano G1 × . . . × Gn uma estrutura de grupo da seguinte forma: (x1 , · · · , xn ).(y1 , · · · , yn ) := (x1 y1 , · · · , xn yn ). É fácil verificar que esta operação é associativa, o elemento neutro é (1, · · · , 1) e o −1 inverso de (x1 , · · · , xn ) é (x−1 1 , · · · , xn ). Assim o conjunto G1 × . . . × Gn passa a ter uma estrutura de grupo e é chamado o produto direto dos grupos G1 , · · · , Gn e é denotado por G1 ⊕ . . . ⊕ Gn . ∼ G1 ⊕ . . . ⊕ Gn se Teorema 10.25. Sejam G, G1 , · · · , Gn grupos. Então G = e somente se existem subgrupos H1 , · · · , Hn de G tais que para todo i, Hi ∼ = Gi , e além disto (1) G = H1 . . . Hn . (2) Hi C G para todo i = 1, · · · , n. (3) Hi ∩ (H1 . . . Hi1 Hi+1 . . . Hn ) = {1} para todo i = 1, · · · , n. Demonstração. Suponhamos que exista um isomorfismo ϕ : G → G1 ⊕ . . . ⊕ Gn . Seja Hi := ϕ−1 ({1} × . . . × Gi × . . . {1}). Definimos a seguinte função ϕi : Hi → Gi dada por ϕi (xi ) := yi , 10.3. PRODUTOS DE GRUPOS 65 onde xi = ϕ((1, · · · , yi , · · · , 1)). Esta função é um isomorfismo de grupos. De fato, se zi = ϕ−1 ((1, · · · , wi , · · · , 1)), então ϕi (xi zi ) = yi wi = ϕi (xi )ϕi (yi ), pois xi zi = ϕ−1 ((1, · · · , zi wi , · · · , 1)). Além disto ϕi é injetiva, pois se yi = 1, então xi = 1. Finalmente é sobrejetiva pois para todo yi ∈ Gi , xi = ϕ−1 ((1, · · · , yi , · · · , 1)) e ϕi (xi ) = yi . (1) Dado x ∈ G seja ϕ(x) := (x1 , · · · , xn ). Então ϕ(x) = (x1 , · · · , 1). . . . .(1, · · · , xn ). Seja yi = ϕ−1 ((1, · · · , xi , · · · , 1)), então x = y1 . . . yn , onde yi ∈ Hi para todo i = 1, · · · , n. (2) Seja x ∈ G e yi ∈ Hi temos que provar que xyi x−1 ∈ Hi . Calculemos −1 ϕ(xyi x−1 ) = ϕ(x)ϕ(yi )ϕ(x)−1 = (x1 , · · · , xn ).(1, · · · , zi , · · · , 1).(x−1 1 , · · · , xn ) −1 −1 −1 = (x1 x−1 1 , · · · , xi zi xi , · · · , xn xn ) = (1, · · · , xi zi xi , · · · , 1). Portanto, xyi x−1 = ϕ−1 ((1, · · · , xi zi x−1 i , · · · , 1)) ∈ Hi . (3) Seja xi ∈ Hi ∩ (H1 . . . Hi−1 Hi+1 . . . Hn ). Assim, por um lado xi = ϕ−1 ((1, · · · , yi , · · · , 1)) e por outro lado xi = ϕ−1 ((z1 , · · · , zi−1 , 1, zi+1 , · · · , zn )). Como ϕ é um isomorfismo concluimos que zj = 1 para todo j e que yi = 1, portanto xi = 1. Reciprocamente, suponhamos que as 3 condições acima sejam satisfeitas. Para provar a recı́proca utilizaremos o ı́tem 2 do lema seguinte. Afirmamos que G ∼ = H1 ⊕ . . . ⊕ Hn . De fato, consideremos a função ψ : G → H1 ⊕ . . . ⊕ Hn dada por ψ(x) = ψ(x1 . . . xn ) := (x1 , · · · , xn ). Esta função é um isomorfismo. Observe que pelo lema abaixo ψ(xy) = ψ(x1 . . . xn y1 . . . yn ) = ψ(x1 y1 x2 . . . xn y2 . . . yn ) = · · · = ψ(x1 y1 . . . xn yn ) = (x1 y1 , · · · , xn yn ) = (x1 , · · · , xn ).(y1 , · · · , yn ) = ψ(x)ψ(y). Se ψ(x) = (1, · · · , 1), então x = 1 . . . 1 = 1, logo ψ é injetiva. Para todo (x1 , · · · , xn ) ∈ H1 ⊕. . .⊕Hn se x = x1 · · · xn temos que ψ(x) = (x1 , · · · , xn ), logo ψ é sobrejetiva. Lema 10.26. As 3 condições acima são equivalentes às seguintes duas condições: (a) Para todo x ∈ G existem únicos xi ∈ Hi para i = 1, · · · , n tais que x = x1 . . . xn . (b) Para todo i 6= j, x ∈ Hi e y ∈ Hj , xy = yx. Demonstração. Suponha que as 3 condições anteriores sejam satisfeitas. Assim para todo x ∈ G podemos escrever x = x1 . . . xn . Suponhamos que x = y1 . . . yn , então −1 y1−1 x1 = y2 . . . yn x−1 n . . . x2 . Como Hi C G temos que para todo x ∈ G, xHi = Hi x, i.e., dado αi ∈ Hi temos que xαi = βi x para algum βi ∈ Hi . Logo −1 −1 (yn x−1 n )xn−1 = zn−1 (yn xn ) para algum zn−1 ∈ Hn−1 . Repetindo o argumento concluimos que −1 −1 y1−1 x1 = y2 . . . yn x−1 n . . . x2 = z2 . . . zn−1 (yn xn ) ∈ H2 . . . Hn ∩ H1 = {1}, portanto x1 = y1 . Pelo mesmo argumento xi = yi para todo i = 2, · · · , n. 66 10. TEORIA DE GRUPOS II Como Hi , Hj C G temos que xyx−1 ∈ Hj , logo xyx−1 y −1 ∈ Hj e yx−1 y −1 ∈ Hi , logo xyx−1 y −1 ∈ Hi , portanto xy = yx, já que Hi ∩ Hj ⊂ Hi ∩ (H1 . . . Hi−1 Hi+1 . . . Hn ) = {1}. Reciprocamente, suponha as duas últimas condições satisfeitas. A primeira condição do teorema segue automaticamente de (a). Seja x = x1 . . . xn ∈ G, yi ∈ Hi e zi = xi yi x−1 i . Então, por (b), −1 −1 xyi x−1 = x1 . . . xn yi x−1 n . . . x1 = x1 . . . xn−1 yi xn−1 . . . x1 = · · · −1 −1 −1 = x1 . . . xi yi x−1 i . . . x1 = x1 . . . xi−2 zi xi−2 . . . x1 = · · · = zi ∈ Hi . Finalmente, se xi ∈ Hi ∩ (H1 . . . Hi−1 Hi+1 . . . Hn , pela unicidade de (a) temos que xi = 1. 10.3.2. Produtos semi-diretos de grupos. Na seção anterior dados dois grupos H e K construimos o produto direto H ⊕ K com a operação componente a componente. Nesta seção modificaremos levemente o procedimento. Lembre que Aut(K) (o conjunto dos automorfismos de K) é um grupo com respeito a composição de automorfismos. Suponhamos que seja dado um homomorfismo de grupo σ : H → Aut(K). Definimos no produto cartesiano H×K uma nova operação da seguinte forma: (x, y) σ (z, w) := (xz, yσ(x)(w)), note que σ(x) : K → K é um automorfismo de K, logo σ(x)(w) ∈ K. Afirmamos que H × K com a operação σ é um grupo, chamado o produto semi-direto de H e K com respeito a σ e denotado por H nσ K. De fato, ((x1 , y1 ) σ (x2 , y2 )) σ (x3 , y3 ) = (x1 x2 , y1 σ(x1 )(y2 )) σ (x3 , y3 ) = ((x1 x2 )x3 , (y1 σ(x1 )(y2 ))σ(x1 x2 )(y3 )) = (x1 (x2 x3 ), (y1 σ(x1 )(y2 ))(σ(x1 )(σ(x2 )(y3 )))) = (x1 (x2 x3 ), y1 σ(x1 )(y2 σ(x2 )(y3 ))) = (x1 , y1 ) σ (x2 x3 , y2 σ(x2 )(y3 )) = (x1 , y1 ) σ ((x2 , y2 ) σ (x3 , y3 )). O elemento neutro é (1, 1). De fato, (1, 1) σ (x, y) = (x, σ(1)(y)) = (x, y) e (x, y) σ (1, 1) = (x, yσ(x)(1)) = (x, y). O inverso de (x, y) é (x−1 , σ(x−1 )(y −1 )). De fato, (x, y) (x−1 , σ(x−1 )(y −1 )) = (1, yσ(x)(σ(x−1 )(y −1 ))) = (1, yy −1 ) = (1, 1) e (x−1 , σ(x−1 )(y −1 )) σ (x, y) = (1, σ(x−1 )(y −1 )σ(x−1 )(y)) = (1, σ(x−1 )(y −1 y)) = (1, σ(x−1 )(1)) = (1, 1). Proposição 10.27. (a) (x, y)n = (xn , n−1 Y σ(xi )(y)). i=0 Conseqüentemente, (x, 1)n = (xn , 1) e (1, y)n = (1, y n ). (b) (1, y) σ (x, 1) = (x, y). 10.3. PRODUTOS DE GRUPOS 67 (c) {1} nσ K C H nσ K. (d) H nσ {1} ⊂ H nσ K é um subgrupo. Este subgrupo é normal, se σ = id. Demonstração. (a) Vamos provar por indução. Para n = 2, (x, y) σ (x, y) = (x2 , yσ(x)(y)). Suponha que o resultado vale para n. Então (x, y)n+1 = (x, y)n σ (x, y) = (xn , n−1 Y σ(xi )(y)) σ (x, y)) i=0 = (xn+1 , n−1 Y σ(xi )(y)σ(xn )(y)) = (xn+1 , i=0 n Y σ(xi )(y)). i=0 (2) Segue da definição. (3) Primeiro verifiquemos que {1} nσ K é de fato um subgrupo de H nσ K. É claro que (1, 1) ∈ {1} nσ K. Se (1, x), (1, y) ∈ {1} nσ K, então (1, x) σ (1, y) = (1, xσ(1)(y)) = (1, xy) ∈ {1} nσ K. Além disto (1, x)−1 = (1, σ(1)(x−1 )) = (1, x−1 ) ∈ {1} nσ K. Dado (x, y) ∈ H nσ K e (1, z) ∈ {1} nσ K, então (x, y) σ (1, z) σ (x, y)−1 = (x, yσ(x)(z)) σ (x−1 , σ(x−1 )(y −1 )) = (1, yσ(x)(z)σ(x)(σ(x−1 (y −1 )))) = (1, yσ(x)(zσ(x−1 (y −1 )))) ∈ {1} nσ K. (4) É claro que (1, 1) ∈ H nσ {1}. Se (x, 1), (y, 1) ∈ H nσ {1}, então (x, 1) σ (y, 1) = (xy, σ(x)(1)) = (xy, 1) ∈ H nσ {1}. Além disto (x, 1)−1 = (x−1 , σ(x−1 )(1)) = (x−1 , 1) ∈ H nσ {1}. Exemplo 10.28. Lembremos que S3 = {1, α, α2 , β, αβ, α2 β} é caracterizado por o(α) = 3, o(β) = 2 e βα = α2 β, i.e., βαβ −1 = α2 . Neste caso K = hαi = {1, α, α2 } e H = hβi = {1, β}. Isto permite-nos definir o seguinte homomorfismo σ : H → Aut K por σ(β)(α) := α2 (verifique que isto é um homorfismo de grupo). Seja a = (1, α) e b = (β, 1). Verifiquemos que estes satisfazem à descrição de S3 , portanto H nσ K ∼ = S3 . De fato, a3 = (1, α3 ) = (1, 1), b2 = (β 2 , 1) = (1, 1) e ba = (β, 1) (1, α) = (β, σ(β)(α)) = (β, α2 ) e a2 b = (1, α2 ) σ (β, 1) = (β.α2 σ(1)(1)) = (β, α2 ) = ba. 68 10. TEORIA DE GRUPOS II Lema 10.29. Seja H = hαi um grupo cı́clico de ordem n, K = hβi um grupo cı́clico de ordem m. Então existem bijeções Hom(K, Aut(H)) → {τ ∈ Aut(H) | o(τ ) | m} σ 7→ σ(β) e {τ ∈ Aut(H) | o(τ ) | m} → {1 ≤ s ≤ n − 1 | sm ≡ 1 (mod n)} s τ 7→ s, onde τ (α) = α . Demonstração. Note que a primeira função está de fato bem definida, pois σ(β)m = σ(β m ) = σ(1) = id. É injetiva pois 2 automorfismos calculados no gerador β de H são necessariamente iguais. Se τ ∈ Aut(H) satisfaz o(τ ) | m, então τ (α)m = τ (αm ) = 1, logo αm = 1, pelo lema chave o(α) = n | m, logo existe um homomorfismo σ : K → Aut(H) tal que σ(β) = τ . Para a segunda, basta observar que Aut(H) → (Z/nZ)∗ dada por τ 7→ s, onde τ (α) = αs é um isomorfismo de grupos. Neste isomorfismo o(τ ) | m se e somente se sm ≡ 1 (mod n). Como conseqüência deste lema temos que se existem inteiros m, n, s ≥ 0 tais que sm ≡ 1 (mod n), então existe um grupo G com #G = nm, G = hα, βi, o(α) = n, o(β) = m e βαβ −1 = αs . De fato, da condição numérica e do lema sabemos que o automorfismo τ : hαi → hαi por τ (α) = αs tem ordem o(τ ) | m. Logo existe um homomorfismo σ : hβi → Aut(hαi). Basta tomar o produto semi-direto hβi nσ hαi para obter um tal G. Para mais tipos de produtos de grupos veja [Go, chapter 2]. 10.4. Grupos metacı́clicos O objetivo desta seção é descrever grupos metacı́clicos que generalizam o D4 e S3 . Teorema 10.30. Seja G um grupo finito, s ≥ 1 inteiro, a, b ∈ G tais que ba = as b (i.e., Ib (a) = as ). Seja G um grupo e α, β ∈ G. Sejam m, n ≥ 1 inteiros tais que an = 1 e bm ∈ hai. (1) Para todo s, t ≥ 1 temos t bt ar = ars bt . Em particular, ha, bi = {ai bj | 0 ≤ i ≤ n − 1, 0 ≤ j ≤ m − 1}. Além disto, se m e n forem escolhidos mı́nimos para esta propriedade, temos que #ha, bi = mn. (2) Supondo m e n mı́nimos, seja u ≥ 0 tal que bm = au . Então existe um homomorfismo f : ha, bi → G tal que f (a) = α e f (b) = β se e somente se βα = αs β, αn = 1 e β m = αu . Demonstração. (1) Vamos provar por indução. Vamos supor primeiro que t r = 0 e provar que Ibt (ar ) = ars . Se t = 1, então já sabemos que Ib (a) = as . Suponhamos que isto valha para t − 1. Então Ibt (ar ) = Ib ◦ Ibt−1 (ar ) = Ib (ars t−1 ) = Ib (a)rs t−1 = (as )rs t−1 t = ars . 10.4. GRUPOS METACÍCLICOS 69 Por definição, ha, bi é formado por produtos de elementos que são iguais a a (ou a−1 ) e b (ou b−1 ). Utilizando o resultado acima, podemos sempre colocar a potência de a em primeiro lugar e escrever ai bj para i, j ∈ Z. Além disto, pelas hipóteses sobre m e n obtemos que basta tomar 0 ≤ i ≤ n − 1 e 0 ≤ j ≤ m − 1. Observemos também que se m e n forem mı́nimos então os elementos de ha, bi = {ai bj | 0 ≤ i ≤ n − 1, 0 ≤ j ≤ m − 1} são todos distintos, portanto sua ordem é mn. De fato, se ai bj = ak bl , então ai−k = bl−j ∈ hai, digamos que l ≥ j. Neste caso, l − j < m, logo l = j e ai−k = 1, bem como ak−i . Tomando o expoente positivo dentre os 2 e notando que este expoente é menor que n concluimos que i = k. (2) É claro que αn = f (a)n = f (an ) = f (1) = 1, β m = f (b)m = f (bm ) = f (au ) = f (a)u = αu e que βα = f (b)f (a) = f (ba) = f (as b) = f (a)s f (b) = αs β. Para verificar a recı́proca basta definir f : ha, bi → G por f (ai bj ) := αi β j e provar que isto realmente é um homomorfismo. De fato, j j j f (ai bj ak bl ) = f (ai aks bj bl ) = f (ai+ks bj+l ) = αi+ks β j+l j = αi (αks β j )β l = αi β j αk β l = f (ai bj )f (ak bl ). Teorema 10.31. Sejam m, n, s, u ≥ 0 inteiros. Existe um grupo G de ordem nm e a, b ∈ G tais que G = ha, bi, an = 1, bm = au e ba = as b se e somente se sm ≡ 1 (mod n) e u(s − 1) ≡ 0 (mod n). m Demonstração. Note que pelo teorema anterior, bm a = as bm . Mas, bm = m m u a , logo bm a = abm = as bm , em particular as −1 = 1 e pelo lema chave, n | (sm − 1). De novo pelo teorema anterior, bau = aus b. Mas au = bm , logo bau = au b = aus b, i.e., au(s−1) = 1, assim n | (u(s − 1)). A recı́proca segue da construção do final da seção anterior. Proposição 10.32. Sejam m, n, s, u ≥ 0 inteiros, G um grupo de ordem nm. Suponha que existam a, b ∈ G tais que G = ha, bi, ba = as b, an = 1 e bm = au . Então a função Aut(G) → {(α, β) ∈ G × G | G = hα, βi, βα = αs β, αn = 1, β m = αu } f 7→ (f (a), f (b)) é bijetiva. Demonstração. Segue do primeiro teorema que f (a) e f (b) satisfazem as condiç ões do conjundo do lado direito. A função é injetiva, pois a e b geram G, assim um homomorfismo fica unicamente determinado pelo seu valor nos geradores. Novamente o primeiro teorema mostra que a função é sobrejetiva. 70 10. TEORIA DE GRUPOS II 10.5. Classificação de grupos de ordem ≤ 11 Comecemos observando que todo grupo cı́clico de ordem n é isomorfo a Z/nZ. De fato, se G é cı́clico de ordem n significa que G = {1, a, · · · , an−1 } para algum gerador a de G. Consideremos a função f : G → Z/nZ definida por f (a) = 1. Exercı́cio: verifique que esta função é um isomorfismo de grupos. 10.5.1. Grupos de ordem : 2,3,5,7,11. Estes números são primos, logo (pelo teoream de Lagrange) todo a ∈ G − {1} tem ordem p, portanto G é cı́clico, i.e., G ∼ = Z/nZ. 10.5.2. Grupos de ordem 4. Se existe a ∈ G tal que o(a) = 4, então G é cı́clico. Logo G ∼ = Z/4Z. Suponhamos que para todo a ∈ G − {1}, o(a) = 2 (que é a única possibilidade pelo teorema de Lagrange). Portanto G é um grupo abeliano. Seja a ∈ G − {1} e b ∈ G − hai. Assim, G = {1, a, b, ab}. Neste caso a função f : G → Z/2Z × Z/2Z definida por f (1) = (0, 0), f (a) = (1, 0), f (b) = (0, 1) e f (ab) = (1, 1) é um isomorfismo de grupos. 10.5.3. Grupos de ordem 6. Se existe a ∈ G tal que o(a) = 6, então G é cı́clico e G ∼ = Z/6Z. Suponhamos que não exista a ∈ G tal que o(a) = 6. Pelo teorema de Lagrange, para todo a 6= 1 as possibilidades para a sua ordem são 2 e 3. Lema 10.33. Existe a ∈ G tal que o(a) = 3. Demonstração. De fato, suponhamos que para todo a ∈ G − {1} tenhamos o(a) = 2. Seja a ∈ G − {1} e b ∈ G − hai. Neste caso, ha, bi é um subgrupo de G de ordem 4, o que contradiz o teorema de Lagrange. Lema 10.34. Existe b ∈ G tal que o(b) = 2. Demonstração. De fato, suponhamos que para todo b ∈ G − {1} tenhamos o(b) = 3. Seja a ∈ G tal que o(a) = 3 e b ∈ G − hai. O subgrupo ha, bi de G tem ordem 9, o que novamente contradiz o teorema de Lagrange. Utilizando os valores das ordens de a e b vemos que G = {1, a, a2 , b, ab, a2 b} e que ba 6= 1, a, a2 , b. Assim, ba = ab ou a2 b. No primeiro caso, G é abeliano e a função f : G → Z/3Z × Z/2Z definida por f (1) = (0, 1), f (a) = (1, 0), f (a2 ) = (2, 0), f (b) = (0, 1), f (ab) = (1, 1), f (a2 b) = (2, 1) é um isomorfismo de grupos. Mas pelo teorema chinês dos restos, Z/3Z × Z/2Z ∼ = Z/6Z, assim descartamos este caso. O caso em que ba = a2 b é exatamente o caso em que G ∼ = S3 . 10.5.4. Grupos de ordem 8. Se existe a ∈ G tal que o(a) = 8 então G é cı́clico e G ∼ = Z/8Z. Suponha que para todo a ∈ G − {1}, o(a) = 2. Neste caso G é abeliano. Seja a ∈ G tal que o(a) = 2, seja b ∈ G − hai e c ∈ G − ha, bi. Note que o subgrupo ha, b, ci = {1, a, b, c, ab, ac, bc, abc} tem ordem 8, logo G = ha, b, ci. Observe também que f : G → Z/2Z × Z/2Z × Z/2Z definida por f (1) = (0, 0, 0), f (a) = (1, 0, 0), f (b) = (0, 1, 0), f (c) = (0, 0, 1), f (ab) = (1, 1, 0), f (ac) = (1, 0, 1), f (bc) = (0, 1, 1) e f (abc) = (1, 1, 1) é um isomorfismo de grupos. Assim, suponha que exista a ∈ G tal que o(a) = 4. Seja b ∈ G − hai. Note que ha, bi = {1, a, a2 , a3 , b, ab, a2 b, a3 b} e que estes elementos são distintos, portanto 10.5. CLASSIFICAÇÃO DE GRUPOS DE ORDEM ≤ 11 71 G = ha, bi. Observe também que como (G : hai = 8/4 = 2, então (bhai)2 = hai, i.e., b2 hai. Observe também que trivialmente b2 6= b, ab, a2 b, a3 b e ba 6= 1, a, a2 , a3 , b. Pelo segundo teorema as únicas possibilidades para u e s tais que b2 = au e ba = as b são u = 0 ou 2 e s = 1 ou 3. Se u = 0 e s = 1, temos que ba = ab e o(b) = 2. O grupo G é abeliano. A função f : G → Z/4Z × Z/2Z definida por f (1) = (0, 0), f (a) = (1, 0), f (a2 ) = (2, 0), f (a3 ) = (3, 0), f (b) = (0, 1), f (ab) = (1, 1), f (a2 b) = (2, 1) e f (a3 b) = (3, 1) é um isomorfismo de grupos. Se u = 0 e s = 3, temos que ba = a3 b e o(b) = 2, neste caso G ∼ = D4 . Se u = 2 e s = 0, temos que ba = ab e b2 = a2 . O grupo G é abeliano. A função f : G → Z/4Z × Z/2Z definida por f (1) = (0, 0), f (a) = (1, 0), f (a2 ) = (2, 0), f (a3 ) = (3, 0), f (ab) = (0, 1), f (b) = (3, 1), f (a2 b) = (1, 1) e f (a3 b) = (2, 1) é um isomorfismo de grupos. Finalmente, se u = 2 e s = 3, temos que ba = a3 b e b2 = a2 . Neste caso G é isomorfo ao grupo Q dos quaternions descrito da seguinte forma. Q é um subgrupo das matrizes 2 × 2 com entradas complexas e determinante não nulo. Ele é definido por 1 0 i 0 0 1 0 i ,± . ± ,± , ± 0 1 0 −i −1 0 i 0 Basta tomar i 0 0 1 a= eb= . 0 −i −1 0 10.5.5. Grupos de ordem 9. Se existe a ∈ G tal que o(a) = 9, então G é cı́clico e G ∼ = Z/9Z. Caso isto não ocorra para todo a ∈ G − {1}, o(a) = 3. Seja b ∈ G − hai. Note que o subgrupo ha, bi = {1, a, a2 , b, b2 , ab, ab2 , a2 b, a2 b2 } de G tem ordem 9, portanto sendo igual ao próprio grupo G. Observe também que ba 6= 1, a, a2 , b, b2 . Assim, e pelo segundo teorema, ba = ab, logo G é abeliano. Neste caso G ∼ = Z/3Z × Z/3Z (exercı́cio: determine explicitamente o isomorfismo, como nos casos anteriores). 10.5.6. Grupos de ordem 10. Se existe a ∈ G tal que o(a) = 10, G é cı́clico eG∼ = Z/10Z. Caso contrário, como nos casos anteriores existem a, b ∈ G tais que o(a) = 5 e o(b) = 2 (verifique!). Pelo segundo teorema as únicas possibilidades para ba = as b são s = 1 ou 4. No primeiro caso, G é abeliano e G ∼ = Z/5Z × Z/2Z, mas este é isomorfo a Z/10Z, assim não consideramos este caso. No outro caso, G ∼ = D5 , o grupo diedral de ordem 10. 10.5.7. Grupos diedrais. Estes grupos têm ordem 2n, um elemento a de ordem n e outro elemento b de ordem 2 satisfazendo a ba = an−1 b. CAPı́TULO 11 Teoremas de Sylow 11.1. Represesentações de grupos Seja G um grupo finito e S um conjunto finito. Denotamos por Perm(S) o conjunto das permutações de S, i.e., das funções f : S → S bijetivas. Este conjunto forma um grupo com respeito à composição de funções. Uma representação de G por permutação é um homomorfismo de grupos ρ : G → Perm(S). Exemplo 11.1. Tomemos como S o próprio grupo G e consideremos para todo x ∈ G o automorfismo interno Ix de G definido por Ix (a) := xax−1 . Assim definimos a função ρ : G → Aut(G) dada por ρ(x) := Ix . Verifiquemos que esta função é um homomorfismo de grupos. Esta representação é chamada a representação de G por conjugação. De fato, dado a ∈ G temos ρ(xy)(a) = (xy)a(xy)−1 = xyay −1 x−1 = xIy (a)x−1 = Ix (Iy (a)) = (Ix ◦ Iy )(a). Outra representação com S = G é a translação ρ : G → Aut(G) dada por ρ(x)(a) := xa para todo a ∈ G. De fato, ρ(x) é um automorfismo de G (exercı́cio) e ρ(xy)(a) = xya = xρ(y)(a) = ρ(x)(ρ(y)(a)) = (ρ(x) ◦ ρ(y))(a). Esta representação de G é chamada representação por translação. Observe que neste último caso a função ρ é injetiva. De fato se ρ(x) = id, então xa = a para todo a ∈ G. Isto significa que x = 1. Como conseqüência deste resultado temos o teorema de Cayley. Teorema 11.2 (teorema de Cayley). Seja G um grupo de ordem n, então G é isomorfo a um subgrupo do grupo Sn das permutações de n elementos. Demonstração. Tome a representação ρ por translação em G e conclua que G∼ = ρ(G) com ρ(G) subgrupo de Sn . Exemplo 11.3. Seja S o conjunto de subgrupos de G e consideremos a função ρ : G → Perm(S) dada por ρ(x)(H) := xHx−1 . Observemos que ρ(x) é de fato uma bijeção em S (exercı́cio) e que ρ(xy)(H) = xyHy −1 x−1 = xρ(y)(H)x−1 = ρ(x)(ρ(y)(H)) = (ρ(x) ◦ ρ(y))(H). Observe que como #H = #xHx−1 , então podemos restringir a representação anterior ao conjunto dos subgrupos H de G com ordem fixada n. Exemplo 11.4. Seja H um subgrupo de G e S o conjunto das classes laterais a direita de H em G, i.e., S := {aH ; a ∈ G}. Consideremos a função ρ : G → Perm(G) dada por ρ(x)(aH) := xaH. De novo fica como exercı́cio verificar que ρ(x) é de fato uma permutação de S. Além disto ρ(xy)(aH) = xy(aH) = xρ(y)(aH) = ρ(x)(ρ(y)(aH)) = (ρ(x) ◦ ρ(y))(aH). 73 74 11. TEOREMAS DE SYLOW Dada uma representação por permutação ρ : G → Perm(S) definimos a órbita Oa de um elemento a ∈ S por Oa := {ρ(x)(a) ; x ∈ G}. O estabilizador de a é definido por E(a) := {x ∈ G ; ρ(x)(a) = a}. Observemos que E(a) é um subgrupo de G. De fato, 1 ∈ E(a), pois ρ(1) = id e portanto ρ(1)(a) = a, i.e., ρ(1) ∈ E(a). Se x, y ∈ E(a), então ρ(xy)(a) = ρ(x)(ρ(y)(a)) = ρ(x)(a) = a, i.e., xy ∈ E(a). Finalmente, ρ(x−1 ) = ρ(x)−1 , pois ρ é um homomorfismo. Portanto, ρ(x−1 )(a) = ρ(x)−1 (a) = a, i.e., x−1 ∈ E(a). Pelo teorema de Lagrange temos que #E(a) divide #G. É menos imediato que o mesmo ocorre com #Oa . Isto segue da proposição seguinte. Proposição 11.5. Existe uma bijeção ϕ : Oa → {C.L.D.} dada por ϕ(ρ(x)(a)) := xE(a), o conjunto do lado direito é o conjunto das classes laterais a direita de E(a) em G. Em particular (novamente pelo teorema de Lagrange), #Oa divide #G. Demonstração. Inicialmente, ϕ está bem definida pois se ρ(x)(a) = ρ(y)(a), então ρ(xy −1 )(a) = a, i.e., xy −1 ∈ E(a), i.e., xE(a) = yE(a). A função é injetiva uma vez que se ϕ(ρ(x)(a)) = ϕ(ρ(y)(a)), i.e., xE(a) = yE(a), então xy −1 ∈ E(a), logo ρ(xy −1 )(a) = a, i.e., ρ(x)(a) = ρ(y)(a). Finalmente, pela própria definição do conjunto do lado direito, ϕ é sobrejetiva. Dada uma representação ρ : G → Perm(S) definimos a seguinte relação de equivalência (verifique!) : a ∼ b se e somente se existe x ∈ G tal que ρ(x)(a) = b. Em particular, a classe de equivalência de a nada mais é que a sua órbita Oa . Além disto o conjunto S fica escrito como a união disjunta das órbitas Oa . Comecemos considerando o caso do exemplo 11.1. Neste caso Oa = {xax−1 ; x ∈ G} é o conjunto dos conjugados de G. Assim, Oa = {a} se e somente se a ∈ Z(G). Desta forma obtemos a equação das classes de conjugação X (11.1) #G = #Z(G) + #Oa . a∈Z(G) / Ainda neste exemplo, o estabilizador E(a) de a é chamado o centralizador de a dado por Z(a) = {x ∈ G ; xa = ax}. No caso do exemplo 11.3, a órbita de H é dada por OH = {xHx−1 ; x ∈ G} 11.2. OS TEOREMAS DE SYLOW 75 é chamado o conjunto dos conjugados de H e o estabilizador de H é chamado o normalizador de H em G denotado por NG (H) = {x ∈ G ; xHx−1 = H}. Observemos que H C G se e somente se NG (H) = G. Além disto da própria definição H C NG (H). O grupo NG (H) também se caracteriza como sendo o maior subgrupo de G no qual H é normal. De fato, se K ⊂ G for um subgrupo e H C K, então para todo x ∈ K temos xHx−1 = H, i.e., x ∈ NG (H), i.e., K ⊂ NG (H). 11.2. Os teoremas de Sylow Seja G um grupo finito e p um número primo. Suponhamos que p | #G, digamos #G = pn b, onde p - b. Teorema 11.6 (primeiro teorema de Sylow). Para todo 0 ≤ m ≤ n existe um subgrupo H de G de ordem pm . Definição 11.7. Um subgrupo de G de ordem pn é chamado um p-subgrupo de Sylow de G. Lema 11.8 (lema de Cauchy). Seja G um grupo abeliano e suponha que p | #G, então existe x ∈ G tal que o(x) = p. Observe que o primeiro teorema de Sylow generaliza o lema de Cauchy para grupos não necessariamente abelianos. Demonstração. A prova será por indução na ordem de G. Se #G = 1, por vacuidade nada há a fazer. Suponha que o resultado seja verdade para todo subgrupo de ordem menor que a ordem de G. Se #G = p nada há a fazer, o grupo é cı́clico e basta tomar um gerador. Suponhamos que |G| 6= p. Afirmamos que existe um subgrupo H de G tal que 1 < #H < #G. De fato, seja x ∈ H − {1}. Se hxi = 6 G, tome H = hyi. Caso hxi = G, tome H = hxp i. Se p | #H, então por hipótese de indução existe x ∈ H com o(x) = p, em particular x ∈ G. Caso p - #H, então p | #G/H e #G/H < #G. Novamente por hipótese de indução existe x ∈ G/H tal que o(x) = p. Consideremos o homomorfismo sobrejetivo ϕ : G G/H. Seja r = o(x). Então o(x) = p | r, digamos r = kp. Desta forma o(xk ) = p. demonstração do primeiro teorema de Sylow. Novamente a prova será por indução na ordem de G. Se #G = 1, nada há a fazer. Suponhamos que o resultado seja verdade para todo grupo de ordem menor que #G. Se existe um subgrupo próprio H de G tal que pm | #H, então por hipótese de indução temos que existe um subgrupo de H de ordem pm , em particular existe um subgrupo de G desta ordem. Suponhamos que não exista subgrupo próprio de G cuja ordem seja divisı́vel por pm . A equação das classes de conjugação afirma que X #G = #Z(G) + (G : E(a)). a∈Z(G) / Para todo a ∈ / Z(a) temos que (G : E(a)) = #Oa > 1, logo #E(a) < #G. Por hipótese pm - |E(a)|, assim p | (G : E(a)). Em particular, p | #Z(G). 76 11. TEOREMAS DE SYLOW Como Z(G) é abeliano, concluimos do lema de Cauchy que existe x ∈ Z(G) tal que o(x) = p. Note que como x ∈ Z(G), então hxi C G, portanto o grupo G/hxi tem ordem pn−1 b < #G. Por hipótese de indução existe K subgrupo de G/hxi tal que #K = pm−1 . Consideremos o homomorfismo canônico ϕ : G G/hxi. Então H = ϕ−1 (K) é um subgrupo de G de ordem pm . Lembremos que dado um grupo qualquer (não necessariamente finito) G e um número primo p, dizemos que G é um p-grupo se todo elemento de G tem ordem potência de p. Utilizaremos o primeiro teorema de Sylow para provar a seguinte proposição. Proposição 11.9. Um grupo finito G é um p-grupo se e somente se #G é potência de p. Demonstração. É claro que se #G é potência de p, então G é um p-grupo. Reciprocamente, se existisse um primo ` 6= p tal que ` | #G, então pelo primeiro teorema de Sylow, existe x ∈ G tal que o(x) = `, em particular G não é um p-grupo. Seja S o conjunto dos p-subgrupos de Sylow de G. Consideremos a representação por conjugação ρ : G → Perm(S) definida por ρ(x)(S) = xSx−1 . A parte mais importante do segundo teorema de Sylow afirma que esta representação é transitiva, i.e., S = OS = {xSx−1 ; x ∈ G}. Seja np := #S. Teorema 11.10 (segundo teorema de Sylow). (1) S = OS , para algum S ∈ S. (2) Se P ⊂ G é um p-subgrupo, então existe S ∈ S tal que P ⊂ S. (3) Se S ∈ S, então np = (G : NG (S)). Para provar este teorema precisamos do seguinte lema. Lema 11.11. Seja S ∈ S e P ⊂ G um p-subgrupo. Então P ∩ NG (S) = P ∩ S. Demonstração. Suponhamos que P ∩NG (S) ' P ∩S, seja x ∈ P ∩NG (S)−S. Como P é um p-grupo temos que o(x) = pr para algum r ≥ 1. Além disto S C NG (S), logo hxiS é um subgrupo de NG (S). Mais ainda, #hxiS = o(x)#S/#hxi ∩ S = pr+n /#hxi ∩ S. Observe que o denominador é < pr , pois x ∈ / S, o que é uma contradição uma vez que a ordem de hxiS supera a ordem de S. Demonstração do segundo teorema de Sylow. Seja C o conjunto dos subgrupos de G e consideremos a representação por conjugação ρ : G → Perm(C) definida por ρ(x)(H) = xHx−1 . Por definição a órbita OS (para S ∈ S) de S é o conjunto dos conjugados de S e #OS = (G : NG (S)). Provemos os 2 primeiros ı́tens. Denotemos OS = T . A restrição ϑ : P → Perm(T ) desta representação a um p-subgrupo P de G dá uma representação sobre o conjunto T dada por ϑ(x) = xaSa−1 x−1 , para aSa−1 ∈ T . Sejam O1 , · · · , Ok as órbitas desta representação. Assim cada Oi é a órbita de Si = yi Syi−1 com relação a ϑ. Lembre qie #Oi = (P : NG (Si ) ∩ P ). Pelo lema anterior (P : NG (Si ) ∩ P ) = (P : Si ∩ P ). Assim, #T = k X i=1 #Oi = k X i=1 (P : Si ∩ P ). 11.3. EXEMPLOS 77 Como #S = pn e S ⊂ NG (S), então p - #T = (G : NG (S)). Por outro lado, como P é um p-grupo finito, para todo i = 1, · · · , k, (P : Si ∩ P ) é potência de p. Mas isto ocorre se e somente se existe i tal que P = Si ∩ P , i.e., P ⊂ Si , isto prova (2). Para (1) note que T ⊂ S. Para a inclusão inversa, aplicando (2) a qualquer S 0 ∈ S temos que existe i tal que S 0 ⊂ Si , i.e., S 0 = Si = yi Syi−1 , i.e., S 0 ∈ T . Finalmente, para provar (3), por (1) temos que np = #T = (G : NG (S)) | b. Teorema 11.12 (terceiro teorema de Sylow). np | b e np ≡ 1 (mod p). Demonstração. A primeira afirmativa já foi provada no teorema anterior. Para a segunda, aplique a última equação para P = S obtendo (G : NG (S)) = k X (S : S ∩ Si ). i=1 Como S é um p-grupo o resultado é imediato. 11.3. Exemplos Determinemos o número de p-subgrupos de Sylow para grupos de certas ordens. Observe que np = 1 se e somente se existe um único p-subgrupo de Sylow normal em G. Exemplo 11.13. Seja G um grupo de ordem 56 = 23 7. Pelo terceiro teorema de Sylow, n7 | 8 e n7 ≡ 1 (mod 7). Então n7 = 1 ou 8. No primeiro caso temos um único 7-subgrupo de Sylow H7 normal em G. No segundo caso, cada 7-subgrupo de Sylow de G produz 6 elementos de ordem 7. Assim terı́amos 48 elementos de ordem 7. Portanto, os demais 8 elementos constituem o único 2-subgrupo de Sylow de G. Isto não poderia ser visto diretamente pelo terceiro teorema de Sylow, pois n2 | 7 e n2 ≡ 1 (mod 2), logo a princı́pio não poderı́amos excluir a possibilidade n2 = 7. Neste caso o 2-subgrupo de Sylow H2 de G é normal em G. Exemplo 11.14. Seja G um grupo de ordem 22 .7.13. Aplicando o terceiro teorema de Sylow obtemos n13 | 22 .7 e n13 ≡ 1 (mod 13). Portanto temos duas possibilidades n13 = 1 e n13 = 14. Vamos excluir a última. Seja H13 um 13subgrupo de Sylow de G. Aplicando o terceiro teorema de Sylow temos n7 | 22 .13 e n7 ≡ 1 (mod 7), logo n7 = 1, ou seja há um único 7-subgrupo de Sylow H7 de G (portanto normal em G). A fortiori, H13 H7 é um subgrupo de G. Aplicando o terceiro teorema de Sylow a este grupo obtemos n13 = (G : NG (H13 )) ≤ (G : H13 H7 ) = 4. Assim, n13 = 1. CAPı́TULO 12 Grupos solúveis 12.1. Teorema de Jordan-Hölder Definição 12.1. Seja G um grupo. Uma série subnormal de G é uma seqüência de grupos G = G0 B G1 B G2 B · · · B Gn = {1}, onde cada Gi é normal no subgrupo anterior Gi−1 . Denotamos por Gn−1 G 0 G1 , ,··· , Q := G1 G2 Gn o conjunto dos quocientes de da série cuja cardinalidade l é dita o comprimento da série. Um refinamente de uma série subnormal é uma outra série subnormal obtida a partir desta inserindo subgrupos normais, por exemplo, Gi B Hi B Gi+1 . Um refinamento é dito próprio, se o comprimento da nova série for superior ao da original. Uma série subnormal é dita uma série de composição, se não admite refinamento próprio. Duas séries subnormais são distas equivalentes se existe uma bijeção entre o conjunto dos quocientes das duas séries. O objetivo desta seção é mostrar que todas as séries de composição de um grupo dado são equivalentes (Teorema de Jordan-Hölder). Definição 12.2. Um grupo G é dito simples, se seus únicos subgrupos normais são {1} e G. Por exemplo todo grupo de ordem prima é simples. Observe que uma série subnormal é uma série de composição se e somente se cada quociente Gi /Gi+1 é um grupo simples. Nem todo grupo admite uma série de composição. Por exemplo, se G = Z e os subgrupos Gi = pi Z para i ≥ 1. A série Z B pZ B {0} pode ser infinitamente refinada inserindo sucessivamente os grupos pi Z para todo i ≥ 2. Lema 12.3. Seja G um grupo finito de ordem maior que 1, então existe um subgrupo normal próprio H de G que é maximal para esta propriedade, i.e., para todo subgrupo K normal próprio de G temos que K ⊂ H. Demonstração. É claro que {1} é um subgrupo próprio normal de G. Se {1} for maximal no sentido acima, nada há a fazer. Caso contrário, existe H1 ' {1} que é um subgrupo próprio normal em G. Se H1 for maximal, acabou, senão prosseguimos. Não podemos prosseguir indefinidamente pois G é finito. 79 80 12. GRUPOS SOLÚVEIS Proposição 12.4. Todo grupo finito admite uma série de composição. Demonstração. Pelo lema anterior, existe um subgrupo maximal normal próprio G1 de G. Similarmente, aplicando o lema sucessivamente a G1 , G2 , etc, obtemos que cada Gi possui um subgrupo maximal normal próprio Gi+1 e uma série subnormal G = G0 B G1 B G2 B · · · , que não pode ser infinita, pois G é finito e as ordens dos grupos Gi ’s são estritamente decrescentes. Logo existe n ≥ 1 tal que Gn = {1}. Além disto, pela maximalidade dos grupos Gi+1 ’s em Gi , concluimos que todos os quocientes Gi /Gi+1 são grupos simples. Isto equivale a dizer que a série é uma série de composição. Exemplo 12.5. Consideremos a seguinte série subnormal Z B h5i B h10i B {0}. G= 30Z Esta série é na verdade uma série de composição, pois o conjunto dos quocientes é Z Z Z , , , 5Z 2Z 3Z ou seja, cada quociente é cı́clico de ordem prima, portanto simples. Ela é refinamento das séries subnormais G B h5i B {0}, e G B h10i B {0}. Além disto esta série é equivalente às seguintes séries de composição Z B h2i B h6i B {0} e G= 30Z Z B h2i B h10i B {0}. G= 30Z Lema 12.6 (lema de Zassenhaus). Sejam H, H1 , K, K1 subgrupos de um grupo G tais que H1 C H e K1 C K. Então (1) H1 (H ∩ K1 ) C H1 (H ∩ K) e K1 (H1 ∩ K) C K1 (H ∩ K). (2) H1 (H ∩ K) ∼ K1 (H ∩ K) . = H1 (H ∩ K1 ) K1 (H1 ∩ K) Demonstração. (1) Mostremos o primeiro fato o segundo é análogo. Queremos mostrar que dados x ∈ H1 e y ∈ H ∩ K temos xy(H1 (H ∩ K1 ))y −1 x−1 = H1 (H ∩ K1 ). De fato, xy(H1 (H ∩ K1 ))y −1 x−1 = x(yH1 y −1 )(y(H ∩ K1 )y −1 )x−1 = x(H1 (H ∩ K1 )x−1 , onde na primeira identidade usamos que y ∈ H e H1 C H e na segunda que y ∈ H ∩ K e K1 C K. Mas x ∈ H1 , portanto x(H1 (H ∩ K1 )x−1 = H1 (H ∩ K1 )x−1 . Como H1 C H, então H1 (H ∩ K1 ) = (H ∩ K1 )H1 12.2. GRUPOS SOLÚVEIS 81 e este é um subgrupo de G. Assim, x(H1 (H ∩ K1 )x−1 = ((H ∩ K1 )H1 )x−1 = (H ∩ K1 )H1 = H1 (H ∩ K1 ), onde novamente usamos que x−1 ∈ H1 . (2) Fica como exercı́cio provar o seguinte fato: se A e B são grupos e A C AB, então (A/B)A = B/(A ∩ B). Tomemos A = H1 (H ∩ K1 ) e B = H ∩ K. Neste caso AB = H1 (H ∩ K) e A ∩ B = (H ∩ K1 )(H1 ∩ K). Assim, pelo fato, H1 (H ∩ K) ∼ H ∩K . = H1 (H ∩ K1 ) (H ∩ K1 )(H1 ∩ K) Similarmente, o outro quociente procurado também é isomorfo a este último grupo. Teorema 12.7 (teorema de Schreier). Duas séries subnormais de um grupo G possuem refinamentos equivalentes. Demonstração. Consideremos as seguintes séries subnormais G = G0 B G1 B G2 B · · · B Gn = {0} e G = H0 B H1 B H2 B · · · B Hm = {0}. Refinemos a primeira utilizando os grupos da segunda da seguinte forma Gi = Gi+1 (Gi ∩ H0 ) B Gi+1 (Gi ∩ H1 ) B · · · Gi+1 (Gi ∩ Hm ) = Gi+1 , o fato de cada passada ser normal segue do ı́tem (1) do lema de Zassenhaus. Da mesma forma refinamos a segunda utilizando os grupos da primeira Hj = Hj+1 (G0 ∩ Hj ) B Hj+1 (G1 ∩ Hj ) B · · · B Hj+1 (Gn ∩ Hj ) = Hj+1 . A equivalência entre estas séries segue o ı́tem (2) do lema de Zassenhaus. Corolário 12.8 (teorema de Jordan-Hölder). Duas séries de composição de um grupo dado são equivalentes. Demonstração. Segue imediatamente do teorema de Schreier. 12.2. Grupos solúveis Definição 12.9. Seja G um grupo. Denotamos por G0 = [G, G] o subgrupo dos comutadores e definimos indutivamente G(0) = G, G(i+1) = (G(i) )0 . Teorema 12.10. Seja G um grupo. As seguintes condições são equivalentes (i) G possui uma série subnormal com quocientes abelianos. (ii) Existe n tal que G(n) = {1}. Se além disto G for finito, então estas condições equivalem a (iii) O grupo G admite uma série de composição com quocientes abelianos (logo cı́clicos de ordem prima). Definição 12.11. Um grupo satisfazendo às condições equivalentes acima é dito um grupo solúvel. 82 12. GRUPOS SOLÚVEIS Demonstração. Suponha (i). Pela observação 10.8, se H C G for tal que G/H é abeliano, então H ⊃ G0 . Assim, como G0 /G1 é abeliano, G1 ⊃ G0 = G(1) . Em seguida, como G1 /G2 é abeliano, então G2 ⊃ (G1 )0 = G(2) . Assim sucessivamente, Gi ⊃ G(i) . Donde, G(n) = {1}. Suponha (ii). Basta notar que por definição a série subnormal G = G(0) B G(1) B G(2) B · · · B G(n) = {1} tem quocientes abelianos. Suponha agora que G seja um grupo finito. No próximo capı́tulo mostraremos que todo grupo abeliano finito pode ser escrito como produto de grupos cı́clicos da forma Z/nZ para n ≥ 1 inteiro. Observemos que as duas formulações de (iii) de fato equivalem-se. Já observamos antes que todo grupo cı́clico de ordem prima é simples. Reciprocamente, se um grupo abeliano finito é simples, pelo que foi dito anteriormente, ele só pode ser um grupo cı́clico da forma Z/nZ para algum inteiro n ≥ 1, já que se tivesse mais de um fator cı́clico, por exemplo, Z/mZ × Z/nZ, então {0} × Z/nZ seria um subgrupo normal não trivial. Mas pelo teorema chinês dos restos, todo grupo cı́clico fatora-se como produto de grupos cı́clicos Z/pr Z, onde p é primo e r ≥ 1 inteiro. Assim, ficamos reduzidos ao caso em que G = Z/pr Z. Mas se r > 1, este grupo admite como subgrupo normal não trivial o grupo pZ/pr Z, logo não poderia ser simples. Se G for um grupo finito é claro que (iii) implica (i). Por outro lado qualquer refinamento de uma série subnormal com quocientes abelianos também tem quocientes abelianos. Além disto, já foi visto anteriormente que toda série subnormal de um grupo finito admite uma série de composição. Segue imediatamente do teorema que grupos abelianos são solúveis. Para ver que p-grupos finitos (onde p denota um número primo) são também solúveis precisaremos da seguinte proposição. Proposição 12.12. Seja G um grupo de ordem pm e H um subgrupo de G de ordem pr , onde r < m. Então (1) existe um subgrupo K de G de ordem pr+1 contendo H. (2) Todo subgrupo L de G de ordem pr+1 contendo H satisfaz : H C L. Em particular, H ( NG (H). Demonstração. Provemos o seguinte resultado mais forte que (1) por indução na ordem de G: existe um subgrupo H de G de ordem pr+1 tal que H C K. Se #G = 1, nada há a fazer. Senão, suponhamos o resultado seja verdade para todo grupo de ordem menor que #G. Como Z(G) 6= {1}, utilizando o lema de Cauchy (cf. capı́tulo sobre teoremas de Sylow) escolhemos um elemento x ∈ Z(G) de ordem p. Note que hxi C G e x ∈ NG (H). Se x ∈ / H, então, o subgrupo K = Hhxi satisfaz às condições desejadas, pois hxi ∩ H = {1}. Caso x ∈ H, o grupo G/hxi tem ordem estritamente menor que G, logo por hipótese de indução existe um subgrupo K 0 de G/hxi tal que #K 0 = pr . Seja K a pré-imagem de K 0 pelo homomorfismo canônico ϕ : G → G/hxi. O subgrupo K 0 de G satisfaz às condições da afirmativa mais forte. Finalmente, o segundo ı́tem segue do primeiro. Corolário 12.13. Seja G um grupo de ordem pm (onde p denota um número primo). Então existem subgrupos H0 = {1}, H2 , · · · , Hm = G tais que Hi C Hi+1 e tais que Hi+1 /Hi é cı́clico de ordem p, para i = 0, · · · , m − 1. 12.2. GRUPOS SOLÚVEIS 83 Demonstração. Aplique a proposição a H0 = {1} obtendo H1 e ordem p, em seguida aplique-a novamente a H1 e assim sucessivamente. Observação 12.14. Segue do teorema 12.10 e do corolário anterior que todo p-grupo finito é solúvel. Proposição 12.15. Seja G um grupo e H um subgrupo de G. (1) Se G for solúvel, então H é solúvel. (2) Se H C G então G é solúvel se e somente se H e G/H são solúveis. Demonstração. (1) Suponha que G seja solúvel. Note que para todo i, G(i) ⊃ H . Portanto, H (n) = {1} e H é solúvel. (2) Seja ϕ : G → G/H o homomorfismo quociente. Observe que ϕ(G0 ) = ϕ(G)0 = (G/H)0 . Suponha que G seja solúvel. Por (1) H é solúvel. Além disto, indutivamente, para todo i, ϕ(G(i) ) = (G/H)(i) , a fortiori, (G/H)(n) = {1}, i.e., G/H é solúvel. Reciprocamente, suponha que H e G/H sejam solúveis. Isto significa que existe n tal que H (n) = {1} e m tal que (G/H)(m) = {1}. Da última igualdade segue que G(m) ⊂ ker(ϕ) = H. Aplicando indutivamente esta derradeira igualdade obtemos G(m+j) ⊂ H (j) . Portanto G(m+n) ⊂ H (n) = {1}, i.e., G é solúvel. (i) CAPı́TULO 13 Grupos abelianos finitamente gerados 13.1. Módulos sobre anéis Seja R um anel comutativo com unidade. Um R-módulo M é um grupo aditivo munido de uma função R × M → M tal que a(x + y) = ax + ay e (a + b)x = ax + bx, para a, b ∈ R e x, y ∈ M . Quando R é um corpo (como os reais) recuperamos a noção de espaço vetorial. Dizemos que um suconjunto Pn S de M gera M se para todo x ∈ M existem x1 , · · · , xn ∈ S tal que x = i=1 ai xi , onde ai ∈ R para i = 1, · · · , n. O conjunto S é dito o conjunto de geradores de M . O módulo M é dito finitamente gerado, se S for finito. Dados x1 , · · · , sn ∈ M dizemos Pnque eles são R-linearmente independentes se para qualquer combinação linear i=1 ai xi = 0 com ai ∈ R tivermos ai = 0 para i = 1, · · · , n. O módulo M é dito um R módulo livre se possui um conjunto de geradores linearmente independentes. Novamente, quando R é um corpo, um conjunto de geradores linearmente independentes nada mais é que a base de um espaço vetorial. Quando o conjunto de geradores S é finito e estes são R-linearmente independentes, da mesma forma que na álgebra linear podemos mostrar que o número de elementos do conjunto gerador não depende da particular escolha do conjunto. Este número é chamado o posto do módulo (que corresponde à noção de dimensão de espaço vetorial).. Observemos que a noção de Z-módulo equivale a de grupo abeliano. De fato, todo Z-módulo por definição é um grupo abeliano. Reciprocamente, todo grupo abeliano G admite uma estrutura de Z-módulo. De fato, denotando G aditivamente, podemos considerar a soma de n > 0 vezes um elemento x de G que é o elemento nx ∈ G. Para n = −m < 0, nx nada mais é que m vezes o elemento −x, portanto também um elemento de G. Ao contrário de espaços vetoriais nem todo Z-módulo livre é finito. De fato, para todo n ≥ 1, Z/nZ é um Z-módulo livre de posto 1 gerado por 1. Na verdade isto corresponde a noção de grupo abeliano de torção. Um grupo abeliano G é de torção se e somente todo elemento de G é de ordem finita. Veremos que o teorema em questão diz inicialmente que todo grupo abeliano finitamente gerado se quebra em um pedaço de torção que descreveremos completamente e uma parte livre que é isomorfa a r cópias de Z, onde r é exatamente o posto do grupo como Z-módulo. Similarmente ao caso de espaços vetoriais temos noções de submódulos e de módulos quocientes. Seja M um R-módulo. Um subconjunto N de M é dito um R-submódulo de N se for um sugrupo e se para todo a ∈ R e x ∈ N , ax ∈ N . Para todo x ∈ M definimos x := x + N := {x + v | v ∈ N } chamada a classe de x com respeito a N . Como conjunto o módulo quociente M/N é definido como sendo {x | x ∈ M }. Definimos uma estrutura de R-módulo em M/N da maneira usual. A 85 86 13. GRUPOS ABELIANOS FINITAMENTE GERADOS soma é definida por x ⊕ y := x + y e a multiplicação por escalar por ax := ax, para todo a ∈ R. Fica como exercı́cio verificar que estas operações estão efetivamente bem definidas. Dados V e W R-módulos uma função ϕ : V → W é dito um homomorfismo de R-módulos se for um homomorfismo de grupos e se para todo a ∈ R e x ∈ V temos ϕ(ax) = aϕ(x). Da mesma forma definimos o núcleo de ϕ por N (ϕ) := {x ∈ V | ϕ(x) = 0}. Já sabemos que N (ϕ) é um subgrupo de V . Além disto ele é um R-submódulo, pois para todo a ∈ R e x ∈ N (ϕ) temos ϕ(ax) = aϕ(x) = 0, i.e., ax ∈ N (ϕ). A imagem ϕ(V ) de φ é um R-submódulo de W (exercı́cio). Teorema 13.1 (teorema dos homomorfismos). Seja ϕ : V → W um homomorfismo de R-módulos. Então ϕ induz um isomorfismo de R-módulos Φ : V /N (ϕ) → ϕ(V ) dado por Φ(x) := ϕ(x). Demonstração. Já sabemos que Φ é isomorfismo de grupos. Basta verificar que é um homomorfismo de R-módulos. De fato, dado a ∈ R temos que Φ(ax) = Φ(ax) = ϕ(ax) = aϕ(x) = aΦ(x). Para todo n ≥ 1 o produto cartesiano Rn é naturalmente um R-módulo somando as coordenadas e multiplicando as coordenadas por um escalar em R. Um homorfismo de R-módulos ϕ : Rm → Rn é determinado pela multiplicação de um vetor por uma matriz n × m com coordenadas em R. De fato, tomemos como conjunto gerador linearmente independente em cada um dos R-módulos a base canônica, então da mesma forma que na álgebra linear, se e1 , · · · , em é uma Pbase de Rm e f1 , · · · , fn é uma base de Rn , então ϕ fica determinado por ϕ(ei ) = j aij fj , onde aij ∈ R. Definimos o grupo GLn (R) como o subgrupo das matrizes quadradas de ordem n com entradas em R. Observemos que este equivale ao grupo das matrizes cujo determinante é um elemento inversı́vel em R. De fato, seja A ∈ GLn (R). Então existe B ∈ Mn (R) tal que AB = Id, em particular det(A) det(B) = 1, i.e., det(A) ∈ R∗ . Reciprocamente, se det(A) = δ ∈ R∗ e Adj(A) denota a adjunta de A (que é construı́da como na álgebra linear, pois as operações elemetares por linhas são precisamente as mesmas tomando cuidado de escolher os escalares pertencendo a um anel R ao invés de um corpo). Assim a regra de Cramer nos informa que δ Id = A Adj(A). A fortiori, Id = A(δ −1 Adj(A)), assim δ −1 Ajd(A) é a inversa de A (observe que podemos tomar δ −1 , pois δ é inversı́vel em R). 13.2. Diagonalização de matrizes Teorema 13.2. Seja A ∈ Mn×m (Z) então existem matrizes Q ∈ GLn (Z) e P ∈ GLm (Z) tais que A0 = QAP −1 é diagonal da seguinte forma: d1 0 · · · 0 0 d 2 · · · 0 0 . . . , 0 0 · · · dr 0 0 onde d1 | d2 | · · · | dr . Demonstração. As matrizes Q e P provêem (como na álgebra linear) da multiplicação de matrizes elementares que correspondem as operações elementares por linhas e por colunas. 13.3. GERADORES E RELAÇÕES PARA MÓDULOS 87 Etapa 1. Trocando linhas e colunas (e eventualmente multiplicando uma linha ou coluna por -1) podemos supor que a11 ≥ 0 é uma entrada de menor valor absoluto (claro que pode haver outra entrada com o mesmo valor absoluto). Etapa 2. Transformamos os demais elementos da primeira coluna em 0 da seguinte forma. Para todo i > 1 dividimos ai1 = a11 q + r, onde 0 ≤ r < a11 . Substituı́mos a i-ésima linha por menos ela mais q vezes a primeira, ou seja trocamos ai1 por r. Se r = 0 nada mais precisamos fazer. Senão permutamos levando r para a primeira posição (1,1) e retornamos à etapa anterior. Em um número finito de passos obteremos r = 0. Repetimos o argumento para as demais entradas da linha. Similarmente, repetimos o argumento para colunas e zeramos o restante da primeira linha. Etapa 3. Seja B a matriz restante eliminando as primeiras linha e coluna. Se existe uma entrada b de B que não seja divisı́vel por a11 , somamos a coluna correspondente com a primeira coluna e retornamos à etapa 2. Após um número finito de passos todos os elementos de B são divisı́veis por a11 e aplicamos as 3 etapas a B. Note que na demonstração anterior além das operações elementares por linhas que valem para qualquer anel, utilizamos tão somente o algoritmo da divisão para os inteiros. Isto permite-nos generalizar o resultado da seguinte forma. Teorema 13.3. Seja R um domı́nio euclideano e A ∈ Mn×m (R). Então existem matrizes Q ∈ GLn (R) e P ∈ GLm (R) tais que A0 = QAP −1 é diagonal da forma indicada no teorema anterior. Notemos que este processo se aplica particularmente à matriz de um homomorfismo de R-módulos ϕ : Rm → Rn . 13.3. Geradores e relações para módulos Seja ϕ : Rn → Rm um homomorfismo de R-módulos cuja matriz na base canônica é A ∈ Mm×n (R). A base canônica de Rn é chamado o conjunto de geradores e o núcleo N (ϕ) de ϕ é dito o conjunto de relações. A imagem de ϕ é dada por multiplicação por A, assim denotamos ϕ(Rn ) := ARn . O conúcleo de ϕ é definido por Rm /ARn . Neste caso dizemos que a matriz A presenta o conúcleo de ϕ, ou em outras palavras, A é a matriz de presentação do conúcleo de ϕ. Mostraremos agora que todo R-módulo finitamente gerado V pode ser presentado por alguma matriz. Inicialmente observemos que se v1 , · · · , vn é um conjunto de geradores de V então temos um homomorfismo sobrejetivo canônico de R-módulos ϕ : Rn → V dado por ϕ(ei ) =P vi , onde e1 , · · · , en é a base canônica de n Rn . De fato, para todo v ∈ V temos v = i=1 ai vi com a1 , · · · , an ∈ R. Portanto, V = ARn . Seja W = N (ϕ). Mostraremos em seguida que W é também um Rmódulo finitamente gerado. Neste caso, digamos que seja gerado por w1 , · · · , wm , temos também um homomorfismo sobrejetivo ψ : Rm → W de R-módulos e o W = BRm . Pelo teorema dos homomorfismos, V ∼ = Rn /W = Rn /BRm , assim a matriz B presenta V . A idéia do teorema será diagonalizar a matriz B como na seção anterior e obter daı́ a decomposição do módulo. Lema 13.4. Seja ϕ : V → W um homomorfismo de R-módulos. (1) Se ker(ϕ) e ϕ(V ) são finitamente gerados, então V também é finitamente gerado. Se V é finitamente gerado e ϕ é sobrejetivo, então W é finitamente gerado. 88 13. GRUPOS ABELIANOS FINITAMENTE GERADOS (2) Seja W um R-submódulo de V . Se W e V /W são finitamente gerados, então V também é finitamente gerado. Se V é finitamente gerado, então V /W é finitamente gerado. Demonstração. (1) Seja u1 , · · · , uk um conjunto de geradores de ker(ϕ) e w1 , · · · , wm um conjunto de geradores de W . Para todo i = 1, · · · , m seja vi ∈ V tal que ϕ(vi ) = wi . Afirmamos que (u1 , · · · , uk ; v1 , · · · , vm ) geram V . De P P fato, dado v ∈ V temos ϕ(v) = i ai wi com ai ∈ R para i = 1, · · · , P m. Seja v 0 = i ai vi ∈ V . Então ϕ(v 0 ) = ϕ(v), i.e., v 0 − v ∈ ker(ϕ), i.e., v 0 − v = j bj uj para bj ∈ R para todo j = 1, · · · , k. Para a segunda parte, se v1 , · · · , vnPgeram V , como todoP w∈W é da forma w = ϕ(v), para algum v ∈ V , então w = i ai ϕ(vi ), onde v = i ai vi , e ϕ(v1 ), · · · , ϕ(vn ) forma um conjunto de geradores de W . (2) Segue de (1) aplicado ao homomorfismo quociente canônico ϕ : V → V /W . Proposição 13.5. Seja V um R-módulo. As seguintes condições são equivalentes: (1) Todo R-submódulo W de V é finitamente gerado. (2) Não existe seqüência estritamente crescente de R-submódulos de V : W1 W2 · · · Demonstração. Suponha que a condição (2) seja satisfeita e que W 6= 0. Seja w1 ∈ W − {0}. Se w1 gera W acabou. Senão seja w2 ∈ W − Rw1 . Se Rw1 + Rw2 = W , acabou, w1 e w2 geram W . Senão seja w3 ∈ W − (RW1 + Rw2 ). Prosseguindo desta forma o conjunto de R-módulos Wi = Rw1 +. . .+Rwi é estritamente crescente. Por hipótese existe k tal que Wk = W , em particular w1 , · · · , wk geram W . Reciprocamente suponha (1). S Seja W1 ⊂ W2 ⊂ · · · uma seqüência de Rsubmódulos de V . A união U = i Wi também é um R-submódulo de V (exercı́cio). Por hipótese U é finitamente gerado, digamos por u1 , · · · , un . Seja j o maior ı́ndice tal que ui ∈ Wj para todo i. Logo Wj ⊂ U ⊂ Wj , i.e., U = Wj e a seqüência estaciona. Definição 13.6. Um anel R tal que todo módulo satisfaça as condições anteriores é chamado um anel noetheriano. Proposição 13.7. Seja R um anel noetheriano e V um R-módulo finitamente gerado. Então todo submódulo W de V também é finitamente gerado. Demonstração. Observemos inicialmente que basta provar a proposição no caso em que V = Rn . De fato, como V é finitamente gerado, então existe um homomorfismo sobrejetivo ϕ : Rn → V . Seja W ⊂ V um submódulo. Então ϕ−1 (W ) = W 0 é um submódulo de Rn , por hipótese é finitamente gerado. Pelo lema anterior concluimos que W também é finitamente gerado. Provemos por indução em n. Para n = 1 isto segue da proposição anterior. Consideremos o homomorfismo de projeção ϕ : Rn → Rn−1 dado por ϕ((a1 , · · · , an )) = (a1 , · · · , an−1 ). O seu núcleo constitui-se dos vetores da forma (0, · · · , 0, an ). Seja W um submódulo de Rn e seja ψ a restrição de ϕ a W , digamos ψ : W → Rn−1 . Por hipótese de indução ψ(W ) é finitamente gerado. Além disto, ker(ψ) = ker(ϕ) ∩ W é um submódulo de ker(ϕ) ∼ = R, portanto também é finitamente gerado. Assim, o resultado segue da proposição anterior. 13.4. O TEOREMA DE ESTRUTURA 89 13.4. O teorema de estrutura Já fizemos tudo que era necessário para obter nosso resultado principal neste capı́tulo. Antes só mais um pouco de notação. Sejam W1 , · · · , Wn submódulos de um R-módulo V . Definimos W1 +. . .+Wn := {w1 +. . .+wn | wi ∈ Wi , i = 1, · · · , n}. Fica como exercı́cio verificar que W1 + . . . + Wn é um R-submódulo de V . Dizemos P que esta soma é direta de para qualquer relação linear i ai wi = 0, com ai ∈ R, temos ai = 0 para todo i. Neste caso escrevemos W1 ⊕ . . . ⊕ Wn . Teorema 13.8. (teorema de estrutura de grupos abelianos finitamente gerados) Seja G um grupo abeliano finitamente gerado. Então G∼ = (Z/d1 Z) ⊕ . . . ⊕ (Z/dk Z) ⊕ Zr , onde d1 | d2 | · · · | dr são inteiros positivos, r é o posto de G como Z-módulo e Gtor = (Z/d1 Z) ⊕ . . . ⊕ (Z/dk Z) é o subgrupo de torção de G, i.e., o conjunto dos elementos de ordem finita. Demonstração. Já vimos anteriormente que G é presentado por uma matriz A ∈ Mn×m (Z), i.e., G = Rn /ARm e que tal matriz pode ser diagonalizada com a propriedade acima para suas entradas d1 , · · · , dk . As relações do grupo s são dadas por di vi = 0 para i = 1, · · · , k para um conjunto de geradores v1 , · · · , vn , Seja L o submódulo gerado por vk+1 , · · · , vn . Como não há relações entre estes vetores vemos que L é um Z-módulo livre de posto n − k, i.e., L ∼ = Zn−k . Afirmamos que G = C1 ⊕ . . . ⊕ Ck ⊕ L, onde Ci = hvi i ∼ = Z/di Z. É claro, pela presentação de G, que estes submódulos geram G. Ou seja, G é igual à soma destes. Queremos mostrar que a soma é direta. De fato, se houvesse uma relação z1 + . . . + zk + w = 0, com zi ∈ Ci e w ∈ L, então podemos reescrê-la da forma k X i=i ri vi + n X ri vi = 0, i=k+1 onde 0 ≤ ri < di para i = 1, · · · , k e ri ∈ Z para i = k + 1, · · · , n. Como não há relação envolvendo os últimos n − k vetores concluimos que ri = 0 para i = k + 1, · · · , n. Além disto pelas relações acima a única possibilidade para que para os demais di | ri é ri = 0 para cada i. Portanto, não há relações entre os módulos acima. Lembremos que no processo de diagonalização das matrizes tudo funcionava bem para qualquer domı́nio euclideano. Assim no teorema acima podemos substituir a noção de grupo abeliano finitamtente gerado pela noção de R-módulo finitamente gerado sobre um domı́nio euclideano R. 13.4.1. Um teorema de Mordell. Grupos abelianos finitamente gerados surgem naturalmente na aritmética. Uma curva elı́tica sobre os complexos pode ser pensada como o conjunto de pontos em C2 que são soluções de uma equação da forma y 2 = x3 + ax + b, 90 13. GRUPOS ABELIANOS FINITAMENTE GERADOS onde x3 + ax + b não admite raı́zes múltiplas e a priori estamos supondo a, b ∈ C. Ocorre que existe uma estrutura de grupo abeliano na curva elı́tica que pode ser definida geometricamente por meio de interseções com retas. Se considerarmos o caso em que a, b ∈ Q, ou seja uma curva elı́tica definida sobre os racionais, existe um célebre teorema devido a Mordell que afirma que o conjunto de soluções (x0 , y0 ) ∈ Q2 da equação é um grupo abeliano finitamente gerado, digamos E(Q)tor ⊕ Zr . O inteiro (misterioso) r é chamado o posto da curva elı́tica. Não se sabe por exemplo se é possı́vel existir curvas elı́ticas com posto arbitrariamente grande, o recorde é 24. A este objeto (a curva elı́tica) está associado a uma função de natureza analı́tica chamada a L-série de Hasse-Weil da curva elı́tica. A famosa conjectura de Birch e Swinnerton-Dyer afirma que a ordem de anulamento desta função em s = 1 é exatamente o posto. Ela surgiu a partir de evidências computacionais. De outro lado podemos nos perguntar o que é conhecido sobre o grupo de torção. A resposta é tudo. Um belo e profundo resultado devido a Mazur mostra que existem exatamente 16 grupos abelianos que podem ser grupos de torção de curvas elı́ticas sobre os racioanis e que cada um desses grupos efetivamente ocorre. Para mais informações sobre curva elı́ticas e o teorema de Mordell ver [Sil]. Para o teorema de Mazur ver [Ma]. Parte 3 Anéis CAPı́TULO 14 Anéis de polinômios 14.1. Algoritmo da divisão Seja K um corpo. Um polinômio definido sobre K é uma expressão da forma f (x) = an xn + . . . + a1 x + a0 , onde a0 , · · · , an ∈ K. Identificamos f (x) a um vetor (a0 , · · · , an , 0, · · · , 0, · · · ). Se f 6= 0 e n ≥ 0 for o maior inteiro tal que an 6= 0, dizemos então que n é o grau de f . O conjunto de todos os polinômios definidos sobre K é denotado por K[x]. Seja g(x) = bm xm + . . . + b1 x + b0 . Suponhamos que n ≥ m. Definimos a soma de f, g ∈ K[x] por (f + g)(x) := (an + bn )xn + . . . + (a1 + b1 )x + a0 + b0 , onde bj = 0 para todo j > m. Se f + g 6= 0, então grau(f + g) ≤ max{grau(f ), grau(g)}. Note que se f = x3 +x+1 e g = −x3 +x2 −2, então grau(f +g) = 2 < 3. Definimos o produto de f e g por X (f g)(x) := cn+m xn+m + . . . + c1 x + c0 , onde ci = aj bl . j+l=i Assim, se f, g 6= 0, grau(f g) = grau(f ) + grau(g). Afirmamos que K[x] é um domı́nio de integridade. Observemos inicialmente que K[x] é um espaço vetorial com a operação de multiplicação por escalar sendo a multiplicação por um polinômio constante de grau zero. Verifique que de fato isto faz de K[x] um espaço vetorial. Em particular, temos as propriedades aditivas de K[x] como anel. A associatividade do produto é provada da seguinte forma. Sejam f, g ∈ K[x]. Pr Seja h(x) = i=0 ci xi . Então fg = n+m X di xi , onde di = i=0 X aj bl , j+l=i logo (f g)h = n+m+r X ei xi , onde ei = i=0 X X aα bβ cl j+l=i α+β=j = X α+β+l=i 93 aα bβ cl . 94 14. ANÉIS DE POLINÔMIOS Por outro lado, gh = m+r X X = Ai xi , onde Ai = i=0 bj cl , j+l=i logo f (gh) = n+m+r X X Bi xi , onde Bi = i=0 X aα bβ cl α+l=i β+j=l X = aα bβ cl . α+β+l=i A comutatividade do produto segue da mesma propriedade para os elementos de K. O elemento neutro do produto é o polinômio constante f = 1. Fica como exercı́cio verificar que a soma distribui em relação ao produto, i.e., f (g + h) = f h + gh. Sejam f, g ∈ K[x] tais que f g = 0, mas f 6= 0 de grau n. Provaremos agora que isto implica em g = 0. De fato, começando pelo coeficiente de xn+m temos que an bm = 0, logo bm = 0. Em seguida, para o coeficiente de xn+m−1 temos an bm−1 + an−1 bm = an bm−1 = 0, logo bm−1 = 0. Para o coeficiente de xn+m−2 temos an bm−2 + an−1 bm−1 + an−2 bm = an bm−2 = 0, logo bm−2 = 0. Assim sucessivamente, todos os coeficientes de g são nulos. Portanto, g = 0. Dizemos que f ∈ K[x] é inversı́vel se existe g ∈ K[x] tal que f g = 1. Note que neste caso, o lado esquerdo da equação tem grau n + m e o lado direito tem grau 0, logo n = m = 0 e f, g ∈ K ∗ = K \ {0}, pois K é um corpo. Teorema 14.1 (algoritmo da divisão). Sejam f, g ∈ K[x], g 6= 0, então existem únicos q, r ∈ K[x] tais que f = qg + r, onde r = 0 ou grau(r) < grau(g). Pn Pm Demonstração. Sejam f = i=0 ai xi e g = j=0 bj xj . Definimos f1 := f − an n−m x g. bm Se f1 = 0, acabou, tome an n−m x . bm Se f1 6= 0, então n1 = grau(f1 ) < n = grau(f ). Se n1 < m, acabou, tome an n−m r = f1 e q = x . bm Suponha que n1 ≥ m. Seja n1 X f1 := a1,i xi . r=0eq= i=0 Defina f2 := f1 − a1,n1 n1 −m x g. bm 14.2. MÁXIMO DIVISOR COMUM DE POLINÔMIOS 95 Se f2 = 0, acabou, tome 1 (an xn−m + a1,n1 xn1 −m ). bm Se f2 6= 0, então n2 = grau(f2 ) < n1 . Se n2 < m, acabou, tome 1 r = f2 e q = (an xn−m + a1,n1 xn1 −m ). bm Prosseguindo obtemos uma seqüência de polinômios fi com graus estritamente decrescentes, assim pelo menos para algum t ≥ 1 temos ft 6= 0 e grau(ft ) < m, neste ponto o algoritmo acaba, tome 1 (an xn−m + a1,n1 xn1 −m + . . . + at−1,nt−1 xnt−1 −m ). r = ft e q = bm Suponha que tenhamos realizado duas divisões r=0eq= f = q 1 g + r1 = q 2 g + r2 , onde para i = 1, 2, ri = 0 ou grau(ri ) < m. Se r1 = r2 , então q1 g = q2 g = 0, e como g 6= 0, então q1 = q2 . Suponhamos que r1 6= r2 . Neste caso, grau(r1 − r2 ) < m. Por outro lado r1 − r2 = (q2 − q1 )g e grau((q2 − q1 )g) ≥ grau(g), o que é impossı́vel. 14.2. Máximo divisor comum de polinômios Sejam f, g ∈ K[x] − {0}. Dizemos que f divide g e denotamos por f | g se existe h ∈ K[x] tal que f h = g. Notemos que esta propriedade é transitiva, i.e., se f | g e g | h, então f | h. De fato, se g = f α e h = gβ, onde α, β ∈ K[x], então h = f αβ, i.e., f | h. Se h 6= 0 e f h | gh, então f | h, pois se gh = f hα para α ∈ K[x], então h(g − f α) = 0 e como h 6= 0 e K[x] é domı́nio de integridade, então g = f α. Além disto, se f | g e g | f, então f = ag, para algum a ∈ K ∗ , pois de f = gα e g = f β obtemos que 1 = αβ, mas a última igualdade só ocorre se α, β ∈ K ∗ . Definição 14.2. Sejam f, g ∈ K[x] − {0}, dizemos que d ∈ K[x] é um mdc de f e g se (1) d | f e d | g. (2) Para todo d0 ∈ K[x] tal que d0 | f e d0 | g, temos d0 | d. Pn Dizemos que f = i=0 ai xi ∈ K[x] é um polinômio mônico, se an = 1. Observação 14.3. Dado um outro mdc e de f e g, pela condição (2) temos que d | e e e | d, portanto d = ae, onde a ∈ K ∗ . A maneira de tornar canônica a escolha do mdc é exigir que ele seja um polinômio mônico e neste caso podemos dizer que d = mdc(f, g) é o mdc de f e g. 96 14. ANÉIS DE POLINÔMIOS Observe que se f | g e f então f é um mdc de f e g. A etapa seguinte é obter o mdc de maneira algorı́timica. Para isto introduzimos um lema simples. Lema 14.4. Sejam f, g ∈ K[x] − {0} e q, r ∈ K[x] tais que f = qg + r, onde r = 0 ou grau(r) < grau(g). Então mdc(f, g) = mdc(g, r). Demonstração. Seja Df,g (resp. Dg,r ) o conjunto dos divisores comuns de f e g (resp. g e r). Seja d = mdc(f, g). Logo para todo d0 ∈ Df,g \ {0} temos grau(d0 ) ≤ grau(d). Assim d é o elemento em Df,g mônico de grau máximo possı́vel. Similarmente, e = mdc(g, r) é o elemento mônico em Dg,r de grau máximo possı́vel. Mostraremos agora que Df,g = Dg,r , conseqüentemente d = e. Seja A ∈ Df,g , logo f = Aα e g = Aβ, onde α, β ∈ K[x]. Segue da equação do enunciado que r = A(α − qβ), em particular A ∈ Dg,r . A inclusão oposta segue pelo mesmo argumento. Teorema 14.5. Sejam f, g ∈ K[x] \ {0} e r1 , · · · , rn ∈ K[x] os restos não nulos na seqüência de divisões f = q1 g + r1 , onde grau(r1 ) < grau(b) (14.1) g = q2 r1 + r2 , onde grau(r2 ) < grau(r1 ) ··· rn2 = qn rn−1 + rn , onde grau(rn ) < grau(rn−1 ) rn−1 = qn+1 rn . Esta seqüência é finita pois os graus são estritamente decrescentes. Então rn é um mdc de f e g. Demonstração. A última linha nos diz que rn é um mdc de rn e rn−1 . Logo rn = mdc(rn−1 , rn ). Pelo lema 14.4 concluimos que rn = mdc(rn−1 , rn−2 ) e prosseguindo nas linhas anteriores temos que rn = mdc(r2 , r1 ) = mdc(r1 , g) = mdc(f, g). Teorema 14.6 (algoritmo euclideano estendido). Sejam f, g ∈ K[x] \ {0} e d = mdc(a, b). Então existem α, β ∈ K[x] tais que d = f α + gβ. Demonstração. Do teorema anterior temos que d = rn . A penúltima equação nos dá rn = rn−2 − qn rn−1 . Tomando A1 = −qn e B1 = 1 reescrevemos rn = B1 rn−2 + A1 rn−1 . Utilizando a equação antecedente a esta obtemos rn = B1 rn−2 + A1 (rn−3 − qn−1 rn−2 ) = B2 rn−3 + A2 rn−2 , onde B2 = A1 e A2 = B1 − A1 qn−1 . Prosseguindo ao longo das demais divisões obtemos rn = Bn−3 r1 + An−3 r2 = Bn−3 r1 + An−3 (g − q2 r1 ) = Bn−2 g + An−2 r1 , 14.3. FATORAÇÃO ÚNICA DE POLINÔMIOS 97 onde Bn−2 = An−3 e An−2 = Bn−3 − An−3 q2 . Pela equação antecedente temos que rn = Bn−2 g + An−2 (f − gq1 ) = α0 f + β 0 g, onde α0 = An−2 e β 0 = Bn−2 − An−2 q1 . Nosso objetivo agora é dar uma prova mais conceitual do algoritmo euclideano estendido usando a noção de ideal. Definição 14.7. Um subconjunto I ⊂ K[x] é dito um ideal de K[x] se (1) O ∈ I. (2) Se f, g ∈ I, então f + g ∈ I. (3) Se f ∈ I e α ∈ K[x], então f α ∈ I. Fica como exercı́cio verificar que os seguintes conjuntos são ideais: (i) Seja f ∈ K[x] e I := (f ) := {f α | α ∈ K[x]} o conjunto dos múltiplos de f. (ii) Sejam f, g ∈ K[x] e I := (f ) + (g) := {f α + gβ | α, β ∈ K[x]}. (iii) Sejam f1 , · · · , fn ∈ K[x] e I := (f1 ) + . . . + (fn ) := {f1 α1 + . . . + fn αn | α1 , · · · , αn ∈ K[x]}. Teorema 14.8. O domı́nio K[x] é principal, i.e., todo ideal I de K[x] é da forma (f ) para algum f ∈ K[x]. Demonstração. Seja I um ideal de K[x]. Se I = (0) nada há a fazer. Suponhamos que I 6= (0). Pelo axioma da boa ordenação existe um único f ∈ I − {0} mônico de grau mı́nimo. Afirmamos que I = (f ). De fato, como f ∈ I, para todo f α ∈ (f ), pelo ı́tem (3) da definição de ideal, f α ∈ I. Assim (f ) ⊂ I. Para provar a inclusão oposta precisamos do algoritmo da divisão. Seja g ∈ I \ {0}. Então existem q, r ∈ K[x] tais que g = qf + r, onde r = 0 ou grau(r) < grau(f ). Note que r ∈ I, pois g, f ∈ I. Logo, se r 6= 0 vioları́amos a minimalidade do grau de f . Portanto, r = 0 e g ∈ (f ). Aplicando este teorema ao ı́tem (ii) anterior, obtemos que existe um único d ∈ K[x] mônico tal que (f ) + (g) = (d). Afirmamos que d = mdc(f, g). De fato, f = 1.f + 0.g ∈ (f ) + (g) = (d), logo f = αd, para α ∈ K[x], i.e., d | f . Da mesma forma d | g. Se d0 | f e d0 | g, para d0 ∈ K[x], então d = αf + βg, para α, β ∈ K[x], se reescreve como d = (αα0 + ββ 0 )d0 , para α0 , β 0 ∈ K[x], i.e., d0 | d, logo d = mdc(f, g). Observe também que de passagem provamos que d = αf + βg que é a igualdade do algoritmo euclideano estendido. 14.3. Fatoração única de polinômios Seja f ∈ K[x] \ {0}. Dizemos que f é irredutı́vel se dados g, h ∈ K[x] \ {0} tais que f = gh então f ∈ K ∗ ou g ∈ K ∗ . Por exemplo x3 − 2 é irredutı́vel em Q[x], pois sendo um polinômio de grau 3 só seria redutı́vel se um dos fatores tivesse grau 1 e outro grau 2 ou se tivermos 3 fatores de grau 1. Mas como x3 − 2 √ é mônico √ 3 isto equivale a este polinômio ter uma raiz racional. Mas suas raı́zes são 2, 3 2α √ e 3 2α2 que não não números racionais, Por outro lado, em √ onde α√= exp(2πi/3). √ C[x] temos a fatoração x3 − 2 = (x − 3 2)(x − 3 2α)(x − 3 2α2 ), assim esta noção é relativa ao corpo considerado. Seja I ⊂ K[x] um ideal não nulo. I é dito um ideal maximal de K[x] se dado um ideal J de K[x] tal que I ⊂ J ⊂ K[x], então J = I ou J = K[x]. 98 14. ANÉIS DE POLINÔMIOS Proposição 14.9. Seja f ∈ K[x] \ {0}. Então f é irredutı́vel se e somente se (f ) é maximal. Demonstração. Suponha que f seja irredutı́vel. Seja J um ideal de K[x] tal que (f ) ⊂ J ⊂ K[x]. Pelo Teorema 14.8 temos que existe g ∈ K[x] tal que J = (g). Logo f = gA, para A ∈ K[x]. Pela irredutibilidade de f temos que g ∈ K ∗ ou A ∈ K ∗ . No primeiro caso, 1 = gg −1 ∈ (g), assim (g) = K[x]. No segundo caso, g = A−1 f ∈ (f ), em particular (g) = (f ). Reciprocamente, suponhamos que (f ) seja maximal e que f = gh para g, h ∈ K[x]\{0}. Então (f ) ⊂ (g) ⊂ K[x]. Pela maximalidade de (f ), temos que (g) = (f ) ou (g) = K[x]. No primeiro caso, g = af para algum a ∈ K ∗ , logo 1 = ah e a fortiori h ∈ K ∗ . No segundo caso, 1 = gg −1 ∈ (g) e assim g ∈ K ∗ . Lema 14.10. Seja f ∈ K[x] irredutı́vel tal que f | gh para g, h ∈ K[x] \ {0}. Então f | g ou f | h. Demonstração. Suponha que f - g, i.e., mdc(f, g) = 1. Pelo algoritmo euclideano estendido existem A, B ∈ K[x] tais que 1 = Af + Bg. Logo, h = Af h + Bgh, e como f | gh, concluimos que f | h. Teorema 14.11. Seja f ∈ K[x]\{0}. Então existem únicos u ∈ K ∗ , p1 , · · · , pr ∈ K[x] polinômios irredutı́veis mônicos tais que grau(p1 ) < · · · < grau(pr ) e inteiros e1 , · · · , er tais que f = upe11 . . . perr . Demonstração. Provavemos primeiro a existência da fatoração. Se f ∈ K ∗ ou f é irredutı́vel nada há a fazer. Suponha que grau(f ) ≥ 1 e f seja redutı́vel. Seja Df o conjunto dos dvisores de f em K[x]. Pelo axioma da boa ordenação existe q1 ∈ Df tal que grau(q1 ) ≤ grau(A) para todo A ∈ Df . Afirmamos que q1 é irredutı́vel. Se isto não ocorresse, um fator B de q1 teria grau menor que grau(q1 ) e além disto pertenceria a Df , o que é impossı́vel. Seja f1 := f . q1 Se f1 ∈ K ∗ ou f1 for irredutı́vel acabou. Senão, seja q2 ∈ Df1 tal que grau(q2 ) ≤ grau(A) para todo A ∈ Df1 . Pelo mesmo argumento anterior q2 é irredutı́vel. Seja f2 := f f1 = . q2 q1 q2 Se f2 ∈ K ∗ ou f2 for irredutı́vel acabou. Senão prosseguimos. Note que grau(f ) > grau(f1 ) > grau(f2 ) > · · · ≥ 0. Assim, existe r ≥ 1 tal que fr ∈ K ∗ , digamos fr = u. Portanto, f = uq1 · · · qr é a fatoração desejada. Observe também que este processo é algorı́tmico e que não fizemos qualquer hipótese sobre os qi ’s serem distintos. Agrupando os polinômios irredutı́veis iguais temos uma fatoração como no enunciado. Provemos agora sua unicidade. Suponha que tenhamos duas fatorações como acima, digamos e f = upe11 · · · prf = vq1g1 · · · qsgs , 14.3. FATORAÇÃO ÚNICA DE POLINÔMIOS 99 onde v ∈ K ∗ , q1 , · · · , qs são irredutı́veis com grau(q1 ) < · · · < grau(qs ) e g1 , · · · , gs ≥ 1 são inteiros. Observe que p1 | vq1g1 · · · qsgs , logo pelo lema 14.10 existe j tal que p1 | qj . Como ambos são irredutı́veis mônicos isto ocorre se e somente se qj = p1 . Afirmamos que j = 1. Suponha que j > 1. Neste caso, pelo mesmo argumento existe i tal que q1 = bi pi para bi ∈ K ∗ . Se i = 1, então grau(q1 ) = grau(p1 ) = grau(qj ), o que é impossı́vel. Se i > 1, então grau(q1 ) = grau(pi ) > grau(p1 ) = grau(qj ), o que também é impossı́vel. Portanto q1 = a1 p1 e além disto e1 = g1 . Dividindo os dois lados por pe11 obtemos a igualdade upe22 · · · perr = vq2g2 · · · qsgs . O mesmo argumento acima mostra que q2 = p2 e que e2 = g2 . Novamente dividindo os dois lados por pe22 obtemos upe33 · · · perr = vq3g3 · · · qsgs . Assim aplicando sucessivamente o argumento temos que r = s, ei = gi para todo i, qi = ai pi , onde ai ∈ K ∗ , e u = v. Nosso objetivo agora é obter um critério de irredutibilidade de polinômios em Q[x] em termos dos seus coeficientes. Lema 14.12 (lema de Gauss). Seja f ∈ Z[x] irredutı́vel. Então f é irredutı́vel em Q[x]. Demonstração. Suponha que f = gh com g, h ∈ Q[x] e grau(g), grau(h) ≥ 1. Multiplicando os dois lados pelo produto m dos denominadores de todos os coeficientes de g e h obtemos mf = g1 h1 , onde g1 , h1 ∈ Z[z] e grau(g1 ) = grau(g) e grau(h1 ) = grau(h). Seja p um fator primo de m. Afirmamos que p divide todos os coeficientes de g1 ou todos os coeficientes de h1 . Escrevemos explicitamente n m X X g1 = ai xi e h1 = bj xj . i=0 j=0 Suponhamos que existam i e j tais que p - ai e p - bj . Além disto escolhamos estes i e j minimais para esta propriedade. Consideremos o coeficiente de xi+j de mf dado por ci+j = a0 bi+j + . . . + ai−1 bj+1 + ai bj + ai+1 bj−1 + . . . + ai+j b0 . Assim p divide todas as parcelas exceto ai bj , mas como p | ci+j isto nos dá uma contradição. Portanto, p | ai para todo i ou p | bj para todo j. Suponhamos o primeiro caso, dividindo por p dos dois lados temos que m f = g2 h1 . p 100 14. ANÉIS DE POLINÔMIOS Repetindo o argumento, cancelamos todos os fatores primos de m obtendo f = g ∗ h∗ , onde g ∗ , h∗ ∈ Z[x] e grau(g ∗ ) = grau(g) e grau(h∗ ) = grau(h). Portanto f é redutı́vel em Z[x]. Proposição 14.13 (critério de Eisenstein). Seja n X f= ai xi ∈ Z[x] \ {0}. i=0 Suponhamos que exista um número primo p tal que p | ai para todo i 6= n e p2 - a0 . Então f é irredutı́vem em Q[x]. Demonstração. Pelo lema de Gauss basta mostrar que f é irredutı́vel em Z[x]. Suponhamos que f = gh com g, h ∈ Z[x] e grau(g), grau(h) ≥ 1, digamos s r X X bj xj . ai xi e h = g= i=0 j=0 Como p - an = br cs então p - br e p - cs . Por outro lado segue de p | a0 = b0 c0 e p2 - a0 que p | b0 ou p | c0 e apenas uma destas opções ocorre. Digamos que p | b0 e p - c0 . Seja i ≤ r o menor inteiro tal que p - bi . O coeficiente de xi em f é dado por ai = b0 ci + b1 ci−1 + . . . + bi−1 c1 + bi c0 , assim p divide todas as parcelas exceto a última, portanto p - ai . Mas isto só pode ocorrer para i = n, mas i ≤ r < n. Utilizando o critério de Eisenstein vemos que todo polinômio xn − p para p um número primo é irredutı́vel em Z[x]. Um exemplo menos óbvio é f (x) = xp−1 +. . .+ x + 1. Não existe a priori um primo para o qual possamos aplicar o critério. A idéia é considerar o automorfismo de K[x] definido por x 7→ x + 1. Assim dado g ∈ K[x] temos que g(x) é irredutı́vel se e somente se g(x + 1) é irredutı́vel. Aplicando isto a f , observamos (exercı́cio) que f (x + 1) tem todos os coeficientes, exceto o lı́der que é 1, divisı́veis por p e o coeficiente constante é igual a p, portanto não é divisı́vel por p2 . CAPı́TULO 15 Anéis e domı́nios 15.1. Domı́nios euclideanos Seja D um domı́nio de integridade e ϕ : D \ {0} → N uma função tal que ϕ(ab) ≥ ϕ(a), para todos a, b ∈ D \ {0}. Dizemos que (D, ϕ) é um domı́nio euclideano, se para todo a, b ∈ D com b 6= 0 temos a = bq + r, onde r = 0 ou ϕ(r) < ϕ(b). Como exemplos temos (Z, | |) e (K[x], grau). Em um domı́nio de integridade D dizemos que b | a (para a, b ∈ D) se existe c ∈ D tal que a = bc. Exemplo 15.1. Um outro exemplo é o anel dos inteiros gaussianos, Z[i] := {a + bi | a, b ∈ Z}, onde i2 = −1. Definimos também ϕ(a + bi) := a2 + b2 . Note que se a + bi, c + di ∈ Z[i] \ {0}, então ϕ((a + bi)(c + di)) = ϕ((ac − bd) + i(ad + bc)i) = (ac − bd)2 + (ad + bc)2 = a2 c2 + b2 d2 + a2 d2 + b2 c2 = a2 (c2 + d2 ) + b2 (c2 + d2 ) = (a2 + b2 )(c2 + d2 ) = ϕ(a + bi)ϕ(c + di). Em particular a condição ϕ((a + bi)(c + di)) ≥ ϕ(a + bi) é satisfeita. Afirmamos que (Z[i], ϕ) é um domı́nio euclideano. De fato, dados a + bi, c + di ∈ Z[i] com c + di 6= 0 queremos mostrar que existem q = q0 + iq1 e r = r0 + ir1 em Z[i] tais que a + bi = q(c + di) + r, onde r = 0 ou ϕ(r) < ϕ(c + di). Se c + di divide a + bi basta tomar a + bi . c + di Suponhamos portanto que isto não ocorra, i.e., procuramos r 6= 0 satisfazendo a r=0eq= ϕ(r) = ϕ(a + bi − q(c + di)) < ϕ(c + di), i.e., (utilizando a multiplicatividade de ϕ) a + bi ϕ − q < ϕ(1) = 1. c + di 101 102 15. ANÉIS E DOMÍNIOS Normalizando (a + bi)/(c + di) obtemos (a + bi)(c − di) = α + iβ, c2 + d2 onde α, β ∈ Q. Assim queremos mostrar que ϕ(α + iβ − q) = (α − q0 )2 + (β − q1 )2 < 1. Note que como α ∈ Q, então existe q0 ∈ Z tal que |α − q0 | ≤ 12 . Da mesma forma, existe q1 ∈ Z tal que |β − q1 | ≤ 12 . Portanto, 1 1 1 + = < 1. 4 4 2 Definimos portanto q como q0 + iq1 e r como a + bi − (c + di)q. (α − q0 )2 + (β − q1 )2 ≤ Exemplo 15.2. Outro exemplo é o anel √ √ Z[ 2] := {a + b 2 | a, b ∈ Z}. Para este anel definimos √ ϕ(a + b 2) := a2 − 2b2 . Observemos que √ √ √ ϕ((a + b 2)(c + d 2)) = ϕ((ac + 2bd) + (ad + bc) 2) = (ac + 2bd)2 − 2(ad + bc)2 = a2 c2 + 4b2 d2 − 2a2 d2 − 2b2 c2 = a2 (c2 − 2d2 ) − 2b2 (c2 − 2d2 ) √ √ = (a2 − 2b2 )(c2 − 2d2 ) = ϕ(a + b 2)ϕ(c + d 2). Portanto, √ √ √ ϕ((a + b 2)(c + d 2)) ≥ ϕ(a + b 2). √ √ √ √ √ Dados a + b 2, c + d 2 ∈ Z[ 2] com c + d 2 6= 0 queremos obter q, r ∈ Z[ 2] tais que √ √ √ a + b 2 = (c + d 2)q + r, onde r = 0 ou ϕ(r) < ϕ(c + d 2). √ √ Se (c + d 2) | (a + b 2) tomamos √ a+b 2 √ r=0eq= . c+d 2 Caso isto não ocorra procuramos r 6= 0 tal que √ √ √ ϕ(r) = ϕ(a + b 2 − q(c + d 2)) < ϕ(c + d 2), i.e., ! √ a+b 2 √ − q < ϕ(1) = 1. ϕ c+d 2 √ √ Normalizando (a + b 2)/(c + d 2) obtemos √ √ √ (a + b 2)(c − d 2) = α + β 2, 2 2 c − 2d onde α, β ∈ Q. Assim queremos mostrar que (α − q0 )2 − 2(β − q1 )2 < 1 15.1. DOMÍNIOS EUCLIDEANOS 103 para q0 , q1 ∈ Z. Novamente podemos escolher q0 , q1 ∈ Z tais que |α − q0 | ≤ |β − q1 | ≤ 21 . Além disto (α − q0 )2 − 2(β − q1 )2 ≤ (α − q0 )2 ≤ 1 2 e 1 < 1. 4 Observação 15.3. Estes exemplos são na verdade casos particulares da seguinte situação mais geral. Seja K ⊃ Q um corpo contendo Q que como Q-espaço vetorial é de dimensão finita. Um tal corpo é chamado um corpo de números. Os elementos α ∈ K que satisfazem uma equação do tipo αn + n−1 X ai αi = 0 tais que ai ∈ Z i=0 são chamados inteiros algébricos de K e o conjunto de todos os inteiros algébricos forma uma anel (dos inteiros algébricos de K) denotado por OK . A pergunta é quando OK com uma função ϕ apropriada é um domı́nio euclideano. A resposta é como no caso anterior geométrica. Tudo depende da representação logarı́tmica de K em um R espaço vetorial Rn de dimensão finita. Existem critérios nos quais podemos mostrar que para certos corpos de números K existem funções ϕK tais que (OK , ϕK ) é um domı́nio euclideano. Para mais sobre esta questão ver [Le1] e [Le2]. Observação 15.4. Mostraremos agora que como no caso dos inteiros e dos polinômios domı́nios euclideanos são principais e fatoriais. Um caso clássico de corpo de números ligado a teoria de números é o corpo (n−1 ) X i Q[ζn ] := ai ζ | ai ∈ Q para todo i , i=0 onde ζ = exp(2πi/n). Este corpo é chamado o n-ésimo corpo ciclotômico. Kummer, no fim do século XIX, pensou erradamente ter “provado” o último teorema de Fermat (i.e., que a equação xn + y n = z n não possui soluções inteiras não triviais para n > 2), e seu erro foi exatamente ter “achado” que OK era principal, o que é falso. Teorema 15.5. Seja (D, ϕ) um domı́nio euclideano. Então D é principal, i.e., todo ideal I ⊂ D é da forma I = (a) = {aα | α ∈ D}. Demonstração. Se I = (0) nada há a fazer. Suponhamos que I 6= (0) e seja a ∈ I \ {0} tal que ϕ(a) ≤ ϕ(α) para todo α ∈ I \ {0}. Afirmamos que I = (a). A inclusão (a) ⊂ I é imediata da definição de ideal. Suponhamos que b ∈ I. Por hipótese existem q, r ∈ D tais que b = aq + r, onde r = 0 ou ϕ(r) < ϕ(a). Se r 6= 0, então r = b − aq ∈ I, mas isto contradiz a escolha de a. Logo r = 0 e b ∈ (a). Teorema 15.6. Seja (D, ϕ) um domı́nio euclideano. Então D é principal, i.e., todo ideal I ⊂ D é da forma I = (a) = {aα | α ∈ D}. Demonstração. Se I = (0) nada há a fazer. Suponhamos que I 6= (0) e seja a ∈ I \ {0} tal que ϕ(a) ≤ ϕ(α) para todo α ∈ I \ {0}. Afirmamos que I = (a). A inclusão (a) ⊂ I é imediata da definição de ideal. Suponhamos que b ∈ I. Por hipótese existem q, r ∈ D tais que b = aq + r, onde r = 0 ou ϕ(r) < ϕ(a). Se r 6= 0, então r = b − aq ∈ I, mas isto contradiz a escolha de a. Logo r = 0 e b ∈ (a). 104 15. ANÉIS E DOMÍNIOS Seja D um domı́nio de integridade. Denotamos por D∗ o conjunto dos elementos inversı́veis de D. i.e., o conjunto dos elementos a ∈ D tais que existe b ∈ D tal que ab = 1. Por exemplo, Z∗ = {±1} e K[x]∗ = K ∗ . Se D = Z[i], notemos que se a + bi ∈ Z[i]∗ então existe c + di ∈ Z[i] tal que (a + bi)(c + di) = 1. Logo (a2 + b2 )(c2 + d2 ) = 1, i.e., a2 + b2 = 1. Mas no cı́rculo x2 + y 2 = 1 os únicos pontos com coordenadas inteiras são ±1 e ±i. Reciprocamente, estes elementos são claramente inversı́veis, portanto Z[i]∗ = {±1, ±i}. Um elemento a ∈ D é dito irredutı́vel, se toda vez que a = bc com b, c ∈ D então b ∈ D∗ ou c ∈ D∗ . Lema 15.7. Seja (D, ϕ) um domı́nio euclideano. Então a ∈ D∗ se e somente se ϕ(a) = ϕ(1). Demonstração. Observemos que ϕ(a) = ϕ(a.1) ≥ ϕ(1) para todo a ∈ D \ {0}. Por outro lado se a ∈ D∗ , então existe b ∈ D \ {0} tal que ab = 1, logo ϕ(1) = ϕ(ab) ≥ ϕ(a), o que mostra que ϕ(a) = ϕ(1). Suponha que ϕ(a) = ϕ(1) para a ∈ D \ {0}. Por hipótese existem q, r ∈ D tais que 1 = qa + r com r = 0 ou ϕ(r) < ϕ(a). Assim, se r 6= 0, então ϕ(r) < ϕ(1) o que é impossı́vel. Portanto, r = 0 e 1 = aq, i.e., a ∈ D∗ . Teorema 15.8. Seja (D, ϕ) um domı́nio euclideano e a ∈ D \ {0}. Então existem u ∈ D∗ e p1 , · · · , pr ∈ D \ {0} irredutı́veis tais que a = up1 · · · pr . Demonstração. Se a ∈ D∗ ou a for irredutı́vel nada há a fazer. Suponhamos a∈ / D∗ redutı́vel. Seja Da o conjunto dos divisores d de a em D. Seja p1 ∈ Da \ {0} tal que ϕ(p1 ) ≤ ϕ(b) para todo b ∈ Da . Afirmamos que p1 é irredutı́vel. De fato, caso contrário, p1 = cd, c, d ∈ / D∗ e ϕ(p1 ) = ϕ(cd) ≥ ϕ(d). Se ϕ(cd) = ϕ(d), por hipótese existem q, r ∈ D tais que d = qcd + r com r = 0 ou ϕ(r) < ϕ(cd) = ϕ(d). Se r 6= 0, então r = d(1 − qc) e ϕ(r) ≥ ϕ(d), o que é impossı́vel, assim r = 0, mas neste caso qc = 1, logo c ∈ D∗ , o que também é impossı́vel. Assim ϕ(cd) > ϕ(d) e d ∈ Da , mas isto contradiz a minimalidade de p1 . Portanto, p1 é irredutı́vel. Seja a a1 := . p1 Se a1 ∈ D∗ ou a1 é irredutı́vel então nada há a fazer. Caso contrário, repetindo o argumento existe p2 ∈ Da1 irredutı́vel tal que ϕ(p2 ) ≤ ϕ(b) para todo b ∈ Da1 \ {0}. Seja a a1 = . a2 := p2 p1 p 2 Novamente, se a2 ∈ D∗ ou a2 for irredutı́vel acabou. Caso contrário prosseguimos. Observe que ϕ(a) > ϕ(a1 ) > ϕ(a2 ) > · · · ≥ ϕ(1), pois os elementos pi ’s são irredutı́veis. Portanto, existe r tal que ϕ(ar ) = ϕ(1), i.e., ar ∈ D∗ e neste caso a = up1 · · · pr com u = ar . Definição 15.9. Sejam a, b ∈ D \ {0}. Definimos um mdc d de a e b por (1) d | a e d | b. (2) Para todo d0 ∈ D \ {0} tal que d0 | a e d0 | b, temos que d0 | d. 15.1. DOMÍNIOS EUCLIDEANOS 105 Observação 15.10. Observe que se d e e são mdc’s de a e b então d | e e e | d, i.e., d = Ae e e = Bd para A, B ∈ D, assim d = BAd e portanto A, B ∈ D∗ . Logo a menos de multiplicação por um elemento inversı́vel a noção de mdc está bem definida. Observação 15.11. Seja I := (a) + (b) := {aα + bβ | α, β ∈ D} o ideal gerado por a e b. Como (D, ϕ) é principal, concluimos que existe d ∈ D \{0} tal que (d) = I. Afirmamos que d = mdc(a, b). De fato, a = 1.a + 0.b ∈ I, logo a = dα, i.e., d | a. Pelo mesmo argumento d | b. Por outro lado existem s, t ∈ D tais que d = as + bt (o algoritmo euclideano estendido). Se d0 | a e d0 | b, então a = Ad0 e b = Bd0 para A, B ∈ D, portanto d = d0 (sA + tB), i.e., d0 | d. Lema 15.12. Seja p ∈ D irredutı́vel e suponha que p | ab para a, b ∈ D. Então p | a ou p | b. Demonstração. Suponha que p - a, então mdc(p, a) = 1 e existem s, t ∈ D tais que 1 = sp + ta. Multiplicando por b e utilizando que ab = αp para α ∈ D, obtemos b = spb + tαp, logo p | b. Teorema 15.13. Seja (D, ϕ) um domı́nio euclideano e a ∈ D \ {0}. Então existem únicos (a menos de inversı́veis) u ∈ D∗ , p1 , · · · , pr ∈ D irredutı́veis com ϕ(p1 ) < · · · < ϕ(pr ) e inteiros e1 , · · · , er ≥ 1 tais que a = upe11 · · · perr . Demonstração. Suponha que possamos fatorar a de duas maneiras distintas a = upe11 · · · perr = vq1f1 · · · qsfs , para v ∈ D∗ , q1 , · · · , qs ∈ D irredutı́veis com ϕ(q1 ) < · · · < ϕ(qs ). Observe que p1 | vq1f1 · · · qsfs . Pelo lema anterior existe i tal que p1 | qi . Como ambos são irredutı́veis isto significa que existe ai ∈ D∗ tal que qi = ai p1 . Afirmamos que i = i. De fato, suponha que i > 1. Pelo mesmo argumento existe j tal que p1 = bj qj com bj ∈ D∗ . Se j = 1, então ϕ(p1 ) = ϕ(q1 ) < ϕ(qi ) = ϕ(p1 ) o que é impossı́vel. Se j > 1, então ϕ(p1 ) = ϕ(qi ) > ϕ(q1 ) = ϕ(pi ) o que também é impossı́vel. Também temos que ter e1 = f1 , pois se por exemplo f1 > e1 , então após cancelar p1 terı́amos que ter q1 = apj para j > 1 o que novamente é impossı́vel. Dividindo ambos os lados por pe11 obtemos uae11 pe22 · · · perr = vq2f2 · · · qsfs . Repetindo o argumento anterior, q2 = a2 p2 para a2 ∈ D∗ e e2 = f2 , dividindo ambos os lados por pe22 obtemos uae11 ae22 pe33 · · · perr = vq3f3 · · · qsfs . Repetindo o argumento obtemos que r = s e para todo i = 1, · · · , r temos que qi = ai pi para ai ∈ D∗ e u = vae11 · · · aerr . 106 15. ANÉIS E DOMÍNIOS 15.2. Domı́nios fatoriais Definição 15.14. Seja D um domı́nio de integridade. Definimos em D := D × (D \ {0}) a seguinte relação de equivalência: (a, b) ∼ (c, d) se e somente se ad = bc. Seja K := D/ ∼ o conjunto das classes de equivalência de D. A classe de equivalência do par (a, b) é denotada pela fração ab . Definimos em D operações de soma e produto por c ad + bc a c ac a + := e + = . b d cd b d bd Com estas operações K é um corpo. O inverso de a/b 6= 0 é b/a. Definição 15.15. Sejam A e B dois anéis (sempre comutativos com elemento neutro para o produto). Uma função f : A → B é dita um homomorfismo de anéis se f (x + y) = f (x) + f (y) e f (xy) = f (x)f (y) para todos x, y ∈ A. O núcleo N (f ) de f é definido como o subconjunto dos elementos a ∈ A tais que f (a) = 0. Note que 0 ∈ N (f ). Observe também que N (f ) é um ideal de A. De fato, se x, y ∈ N (f ), então f (x + y) = f (x) + f (y) = 0, i.e., x + y ∈ N (f ). Se x ∈ N (f ) e a ∈ A, então f (x, y) = f (x)f (y) = 0, i.e., xa ∈ N (f ). Lema 15.16. f é injetivo se e somente se N (f ) = (0). Demonstração. Se f é injetivo e x ∈ N (f ), então f (x) = 0 = f (0), logo x = 0. Se N (f ) = (0) e f (x) = f (y), então f (x − y) = 0, i.e., x − y ∈ N (f ), i.e., x = y. Observação 15.17. Um homomorfismo f : A → B é dito um isomorfismo se for um homomorfismo bijetivo. Consideremos o homomorfismo de anéis ϕ : D → K definido por ϕ(a) := a/1. Este é um homomorfismo injetivo, pois se a/1 = 0/1, então a = 0. Por isto D é isomorfo a sua imagem e K é dito o corpo de frações de D e denotado por fr(D). Definição 15.18. Um domı́nio de integridade D é dito fatorial quando para todo a ∈ D \ {0} podemos escrever a de maneira única a = upe11 · · · perr , onde u ∈ D∗ , p1 , · · · , pr ∈ D são irredutı́veis e e1 , · · · , er ≥ 1 são inteiros, onde a unicidade é a menos de multiplicação por um elemento de D∗ ou de permutação dos irredutı́veis. No caso de um domı́nio euclideano, a função ϕ determina a ordem dos elementos irredutı́veis, assim não podemos permutá-los e a a unicidade é a menos de multiplicação por inversı́veis. Dois elementos a, b ∈ D são ditos associados (denotado por a ∼ b), se a = ub onde u ∈ D∗ . Definição 15.19. Seja D[x] o anel de polinômios com coeficientes em D, i.e., são os elementos da forma n X f= ai xi tais que ai ∈ D para todo i. i=0 Seja K := fr(D) seu corpo de frações. O conteúdo c(f ) de f ∈ D[x] é definido por c(f ) := mdc(an , · · · , a0 ). 15.2. DOMÍNIOS FATORIAIS 107 Sendo um mdc, o elemento c(f ) é único a menos de multiplicação por elemento de D∗ . Um polinômio f ∈ D[x] é dito primitivo, se c(f ) = 1. Lema 15.20 (lema de Gauss generalizado). Seja D um domı́nio fatorial e K seu corpo de frações. (1) Se f, g ∈ D[x], então c(f g) = c(f )c(g). (2) Se f, g ∈ D[x] são primitivos, então f é associado a g em D[x] se e somente se ele o for em K[x]. (3) Seja f ∈ D[x] primitivo. Então f é irredutı́vel em D[x] se e somente se f é irredutı́vel em K[x]. Demonstração. (1) Podemos sempre escrever f = c(f )f1 para f1 ∈ D[x] primitivo. Logo, f g = c(f )c(g)f1 g1 e c(f g) = c(f )c(g)c(f1 g1 ). Afirmamos que c(f1 g1 ) = 1. Escrevamos explicitamente f1 = n X ai xi e g1 = i=0 m X bi xi . i=0 Seja f1 g1 = n+m X cj xj . i=0 Seja p ∈ D irredutı́vel. Como c(f1 ) = c(g1 ) = 1 existe i tal que p - ai e l tal que p - bl . Escolhamos i e l mı́nimos com esta propriedade. Então ci+l = ai+l b0 + ai+l−1 b1 + . . . + ai+1 bl−1 + ai bl + ai−1 bl+1 + . . . + a0 bi+l não pode ser divisı́vel por p. Em particular, p - c(f1 g1 ) e c(f1 g1 ) = 1. (2) É claro que que se f é associado a g em D[x] também o é em K[x]. Provemos a recı́proca. Ou seja, suponhamos que f = ug para u ∈ K ∗ e K = fr(D). Digamos que u = ab . Logo bf = ag, c(bf ) = bc(f ) = b e c(ag) = ac(g) = a, i.e., b = va para v ∈ D∗ , portanto f é associado a g em D[x]. (3) É claro que se f é irredutı́vel em K[x] ele também o é em D[x]. Suponha que f seja redutı́vel em K[x], digamos f = gh para g, h ∈ K[x] tais que grau(g), grau(h) ≥ 1. Eliminando os denominadores de g e h obtemos a ∈ D \ {0} tal que af = g1 h1 para g1 , h1 ∈ D[x] e grau(g1 ) = grau(g) e grau(h1 ) = grau(h). Note que c(af ) = ac(f ) = a e c(g1 h1 ) = c(g1 )c(h1 ), ∗ logo existe u ∈ D tal que a = c(g1 )c(h1 )u. Além disto, escrevendo g1 = c(g1 )g1∗ e h1 = c(h1 )h∗1 com g1∗ , h∗1 ∈ D[x] primitivos temos que af = c(g1 )c(h1 )g1∗ h∗1 , i.e., f = u−1 g1∗ h∗1 o que contradiz o fato de f ser irredutı́vel em D[x]. Teorema 15.21. Seja D um domı́nio fatorial. Então D[x] também é um domı́nio fatorial. 108 15. ANÉIS E DOMÍNIOS Demonstração. Seja f ∈ D[x] \ {0}. Se f ∈ D∗ ou f for irredutı́vel nada há a fazer. Caso contrário fatoramos f = upe11 · · · perr com u ∈ K ∗ , p1 , · · · , pr ∈ K[x] irredutı́veis, grau(p1 ) < · · · < grau(pr ) e e1 , · · · , er ≥ 1 inteiros. Multiplicando pelo produto dos denominadores obtemos a ∈ D \ {0} tal que af = vq1e1 · · · qrer , onde v ∈ D \ {0} e q1 , · · · , qr ∈ D[x] irredutı́veis em K[x] e grau(qi ) = grau(pi ) para todo i. Para todo i escreva qi = c(qi )qi∗ com qi∗ ∈ D[x] primitivo e irredutı́vel em K[x]. Pelo lema de Gauss qi∗ é irredutı́vel em D[x] para todo i. Assim, af = vc(q1 )e1 · · · c(qr )er (q1∗ )e1 · · · (qr∗ )er . Mas c(af ) = ac(f ) e c(vc(q1 )e1 · · · c(qr )er (q1∗ )e1 · · · (qr∗ )er ) = vc(q1 )e1 · · · c(qr )er . Logo existe w ∈ D∗ tal que ac(f ) = wvc(q1 )e1 · · · c(qr )er . Em particular, f = w−1 (q1∗ )e1 · · · (qr∗ )er o que mostra que D[x] é fatorial. Teorema 15.22 (critério de Eisenstein generalizado). Seja D um domı́nio fatorial, K = fr(D) seu corpo de frações, f= n X ai xi ∈ D[x] − {0} i=0 primitivo e p ∈ D irredutı́vel. Se p | ai para i = 0, · · · , n − 1, p - an e p2 - a0 , então f é irredutı́vel em K[x]. Demonstração. A prova é igual ao caso em que D = Z que foi feita anteriormente, substituindo o lema de Gauss pela sua generalização. 15.3. Fatores múltiplos e resultante Proposição 15.23. Sejam f, g ∈ K[x] \ K. Então existe h ∈ K[x] \ K irredutı́vel tal que h|f eh|g se e somente se existem u, v ∈ K[x] \ {0} tais que ug = vf, grau(u) < grau(f ) e grau(v) < grau(g). Demonstração. Suponhamos que exista h como acima, i.e., f = hf1 e g = hg1 com f1 , g1 ∈ K[x] e grau(f1 ) < grau(f ) e grau(g1 ) < grau(g). Logo f1 g = g1 f e tomamos u = f1 e v = g1 . Reciprocamente, suponhamos a segunda condição satisfeita. Como grau(u) < grau(f ) e pela unicidade da fatoração de polinômios temos que existe algum fator irredutı́vel h de f tal que h | g. 15.3. FATORES MÚLTIPLOS E RESULTANTE 109 Definição 15.24. Sejam f= n X ai xi e g = i=0 m X bj xj . j=0 A resultante Res(f, g) é definida como o determinante an an−1 ··· a1 a0 a a · · · a1 a0 n n−1 . . . . . . . .. . . . an an−1 · · · bm bm−1 · · · b1 b0 b b · · · b1 b0 m m−1 . . . . .. .. .. .. bm bm−1 · · · da seguinte matriz .. . a1 .. . b1 a0 , b0 onde as linhas com os coeficientes ai ’s são repetidas m vezes e as linhas com os coeficientes bj ’s são repetidas n vezes, ou seja a matriz é (n + m) × (n + m). As demais entradas da matriz são todas nulas. Observação 15.25. Seja u= r X i ci x e v = i=0 s X dj xj , j=0 onde r ≤ n − 1 e s ≤ m − 1. Para facilitar a notação tomaremos os coeficientes de u (resp. v) até n − 1 (resp. m − 1) com a convenção que se i > r (resp. j > s) então ci = 0 (resp. dj = 0). A igualdade ug = vf resulta em um sistema linear homogêneo an dm−1 − bm cn−1 = 0 an dm−2 + an−1 dm−1 − bm cn−2 − bm−1 cn−1 = 0 ······ a1 d0 + a0 d1 − b1 c0 − b0 c1 = 0 a0 d0 − b0 c0 = 0 cuja matriz transposta é igual a an an−1 ··· a a n n−1 .. . −bm −bm−1 ··· −b −b m m−1 . .. a1 ··· .. . a0 a1 .. . an −b1 ··· .. . an−1 −b0 −b1 .. . ··· . a1 −b0 .. . .. −bm −bm−1 ··· a0 .. . .. . −b1 a0 . −b0 Portanto, o determinante da matriz do sistema é igual a (−1)n Res(f, g). Da álgebra linear o sistema tem solução não trivial se e somente se o determinante da matriz do sistema é nulo, o que equivale a Res(f, g) = 0. A existência de solução não trivial 110 15. ANÉIS E DOMÍNIOS equivale justamente a existência de u e v satisfazendo à condição acima. Dessa forma temos o teorema seguinte. Teorema 15.26. Sejam f, g ∈ K[x] \ K, então existe h ∈ K[x] \ K irredutı́vel tal que h | f e h | g se e somente se Res(f, g) = 0. Definição 15.27. Definimos formalmente a derivação de polinômios D : K[x] → K[x] por ! n n X X i D ai x := iai xi . i=0 i=1 Esta função satisfaz as seguintes propriedades: (1) D(f + g) = D(f ) + D(g), para f, g ∈ K[x]; (2) D(af ) = aD(f ), para a ∈ K e f ∈ K[x]; (3) (regra de Leibniz) D(f g) = f D(g) + D(f )g, para f, g ∈ K[x]. Dizemos que um fator irredutı́vel f de g ∈ K[x] − K é múltiplo se f 2 | g. Proposição 15.28. Seja g ∈ K[x]\K e f ∈ K[x]\K um polinômio irredutı́vel. Então f é fator múltiplo de g se e somente se f | D(g). Demonstração. Suponha que f seja fator múltiplo de g, então f 2 | g, i.e., g = Af 2 para algum A ∈ K[x]. Logo D(g) = D(A)f 2 + 2Af D(f ), portanto f | D(g). Reciprocamente, suponha que f | D(g), digamos g = f A e D(g) = f B para A, B ∈ K[x]. Derivando a primeira igualdade, D(g) = f D(A) + D(f )A, substituindo temos que f (B − D(A)) = D(f )A. Se D(f ) = 0 então trivialmente D(f ) | g. Suponhamos que D(f ) 6= 0. Neste caso grau(D(f )) < grau(f ) e como f é irredutı́vel, pela unicidade da fatoração de polinômios, concluimos que f é um fator de A, digamos A = f C para C ∈ K[x]. Assim g = f 2 C e f é um fator múltiplo de g. Definição 15.29. Definimos o discriminante de f ∈ K[x] \ {0} por disc(f ) := Res(f, D(f )). Assim concluimos a seguinte proposição. Proposição 15.30. Seja f ∈ K[x] \ K, então f possui fator múltiplo se e somente se disc(f ) = 0. 15.4. Anéis quocientes e teorema chinês dos restos Seja A um anel (sempre comutativo com unidade) e I, J ⊂ A ideais de A definimos o ideal soma I + J por I + J := {a + b | a ∈ I e b ∈ J}. Fica como exercı́cio verificar que I + J é de fato um ideal de A. Dizemos que os ideais I e J são coprimos se I + J = A, i.e., se existem a ∈ I e b ∈ J tais que 1 = a + b. Por exemplo, se A = Z, I = nZ e J = mZ com n, m ≥ 1 inteiros, temos que I e J são coprimos se e somente se mdc(m, n) = 1. De fato, se os ideais forem coprimos, então existem s, t ∈ Z tais que 1 = sn + tm. Assim, qualquer divisor primo comum de n e m dividiria também 1, o que é impossı́vel. Reciprocamente, se mdc(n, m) = 1, então pelo algoritmo euclideano estendido existem s, t ∈ Z tais que 1 = sn + tm, a fortiori 1 ∈ I + J. 15.4. ANÉIS QUOCIENTES E TEOREMA CHINÊS DOS RESTOS 111 Definição 15.31. Seja A um anel e I um ideal de A. Definimos em A a seguinte relação. Dados a, b ∈ A dizemos que a≡b (mod I) se a − b = α ∈ I, dizemos neste caso que a é equivalente a b módulo I. Fica como exercı́cio verificar que isto define de fato uma relação de equivalência. A classe de equivalência de a ∈ A módulo I será denotada por a + I := {a + α | α ∈ I}. O conjunto de classes de equivalência será denotado por A/I. Quando A = Z e I = nZ a relação acima é apenas a relação de congruência módulo n, uma vez que Z é um domı́nio principal. Definição 15.32. Definimos em A/I uma estrutura de anel da seguinte forma: (a + I) ⊕ (b + I) := (a + b) + I e (a + I) (b + I) := (ab) + I. Observação 15.33. Verifiquemos que estas operações estão bem definidas. Sejam a0 , b0 ∈ A tais que a0 ≡ a (mod I) e b0 ≡ b (mod I), i.e., a0 − a = α ∈ I e b0 − b = β ∈ I. Assim, (a0 + b0 ) − (a + b) = α + β ∈ I e em particular a0 + b0 ≡ a + b (mod I) (o que equivale a (a0 + b0 ) + I = (a + b) + I). Também temos que a0 b0 − ab = a0 b0 − a0 b + a0 b − ab = a0 (b0 − b) + b(a0 − a) = a0 β + bα ∈ I, portanto a0 b0 ≡ ab (mod I) (ou equivalentemente, (a0 b0 ) + I = (ab) + I). Deixamos também como exercı́cio verificar (exatamente como no caso dos inteiros módulo n) que o conjunto A/I com as operações ⊕ e é um anel. Note que o elemento neutro para a soma é a classe I e o elemento neutro para o produto é a classe 1 + I. 15.4.1. Ideais primos e maximais. Definição 15.34. Um ideal I de um anel A é dito maximal se para todo ideal J de A tal que I ⊂ J ⊂ A temos J = I ou J = A. Proposição 15.35. Um ideal I de A é maximal se e somente se o anel quociente A/I é um corpo. Demonstração. Suponha que I seja um ideal maximal de A. Seja a + I 6= I uma classe em A/I. Isto equivale a a ∈ / I. O conjunto (a) = {xa | x ∈ A} é um ideal de A e pelo que foi feito anteriormente o conjunto J = I + (a) também é um ideal de A. Além disto, I J. Pela maximalidade de I concluimos que J = A, i.e., que existem t ∈ I e s ∈ A tais que 1 = t + sa, i.e., sa ≡ 1 (mod I), i.e., (sa) + I = (s + I) (a + I) = 1 + I, i.e., a + I admite inverso multiplicativo. Reciprocamente, suponha que A/I seja um corpo. Seja J um ideal de A tal que I J. Seja a ∈ J − I. Então a + I 6= I e por hipótese existe b ∈ A tal que (a + I) (b + I) = 1 + I, i.e., (ab) + I = 1 + I, i.e., existe t ∈ I tal que ab − 1 = t. Em outras palavras 1 = t − ab ∈ J, logo A = J e I é maximal. Definição 15.36. Um ideal I de A é dito um ideal primo se dados a, b ∈ A tais que ab ∈ I, então a ∈ I ou b ∈ I. Note que quando A = Z e p é um número primo o ideal pZ é um ideal primo de Z. 112 15. ANÉIS E DOMÍNIOS Proposição 15.37. Um ideal I de A é primo se e somente se o anel quociente A/I é um domı́nio de integridade. Demonstração. Suponha que I seja um ideal primo de A. Sejam a+I, b+I ∈ tais que (a + I) (b + I) = I, i.e., (ab + I) = I, i.e., ab ∈ I. Como I é primo, temos que a ∈ I ou b ∈ I, i.e., a + I = I ou b + I = I. Reciprocamente, suponha que A/I seja um domı́nio de integridade. Sejam a, b ∈ A tais que ab ∈ I, i.e., (ab) + I = (a + I) (b + I) = I. Por hipótese, a + I = I ou b + I = I, i.e., a ∈ I ou b ∈ I. A I 15.4.2. Homomorfismo de anéis. Definição 15.38. Sejam A e B anéis e f : A → B uma função. Esta função é dito um homomorfismo de anéis se f (a + b) = f (a) + f (b) e f (ab) = f (a)f (b). Observe que f (0) = f (0 + 0) = f (0) + f (0), portanto f (0) = 0. Se além disto A for um domı́nio de integridade e f não for a função nula, então f (1) = 1. De fato, f (1) = f (1.1) = f (1)f (1), i.e., f (1)(f (1) − 1) = 0. Se A é um domı́nio de integridade, então f (1) = 0 ou f (1) = 1. No primeiro caso a função é identicamente nula, pois f (a) = f (1.a) = f (1)f (a) = 0. Observe também que como 0 = f (0) = f (a + (−a)) = f (a) + f (−a), então f (−a) = −f (a). Definição 15.39. Um homomorfismo f : A → B é dito um isomorfismo se for bijetivo. Um homomorfismo f : A → A é dito um endomorfismo de A. Se este endomorfismo for bijetivo ele é dito um automorfismo de A. Seja f : A → B um homomorfismo de anéis. O núcleo N (f ) de f é definido por {a ∈ A | f (a) = 0}. Fica como exercı́cio mostrar que N (f ) é um ideal de A. A imagem f (A) de f é um subanel de B (isto também é um exercı́cio). Lema 15.40. Seja f : A → B um homomorfismo de anéis. Então f é injetivo se e somente se N (f ) = (0). Demonstração. Suponha que f seja injetivo e que a ∈ N (f ). Logo f (a) = 0 = f (0), pela injetividade de f concluimos que a = 0. Reciprocamente, suponha que N (f ) = (0). Sejam a, b ∈ A tais que f (a) = f (b). Então f (a − b) = 0, i.e., a − b ∈ N (f ), em particular a = b. Teorema 15.41 (teorema dos homomorfimos). Seja f : A → B um homomorfismo de anéis. Então f induz um isomorfismo ϕ : A/N (f ) → f (A) (em outras palavras A/N (f ) ∼ = f (A), i.e., estes dois anéis são isomorfos). Demonstração. A função ϕ é definida por ϕ(a + N (f )) := f (a). Verifiquemos inicialmente que ϕ está bem definida. Seja a0 ∈ A tal que a0 ≡ a (mod N (f )), i.e., a0 − a = α ∈ N (f ). Logo f (a0 ) = f (a), i.e., ϕ(a0 + N (f )) = ϕ(a + N (f )). Esta função é um homomorfismo, pois ϕ((a + N (f )) ⊕ (b + N (f ))) = ϕ((a + b) + N (f )) = f (a + b) = f (a) + f (b) = ϕ(a + N (f )) + ϕ(b + N (f )) e ϕ((a + N (f )) (b + N (f ))) = ϕ((ab) + N (f )) = f (ab) = f (a)f (b) = ϕ(a + N (f ))ϕ(b + N (f )). 15.4. ANÉIS QUOCIENTES E TEOREMA CHINÊS DOS RESTOS 113 Esta função é sobrejetiva, pois para todo y ∈ f (A), temos que y = f (a) para a ∈ A, portanto y = ϕ(a + N (f )). Esta função também é injetiva, pois se ϕ(a + N (f )) = f (a) = 0, então a ∈ N (f ), i.e., a + N (f ) = N (f ). 15.4.3. Teorema chinês dos restos. Proposição 15.42. Sejam I, J ideais de A tais que I + J = A e a, b ∈ A. Então existe x ∈ A tal que ( x ≡ a (mod I) x≡b (mod J). Demonstração. Por hipótese existem α ∈ I e β ∈ J tais que 1 = α + β. Então β ≡ 1 (mod I) e α ≡ 1 (mod J). Em particular, aβ ≡ a (mod I) e bα ≡ b (mod J). Basta tomar x = aβ + bα. Vamos generalizar o resultado anterior para um número qualquer de ideais. Para isto precisamos da noção de produto de ideais. Sejam I1 , · · · , Ir ideais de A. Seja I1 . . . Ir := {a1,1 · · · ar,1 + . . . + a1,n . . . ar,n | onde ai,j ∈ Ii , para todo i}. Fica como exercı́cio mostrar que I1 . . . Ir é efetivamente um ideal de A. Proposição 15.43. Sejam I1 , · · · , Ir ideais de A tais que para todo α 6= β tenhamos Iα + Iβ = A. Sejam a1 , · · · , ar ∈ A. Então existe x ∈ A tal que x ≡ a1 (mod I1 ) .. .. . . x ≡ ar (mod Ir ). Demonstração. Denotamos J := I1 . . . Ir e para cada ν, Jν := I1 . . . Iν−1 Iν+1 . . . Ir . Afirmamos que (15.1) Iν + Jν = A. De fato, sabemos que para cada α 6= ν existem λα ∈ Iα e λν(α) ∈ Iν tais que λα + λν(α) = 1. Note que utilizamos o ı́ndice ν(α) para dizer que o elemento λν(α) efetivamente depende da escolha de α, uma vez que os ideais são dois a dois coprimos. Seja γν := λ1 . . . λν−1 λν+1 . . . λr ∈ Jν . Então Y (λα + λν(α) ) = γν + δν , α6=ν onde δν ∈ Iν . Da igualdade (15.1) obtemos que para cada ν vale γν ≡ 1 (mod Iν ) e γν ≡ 0 (mod Iα ) para α 6= ν. Finalmente, x := a1 γ1 + . . . + ar γr é uma solução do sistema. Lema 15.44. Sejam I1 , · · · , Ir ideais de A tais que para todo α 6= β tenhamos Iα + Iβ = A. Então I1 . . . Ir = I1 ∩ . . . ∩ Ir . 114 15. ANÉIS E DOMÍNIOS Demonstração. Provemos o resultado por indução em r. Suponhamos inicialmente r = 2. Assim, um elemento de I1 I2 é da forma a1,1 a2,1 + . . . + a1,n a2,n , onde a1,ν ∈ I1 (resp. a2,ν ∈ I2 ) para cada ν. Note que cada parcela a1,ν a2,ν pertence a I1 ∩ I2 , pela definição de ideal. Logo I1 I2 ⊂ I1 ∩ I2 . Basta provar a inclusão oposta. Por hipótese existem γ1 ∈ I1 e γ2 ∈ I2 tais que 1 = γ1 + γ2 . Seja a ∈ I1 ∩ I2 , logo a = γ1 a + aγ2 ∈ I1 I2 . Suponha agora o resultado provado para r − 1 fatores, vamos prová-lo para r fatores. Novamente, pela própria definição de produto de ideais temos que I1 . . . Ir ⊂ I1 ∩ . . . ∩ Ir . Basta provar a inclusão oposta. Da demonstração da proposição anterior concluimos que I1 . . . Ir−1 e Ir são coprimos. Logo existe γr ∈ I1 . . . Ir−1 e δr ∈ Ir tal que γr + δr = 1. Seja a ∈ I1 ∩ · · · ∩ Ir . Note que para todo t ≥ 1 temos também que at ∈ I1 ∩ · · · ∩ Ir . Então ar = γr ar + a . . . a(aδr ) ∈ I1 + . . . + Ir , onde a repete-se r − 1 vezes no produto acima. Teorema 15.45 (teorema chinês dos restos). Sejam I1 , · · · Ir ideais de A tais que Iα + Iβ = A, para α 6= β. Então (1) existe um isomorfismo de anéis A ∼ A × ... × A. = I1 . . . Ir I1 Ir (2) Este isomorfismo restringe-se a um isomorfismo de grupos ∗ ∗ ∗ A A A ∼ × ... × . = I1 . . . Ir I1 Ir Demonstração. Definimos ϕ: A A A → × ... × por I1 · · · Ir I1 Ir ϕ(a + I1 . . . Ir ) := (a + I1 , · · · , a + Ir ). Verifiquemos que esta função está bem definida. De fato, se b − a = α ∈ I1 . . . Ir = I1 ∩. . . Ir (pelo lema anterior), então b ≡ a (mod Iν ) para todo ν, i.e., b+Iν = a+Iν para todo ν. Afirmamos que ϕ é um homomorfismo. De fato, ϕ((a + I1 . . . Ir ) ⊕ (b + I1 . . . Ir )) = ϕ((a + b) + I1 . . . Ir ) = ((a + b) + I1 , · · · , (a + b) + Ir ) = ((a + I1 ) ⊕ (b + I1 ), · · · , (a + Ir ) ⊕ (b + Ir )) = (a + I1 , · · · , a + Ir ) ⊕ (b + I1 , · · · , b + Ir ) e ϕ((a + I1 . . . Ir ) (b + I1 . . . Ir )) = ϕ((ab) + I1 . . . Ir ) = ((ab) + I1 , · · · , (ab) + Ir ) = ((a + I1 ) (b + I1 ), · · · , (a + Ir ) (b + Ir )) = (a + I1 , · · · , a + Ir ) (b + I1 , · · · , b + Ir ). 15.5. APLICAÇÕES 115 Esta função é sobrejetiva. De fato, dado (a1 + I1 , · · · , ar + Ir ) ∈ A A × ... × , I1 Ir pela proposição anterior existe x ∈ A tal que x ≡ aν (mod Iν ) para todo ν, i.e., x+Iν = aν +Iν para todo ν. Portanto, (a1 +I1 , · · · , ar +Ir ) = (x+I1 , · · · , x+Ir ) = ϕ(x + I1 . . . Ir ). Finalmente, ϕ é injetiva. De fato, se (a + I1 , · · · , a + Ir ) = (I1 , · · · , Ir ), então a ∈ I1 ∩ . . . ∩ Ir = I1 . . . Ir . Suponhamos que a + I1 . . . Ir ∈ (A/I1 . . . Ir )∗ , i.e., que exista b + I1 . . . Ir ∈ (A/I1 . . . Ir ) tal que (a + I1 . . . Ir ) (b + I1 . . . Ir ) = (ab) + I1 . . . Ir = 1 + I1 . . . Ir , i.e., ab − 1 = c ∈ I1 . . . Ir = I1 ∩ . . . ∩ Ir . Logo ab ≡ 1 (mod Iν ) para todo ν, i.e., (a + Iν ) · (b + Iν ) = 1 + Iν para todo ν. Portanto (a + I1 , · · · , a + Ir ) ∈ (A/I1 )∗ × . . . × (A/Ir )∗ . É claro que a restrição de ϕ (A/I1 . . . Ir )∗ é um homomorfismo injetivo. Resta provar a sua sobrejetividade. Seja (a1 + I1 , · · · , ar + Ir ) ∈ (A/I1 )∗ × . . . × (A/Ir )∗ . Pela parte anterior sabemos que existe x ∈ A tal que aν + Iν = x + Iν para todo ν. Basta provar que x + I1 . . . Ir ∈ (A/I1 . . . Ir )∗ . Mas para todo ν existe αν ∈ A tais que αν x ≡ 1 (mod Iν ), pois x é inversı́vel simultaneamente módulo cada Iν . Ou seja, αν x − 1 = δν ∈ Iν para cada ν. Assim, Y Y (αν x − 1) = xz + (−1)r 1 = δν ∈ I1 . . . Ir , ν ν para algum z ∈ A, i.e., xz ≡ ±1 (mod I1 . . . Ir ). Substituindo, se necessário, z por −z, concluimos que x ∈ (A/I1 . . . Ir )∗ . 15.5. Aplicações 15.5.1. Soma de quadrados. Teorema 15.46 (Fermat). Seja p um número primo. As seguintes condições são equivalentes: (i) p = 2 ou p ≡ 1 (mod 4). (ii) Existe a ∈ Z tal que a2 ≡ −1 (mod p). (iii) p é redutı́vel em Z[i]. (iv) p = a2 + b2 com a, b ∈ Z. Demonstração. Suponha (i). Se p = 2, tome a = 1 e lembre que 1 ≡ −1 (mod 2). Suponhamos que p = 4n + 1. Pelo pequeno teorema de Fermat para todo a ∈ Z tal que p - a temos que ap−1 ≡ 1 (mod p). Em outras palavras, temos a fatoração xp−1 − 1 = (x − 1) · · · (x − p − 1). Por outro lado, xp−1 − 1 = x4n − 1 = 2n (x2n −1)(x2n +1). Ou seja, existe b ∈ {1, · · · , p − 1} tal que b = −1, i.e., b2n ≡ −1 (mod p). Tome a = bn . Suponha (ii). Seja k ∈ Z tal que a2 = −1 + kp. Logo (a − i)(a + i) = kp. Suponhamos que p | (a + i), i.e, que existam c, d ∈ Z tais qeu p(c + di) = a + i. Em particular, pd = 1 e p | 1 o que é impossı́vel. Portanto, p - (a + i). Pelo mesmo argumento p - (a − i). Mas Z[i] é um domı́nio euclideano, logo fatorial, assim p não pode ser um irredutı́vel am Z[i]. 116 15. ANÉIS E DOMÍNIOS Suponha que p = (a + bi)(c + di) com a2 + b2 6= 1 e c2 + d2 6= 1. Pela multiplicatividade da norma, p2 = N (p) = N (a + bi)N (a + di) = (a2 + b2 )(c2 + d2 ), mas a única possibilidade para que isto ocorra é que a2 + b2 = c2 + d2 = p. Suponhamos (iv) e que p > 2. Dado a ∈ Z temos que a2 ≡ 0 ou 1 (mod 4). Assim, as possibilidades para a2 + b2 (mod 4) são 0, 1 ou 2. Mas como p é primo apenas a segunda possibilidade pode acontecer. 15.5.2. Lei de reciprocidade quadrática. Definição 15.47. Vamos reescrever o ı́tem (ii) do teorema de outra forma. Seja a ∈ Z, dizemos que a é resto quadrático módulo p se existe b ∈ Z tal que b2 ≡ a (mod p). Assim em (ii) estamos dizendo que -1 é resto quadrático módulo p. Dado a ∈ Z e um número primo p tal que p - a, definimos o sı́mbolo de Legendre de a em p por a = 1, se a é resto quadrático módulo p, p a = −1, caso contrário. p Assim o teorema afirma que p é soma de quadrados se e somente se (−1/p) = 1. Um importante teorema na teoria dos números (que não demonstraremos aqui) é a lei de reciprocidade quadrática (cf [IrRo, chapter 5]). Teorema 15.48 (lei de reciprocidade quadrática). Sejam p, q > 2 primos distintos. Enão p−1 q−1 p q = (−1) 2 2 . q p Uma maneira de interpretar esta lei é uma fórmula de inverter o sı́mbolo de Legendre, ou seja, p−1 q−1 q p 2 2 = (−1) . p q Por exemplo, se p, q ≡ 1 (mod 4), então q p = 1 se e somente se = 1. p q Se p, q ≡ 3 (mod 4), então p q = 1 se e somente se = −1. q p Finalmente se p ≡ 1 (mod 4) e q ≡ 3 (mod 4) (ou vice-versa), então p q = 1 se e somente se = 1. q p Parte 4 Corpos CAPı́TULO 16 Extensões finitas Sejam K ⊂ L dois corpos. Dizemos que L é uma extensão de K ou que L/K é uma extensão de corpos. Notemos neste caso que a multiplicação de elementos de K por elementos de L induz em L uma estrutura de K-espaço vetorial. Quando L é um K-espaço vetorial de dimensão finita, dizemos que L/K é uma extensão finita e denotamos dimK L = [L : K] chamado o grau da extensão. Proposição 16.1. Sejam K ⊂ L ⊂ M corpos. Então M/K é uma extensão finita se e somente se M/L e L/K são extensões finitas e neste caso [M : K] = [M : L][L : K]. Demonstração. Suponha que M/K seja uma extensão finita. Qualquer conjunto de elementos de M que seja L-linearmente independente é em particular Klinearmente independente. Portanto, o número máximo de vetores L-linearmente independentes em M é [M : K], em particular M/L é finita. Como L ⊂ M e M é um K-espaço vetorial de dimensão finita, concluimos que o mesmo vale para L, i.e., L/K é finita. Suponha que M/L e L/K sejam finitas. Sejam {α1 , · · · , αn } uma base de M/L e {β1 , · · · , βm } uma base de L/K. Afirmamos que o conjunto {αi βj }1≤i≤n,1≤j≤m é uma base de M/K. Disto segue imediatamente a proposição. Seja x ∈ M , então n X x= ai αi , i=1 onde a1 , · · · , an ∈ L. Além disto para todo i = 1, · · · , n, temos que ai = m X bij βj , j=1 onde βj ∈ K. Logo, x= n X m X bij αi βj , i=1 j=1 em particular o conjunto acima gera M como K-espaço vetorial. Suponha que tenhamos uma K-combinação linear trivial n X m X cij αi βj = 0, i=1 j=1 119 120 16. EXTENSÕES FINITAS onde para todo i, j, cij ∈ K. Reescremos n m X X cij βj αi = 0. i=1 j=1 Como para todo i temos m X cij βj ∈ L e {α1 , · · · , αn } j=1 é um conjunto L-linearmente independente, concluimos que para todo i temos m X cij βj = 0. j=1 Por outro lado, segue do fato de {β1 , · · · , βm } ser K-linearmente independente que cij = 0 para todo i, j. Corolário 16.2. Seja L/K uma extensão finita de grau primo. Então para todo corpo F tal que K ⊂ F ⊂ L temos que F = K ou F = L. Definição 16.3. Seja L/K uma extensão finita com base {α1 , · · · , αn } e u ∈ L. Definimos o polinômio caracterı́stico de u em relação a L/K da seguinte forma. Para todo i = 1, · · · , n temos n X uαi = aij αj . j=1 O polinômio é definido por Fu,L/K (x) := det(Ix − (aij )). Denotamos A := (aij ). Observação 16.4. (1) Fu,L/K tem coeficiente lı́der 1 e grau n = [L : K]. (2) Fu,L/K não depende da escolha da base. De fato, seja {β1 , · · · , βn } uma outra base de L/K e B a matriz de mudança de base de {β1 , · · · , βn } para {α1 , · · · , αn }. Seja C := B −1 . Assim, uβi = u = n X j=1 n X bij αj = n X j=1 bij n X ajl αl = (BA)il αl l=1 (BA)il clh βh = (BAC)ih βh . h=1 Assim, det(Ix−(BAB −1 )) = det(B(Ix−A)B −1 ) = det(B) det(Ix−A) det(B −1 ) = Fu,L/K . (3) Se u ∈ K, então Fu,L/K = (x − u)n . Proposição 16.5. Sejam K ⊂ L ⊂ M tais que M/L e L/K sejam extensões finitas. Seja u ∈ L. Então [M :L] Fu,M/K = Fu,L/K . 16. EXTENSÕES FINITAS 121 Demonstração. Sejam {α1 , · · · , αn } uma base de M/L e {β1 , · · · , βm } uma base de L/K. Então {αi βj }1≤i≤n,1≤j≤m é uma base de M/K. Note que uαi βj = αi m X ajl βl = l=1 m X ajl αi βl . l=1 Assim, em cada bloco {α1 β1 , · · · , α1 , βm }, ... , {αn β1 , · · · , αn βm } a matriz do operador linear definido pela multiplicação por u é igual a A. Portanto, Fu,M/K Ix − A 0 0 Ix −A = det . .. . . . 0 0 ··· ··· ··· ··· 0 0 .. . n . = Fu,L/K Ix − A Definição 16.6. Escrevendo explicitamente, Fu,L/K = xn + f1 xn−1 + . . . + fn−1 x + fn . O traço TL/K (u) de u em relação a L/K é definido por TL/K (u) := −f1 . A norma NL/K (u) de u em relação a L/K é definida por NL/K (u) := (−1)n fn . Observe que expandindo o determinante que define Fu,L/K obtemos f1 = n X aii = Tr(A), o traço da matriz A, e fn = det(A). i=1 Definição 16.7. Sejam L/K uma extensão de corpos f ∈ K[x]\{K}. Dizemos que um elemento α ∈ L é raiz de f se f (α) = 0. Suponhamos conhecidas u1 , · · · , un as raı́zes de Fu,L/K . Note que uma destas raı́zes, digamos u1 , é exatamente u. Observe também que usando o algoritmo da divisão, se α é raiz de f então f (x) = (x − α)g(x), para algum g ∈ K[x]. Neste caso temos a fatoração Fu,L/K (x) = n Y i=1 (x − ui ). 122 16. EXTENSÕES FINITAS Desenvolvendo este produto obtemos n X f1 = − ui i=1 X f2 = ui uj 1≤i<j≤n f3 = − X ui uj uk 1≤i<j<k≤n .. .. . . fn = (−1)n n Y ui . i=1 Assim, TL/K (u) = NL/K (u) = n X i=1 n Y ui ui . i=1 Definição 16.8. Sejam x1 , · · · , xn variáveis independentes (ver definição no capı́tulo de extensões trancendentes) sobre um corpo K. Para todo 1 ≤ i ≤ n definimos a i-ésima função simétrica elementar nas variáveis x1 , · · · , xn por X si (x1 , · · · , xn ) := uj1 . . . uji . 1≤j1 <·<ji ≤n Observe que para todo 1 ≤ i ≤ n temos fi = (−1)i si (u1 , · · · , un ). Segue imediatamente da lineraridade de traço de matriz e da multiplicatividade de determinante de matriz o seguinte lema. Lema 16.9. (1) Se u ∈ K, então NL/K (u) = un e TL/K (u) = nu. (2) A função NL/K é multiplicativa, i.e., NL/K (uv) = NL/K (u)NL/K (v). (3) A função TL/K é K-linear, i.e., TL/K (u + v) = TL/K (u) + TL/K (v) e TL/K (au) = aTL/K (u), para a ∈ K. (4) Se K ⊂ L ⊂ M são extensões finitas e u ∈ L, então NM/K (u) = u[M :L] e TM/K (u) = [M : L]TL/K (u). CAPı́TULO 17 Extensões algébricas 17.1. Elementos algébricos e transcendentes Seja L/K uma extensão de corpos e α ∈ L. Dizemos que α é algébrico sobre L, se existe f ∈ K[x] − {0} tal que f (α)√ = 0. Caso não exista tal f dizemos que α é transcendente sobre K. Por exemplo, 2 ∈ R é algébrico sobre Q, pois é raiz de x2 −2 e i ∈ C é algébrico sobre Q, pois é raiz de x2 +1. Por outro lado, são teoremas não triviais devidos a Lindeman e Hilbert (resp.) que e, π ∈ R são transcendentes sobre Q (ver capı́tulo de extensões transcendentes). Na situação acima definimos a função ϕα : K[x] → L por ϕα (g) := g(α). Fica como exercı́cio mostrar que ϕα é um homomorfismo de anéis. Seja K[α] a imagem de ϕα . Este é um subanel de L. Seja N (ϕα ) o núcleo de ϕα , i.e., este é o conjunto dos elementos g ∈ K[x] tais que g(α) = 0, ou seja, este é o conjunto dos polinômios dos quais α é raiz. Este conjunto é um ideal de K[x]. Teorema 17.1. Seja L/K uma extensão de corpos e α ∈ L. (1) O elemento α é transcendente sobre K se e somente se ϕα é injetiva o que equivale a N (ϕα ) = (0). Neste caso, K[α] é isomorfo ao anel de polinômios K[x]. (2) O elemento α é algébrico sobre K se e somente se K[α] é um corpo. Neste caso, [K[α] : K] = grau(Pα|K ). Demonstração. Note que (1) é imediato das definições. (2) Inicialmente, α é algébrico se e somente se N (ϕα ) 6= (0). Suponha que isto ocorra. Seja Pα|K o gerador mônico do ideal N (ϕα ). Este polinômio é chamado o polinômio mı́nimo de α sobre K. Por definição este é o polinômio mônico de menor grau do qual α é raiz, sendo em particular irredutı́vel. Mas, isto equivale a dizer que o ideal N (ϕα ) = (Pα|K ) é um ideal maximal de K[x]. Esta última afirmativa equivale a dizer o anel quociente K[x]/(Pα|K ) é um corpo. Note que pelo teorema dos homomorfismos K[α] é isomorfo como anel a K[x]/(Pα|K ). Portanto K[α] é um corpo. Reciprocamente, se K[α] for um corpo, então por (1), temos que α é algébrico sobre K, pois K[x] não é corpo, uma vez que 1/x ∈ / K[x]. Provemos a última afirmativa. Seja n := grau(Pα|K ). Afirmamos que {1, α, · · · , αn−1 } é uma base de K[α]/K. De fato, este conjunto é K-linearmente independente, do contrário existiriam a0 , · · · , an−1 ∈ K não todos nulos tais que a0 + . . . + an−1 αn−1 = 0. 123 124 17. EXTENSÕES ALGÉBRICAS Ou seja α é raiz do polinômio f (x) = n−1 X ai xi 6= 0. i=0 Mas isto contradiz a minimalidade do grau de Pα|K . Para ver que este conjunto gera K[α], seja g ∈ K[x] \ {0}. Dividindo g por Pα|K obtemos g = Pα|K q + r, para q, r ∈ K[x] tais que r = 0 ou grau(r) < n. Substituindo x por α concluimos que g(α) = r(α). A fortiori, g(α) é uma K-combinação linear de {1, α, · · · , αn−1 }. Lema 17.2. Sejam L/K uma extensão de corpos e α ∈ L algébrico sobre K. Então (1) Fα,K[α]/K = Pα|K . (2) Em particular, se L/K for finita, então [L:K[α]] Fα,L/K = Pα|K . Demonstração. (1) Por definição, Fα,L/K é um polinômio mônico de grau n tendo α como raiz. Logo Fα,K[α]/K ∈ N (ϕα ), i.e., Pα|K | Fα,K[α]/K . Mas pela igualdade do grau e por ambos serem mônicos concluimos que Pα|K = Fα,K[α]/K . (2) Vimos no capı́tulo anterior que [L:K[α]] [L:K[α]] Fα,L/K = Fα,K[α]/K , i.e., Fα,L/K = Pα|K . Este é um caso particular do teorema de Cayley-Hamilton da álgebra linear. 17.2. Extensões algébricas Definição 17.3. Uma extensão L/K é dita algébrica se todo α ∈ L é algébrico sobre K. Caso exista algum α ∈ L transcendente sobre K dizemos que L/K é transcendente. Proposição 17.4. Toda extensão finita é algébrica. Demonstração. Sejam L/K uma extensão finita e α ∈ L. Então existe n ≥ 1 inteiro mı́nimo tal que {1, α, · · · , αn−1 } é um conjunto K-linearmente independente. Ou seja, existem a0 , · · · , an ∈ K não todos nulos tais que n X ai αi = 0. i=0 A fortiori, α é raiz do polinômio não nulo f := n X ai xi . i=0 17.2. EXTENSÕES ALGÉBRICAS 125 Definição 17.5. Seja L/K uma extensão algébrica. Suponhamos que existam α1 , · · · , αr ∈ L tais que K ⊂ K1 = K[α1 ] ⊂ K2 = K1 [α2 ] ⊂ · · · ⊂ Kr = Kr−1 [αr ] = K[α1 , · · · , αr ] = L. Dizemos que L/K é uma extensão finitamente gerada e que L é gerada sobre K por α1 , · · · , αr . Proposição 17.6. Seja L/K uma extensão algébrica. Então L/K é finita se e somente se L/K é finitamente gerada. Demonstração. Suponha que L/K seja finita. Se L = K acabou. Senão existe α1 ∈ L \ K. Seja K1 := K[α1 ]. Se L = K1 acabou. Senão existe α2 ∈ L \ K1 . Seja K2 := K1 [α2 ]. Prosseguindo o argumento temos uma seqüência de corpos estrita, i.e., K ( K1 ( K2 ( · · · . Como L/K é finita esta seqüência não pode ser infinita. Logo existe r tal que L = Kr e L/K é finitamente gerada. Reciprocamente, se L/K é finitamente gerada então cada extensão Ki /Ki−1 é finita e pela transitividade de extensões finitas, concluimos que L/K também é finita. Teorema 17.7. Sejam M/L e L/K extensões de corpos. algébrica se e somente se M/L e L/K também são algébricas. Então M/K é Demonstração. Segue da definição que se M/K é algébrica então M/L e L/K também são algébricas. Suponhamos que estas duas extensões sejam algébricas. Seja α ∈ M e Pα|L := n−1 X ai xi + xn . i=0 Seja L a extensão de K gerada por a0 , · · · , an−1 . Então L ⊂ L e Pα|L ∈ L[x]. Pela proposição anterior L/K é finita. Além disto, como α é algébrico sobre L, então L[α]/L é finita. Pela transitividade de extensões finitas concluimos que L[α]/K é finita. Por outro lado, K ⊂ K[α] ⊂ L[α], logo K[α]/K é finita. Em particular, α é algébrico sobre K. Exemplo 17.8. Seja L/K extensão com [L : K] = p número primo. Então para todo K ⊂ K 0 ⊂ L temos que K 0 = K ou K 0 = L. Em particular, dado α ∈ L \ K, então L = K[α]. √ Exemplo 17.9. Seja L/Q tal que [L : Q] = 2. Mostraremos que L = Q[ d] para d ∈ Q que não é um quadrado. Pelo exemplo anterior, dado α ∈ L \ Q temos que L = Q[α]. Seja a a2 Pα|Q := x2 + ax + b = x + + b− . 2 4 A mudança de variável x 7→ x+a/2 transforma Pα|Q em X 2 −β, onde β = (a2 /4)−b. Além disto esta mudança de variável é um automorfismo de K[x], portanto x2 − β é irredutı́vel, assim tomamos d = β. 126 17. EXTENSÕES ALGÉBRICAS 17.3. Adjunção de raı́zes Lema 17.10 (lema da duplicação). Sejam κ : K → K 0 um isomorfismo de corpos e L0 ⊃ K 0 um corpo contendo K 0 . Então existe uma extensão L/K e um isomorfismo de corpos λ : L → L0 estendendo κ, i.e., λ|K = κ. Demonstração. Suponha que L0 ∩ K = ∅. Definimos L da seguinte forma : L := K q (L0 \ K 0 ), onde q denota união disjuta. Definimos λ por λ : L → L0 , se x ∈ K, então λ(x) := κ(x); se x ∈ L0 \ K 0 , então λ(x) := x. Dessa forma λ é uma bijeção. Utilizamos esta bijeção para colocar uma estrutura de corpo em L por : dados x, y ∈ L definimos x + y := λ−1 (λ(x + y)) e xy := λ−1 (λ(x)λ(y)). Com esta estrutura, λ é o isomorfismo de corpos procurado. Se L0 ∩ K 6= ∅, basta aplicar o lema 1.1 para obter um conjunto L00 e uma bijeção λ0 : L0 → L00 tal que L00 ∩ K = ∅. Novamente, definimos uma estrutura de 0 0 corpo em L00 por x0 +y 0 := λ −1 (λ0 (x)+λ0 (y)) et x0 y 0 := λ −1 (λ(x)λ(y)). Aplicamos agora a parte anterior substituindo K 0 por K 00 := λ0 (K 0 ) e κ por κ0 := λ0 ◦ κ. Definição 17.11. Seja κ : K → K 0 um homomorfismo não nulo de corpos (logo necessariamente injetivo). Este homomorfismo induz um homomorfismo de anéis de polinômios da seguinte forma κ∗ : K[x] → K 0 [x] n X i=0 ai xi 7→ n X κ(ai )xi . i=0 Teorema 17.12. Dado f ∈ K[x] \ K irredutı́vel existe uma extensão finita L/K e α ∈ L tal que f (α) = 0. Demonstração. Como f é irredutı́vel o ideal (f ) é maximal, logo o anel quociente L := K[x]/(f ) é um corpo. Consideremos o homomorfimso sobrejetivo ϕ : K[x] → K[x] definido por g 7→ g (f ) (mod (f )). Este homomorfismo não é o homomorfismo nulo, logo é injetivo quando restrito a K, i.e., ϕ|K : K → K := ϕ(K) é um isomorfismo de corpos. Este induz um isomorfismo de anéis de polinômios ϕ∗|K : K[x] → K[x] como na definição anterior. Em particular, se x := ϕ(x), então ϕ∗|K (f )(x) = n X ϕ(ai )xi = ϕ(f (x)) ≡ 0 (mod (f )). i=0 Assim x ∈ L é uma raiz de ϕ∗|K (f ). Pelo lema da duplicação, existe uma extensão L/K e um isomorfismo λ : L → L tal que λ|K = ϕ|K . A fortiori, definindo α := λ−1 (x), este elemento é uma raiz de f em L. Corolário 17.13. Seja f ∈ K[x] \ K, então existe uma extensão finita L/K e α ∈ L tal que f (α) = 0. 17.4. FECHOS ALGÉBRICOS 127 Demonstração. Basta fatorar f em fatores irredutı́veis e usar o teorema para determinar uma extensão finita de K no qual um dos fatores tenha raiz. Esta raiz será também raiz de f . Corolário 17.14. Seja f ∈ K[x] \ K. Existe uma extensão finita L/K tal que f fatora-se linearmente em L[x]. Demonstração. Aplicando o teorema sucessivamente a cada fator irredutı́vel de f obtemos em cada etapa uma extensão finita do corpo anterior e mais uma raiz do fator. Como o número de fatores é finito e o número de raı́zes em cada fator também o é, pela transitividade de extensões finitas, concluimos que existe L/K finita como no corolário. 17.4. Fechos algébricos Definição 17.15. Seja L/K uma extensão de corpos. Definimos AL (K) como o conjunto dos elementos α ∈ L que são algébricos sobre K. Este conjunto é chamado o fecho algébrico de K em L. Observação 17.16. O conjunto AL (K) é um corpo. De fato, basta mostrar que dados α, β ∈ AL (K) \ {0}, então α + β, αβ, α−1 ∈ AL (K). Provemos o caso de α + β, os demais são similares. Por hipótese K[α] e K[β] são corpos e K[α]/K e K[β]/K são finitas. Seja K[α, β] a extensão gerada sobre K por α e β. Considere o seguinte diagrama de corpos. K[α, β] / | \ K[α] K[α + β] K[β] \ | / K A extensão K[α, β] é gerada por β sobre K[α]. Como β é algébrico sobre K e K ⊂ K[α], concluimos que β é algébrico sobre K[α]. Logo a extensão K[α, β]/K[α] é finita. Pela transitividade de extensões finitas, concluimos que K[α, β]/K é finita. Mas, K ⊂ K[α + β] ⊂ K[α, β]. Logo K[α + β]/K é finita, portanto α + β ∈ AL (K). Exemplo 17.17. Seja K um corpo, L/K extensão e τ ∈ L transcendente sobre K. Afirmamos que K é algebricamente fechado em K(τ ) = {f (τ )/g(τ ) | f, g ∈ K[x], g 6= 0}. De fato, se existisse α ∈ K(τ ) \ K algébrico sobre K, digamos α = f (τ )/g(τ ), então K[α]/K seria finita. Observe que h := f (x) − αg(x) ∈ (K[α])[x] e h(τ ) = 0, ou seja, τ é algébrico sobre K[α]. Portanto, K(τ ) = (K[α])[τ ] é algébrico sobre K, mas isto é impossı́vel, pois τ é transcendente sobre K. Definição 17.18. Dizemos que um corpo K é algebricamente fechado, se todo f ∈ K[x] \ K possui uma raiz α ∈ K. A seguinte proposição é uma conseqüência direta desta definição, da fatoração de polinômios e da definição sobre elementos algébricos. Proposição 17.19. As seguintes condições são equivalentes. (1) K é algebricamente fechado. 128 17. EXTENSÕES ALGÉBRICAS (2) Todo f ∈ K[x] \ K fatora-se como produto de polinômios lineares. (3) Todo f ∈ K[x] irredutı́vel tem grau 1. (4) Não existe extensão L ) K algébrica. O primeiro exemplo de corpo algebricamente fechado é C. Teorema 17.20 (teorema fundamental da Álgebra). [Lins, p.199, corolário 4] O corpo C é algebricamente fechado. Exemplo 17.21. Seja f ∈ R[x]. Mostremos que grau(f ) = 1 ou 2. Seja β ∈ C uma raiz de f . Então f = Pβ|R e como R ⊂ R[β] ⊂ C, e [C : R] = 2, então grau(f ) = 1 ou 2. Definição 17.22. Sejam K ⊂ Ω corpos com Ω algebricamente fechado. Dizemos que AΩ (K) é um fecho algébrico de K. Definição 17.23. Sejam K um corpo e I um conjunto qualquer de ı́ndices. O anel de polinômios K[xI ] em variáveis xi parametrizadas por elementos i ∈ I é definido como sendo o conjunto de polinômios f com coeficientes em K em um número finito de variáveis xi1 , · · · , xin , para i1 , · · · , in ∈ I. Teorema 17.24. Para todo corpo K existe um corpo Ω ⊃ K algebricamente fechado. Demonstração. Seja P o conjunto dos polinômios irredutı́veis mônicos em K[x]. Seja R o anel R := K[xP ]. Considere o ideal p de R gerado pelo conjunto {P (xP ) | P ∈ P}. Este ideal é próprio, caso contrário existiriam P1 , · · · , Pr ∈ P e G1 , · · · , Gr ∈ K[xP1 , · · · , xPr ] ⊂ R tais que r X P (xPi )Gi (xP1 , · · · , x(Pr )) = 1. i=1 Mas pelo corolário 17.14 existe uma extensão finita L/K tal que P1 . . . Pr fatora-se linearmente em L. Para cada 1 ≤ i ≤ r seja αi ∈ L uma raiz de Pi . Logo r X 1= P (αi )Gi (α1 , · · · , αr ) = 0, i=1 o que é uma contradição. Pelo lema de Krull, existe m ( R ideal maximal contendo p. Considere o homomorfismo quociente ϑ : R → R/m. A restrição κ de ϑ a K induz um isomorfimso de corpos κ : K → K := ϑ(K). Pelo lema da duplicação existe uma extensão L1 /K e um isomorfismo de corpos λ : L1 → R/m estendendo κ. Como na demonstração do teorema 17.12 αP := ϑ(xP ) é uma raiz de ϑ∗ (P ), e a fortiori λ−1 (αP ) ∈ L1 é uma raiz de P . Dessa forma construimos uma extensão L1 /K na qual todo elemento de P possui uma raiz. Prosseguindo indutivamente, contruimos uma seqüência de corpos L0 := K ⊂ L1 ⊂ L2 ⊂ · · · ⊂ Ln ⊂ · · · tais que todo S polinômio irredutı́vel mônico em Lj [x] possui uma raiz em Lj+1 . Seja Ω := j≥1 Lj . Este conjunto é um corpo contendo K e afirmamos que é algebricamente fechado. De fato, dado f ∈ Ω[x] \ Ω, este fatora-se linearmente em algum Lj [x] para j suficientemente grande. Portanto, por construção, f possui raiz em Lj+1 ⊂ Ω. 17.4. FECHOS ALGÉBRICOS 129 Corolário 17.25 (existência de fecho algébrico). Todo corpo K possui um fecho algébrico. Demonstração. Pelo teorema anterior existe extensão Ω/K tal que Ω é algebricamente fechado, portanto AΩ (K) é um fecho algébrico de K. Teorema 17.26. Sejam K, K 0 corpos, κ : K → K 0 um isomorfismo de corpos, L/K, L0 /K 0 extensões de corpos, α ∈ L (resp. α0 ∈ L0 ) algébrico sobre K (resp. algébrico sobre K 0 ). As seguintes condições são equivalentes. (1) O isomorfismo κ estende-se a um isormorfismo de corpos κα : K[α] → K 0 [α0 ] tal que κα (α) = α0 . (2) κ∗ (Pα|K ) = Pα0 |K 0 . Demonstração. Suponha (1). Então κ∗ (Pα|K )(α0 ) = κα (Pα|K (α)) = 0, em particular κ∗ (Pα|K ) | Pα0 |K 0 . Mas estes dois polinômios são irredutı́veis mônicos. Portanto vale a igualdade. Suponha (2). Sabemos que K[α] ∼ = K[x]/(Pα|K ) e K 0 [α0 ] ∼ = K 0 [x]/(Pα0 |K 0 ). Assim, compondo os isomorfismos abaixo encontramos κα : ∼ K[x] κ K 0 [x] ∼ = = K[α] −→ −→ −→ K 0 [α0 ]. (Pα|K ) (Pα0 |K 0 ) Definição 17.27. Sejam L e L0 extensões de K e λ : L → L0 um isomorfismo de corpos. Dizemos que λ é um K-isomorfismo, se λ|K for a identidade. Em particular, tomando K = K 0 , κ a identidade e L = L0 obtemos o corolário. Corolário 17.28. Sejam L/K uma extensão de corpos e α, α0 ∈ L algébricos sobre K. As seguintes condições são equivalentes. (1) Existe um K-isomorfismo K[α] → K[α0 ] tal que α 7→ α0 . (2) Pα|K = Pα0 |K 0 . Definição 17.29. Sejam L/K uma extensão e α, β ∈ L algébricos sobre K. Dizemos que α é K-conjugado a β (denotamos por α ∼K β), se Pα|K = Pβ|K . Esta noção independe da escolha da extensão L/K. O conjunto Cα dos K-conjugados de α é finito, pois #Cα ≤ grau(Pα|K ). Proposição 17.30. Seja L/K uma extensão algébrica. Todo K-endomorfismo de L é também um K-isomorfismo de L. Demonstração. Seja σ um K-endomorfismo de L. Observe que para todo α ∈ L temos σ(Cα ) ⊂ Cα , pois Pα|K (σ(β)) = β(Pα|K (β)) = 0. Mas Cα é finito e σ é injetivo (pois é não nulo). Logo σCα é uma bijeção de um conjunto finito nele mesmo. A fortiori, σ é sobrejetiva e σ é um K-automorfismo de L. Teorema 17.31 (extensão de homomorfismos). Sejam L/K uma extensão algébrica e κ : K → Ω um homomorfismo de corpos com Ω algebricamente fechado. Então existe λ : L → Ω um homomorfismo de corpos estendendo κ. Demonstração. Suponha inicialmente que L = k[α] para algum α ∈ L. Seja α0 ∈ Ω uma raiz de κ∗ (Pα|K ). Assim, κ∗ (Pα|K ) = Pα0 |K 0 , onde K 0 := κ(K). Pelo teorema 17.26, existe um homomorfismo de corpos λ : L → Ω estendendo κ tal que λ(α) = α0 . 130 17. EXTENSÕES ALGÉBRICAS No caso geral, consideramos o conjunto M de pares ordenados (L0 , λ0 ) formados por extensões L0 /K contidas em L e homomorfismos de corpos λ0 : L0 → Ω estendendo κ. Definimos uma ordem parcial em M por (L0 , λ0 ) ≤ (L00 , λ00 ) se e somente se L0 ⊂ L00 e λ0 = λ00|L0 . O conjunto M é indutivo. De fato, se L := {(Lj , λj ) | j ∈ J} ⊂ M for um subconjunto totalmente ordenado, então o corpo [ LJ := Lj j∈J é um subcorpo de L e definindo λJ em cada Lj por λJ := λj obtemos (por construção) um homomorfismo de corpos λJ : LJ → Ω. Além disto, temos que (Lj , λj ) ≤ (LJ , λJ ) para todo j ∈ J. Assim, (LJ , λJ ) é um limite superior para M. Pelo lema de Zorn, o conjunto M admite elemento maximal (L̃, λ̃). Afirmamos que L̃ = L. De fato, caso contrário, se α ∈ L̃ \ L, utlizando a primeira parte da prova, poderı́amos estender λ̃ a um homomorfismo de corpos L̃(α) → Ω, o que é uma contradição. Teorema 17.32 (unicidade a menos de isomorfismo). Seja K um corpo. Suponha que Ω e Ω1 sejam corpos algebricamente fechados contendo K. Então AΩ (K) e AΩ1 (K) são K-isomorfos. Demonstração. Pelo teorema anterior, existe um K-homomorfismo λ : AΩ (K) → Ω1 . É claro que a imagem de λ está contida em AΩ1 (K). Por outro lado para todo α1 ∈ AΩ1 (K) e toda raiz α ∈ Ω de Pα1 |K temos que Pα|K = Pα1 |K . Logo, pelo teorema 17.26, concluimos que existe um K-isomorfismo K[α] → K[α1 ] tal que α 7→ α1 . Em particular, λ(AΩ (K)) = AΩ1 (K). Exemplo 17.33. A motivação para o teorema anterior vem da seguinte situação. Uma maneira de construir R a partir de Q é adicionar a Q os limites de seqüências de Cauchy de elementos de Q (ver [Li]). Por isto dizemos que R é o completamento de Q. Note-se entretanto que está implı́cito na discussão anterior que estamos utilizando para a noção de limite o valor absoluto usual dos números racionais. Tal valor absoluto é arquimediano, ou seja satisfaz a desigualdade triangular |x + y| ≤ |x| + |y|. Por isto vamos dizer que R é o completamento arquimediano de Q. Na linguagem da geometria aritmética moderna, o valor absoluto arquimediano nada mais é que o primo no infinito que compatifica o conjunto (esquema) Spec(Z) dos ideais primos de Z. Porque dizemos isto? Para cada número primo p, pela unicidade da fatoração de números inteiros em produto de números primos, para todo x ∈ Q existe um único ordp (x) ∈ Z tal que x = pordp (x) x0 , onde nem o numerador nem o denominador de x0 ∈ Q são divisı́veis por p. Isto permite definir o seguinte valor absoluto (chamado de p-ádico) |x|p := p−ordp (x) . Este valor absoluto é não arquimediano, ou seja, vale uma propriedade mais forte que a propriedade triangular, |x + y|p ≤ max(|x|p , |y|p ). Repetimos o procedimento de construção de R a partir de Q e acrescentamos a Q os limites de seqüências de Cauchy (com respeito ao valor absoluto p-ádico). O 17.4. FECHOS ALGÉBRICOS 131 conjunto obtido é o corpo Qp dos números p-ádicos. Uma outra forma de representar um elemento de Qp é através de uma “série de Laurent” X ai pi , x= i≥n onde n ∈ Z e 0 ≤ ai < p é inteiro para todo i. Assim, Qp é o completamento de Q com respeito ao valor absoluto p-ádico. Pelo teorema 17.24 existe um corpo algebricamente fechado contendo R, por exemplo C, e um corpo algebricamente fechado (até completo, mas isto não segue do teorema, ver [Kob]) Cp contendo Qp . Assim, terı́amos por um lado o fecho algébrico AC (Q) de Q en C (chamado o corpo de todos os números algébricos e denotado por Q) e o fecho algébrico ACp (Q) de Q em Cp . O que o teorema nos diz é que apesar destes dois fechos algébricos serem subcorpos de corpos distintos (os valores absolutos são diferentes), eles são Q-isomorfos. Isto nos permite usar a notação Q sem ambuiguidade. Nos tópicos adicionais comentaremos sobre um grupo ligado a Q e um dos objetos mais importantes da aritmética (bastante misterioso, ainda) o grupo de Galois absoluto de Q. CAPı́TULO 18 Extensões separáveis Definição 18.1. Seja f ∈ K[x], L/K uma extensão de corpos e α ∈ L uma raiz de f . A multiplicidade m = m(f, α) de α como raiz de f é definido como o maior inteiro m ≥ 1 tal que existe g ∈ L[x] com g(α) 6= 0 satisfazendo a f = (x − α)m g. Se m = 1 dizemos que α é uma raiz simples, caso contrário que é uma raiz múltipla. No capı́tulo 15, seção 15.3 mostramos que dados f, g ∈ K[x]\K eles possuem um fator comum não constante (logo uma raiz comum, utilizando o capı́tulo anterior) se e somente sua resultante Res(f, g) for nula. Além disto, mostramos também que f possui fator múltiplo (logo raiz múltipla) se e somente se seu discriminante disc(f ) for nulo. Lembre que disc(f ) = Res(f, D(f )), onde D(f ) denota a derivada de f . Definição 18.2. Seja D um domı́nio de integridade. Consideremos o homomorfismo ϑ : Z → D tal que ϑ(1) = 1D , onde 1D denota o elemento neutro multiplicativo de D. Seja I = N (ϑ) o núcleo de ϑ. Se N (ϑ) = (0) (i.e., ϑ for injetivo) dizemos que a caracterı́stica car(D) como 0. Caso isto não ocorra I é um ideal não nulo de Z, logo I = nZ para algum n ≥ 1. Além disto pelo teorema dos isomorfismos Z/nZ é isomorfo a um subdomı́nio de D. Mas Z/nZ é um domı́nio se e somente se n = p é um número primo. Neste caso dizemos que car(D) = p. Note que neste caso p.1D = 0 e para todo a ∈ D temos também que pa = 0. Observe também que p X p i p−i (a + b)p = ab = ap + bp , i i=0 pois para todo i = 1, · · · , p − 1 temos p ≡0 i (mod p). Teorema 18.3. Seja L/K uma extensão de corpos e α ∈ L algébrico sobre K. Então Pα|K não possui raı́zes múltiplas ou existe h ∈ K[x] tal que Pα|K (x) = h(xp ) e neste caso p = car(K). Demonstração. Suponha que D(Pα|K ) 6= 0. Neste caso, como grau(D(Pα|K )) < grau(Pα|K ), então mdc(Pα|K , D(Pα|K )) = 1, i.e., Pα|K não admite raı́zes múltiplas. Seja Pα|K = xn + n−1 X i=0 133 ai xi . 134 18. EXTENSÕES SEPARÁVEIS Então D(Pα|K ) = 0 se e somente se para todo i tal que ai 6= 0 temos que i = 0 em K (i.e., i ≡ 0 (mod p) em Z). Assim, 0 0 Pα|K = xn p + a(n0 −1)p x(n −1)p + . . . + ap xp + a0 e basta tomar 0 0 h = xn + a(n0 −1)p xn −1 + . . . + ap x + a0 . Definição 18.4. Dado f ∈ K[x] \ K, dizemos que f é separável, se f não admite raı́zes múltiplas. Seja L/K uma extensão de corpos e α ∈ L algébrico sobre K, então α é dito separável sobre K, se Pα|K for separável. Uma extensão algébrica L/K é dita separável, se todo α ∈ L for separável sobre K. Um corpo K é dito perfeito, se car(K) = 0 ou car(K) = p e K = K p = {ap | a ∈ K} (i.e., todo elemento de K é p-potência). Note que a inclusão K p ⊂ K é sempre satisfeita. A questão é a inclusão oposta. Proposição 18.5. Um corpo K é perfeito se e somente se para todo f ∈ K[x] irredutı́vel for separável. Demonstração. Suponha que K seja perfeito e seja f ∈ K[x] irredutı́vel. Seja L/K finita e α ∈ L tal que f (α) = 0. Logo f = aPα|K para a ∈ K ∗ . Se car(K) = 0 ou D(Pα|K ) 6= 0, então Pα|K é separável (logo o mesmo vale para f ). Caso isto não ocorra, então Pα|K (x) = h(xp ) para algum h ∈ K[x] e p = car(K). Como K é perfeito K = K p . Escrevendo Pα|K = n X aip xip i=0 temos que para todo i existe bi ∈ K tal que aip = bpip . Logo Pα|K = ( n X bip xi )p i=0 é redutı́vel, o que é uma contradição. Reciprocamente, suponha que todo f ∈ K[x] irredutı́vel seja separável. Se car(K) = 0 nada há a fazer. Suponhamos que car(K) = p. Seja a ∈ K e f = xp −a. Existe uma extensão finita L/K e α ∈ L tal que f (α) = 0, em particular Pα|K | f = (x − α)p , i.e., Pα|K = (x − α)` , para algum 1 ≤ ` ≤ p. Mas pela separabilidade de Pα|K , temos que ` = 1 e α ∈ K. Proposição 18.6. Um corpo K é perfeito se e somente se toda extensão algébrica L/K for separável. Demonstração. Suponha que K seja perfeito e seja L/K uma extensão algébrica. Pela proposição anterior para todo α ∈ L temos que Pα|K é separável. Reciprocamente, suponhamos que toda extensão algébrica L/K seja separável. Novamente, se car(K) = 0 nada há a fazer. Suponhamos que car(K) = p. Seja a ∈ K e f = xp − a. Seja L/K finita e α ∈ L tal que f (α) = 0. Logo Pα|K | f e pelo mesmo argumento anterior α ∈ K. 18. EXTENSÕES SEPARÁVEIS 135 Definição 18.7. Seja L/K uma extensão algébrica. Dizemos que α ∈ L é inseparável sobre K, se não for separável, i.e., se Pα|K admitir raı́zes múltiplas. Para provar uma proposição sobre transitividade de extensões separáveis, precisamos antes do seguinte resultado sobre extensões de homomorfismos. Proposição 18.8. Seja L/K uma extensão finita, digamos L = K[α1 , · · · , αr ]. Seja Ω um corpo algebricamente fechado e κ : K → Ω um homomorfismo não trivial (logo necessariamente injetivo) de corpos, onde Ω é algebricamente fechado. Seja m o número de extensões λ : L → Ω de κ a L (ver capı́tulo anterior). Então 1 ≤ m ≤ [L : K]. Além disto as seguintes condições são equivalentes: (i) m = [L : K]. (ii) α1 , · · · , αr são separáveis sobre K. (iii) L/K é separável. Demonstração. Provaremos inicialmente a proposição para r = 1. Sejam {α1 = β1 , · · · , βn } as raı́zes de Pα1 |K . Se λ é uma extensão de κ a L, então λ(α1 ) é necessariamente uma raiz de Pα1 |K , uma vez que este polinômio é invariante por κ. Assim, o número de extensões λ é igual ao número de raı́zes distintas de Pα1 |K . Este número é no máximo igual a grau(Pα1 |K ) = [L : K]. Além disto, m ≥ 1, pois provamos no capı́tulo anterior a existência de extensões λ de κ, se L/K for algébrica. Observe que m = [L : K] se e somente se o número de raı́zes distintas de Pα1 |K for igual a [L : K] = grau(Pα1 |K ). Isto equivale a Pα1 |K ser separável. Assim, as condições (i) e (ii) são equivalentes. É claro que (iii) implica (ii). Suponha que L/K seja inseparável, digamos que γ ∈ L seja inseparável sobre K. Pela equivalência entre (i) e (ii) concluimos que o número de extensões κγ de κ a K[γ] é estritamente inferior a [K[γ] : K]. Por outro lado, pela primeira parte, cada κγ possui no máximo [L : K[γ]] extensões a L. Dessa forma, o número de extensões de κ a L é menor que [L : K], ou seja, (i) implica (iii). Para provar o caso geral, para qualquer r, lembremos que existe uma seqüência finita de extensões K = K0 ⊂ K1 = K0 [α1 ] ⊂ K2 = K1 [α2 ] ⊂ · · · ⊂ Kr = Kr−1 [αr ] = K[α1 , · · · , αr ] = L. Pela primeira parte, o número de extensões κ1 de κ a K1 é no máximo [K1 : K], o número de extensões de κ1 a K2 é no máximo [K2 : K1 ], etc. Portanto, o número de extensões de κ a L é no máximo igual a [K1 : K][K2 : K1 ] . . . [Kr : Kr−1 ] = [L : K]. Como anteriormente (iii) implica (ii). Suponha (ii). Então cada αi é separável também sobre Ki−1 . A fortiori, pela primeira parte, o número de extensões de κi−1 a Ki é igual a [Ki : Ki−1 ]. Aplicando a multiplicativade dos graus concluimos que m = [L : K]. Finalmente, a prova que (i) implica (iii) é idêntica à da primeira parte. Corolário 18.9. Sejam L/K uma extensão algébrica e M um subconjunto de L. Se todo α ∈ M for separável sobre K, então K[M]/K é separável. 136 18. EXTENSÕES SEPARÁVEIS Demonstração. Basta observar que [ K[M] = K[F], F∈C onde F percorre o conjunto C de subconjuntos finitos de M, e aplicar a proposição anterior. Teorema 18.10. Sejam L/K e M/L extensões algébricas. Então M/K é separável se e somente se M/L e L/K o forem. Demonstração. É claro que se M/K for separável, então M/L e L/K também o são. Provemos a recı́proca. Seja α ∈ M e Pα|L = xn + an−1 xn−1 + . . . + a0 . Seja L := K[a0 , · · · , an−1 ]. Então Pα|L ∈ L[x] e α é separável sobre L. Como cada ai ∈ L e L/K e separável, pela proposição 18.8 L/K também é separável. Além disto, pelo observado acima e pela proposição 18.8 obtemos que L[α]/L também é separável. Seja κ : K → Ω um homorfismo não trivial de corpos, com Ω algebricamente fechado. O número de extensões κL de κ a L é igual a [L : K]. Além disto, para cada κL o número de extensões deste homomorfismo a L[α] é igual a [L[α] : L]. Portanto, o número de extensões de κ a L[α] é igual a [L : K][L[α] : L] = [L[α] : K]. Novamente, aplicando a proposição 18.8 concluimos que L[α]/K é separável, assim α é separável sobre K. Definição 18.11. Seja L/K uma extensão algébrica e Ω um corpo algebricamente fechado. Denotamos por HomK (L, Ω) o conjunto dos homomorfismos de corpos λ : L → Ω tais que λ|K = id. São chamados K-homomorfismos de L em Ω. O seguinte resultado é uma conseqüência imediata da proposição 18.8. Teorema 18.12. Seja L/K uma extensão finita. Então # HomK (L, Ω) ≤ [L : K]. Além disto, vale a igualdade se e somente se L/K for separável. Definição 18.13. Seja L/K uma extensão algébrica. Definimos o fecho separável SL (K) de K em L por SL (K) := {α ∈ L | α é separável sobre K. É claro que K ⊂ SL (K). Fica como exercı́cio provar que SL (K) é um subcorpo de K (utilize a transitividade de extensões separáveis provada acima). Definição 18.14. Seja L/K uma extensão de corpos. Dizemos que α é um elemento primitivo de L/K se L = K[α]. Neste caso, dizemos que L/K é uma extensão simples. Teorema 18.15 (teorema do elemento primitivo). Suponha que K seja um corpo infinito. Seja L/K uma extensão finita e separável. Então L/K é simples, i.e., existe α ∈ L elemento primitivo de L/K. 18.1. CORPOS FINITOS 137 Demonstração. Observemos inicialmente que basta supor que L seja gerado por 2 elementos α, β, digamos L = K[α, β]. De fato, sendo L/K finita, sabemos que L é da forma L = K[α1 , · · · , αr ]. Suponha o resultado provado para extensões geradas por 2 elementos. Assim, existe β1 ∈ K2 = K1 [α1 ] = K[α1 , α2 ] tal que K2 = K[β1 ]. Pelo mesmo argumento, existe β2 ∈ K3 tal que K3 = K[β1 , α3 ] = K[β2 ]. Repetindo sucessivamente o argumento, concluimos que L = Kr = K[βr−1 ]. Sejam f := Pα|K = (x − α) . . . (x − αn ) e g := Pβ|K = (x − β) . . . (x − βm ). Seja c ∈ K e γ := α + cβ. Consideremos os corpos K ⊂ F = K[γ] ⊂ L = K[α, β]. Provaremos que L = F para uma escolha genérica de c ∈ K. Seja h(x) := f (γ − cx) ∈ F [x]. Observe que h(β) = 0. Portanto, x − β divide h em L[x]. Seja M/L uma extensão finita contendo todas as raı́zes de f e g. Mostraremos que mdcM [x] (h, g) = x − β. Observemos inicialmente que algum βj é raiz de f (com j > 1) se e somente se γ − cβj = α + c(β − βj ) = αi , para algum i. Ou equivalentemente, se e somente se αi − α . (18.1) c= β − βj Note que o conjunto destas frações com j percorrendo 2, · · · , m e i percorrendo 1, · · · , n é finito. Como o corpo K é infinito, podemos sempre escolher c ∈ K diferente de todas estas frações. Em outras palavras a única raiz comum de h e g é β, daı́ segue o resultado sobre o mdc. Mas o mdc não depende do corpo no qual estamos considerando, pela unicidade do resto no algoritmo de divisão de polinômios. Dessa forma, como g, h ∈ F [x] concluimos que β ∈ F . Portanto, por construção α ∈ F e L = F . Observação 18.16. No próximo capı́tulo daremos uma prova intrı́nseca do teorema do elemento primitivo para corpos finitos. Observe também que na prova do teorema do elemento primitivo, se nos restringirmos a corpos L da forma K[α, β], não precisamos supor que L/K seja separável. Basta que β seja separável sobre K, uma vez que isto garante que os denominadores de (18.1) sejam todos não nulos. 18.1. Corpos Finitos Dado um inteiro n ≥ 1 sabemos que o anel quociente Z/nZ é um corpo se e somente se n = p for um número primo. Este é o primeiro exemplo de um corpo finito que será denotado por Fp . Uma maneira natural de definir corpos finitos é tomar f ∈ Fp [x] irredutı́vel e lembrar que o anel quociente Fp [x]/(f ) é neste caso um corpo. Este corpo também pode ser escrito como Fp [α] para raiz α de f em alguma extensão finita l de Fp . Além disto, [Fp [α] : Fp ] = grau(f ) digamos n. Assim, como Fp espaço vetorial Fp [α] é isomorfo a Fnp portanto é um corpo de q = pn elementos. Estes corpos são caracterizados pelo seguinte teorema. Teorema 18.17. (a) Para todo n ≥ 1 inteiro existe um corpo finito Fq de q = pn elementos dado pelo conjunto das raı́zes Rxq −x de xq −x em algum corpo algebricamente fechado Ω contendo Fp . Além disto este polinômio é separável. (b) O corpo Fq é único a menos de isomorfismo. 138 18. EXTENSÕES SEPARÁVEIS (c) O grupo multiplicativo F∗q = Fq \ {0} é um grupo cı́clico. (d) Os fatores irredutı́veis mônicos de xq − x são exatamente os polinômios irredutı́veis mônicos f ∈ Fp [x] tais que grau(f ) | n. (e) Se q 0 = pm , então Fq0 ⊂ Fq se e somente se q 0 | q. Demonstração. (a) Sabemos que existe uma extensão finita L de Fp tal que f fatora-se linearmente em L[x]. Seja Fq := Rxq −x ⊂ L. Afirmamos que Fq é um subcorpo de L. De fato, se a, b ∈ Fq , então (a + b)q = aq + bq = a + b, logo a + b ∈ Fq . Além disto (ab)q = aq bq = ab, logo ab ∈ Fq . E se a ∈ F∗q , então (a−1 )q = (aq )−1 = a−1 , logo a−1 ∈ Fq . Além disto, como D(xq − x) = −1, concluimos que xq −x é separável. O ı́tem (b) segue da unicidade de fecho algébrico a menos de isomorfismo. O item (c) segue imediatamente do seguinte lema. Lema 18.18. Seja K um corpo e G ⊂ K ∗ um subgrupo finito. Então G é cı́clico. Demonstração. Como G é finito, então seu expoente exp(G) também o é (veja definição 9.33). Digamos que n = exp(G). Isto significa que para todo a ∈ G, temos an = 1, ou seja, G ⊂ Wn (K) := {α ∈ K | αn = 1}. Mas este é o conjunto das raı́zes de xn − 1 que tem cardinalidade no máximo n. Portanto, #G ≤ n, como a desigualdade contrária vale em geral, temos que |G| = exp(G) = n. Pela proposição 9.36, concluimos que G é cı́clico. Para provar os ı́tens (d) e (e) precisamos de um lema adicional. 0 Lema 18.19. Seja q 0 := pm tal que n = mk. Então xq − x divide xq − x. Demonstração. Recordemos a fatoração y d − 1 = (y − 1)(y d−1 + . . . + y + 1). 0 Tomemos y = q 0 e d = k, assim q 0 − 1 divide (q 0 )k − 1 = q − 1. Tomando y = xq −1 e 0 0 0 d = (q − 1)/(q 0 − 1) obtemos que xq −1 − 1 divide (xq −1 )(q−1)/(q −1) − 1 = xq−1 − 1, 0 multiplicando por x concluimos que xq − x divide xq − x. Suite da prova do teorema. (d) Seja f um fator irredutı́vel mônico de xq − x. Então existe α ∈ Fq tal que f = Pα|Fp . Neste caso, Fq ⊃ Fp [α] ⊃ Fp e como [Fp [α] : Fp ] = grau(Pα|Fp ) concluimos que grau(f ) | n. Reciprocamente, se f ∈ Fp [x] é irredutı́vel mônico de grau m | n, então existe uma extensão finita L de Fp e α ∈ L tal que f = Pα|Fp . Neste caso, Fp [α] = Fq0 , 0 onde q 0 = pm . Como m | n, (xq − x) | (xq − x), em particular Rxq0 − x = Fq0 ⊂ Rxq −x = Fq . Logo α é raiz de xq − x, assim f = Pα|Fp | (xq − x). 0 (e) Suponhamos que m | n. Pelo lema anterior, (xq − x) | (xq − x), logo Rxq0 − x = Fq0 ⊂ Rxq −x = Fq . Reciprocamente, se Fq0 ⊂ Fq , então [Fq : Fp ] = n = [Fq : Fq0 ][Fq0 : Fp ] = [Fq : Fq0 ]m, assim m | n. CAPı́TULO 19 Extensões puramente inseparáveis Ao longo de todo este capı́tulo K será um corpo de caracterı́stica prima p. Sabemos que se L/K for uma extensão e α ∈ AL (K), então Pα|K é separável ou existe h1 ∈ K[x] tal que Pα|K (x) = h1 (xp ). Note que h1 (x) é mônico e irredutı́vel, na verdade coincide com Pαp |K . Assim, podemos repetir o argumento para h1 . Pela finitude do grau de Pα|K , concluimos que existe um e ≥ 0 inteiro máximo e P̃α|K ∈ K[x] tal que e Pα|K (x) = P̃α|K (xp ). Este inteiro e é dito o expoente de Pα|K . O anel K[x] é fatorial, logo similarmente, podemos definir para todo f ∈ K[x] \ K o maior inteiro e ≥ 0 tal que e f (x) = f˜(xp ), para um único f˜ ∈ K[x]. Novamente e é dito o expoente de f . Observamos que f é separável se e somente se e = 0. Definição 19.1. Um polinômio f ∈ K[x] \ K é dito puramente inseparável se e f (x) = xp − a para algum e ≥ 0 e a ∈ K. Note que neste caso f˜ = x − a. Observe também que se α for uma raiz de f em uma extensão finita L/K então e f (x) = (x − α)p . Ou seja, um polinômio puramente inseparável possui uma única raiz em um fecho algébrico de K. Neste sentido um polinômio puramente inseparável é o extremo oposto de um polinômio separável. Definição 19.2. Seja L/K uma extensão de corpos e α ∈ L algébrico sobre K. Dizemos que α é puramente inseparável sobre K se for raiz de algum f ∈ K[x] \ K puramente inseparável. Observe que todo elemento de K é simultaneamente separável e puramente inseparável sobre K. Dizemos que uma extensão algébrica L/K é puramente inseparável se todo α ∈ L for puramente inseparável sobre K. Lema 19.3. Seja L/K extensão e α ∈ AL (K). Então α é puramente inseparável sobre K se e somente se Pα|K for puramente inseparável. Demonstração. Se Pα|K for puramente inseparável nada há a fazer. Suponhamos que α seja puramente inseparável sobre K. Ou seja, existe e ≥ 0 tal que e α é raiz de xp − a para algum a ∈ K. Suponha e mı́nimo para esta propriedade. e Neste caso, xp − a é irredutı́vel, coincidindo portanto com Pα|K . Teorema 19.4. Seja L/K algébrica, digamos L = K[M]. Sejam Ω um corpo algebricamente fechado e κ : K → Ω um homomorfismo não trivial de corpos. As seguintes condições são equivalentes: 139 140 19. EXTENSÕES PURAMENTE INSEPARÁVEIS (i) Existe uma única extensão λ : L → Ω de κ a L. (ii) Todo elemento de M é puramente inseparável sobre K. (iii) L/K é puramente inseparável. Demonstração. Suponha (ii). Sabemos que existe um homomorfismo λ : L → Ω estendendo κ. Além disto para todo α ∈ M temos que β := λ(α) é uma raiz de κ∗ (Pα|K ). Como Pα|K é puramente inseparável, o mesmo vale para κ∗ (Pα|K ). Logo β fica univocamente detereminado, portanto λ é único. Suponha que L/K não seja puramente inseparável, i.e., existe α ∈ L tal que Pα|K é puramente inseparável. Logo κ∗ (Pα|K ) também não é puramente inseparável. Portanto possui pelo menos duas raı́zes distintas digamos α1 6= β1 . Assim, existem pelo menos duas opções para λ, ou λ(alpha) = α1 ou λ(α) = β1 . Isto mostra que (i) implica (iii). É imediato que (iii) implica (ii). Proposição 19.5. Sejam L/K e M/L extensões algébricas. Então M/K é puramente inseparável se e somente se M/L e L/K forem puramente inseparáveis. Demonstração. Suponha que M/K seja puramente inseparável. Então automaticamente L/K é puramente inseparável. Além disto, como K ⊂ L, se e αp ∈ K ⊂ L, então M/L é puramente inseparável. Reciprocamente, suponha que M/L e L/K sejam puramente inseparáveis. Dae do α ∈ M temos que existe e ≥ 0 tal que αp ∈ L. Por outro lado, existe f ≥ 0 tal e f e+f que (αp )p ∈ K, i.e., αp ∈ K e α é puramente inseparável sobre K. Definição 19.6. Seja L/K uma extensão algébrica. Definimos o fecho puramente inseparável de K em L por PL (K) := {α ∈ L | α é puramente inseparável sobre K}. Deixamos a cargo do leitor verificar que isto é um subcorpo de L contendo K. Observação 19.7. Lembre que o fecho separável SL (K) de K em L é definido similarmente como o conjunto dos elementos de L separáveis sobre K. Assim, PL (K) ∩ SL (K) = K. Proposição 19.8. Seja L/K uma extensão algébrica. Então L/SL (K) é puramente inseparável. Demonstração. Seja α ∈ L. Seja e o expoente de Pα|K . Assim Pα|K (x) = e e h1 (xp ) com h1 ∈ K[x] separável. Em particular, αp como raiz de h1 pertence a SL (K). Observação 19.9. Note que a proposição diz que qualquer extensão algébrica L/K pode ser decomposta em dois pedaços, L/SL (K), puramente inseparável, e SL (K)/K separável. Definição 19.10. Seja L/K uma extensão algébrica. Se SL (K) = K dizemos que K é separavelmente fechado em L. Definição 19.11. Seja L/K uma extensão finita. O grau de separabilidade [L : K]s de L/K é definido por [SL (K) : K], e o grau de inseparabilidade [L : K]i de L/k é definido por [L : SL (K)]. 19. EXTENSÕES PURAMENTE INSEPARÁVEIS 141 Proposição 19.12. Seja L/K finita puramente inseparável, então [L : K] é potência de p. Demonstração. Sejam α1 , · · · , αr geradores de L sobre K e para todo i seja Ki := Ki−1 [αi ]. Como cada αi é puramente inseparável sobre K, ele também o é sobre Ki−1 . Assim, [Ki : Ki−1 ] é potência de p, pois é igual ao grau de Pαi |Ki−1 que é puramente inseparável. A fortiori, [L : K] é potência de p. CAPı́TULO 20 Corpos de decomposição e extensões normais Definição 20.1. Seja K um corpo e f ∈ K[x] \ K. Seja Ω um corpo algebricamente fechado com Ω ⊃ K. Seja Rf := {α ∈ Ω | f (α) = 0} = {α1 , · · · , αn }. O corpo de decomposição K[Rf ] de f com relação a K é a extensão finita K[α1 , · · · , αn ] gerada sobre K por {α1 , · · · , αn }. Observemos que este é o menor subcorpo de Ω contendo K e Rf . De fato, qualquer outro subcorpo contendo K e Rf necessariamente contém K(Rf ), pois os elemento deste são polinômios nos αi ’s com coeficientes em K. Uma extensão algébrica L/K é dita normal, se para todo α ∈ L, RPα|K ⊂ L. Observação 20.2. Note que a noção de corpo de decomposição a priori dependeria do corpo Ω. Novamente, com o mesmo argumento que utilizado para provar a unicidade de fecho algébrico a menos de isomorfismo, observamos que se R0f for o conjunto de raı́zes de f em um outro corpo algebricamente fechado Ω0 ⊃ K, então K[R0f ] e K[Rf ] são K-isomorfos. Observação 20.3. Se F ⊂ K[x] \ K for uma famı́lia de polinômios, definimos da mesma forma o conjunto [ RF := Rf f ∈F e denotamos por K[RF ] o corpo de decomposição da famı́lia em Ω. Este nada mais é que o compositum dos corpos K[Rf ] para f ∈ F. Proposição 20.4. Uma extensão algébrica L/K é normal se e somente se para todo f ∈ K[x] irredutı́vel temos Rf ⊂ L ou Rf ∩ L = ∅. Demonstração. Suponha que L/K seja normal. Seja f ∈ K[x] irredutı́vel tal que Rf ∩ L 6= ∅. Seja α ∈ L ∩ Rf . Então existe a ∈ K ∗ tal que f = aPα|K . Por hipótese, RPα|K ⊂ L, mas Rf = RPα|K . Reciprocamente, suponha que para todo f ∈ K[x] irredutı́vel Rf ⊂ L ou Rf ∩ L = ∅. Seja α ∈ L. Então RPα|K ∩ L 6= ∅, portanto RPα|K ⊂ L. Exemplo 20.5. Considere f = x3 − 2 ∈ Q[x]. Seja z = e2πi/3 . Então Rx3√ −2 = √ √ √ √ √ 3 3 3 3 3 3 2 3 −2 ) ⊂ Q[ Q(R 2, z]. Mas z = ( 2z)/ 2∈ { 2, 2z, 2z } ⊂ C. Desta forma, x √ 3 3 3 4 Q(R ). Logo Q(R ) = Q[ 2, z]. Pelo mesmo argumento, Q(R ) x −5 = x −2 √ x −2 Q[ 4 5, i]. Proposição 20.6. Seja L/K uma extensão tal que [L : K] = 2. Então L/K é normal. Demonstração. Seja α ∈ L. Se α ∈ K, então Pα|K = x − α e RPα|K = {α} ⊂ K ⊂ L. Caso contrário, em L[x] temos Pα|K = (x − α)g(x) para g ∈ L[x] mônico de grau 1, assim g(x) = x − β, logo RPα|K = {α, β} ⊂ L. 143 144 20. CORPOS DE DECOMPOSIÇÃO E EXTENSÕES NORMAIS Observação 20.7. Note que em uma extensão normal L/K para todo α ∈ L, Pα|K fatora-se linearmente em L[x]. Definição 20.8. Seja L/K uma extensão de corpos, Ω um corpo algebricamente fechado contendo K e HomK (L, Ω) o conjunto dos K-homomorfismos ϕ : L → Ω. Denotamos por Aut(L/K) ao conjunto dos K-automorfismos de L, i.e., o conjunto dos automorfismos σ : L → L de L tais que σ|K = idK . Observação 20.9. Ao contrário das extensões finitas, algébricas e separáveis, √ não vale transitividade para extensões normais. De fato, se L = Q[ 3 2, z] = √ Q(Rx3 −2 ), então L/Q é normal (pelo teorema). A extensão L/Q[ 3 2] é normal, √ 3 pois seu grau√é 2. Mas a extensão Q[ 2]/Q não é normal, pois x3 − 2 tem também √ 3 3 como raı́zes 2z e 2z 2 e este números são números complexos conjugados, en√ 3 quanto Q[ 2] ⊂ R. √ Consideremos agora a extensão Q[ 4 5]/Q. Ela tem grau 4, pois x4 − 5 é irredutı́vel √ √sobre Q√(critério de Eisenstein para p = 5). Assim, as extensões 4 Q[ √ 5]/Q[ 5] e Q[ 5]/Q têm grau 2, portanto são normais. Mas a extensão √ 4 Q[ 4 5]/Q não o é, pois x4 − 5 tem também como raı́zes ± 5i e estes são números √ complexos conjugados, enquanto Q[ 4 5] ⊂ R. O lema a seguir permite-nos definir o fecho normal de uma extensão L/K. Lema 20.10. Sejam K ⊂ Ω corpos com Ω algebricamente fechado. Seja N o conjunto dos subcorpos de Ω normais sobre K. Então a extensão ! \ N /K N ∈N é normal. T Demonstração. Seja α ∈ N ∈N N . Como α ∈ N e N/K é normal, concluimos que RPα|K ⊂ N , para todo N ∈ N. Definição 20.11. Sejam K ⊂ L ⊂ Ω corpos com Ω algebricamente fechado. Seja NL o conjunto de subcorpos N de Ω contendo L tais que N/K seja normal. O corpo \ NΩ (L/K) := N N ∈NL é chamado o fecho normal da extensão L/K em Ω. Segue da definição que NΩ (L/K) é o menor subcorpo de Ω contendo L que é normal sobre K. Caracterizaremos agora extensões normais como sendo corpos de decomposição de uma famı́lia de polinômios. Disto seguirá que no caso particular de extensões normais finitas, estas podem ser caracterizadas como corpos de decomposição de apenas um polinômio. Teorema 20.12. Sejam K ⊂ Ω corpos com Ω algebricamente fechado. Seja L/K uma extensão algébrica contida em Ω. As seguintes condições são equivalentes: (i) L/K é normal. (ii) Existe uma famı́lia F ⊂ K[x] \ K tal que L = K[RF ]. (iii) HomK (L, Ω) = Aut(L/K). A famı́lia F é descrita como {Pα|K | α ∈ M}, onde M ⊂ L é tal que L = K[M]. 20. CORPOS DE DECOMPOSIÇÃO E EXTENSÕES NORMAIS 145 Demonstração. Suponha (i) e seja F como acima. Para todo α ∈ M, uma vez que L/K é normal, RPα|K ⊂ L. A fortiori, K[RF ] ⊂ L. Por outro lado, L = K[M] ⊂ K[RF ] ⊂ L, logo vale (ii). Suponha (ii). Observe que temos sempre a inclusão Aut(L/K) ⊂ HomK (L, Ω). Seja σ ∈ HomK (L, Ω). Para todo f ∈ F temos que σ(Rf ) ⊂ Rf , em particular σ(L) ⊂ L. A igualdade segue da proposição 17.30. Suponha (iii). Sejam α ∈ L e β ∈ RPα|K . Logo Pβ|K = Pα|K . Pelo corolário 17.28 existe um K-isomorfismo θ : K[α] → K[β] ⊂ Ω tal que θ(α) = β. Como β ∈ L e L/K é algébrica, existe um K-homomorfismo λ : L → Ω tal que λK[α] = θ. Por (iii) temos então β = λ(α) ∈ L. Assim, RPα|K ⊂ L e L/K é normal. Corolário 20.13. Sejam L/K uma extensão algébrica, M e F como no teorema. Então K[RF ] é o fecho normal de L/K em Ω. Demonstração. É claro que K ⊂ L ⊂ K[RF ], e pelo teorema K[RF ]/K é normal. Por outro lado para todo subcorpo N de Ω contendo L e normal sobre K e para todo α ∈ M temos RPα|K ⊂ N , portanto K[RF ] ⊂ N . Corolário 20.14. Seja L/K uma extensão finita, digamos L = K[α1 , · · · , αr ]. Seja P := Pα1 |K . . . Pαr |K . Então K[RP ] é o fecho normal de L/K em Ω. Corolário 20.15. Seja L/K uma extensão finita. As seguintes condições são equivalentes. (1) L/K é normal. (2) Existe f ∈ K[x] \ K tal que L = K[Rf ]. (3) HomK (L, Ω) = Aut(L/K). Reunindo as informações deste capı́tulo e do anterior obtemos o seguinte teorema. Teorema 20.16. Seja L/K uma extensão finita e Ω um corpo algebricamente fechado contendo K. (1) # HomK (L, Ω) ≤ [L : K] e vale a igualdade se e somente se L/K é separável. (2) # Aut(L/K) ≤ # HomK (L, Ω) e vale a igualdade se e somente se L/K é normal. (3) # Aut(L/K) ≤ [L : K] e vale a igualdade se e somente se L/K é separável e normal. No próximo capı́tulo definiremos extensões finitas separáveis e normais como extensões galoisianas. 146 20. CORPOS DE DECOMPOSIÇÃO E EXTENSÕES NORMAIS 20.1. Exemplos Exemplo 20.17. Seja f = x3 − 2 ∈ Q[x]. Considere o diagrama de corpos √ Q[ 3 2, z] = Q[Rf ] \ / √ 3 Q[ 2] Q[z] \ / Q √ A extensão Q[ 3 2]/Q tem grau 2 pois x3 − 2 é irredutı́vel em Q[x] pelo critério de Eisenstein com p = 2. A extensão Q[z]/Q tem grau 2, pois o polinômio mı́nimo de z sobre Q é x2 + x + 1. As raı́zes deste polinômio são z e z 2 que são números √ 3 complexos, um conjugado do outro. Como Q[ 2] ⊂ R, x2 + x + 1 é irredutı́vel √ 3 sobre Q[ 2], portanto √ √ 3 3 [Q[ 2, z] : Q[ 2]] = 2 e [Q(Rx3 −2 ) : Q] = 6. Assim # Gal(Q(Rx3 −2 )/Q) = 6. Um grupo de ordem 6 gerado por dois elementos σ e τ com σ de ordem 3 e τ de ordem 2 satisfazendo a τ σ = σ2 τ é isomorfo ao grupo S3 das permutações de 3 elementos que é dado explicitamente por {id, σ, σ 2 , τ, στ, σ 2 τ }. Vamos mostrar que este é o grupo de Galois G = Gal(Q(Rx3 −2 )/Q). √ √ 2 √ √ Como 1, 3 2, 3 2 , z, z 3 2, z 3 2 é uma base de Q(R √x3 −2 ) como Q-espaço vetorial, para obter um elemento de G basta calculá-lo em 3 2 e z. Observemos que dado ϕ ∈ G, então √ √ 3 3 3 ϕ( 2)3 = ϕ( 2 ) = ϕ(2) = 2, √ √ logo ϕ( 3 2) ∈ { 3 2z i | para i = 0, 1, 2}. Da mesma forma ϕ(z) ∈ {z, z 2 }. Definimos σ por √ √ 3 3 σ( 2) := 2z e σ(z) := z e √ √ 3 3 τ por τ ( 2) := 2 e τ (z) := z. √ √ Observemos que σ e τ satisfazem à √ condição acima. De fato, σ 2 ( 3 2)√= σ( 3 2z) √ √ √ √ = 3 2z 2 e σ 2 (z) = z; √ σ 3 ( 3 2) =√σ( 3 2z 2√ ) = 3 2 e σ 3 (z) = z; τ 2 ( 3 2) =√ 3 2 e τ (z)√= z 4 √= z; τ σ( 3 2) = τ ( 3 2z) = 3 2z 2 e τ σ(z) = τ (z) = z 2 ; σ 2 τ ( 3 2) = σ 2 ( 3 2) = 3 2z 2 e σ 2τ (z) = σ 2 (z 2 ) = z 2 . Finalmente, note que o subgrupo de Aut(Q[Rf ]/Q) gerado por σ e τ tem ordem 6, logo deve ser todo o grupo. 20.1. EXEMPLOS 147 √ Exemplo 20.18. Seja f = x4 − 5 ∈ Q[x] e K = Q(Rx4 −5 ) = Q[ 4 5, i]. Considere o diagrama de corpos √ Q[ 4 5, i] = Q[Rf ] \ / √ 4 Q[ 5] Q[i] \ √ 4 / Q 4 Note que [Q[ 5] : Q] = 4, pois x − 5 é irredutı́vem em Q[x] pelo critério de Eisenstein para p = 5, [Q[i] : Q]√ = 2, pois x2 + 1 é irredutı́vel em Q[x], suas raı́zes 4 são ±i, assim, uma vez que Q[ 5] ⊂ R, temos que x2 + 1 é também irredutı́vel √ 4 sobre Q[ 5][x], portanto [K : Q] = 8 = # Gal(K/Q). Um grupo de ordem 8 gerado por 2 elementos σ de ordem 4 e τ de ordem 2 tal que τ σ = σ3 τ é isomorfo ao grupo diedral de ordem 4, D4 que é dado explicitamente por {id, σ, σ 2 , σ 3 , τ, στ, σ 2 τ, σ 3 τ }. Vamos mostrar que este é o grupo de Galois G = Gal(K/Q). √ √ 2 √ 3 √ √ 2 √ 3 Como 1, 4 5, 4 5 , 4 5 , i, 4 5i, 4 5 i, 4 5 i formam uma base de √K como Qespaço vetorial, para obter um elemento de √ G basta cálculá-lo em 4 5 e i. Ob√ √ 4 4 servemos que dado ϕ ∈ G, ϕ( 5) ∈ {± 5, ± 4 5i} e ϕ(i) ∈ {±i}. Definimos σ por √ √ 4 4 σ( 5) := 5i e σ(i) := i e √ √ 4 4 τ por τ ( 5) := 5 e τ (i) := −i. √ √ Observemos que σ e √ τ satisfazem à condição acima. De fato,√σ 2 ( 4 5) =√σ( 4 5i)√= √ √ √ − 4 5 e σ 2 (i) = i; √ σ 3 ( 4 5) √ = σ(− 4 5) = − 4 5i e σ 3 (i) = i;√σ 4 ( 4 5) =√σ(− 4 5i) √ = 45 4 4 4 4 2 4 2 e σ (i) = i; τ ( 5) = √ 5 e τ (i) = τ (−i) = i; τ σ( 5) = τ ( 5i) = − 4 5i e √ √ 4 4 4 τ σ(i) = τ (i) = −i; σ 3 τ ( 5) = σ 3 ( 5) = − 5i e σ 3 τ (i) = σ 3 (−i) = −i. Finalmente, o subgrupo de Aut(Q[Rf ]/Q) gerado por σ e τ tem ordem 8, logo é todo o grupo. CAPı́TULO 21 Teoria de Galois 21.1. Correspondência de Galois Definição 21.1. Seja N/K uma extensão finita, G = Aut(N/K), K o conjunto dos subcorpos L de N contendo K e G o conjunto dos subgrupos H de G. Definimos duas funções: γ : K → G dada por γ(L) := Aut(N/L) e κ : G → K dada por κ(H) := N H := {α ∈ N | τ (α) = α para todo τ ∈ H}. Verifiquemos que N H é de fato um subcorpo de N , é claro que K ⊂ N H . De fato, como τ é um homomorfismo temos que τ (α + β) = τ (α) + τ (β) = α + β. O mesmo vale para o produto. Além disto, τ (α−1 ) = τ (α)−1 = α−1 . O par de funções {γ, κ} é chamado uma conexão de Galois. Este par satisfaz às seguintes propriedades. Proposição 21.2. (1) Se L1 ⊂ L2 , então γ(L1 ) ⊃ γ(L2 ). (2) Se H1 ⊂ H2 , então κ(H1 ) ⊃ κ(H2 ). (3) L ⊂ κ ◦ γ(L). (4) H ⊂ γ ◦ κ(H). Além disto, denotando por K∗ a imagem de κ e G ∗ a imagem de γ temos também as seguintes propriedades. (5) L ∈ K∗ se e somente se L = κ ◦ γ(L). (6) H ∈ G ∗ se e somente se H = γ ◦ κ(H). Como conseqüência destes últimos 2 itens temos imediatamente que (7) γ ◦ κ ◦ γ = γ. (8) κ◦γ◦κ = κ. Em particular, {γ, κ} induzem uma bijeção entre os conjuntos K∗ e γ ∗ . Demonstração. (1) Seja τ ∈ γ(L2 ), então para todo α ∈ L2 , τ α = α, em particular o mesmo vale para todo α ∈ L1 , logo τ ∈ γ(L1 ). (2) Seja α ∈ κ(H2 ), logo para todo τ ∈ H2 , τ α = α, em particular o mesmo vale para todo τ ∈ H1 , logo α ∈ κ(H1 ). (3) É claro que para todo α ∈ L e para todo τ ∈ Aut(N/L) temos τ α = α, assim α ∈ κ ◦ γ(L). (4) É claro que para todo τ ∈ H e α ∈ κ(H) temos que τ α = α, portanto, τ ∈ γ ◦ κ(H). (5) É claro que se L = κ ◦ γ(L), então L ∈ K∗ . Por outro lado, se L ∈ K∗ , digamos L = κ(H), então, como H ⊂ γ ◦ κ(H), temos que L = κ(H) ⊃ κ ◦ γ ◦ κ(H) = κ ◦ γ(L). 149 150 21. TEORIA DE GALOIS (6) É claro que se H = γ ◦ κ(H), então H ∈ G ∗ . Por outro lado, se H ∈ G ∗ , digamos H = γ(L), então, como L ⊂ κ ◦ γ(L), temos que H = γ(L) ⊃ γ ◦ κ ◦ γ(L) = γ ◦ κ(H). Definição 21.3. Dizemos que a restrição de uma conexão de Galois {γ, κ} aos conjuntos K∗ e G ∗ é uma correspondência de Galois. Uma extensão finita L/K é dita galoisiana se for separável e normal. Teorema 21.4 (teorema de Artin). Dado H ∈ G temos que N/N H é galoisiana, [N : N H ] = #H e H = Aut(N/N H ) = γ ◦ κ(H). Demonstração. Seja α ∈ N e Cα = {τ α | τ ∈ H} o conjunto dos elementos H-conjugados a α. Note que #Cα ≤ |H|. Seja Y fα := (x − β). β∈Cα Observemos que para todo τ ∈ H, τ|Cα é uma permutação de Cα (uma vez que τ é injetivo, Cα é finito e τ (Cα ) ⊂ Cα ). Portanto, fα ∈ N H [x]. Por construção fα é separável, portanto α é separável sobre N H . Assim, para provar que N/N H é normal, basta mostrar que # Aut(N/N H ) = [N : N H ]. Inicialmente, como H ⊂ Aut(N/N H ) temos que #H ≤ | Aut(N/N H )| ≤ [N : N H ]. Para provar a desigualdade oposta, observe que como N/N H é finita e separável, pelo teorema do elemento primitivo, existe α ∈ N tal que N = N H (α). Mas neste caso, [N : N H ] = grau(Pα|N H ) ≤ grau(fα ) ≤ |H|. Portanto, [N : N H ] = |H| = | Aut(N/N H )| e H = γ ◦ κ(H), pois o primeiro é subgrupo do segundo e ambos têm a mesma ordem. Proposição 21.5. Seja L ∈ K. Então L ∈ K∗ se e somente se N/L for galoisiana. Demonstração. Se L ∈ K∗ , o teorema de Artin garante que N/L é galoisiana. Reciprocamente, suponha que N/L seja galoisisana. Logo | Aut(N/L)| = [N : L]. Por outro lado, L ⊂ κ ◦ γ(L) ⊂ N e pelo teorema de Artin, [N : κ ◦ γ(L)] = [N : N Aut(N/L) ] = | Aut(N/L)| = [N : L], portanto L = κ ◦ γ(L) ∈ K∗ . Teorema 21.6 (teorema fundamental da teoria de Galois). Seja N/K uma extensão galoisiana finita. Então {γ, κ} define uma correspondência de Galois entre K e G. 21.1. CORRESPONDÊNCIA DE GALOIS 151 Demonstração. Já provamos anteriormente que se N/K for galoisiana então N/L também o será para todo L ∈ K (ver capı́tulos de extensões separáveis e normais). Assim, pela proposição anterior, κ ◦ γ(L) = L. Por outro lado, pelo teorema de Artin, γ ◦ κ(H) = H. Calculemos alguns exemplos concretos da correspondência de Galois. Exemplo√21.7. Seja K = Q, N = Q[Rx3 −2 ]. Já provamos anteriormente que N = Q[ 3 2, ζ], onde ζ = e2πi/3 , [N : Q] = 6 e G = Aut(N/Q) =√S3 = {id, σ, σ 2 , τ, στ, σ 2 τ√} com√o(σ) = 3, o(τ ) = 2 e τ σ = σ 2 τ . Além disto, σ( 3 2) = √ 3 2ζ, σ(ζ) = ζ, τ ( 3 2) = 3 2 e τ (ζ) = ζ 2 . Note que N ⊂ N {id} ⊂ N , logo N {id} = N . Também Q ⊂ N G ⊂ N e pela teoria de Galois [N : N G ] = #G = 6, logo Q = N G . Seja H1 = hαi = {id, σ, σ 2 }. Observe que Q[ζ] ⊂ N H1 ⊂ N e que [N : N H1 ] = #H1 = 3. Como [Q[ζ] : Q] = 2, concluimos que Q[ζ] = N H1 . √ 3 Seja H Q[ 2] ⊂ N H2 ⊂ N , [N : N H2 ] = #H2 = 2. 2 = hτ i = {id, τ }. Então√ √ 3 3 Como [Q[ 2] : Q] = 3, segue que Q[ 2]√= N H2√ . √ 3 3 Seja H = hστ i. Observe que στ ( 2) = 2ζ, στ (ζ) = ζ 2 , logo στ (√3 2ζ) = 3 √ √ √ √ √ 3 2ζζ 2 = 3 2. Portanto, στ ( 3 2(1 + ζ)) = 3 2(1 + ζ) = − 3 2ζ 2 . Assim, Q[ 3 2ζ 2 ] ⊂ √ 3 3 N H√ ⊂ N . Como 2ζ 2 é raiz de x3 − 2 e este é irredutı́vel sobre√Q, segue que 3 2, concluimos que Q[ 3 2ζ 2 ] = √ [Q[ 2ζ 2 ] : Q] = 3. Como [N : N H3 ] = #H N H3 . 3 =√ √ 3 3 2 2 2 2 2 2 Seja H4 √ = hσ τ i. Observe √ que σ τ ( 2) =√ 2ζ e σ τ (ζ)√= ζ , logo σ τ √ ( 3 2ζ 2 ) √ = 3 2ζ 2 ζ = 3 2, portanto σ 2 τ ( 3 2(1+ζ 2√ )) = 3 2(1+ζ 2 ) = − 3 2ζ. Assim, Q[ 3 2ζ] ⊂ √ 3 3 H4 H4 N ⊂ N , [N : N ] = #H4 = 2 e [Q[ 2ζ] : Q] = 3, portanto Q[ 2ζ] = N H4 . Exemplo 21.8. Seja K = Q, N = Q[Rx4 −3 ]. Já provamos anteriormente que √ N = Q( 4 3, i), [N : Q] = 8 e G = Aut(N/Q) = D4 = {id, σ, σ2 , σ3 ,√ τ, στ, σ 2 τ, σ 3 τ } √ 4 3 com o(σ)√= 4, o(τ ) = 2 e τ σ = σ τ . Além disto, σ( 3) = 4 3i, σ(i) = i, √ 4 τ ( 3) = 4 3 e τ (i) = −i. N ⊂ N {id} ⊂ N , N = N {id} . Q ⊂ N G ⊂ N , [N : N G ] = #G = 8, Q = N G . H1 H1 N , [N : N H1 ] = #H =√ 2, Q[i] = H1 = hσi, Q[i] ⊂ √N ⊂√ √ 1 = 4, [Q[i] √ : Q] √N . 4 2 2 4 2 2 2 4 2 H2 = hσ i, σ ( 3) = − 3, σ (i) =√i, σ ( 3i) = σ ( 3)√ i = 3i, Q[ 3i] ⊂ N H2 ⊂ N , [N : N H2 ] √ = #H2 = 2, [Q[ 3i] : Q] = 4 já que 3i é raiz de x4 + 3 irredutı́vel sobre Q, Q[ 3i] = N H2 . √ √ 4 H3 = hτ i, Q[ 3] ⊂ N H3 ⊂ N , [N : N H3 ] = #H3 = 4, [Q[ 4 3] : Q] = 4, √ Q[ 4 3] = N H3 . √ √ √ √ √ H4 = hστ i, στ ( 4 3) = 4 3i, στ (i) = −i, στ ( 4 3i) = 4 3, στ ( 4 3(1 + i)) = √ √ 4 3(1 + i), 4 3(1 + i) é raiz de x4 + 12, pelo critério de Eisenstein para p = 3, este √ √ 4 4 3(1 + i)] : Q] = 4, Q[ 3(1 + i)] ⊂ N H4 ⊂ polinômio é irredutı́vel sobre Q, logo [Q[ √ 4 H4 N4 N , [N : N ] = #H4 =√2, Q( 3(1 √ + i)) = N . √ √ √ (i) = −i, σ 2 τ ( 4 3i) = 4 3i, Q[ 4 3i] ⊂ H5 = hσ 2 τ i, σ 2 τ ( 4 3) = − 4 3, σ 2 τ√ N H√5 ⊂ N , [N : N H5 ] = #H5 = 2, [Q[ 4 3i] : Q] = 4, já que é raiz de x4 − 3, Q[ 4 3i] = N H5 . √ √ √ √ √ H6 = hσ 3 τ√i, σ 3 τ ( 4 3) = − 4 3i, σ 3 τ (i) = √ −i, σ 3 τ ( 4 3i) = − 4 3, √ σ 3 τ ( 4 3(1 − √ i)) 4 3(1 − i), 4 3(1 − i) é raiz de x4 + 12, [Q[ 4 3(1 − i)] : Q] = 4, Q[ 4 3(1 − i)] ⊂ N H6 ⊂ N , [N : N H6 ] = #H6 = 2. 152 21. TEORIA DE GALOIS Finalmente, fica como exercı́cio calcular os corpos fixos dos seguintes subgrupos de G : hσ 2 , τ i e hσ 2 , στ . Ambos têm ordem 4, e esgotam a correspondência de Galois. 21.2. Extensões e subgrupos normais Proposição 21.9. Seja N/K galoisiana finita, L ∈ K e H ∈ G. Então σ Aut(N/L)σ −1 = Aut(N/σ(L)) e N σHσ −1 = σ(N H ). Demonstração. Como N/K é galoisiana L = N Aut(N/L) . Seja τ ∈ Aut(N/L) e α ∈ N , então στ σ −1 (σα) = στ α = σα, i.e., στ σ −1 ∈ Aut(N/σ(L)). Reciprocamente, se τ ∈ Aut(N/σ(L)) e α ∈ N , então τ σα = σα, i.e., σ −1 τ σα = α, i.e., σ −1 τ σ ∈ Aut(N/L), i.e., τ ∈ σ Aut(N/L)σ −1 . −1 Seja α ∈ N σHσ e τ ∈ H, então στ σ −1 α = α, i.e., τ σ −1 α = σ −1 α, i.e., −1 H σ α ∈ N , i.e., α ∈ σ(N H ). Reciprocamente, se α ∈ N H e τ ∈ H, então −1 στ σ −1 (σα) = στ α = σα, i.e., σα ∈ N σHσ . Teorema 21.10. Seja N/K galoisiana finita e L ∈ K. Então L/K é normal (logo galoisiana) se e somente se Aut(N/L) C Aut(N/K). Neste caso Aut(N/K)/ Aut(N/L) ∼ = Aut(L/K). Demonstração. Suponha que L/K seja normal. Dado σ ∈ Aut(N/L) e Ω ⊃ N algebricamente fechado, então σ|L : L → N ⊂ Ω é um K-homomorfismo (já que L ⊃ K), portanto σ(L) = L e σ|L ∈ Aut(L/K). Neste caso, pela proposição anterior, σ Aut(N/L)σ −1 = Aut(N/σ(L)) = Aut(N/L), i.e., Aut(N/L) C Aut(N/K). Reciprocamente, se Aut(N/L) C Aut(N/K), então Aut(N/σ(L)) = σ Aut(N/L)σ −1 = Aut(N/L). Pela correspondência de Galois L = σ(L). Seja λ : L → Ω um K-homomorfismo. Como N/L é finita (logo algébrica), existe ν : N → Ω um K-homomorfismo tal que ν|L = λ. Como N/K é normal, ν ∈ Aut(N/K), pelo que foi feito acima, ν(L) = λ(L) = L, i.e., λ ∈ Aut(L/K). Suponhamos que L/K seja normal. A função ϕ : Aut(N/K) → Aut(L/K) definida por σ 7→ σ|L é um homomorfismo de grupos. Este homomorfismo é sobrejetivo, pois dado τ ∈ Aut(L/K), o processo acima produz σ ∈ Aut(N/K) tal que σ|L = τ . Além disto, σ ∈ N (ϕ) se e somente se σ|L = id, i.e., σ ∈ Aut(N/L). Finalmente a última afirmativa segue do teorema dos homomorfismos. Definição 21.11. Sejam K, L subcorpos de Ω. Definimos o compositum KL de k e L em Ω como sendo o menor subcorpo de Ω contendo K e L. Lema 21.12. Sejam K, L subcorpos de Ω e f (α1 , · · · , αm ) | f eg K[L] := g(β1 , · · · , βn ) têm coeficientes em K e α1 , · · · , αm , β1 , · · · , βn ∈ L} . Então KL = K[L]. 21.3. COEFICIENTES E RAÍZES 153 Demonstração. Observemos inicialmente que por construção K[l] é um subcorpo de Ω. Além disto contem K (tome denominador igual a 1 e numerador igual a uma função constante) e L (tome denominador igual a 1 e numerador igual a variável α1 ). Seja N ⊂ Ω um subcorpo contendo K e L. Então necessariamente conterá qualquer fração f (α1 , · · · , αm )/g(β1 , · · · , βn ) como acima. Portanto, KL = K[L]. Proposição 21.13. Seja N/K galoisiana finita, K 0 /K finita e Ω ⊃ N, K 0 um corpo algebricamente fechado. Então K 0 N/K 0 é galoisiana finita e ϕ : Aut(K 0 N/K 0 ) → Aut(N/K 0 ∩ N ) dada por σ 7→ σ|N é um isomorfismo de grupos. Em particular, [K 0 N : K 0 ] = [N : K 0 ∩ N ]. Demonstração. Como N/K é finita, então existem α1 , · · · , αr ∈ N tais que N = K[α1 , · · · , αr ]. Logo K 0 N = K 0 [α1 , · · · , αr ] e como cada αi é algébrico sobre K (logo sobre K 0 ) concluimos que K 0 N/K 0 é finita. Além disto cada αi é separável sobre K, assim Pαi |K é separável. Mas Pαi |K 0 | Pαi |K , logo Pαi |K 0 também é separável, em particular αi é separável sobre K 0 e K 0 N/K 0 é separável. Seja σ : K 0 N → Ω um K 0 -homomorfismo, onde Ω ⊃ K 0 é algebricamente fechado. Logo σ|N : N → Ω é um K-homorfismo. Como N/K é normal, então σ ∈ Aut(N/K) e σ(αi ) ∈ N para todo i. Como σ|K 0 = id, concluimos que σ(K 0 N ) ⊂ K 0 N . Por outro lado, para todo z ∈ K 0 N , z = f (α1 , · · · , αr ) com coeficientes em K 0 , e como αi = σβi para algum βi ∈ N , concluimos que z = σ(f (β1 , · · · , βr )), portanto σ(K 0 N ) = K 0 N , σ ∈ Aut(K 0 N/K 0 ) e K 0 N/K 0 é normal. Observe que ϕ está bem definita e é injetiva. Seja σ ∈ Aut(N/K 0 ∩ N ). Como K ⊂ K 0 ∩ N , então σ ∈ Aut(N/K). Seja H a imagem de ϕ. Basta mostrar que κ(H) ⊂ K 0 ∩ N . De fato, neste caso, H = γ ◦ κ(H) ⊃ γ(K 0 ∩ N ) = Aut(N/K 0 ∩ N ) ⊃ H. Seja α ∈ κ(H) = N H e τ ∈ H. Basta mostrar que α ∈ K 0 , pois automaticamente α ∈ N . Existe σ ∈ Aut(K 0 N/K 0 ) tal que σ|N = τ . Assim, para 0 0 todo σ ∈ Aut(K 0 N/K 0 ), σα = α, i.e., α ∈ N Aut(K N/K ) = K 0 , pois K 0 N/K 0 é galoisiana. Corolário 21.14. Seja N/K uma extensão galoisiana finita com K ⊂ R, N ⊂ C e N 6⊂ R. Então [N : N ∩ R] = 2 e [N : K] é par. Demonstração. Observe que RN = C e [N : (N ∩R)] = [C : R] = 2 e aplique a proposição. Corolário 21.15. Seja N/K uma extensão galoisiana finita. Seja N (x1 , · · · , xn ) o corpo de frações do anel de polinômio N [x1 , · · · , xn ] em n variáveis com coeficientes em N . Então N (x1 , · · · , xn )/K(x1 , · · · , xn ) é galoisiana com grupo de Galois isomorfo a Aut(N/K). Demonstração. Basta observar que N K(x1 , · · · , xn ) = N (x1 , · · · , xn ) e aplicar a proposição anterior. 21.3. Coeficientes e raı́zes Para todo n ≥ 1 inteiro seja Sn o grupo das permutações de n elementos. Para todo conjunto finito S denotamos por Perm(S) o grupo das permutações de S. 154 21. TEORIA DE GALOIS Proposição 21.16. Seja f ∈ K[x] irredutı́vel, mônico, separável de grau n e N = K(Rf ). Então (a) para todo σ ∈ Aut(N/K), σ|Rf ∈ Perm(Rf ) = Sn . (b) A função ϕ : Aut(N/K) → Sn dada por σ 7→ σRf é um homomorfismo injetivo de grupos. Demonstração. Observemos que #Rf = n e que σ|Rf é injetiva. Assim (1) segue. É claro que ϕ é um homomorfismo de grupos. Observemos que se ϕ|Rf = id, então ϕ = id, pois N = K(Rf ). O ı́tem (b) é um caso particular do seguinte teorema de Cayley (ver capı́tulo sobre teoremas de Sylow). Definição 21.17. A imagem de ϕ é chamado o grupo de Galois de f com respeito a K e denotado por Gal(f, K). Observação 21.18. Quando K = Q, o problema de Galois era caracterizar em termos de propriedades de Gal(f, Q) quando as raı́zes de f seriam expressas da forma radical. Isto equivale a Gal(f, Q) ser um grupo solúvel. Retornaremos a este ponto no capı́tulo de solubilidade por radicais. Existe uma situação em que o grupo de Galois Gal(f, K) é todo o grupo Sn . Para isto utilizaremos o seguinte lema (ver [GaLe, p. 106]). Lema 21.19. Seja p > 2 um número primo e H um subgrupo do grupo Sp de permutações de p elementos. Suponha que H contenha uma transposição (elemento de ordem 2) e um elemento de ordem p. Então H = Sp . Teorema 21.20. Seja f ∈ Q[x] irredutı́vel mônico de grau primo p > 2. Suponha que f possua exatamente p − 2 raı́zes reais. Então Gal(f, Q) = Sp . Demonstração. A conjugação complexa τ restrita a N = Q[Rf ] nos dá um Q-homomorfismo η : N → C. Mas como N/Q é normal, então η ∈ Aut(N/Q). Por hipótese η fixa as p − 2 raı́zes reais e necessariamente permuta as duas raı́zes complexas conjugadas restantes. Portanto η tem ordem 2. A fortiori, sua imagem, também denotada por η em Gal(f, Q) também tem ordem 2. Seja α ∈ Rf . Logo [Q[α] : Q] = grau(f ) | [N : Q] = # Gal(N/Q), uma vez que N/Q é galoisiana. Pelo primeiro teorema de Sylow, existe θ ∈ Gal(N/Q) de ordem p. A fortiori, sua imagem, também denotada por θ em Gal(f, Q) também tem ordem p. Assim, o teorema segue do lema. CAPı́TULO 22 Extensões ciclotômicas Seja K um subcorpo de um corpo algebricamente fechado Ω. Para todo n ≥ 1, consideremos o subgrupo Wn := Wn (Ω) := {z ∈ Ω | z n = 1} de Ω∗ , dito grupo das raı́zes n-ésimas da unidade. Observemos que este grupo é finito de ordem no máximo n. Pelo lema 18.18 temos que Wn é um grupo cı́clico cuja ordem coincide com o seu expoente. Além disto, #Wn = n se somente se p = car(Ω) - n. De fato, #Wn = n se e somente se polinômio xn − 1 ∈ Ω[x] é separável, o que ocorre se e somente se car(Ω) = 0 ou p com p - n. Note por exemplo que Wp = {1}, se car(Ω) = p. A partir de agora suporemos sempre que car(Ω) = 0 ou p com p - n. Seja Wn (K) := Wn ∩ K. Este conjunto é um subgrupo cı́clico de Wn e de K ∗ . Este subgrupo depende diretamente de K e n. Por exemplo, se K = Q, Ω = C e n = 6, temos que W6 = {1, ζ, · · · , ζ 5 }, onde ζ = e2πi/6 , mas W6 (Q) = {±1}. Se n = 5, então Wn = {1, η, · · · , η 4 }, onde η = e2πi/5 , mas W5 (Q) = {1}. Assim, Wn (K) depende de n e de K. Por outro lado, se n é par (resp. ı́mpar), então Wn (Q) = {±1} (resp. Wn (Q) = {1}). Seja ζ um gerador de Wn . Existe um isomorfismo canônico Wn ∼ = Z/nZ dado por ζ i 7→ i. Lembremos que os geradores de Z/nZ são exatamente as classes a tais que mdc(a, n) = 1, i.e., são os elementos de (Z/nZ)∗ . A pré-imagem destes geradores pelo isomorfismo anterior é o conjunto Pn de geradores de Wn . Tal conjunto é chamado o conjunto das raı́zes primitivas n-ésimas da unidade. Observe também que pelo teorema de Lagrange para todo ϑ ∈ Wn temos o(ϑ) = d | n. Assim, podemos escrever [ (22.1) Wn = Pd . d|n Como anteriormente definimos Pn (K) := Pn ∩ K. Assim, Wn (K) é cı́clico de ordem n se e somente se Pn (K) 6= ∅. Definição 22.1. Dizemos que Ln := K[Rxn −1 ] é a n-ésima extensão ciclotômica de K contida em Ω. Quando K = Q, Ln é dito o n-ésimo corpo ciclotômico. 155 156 22. EXTENSÕES CICLOTÔMICAS Teorema 22.2. A extensão Ln /K é galoisiana finita, Aut(Ln /K) é um grupo abeliano isomorfo a um subgrupo de (Z/nZ)∗ . Em particular, [Ln : K] | φ(n). Além disto, Ln = K(ζ) para algum gerador ζ de Wn (Ln ). Demonstração. Esta extensão é finita, pois é finitamente gerada por elementos algébricos sobre K, as raı́zes de xn − 1. É claro que Ln /K é normal, pois Ln é o corpo de decomposição de xn − 1 sobre K. Também é claro que Ln /K é separável, pois xn − 1 é separável (lembre que p - n, se p > 0). Seja ζ um gerador de Wn (Ln ) = Wn . Então σ ∈ Aut(Ln /K) se e somente se σ(ζ) for também um gerador de Wn , o que ocorre se e somente se σ(ζ) = ζ aσ para algum aσ ∈ {0, · · · , n − 1} tal que mdc(aσ , n) = 1. Isto induz a seguinte função ϕ : Aut(Ln /K) → (Z/nZ)∗ definida por σ 7→ aσ . Esta função é um homomorfismo injetivo de grupos. De fato, por um lado ϕ(στ ) = aστ . Por outro lado, στ (ζ) = σ(ζ aτ ) = σ(ζ)aτ = ζ aσ aτ , portanto aστ = aσ aτ , a fortiori, ϕ(στ ) = ϕ(σ)ϕ(τ ) e ϕ é um homomorfismo de grupos. Além disto, σ ∈ N (ϕ) se e somente se aσ = 1, o que ocorre se e somente se σ = id. Corolário 22.3. [Ln : K] = φ(n) se e somente se Aut(Ln /K) ∼ = (Z/nZ)∗ . Verificaremos que a condição do corolário é satisfeita se K = Q. Para isto precisamos do seguinte lema elementar cuja demonstração deixamos a cargo do leitor. Lema 22.4. Sejam f, g ∈ Q[x] tais que f g ∈ Z[x], então f, g ∈ Z[x]. Teorema 22.5. Seja ζ um gerador de Wn ⊂ C∗ . Então [Q(ζ) : Q] = φ(n). Demonstração. Seja p um número primo tal que p - n. Afirmamos que Pζ|Q = Pζ p |Q . Suponha que Pζ|Q 6= Pζ p |Q . Seja κ p : Z → Fp , a 7→ a o homomorfismo quociente. Este induz um homomorfismo sobrejetivo κ∗p : Z[x] → Fp [x] dado por X X ai xi 7→ ai xi . i Observe que ζ p ∈ Rxn −1 , logo Pζ|Q e Pζ p |Q dividem xn −1. Ou seja, existe h ∈ Q[x] tal que xn − 1 = hPζ|Q Pζ p |Q . Pelo lema anterior concluimos que h, Pζ|Q , Pζ p |Q ∈ Z[x]. Em particular, xn − 1 = κ∗p (h)κ∗p (Pζ|Q )κ∗p (Pζ p |Q ). Observe que ζ é raiz de Pζ p |Q (xp ), logo Pζ p |Q (xp ) = h1 (x)Pζ|Q (x), para algum h1 ∈ Z[x], onde novamente utilizamos pelo lema anterior. Portanto, κ∗p (Pζ p |Q (xp )) = κ∗p (Pζ p |Q )(x)p = κ∗p (h1 )(x)κ∗p (Pζ|Q )(x). Mas κ∗p (Pζ|Q ) e κ∗p (Pζ p |Q ) são irredutı́veis mônicos. Logo κ∗p (Pζ|Q ) = κ∗p (Pζ p |Q ). Em particular, xn − 1 possui fator múltiplo. Mas este polinômio é separável, pois p - n. Concluimos assim que (22.2) Pζ|Q = Pζp |Q . 22. EXTENSÕES CICLOTÔMICAS 157 Seja η ∈ Pn , então η = ζ a , onde a = p1 · · · pr , onde pi é primo e pi - n. Aplicando sucessivamente (22.2) concluimos que Pη|Q = Pζ|Q . Logo #RPζ|Q ≥ #Pn = φ(n). Por outro lado, #RPζ|Q = grau(Pζ|Q ) = [Q(ζ) : Q] ≤ φ(n), onde a última desigualdade segue do teorema anterior. Definição 22.6. Denotamos por Φn := Pζ|Q o n-ésimo polinômio ciclotômico. Segue de (22.1) e da prova do teorema anterior que Y xn − 1 = Φd . d|n Esta última igualdade permite recuperar indutivamente os polinômios ciclotômicos, por exemplo, a partir de Φp para p um número primo. O grupo de Galois de extensões ciclotômicas, mesmo sobre os racionais, é sempre abeliano, mas raramente é cı́clico. Lembre por exemplo que (Z/nZ)∗ é cı́clico se n for 2, 4, p número primo ou 2p. Entretanto, quando substituimos Q pelo corpo finito Fp de p elementos, para um número primo p, o que obtemos é sempre um grupo cı́clico como explicaremos a seguir. Observação 22.7. Note também que todo corpo finito Fq de q = pn elementos dá origem a uma extensão ciclotômica Fq /Fp de corpos finitos é necessariamente uma extensão ciclotômica, pois Fpn \ {0} é exatamente Wpn −1 . Extensões finitas de Q são ditas corpos de números. Podemos naturalmente constuir uma torre de extensões ciclotômicas Q ⊂ Q[ζp ] ⊂ Q[ζp2 ] ⊂ · · · ⊂ Qp∞ chamada uma torre p-ádica. O estudo deste tipo de torre foi feito por K. Iwasawa e este associa a cada torre uma série p-ádica intimamente ligada à função analı́tica p-ádica de Kubota e Leopoldt a qual interpola L-funções de Dirichlet nos inteiros negativos. Por outro lado é possı́vel construir torres semelhantes quando substituimos Q pelo corpo de funções racionais Fp (x). Neste caso entretanto dois tipos de ciclotomia aparecem, emergindo um fenômeno distinto do caso de corpos de números. De um lado as extensões do tipo Fq (x)/Fp (x) por constantes, que como observamos anteriormente e utilizando a teoria de Galois são extensões ciclotômicas. Por outro lado, o papel das raı́zes da unidade também tem como contrapartida o que chamamos de pontos de torção de um determinado módulo devido a Carlitz. Para mais sobre isto ver [Goss]. Finalmente, a teoria de extensões ciclotômicas tanto em um caso quanto em outro são incarnações unidimensionais de um fenômeno mais amplo (multiplicação complexa) que ocorre por exemplo no contexto de variedades abelianas e módulos de Drinfeld. 158 22. EXTENSÕES CICLOTÔMICAS Definição 22.8. Seja Ωp um corpo algebricamente fechado contendo Fp . Definimos em Ωp o automorfismo de Frobenius Frobp (a) = ap . Teorema 22.9. A extensão Fq /Fp é galoisiana finita e seu grupo de Galois Aut(Fq /Fp ) é cı́clico de ordem n gerado pela restrição (Frobp )|Fq do automorfismo de Frobenius Frobp a Fq . Demonstração. A primeira parte do teorema já está feita. Note que (Frobp )nFq = id. Seja ζ um gerador de F∗q . Então o(ζ) = pn − 1. Se existisse j < n j tal que (Frobp )j|Fq = id, então ζ = Frobp (ζ)j = ζ p , i.e., (pn − 1) | (pj − 1), o que é impossı́vel. Assim, o((Frobp )|Fq ) = n. Mas # Aut(Fq /Fp ) = [Fq : Fp ] = n. Teorema 22.10. Seja η um gerador de Wn (Ωp ). Então [Fp (η) : Fp ] = o(p) em (Z/nZ)∗ . Demonstração. Seja m := [Fp (η) : Fp ] e f := o(p) em (Z/nZ)∗ . Neste caso Fp (η) ∼ = Fq , onde q = pm . Além disto, o(η) = n | |F∗q | = q −1, i.e., pm ≡ 1 (mod n), em particular pm = 1. Pelo lema chave, o(p) = f | m, a fortiori f ≤ m. f f Reciprocamente, como pf ≡ 1 (mod n), então η p −1 = 1, i.e., η p = η. Por outro lado, para todo α ∈ Fp (η) temos que α= m−1 X ai η i , i=0 onde ai ∈ Fp para todo i. Pelo pequeno teorema de Fermat, api = ai para todo i, portanto, m−1 X pf f m−1 X f αp = ai η p = ai η i = α. i=0 i=0 f Em particular, tomando α um gerador de Fp (η)∗ concluimos que αp pelo lema chave, o(α) = (pm − 1) | (pf − 1), em particular m ≤ f . Definição 22.11. Analogamente, definimos Ψn := Pη|Fp . Observação 22.12. A decomposição de [ Wn (Ωp ) = Pd (Ωp ) d|n e o teorema anterior implicam que xn − 1 = Y d|n Além disto é fácil ver que Ψd = κ∗p (Φd ). Ψd . −1 = 1, logo CAPı́TULO 23 Extensões cı́clicas Seja K um subcorpo de um corpo algebricamente fechado Ω. Uma extensão galoisiana finita L/K é cı́clica (resp. abeliana) se Aut(L/K) for cı́clico (resp. abeliano). Teorema 23.1 (teorema de Abel). Seja K um corpo, car(K) = p primo e a ∈ K ∗ . As seguintes condições são equivalentes: (1) xp − a é irredutı́vel em K[x]. (2) xp − a não possui raiz em K. (3) a ∈ / K p := {bp | b ∈ K}. Demonstração. É claro que (1) implica (2) que implica (3). Suponha que xp − a seja redutı́vel em K[x] e seja α ∈ Ω tal que αp = a. Então Pα|K | (xp − a). Como xp − a = (x − α)p em Ω[x] concluimos que Pα|K (x) = (x − α)l , onde 1 ≤ l ≤ p − 1. Mas se l > 1, entâo Pα|K não é separável, consequentemente existe h ∈ K[x] tal que Pα|K (x) = h(xp ). Mas devido ao grau de Pα|K isto não é possı́vel. Portanto, Pα|K (x) = x − α é separável e α ∈ K, em particular a ∈ K p . Trataremos agora o caso em que car(K) = 0 ou car(K) = p e p - n. Neste caso Pn 6= ∅, digamos ζ ∈ Pn e Rxn −a = {ζ i α | 0 ≤ i ≤ n − 1, α ∈ Ω, αn = a}. Analisaremos primeiro o caso em que Pn (K) 6= ∅. Teorema 23.2. Suponhamos que Pn (K) 6= ∅ e seja L = K[Rxn −a ]. Então L/K é galoisiana e Aut(L/K) é isomorfo a um subgrupo de Z/nZ, sendo portanto cı́clico. Em particular, [L : K] | n e L = K[α] para qualquer α ∈ Rxn −a . Demonstração. Como L é um corpo de decomposição, então L/K é normal. Além disto como p - n e D(xn − a) = nxn−1 concluimos que xn − a é separável, portanto L/K é separável. Além disto para todo σ ∈ Aut(L/K), σ(α) ∈ Rxn −a , portanto existe 0 ≤ iσ < n tal que σ(α) = ζ iσ . Consideremos a função ϕ : Aut(L/K) → Z/nZ dada por ϕ(σ) = iσ . Esta função é um homomorfismo injetivo de grupos (neste caso, como Z/nZ é cı́clico, concluimos que Aut(L/K) como subgrupo também o é). De fato, dados σ, τ ∈ Aut(L/K), então τ σ(α) = τ (ζ iσ α) = ζ iτ iσ , portanto ϕ(τ σ) = iτ iσ = ϕ(τ )ϕ(σ). Além disto σ ∈ N (ϕ) se e somente se iσ = 0, i.e., iσ = 0, mas neste caso σ = id. Definição 23.3. A extensão cı́clica L = K[Rxn −a ] é dita uma extensão de Kummer. 159 160 23. EXTENSÕES CÍCLICAS Observação 23.4. É possı́vel desenvolver uma teoria de extensões de Kummer mesmo que Pn (K) = ∅. Para isto é necessário cohomologia galoisiana. Para mais detalhes ver [La, chapter VI]. Nesta última situação construimos a seguinte seqüência de extensões K[Rxn −a ] = K[ζ, α] ⊃ K[ζ] ⊂ K. A primeira extensão é cı́clica de grau dividindo n enquanto a segunda é abeliana de grau diviindo φ(n). Mais tarde veremos que isto pode ser traduzido em termos do grupo Aut(L/K). Ele tem a propriedade de ser um grupo solúvel. Em particular obteremos que o polinômio xn − a = 0 é solúvel por radicais (o que é exatamente a pergunta original de Galois para este polinômio particular. Para provar a recı́proca do teorema anterior precisamos do teorema 90 de Hilbert. Seja G um grupo e Hom(G, K) denota o conjunto dos homomorfismos multiplicativos, i.e., dado σ ∈ hom(G, K), σ(xy) = σ(x)σ(y). Por abuso de notação denotaremos ainda por Hom(G, K) o K-espaço vetorial gerado por este conjunto. Teorema 23.5 (teorema de Artin). Dados ϕ1 , · · · , ϕn ∈ Hom(G, K) distintos então estes elementos são K-linearmente independentes. Demonstração. Suponhamos que existam a1 , · · · , an ∈ K não todos nulos tais que a1 ϕ1 + . . . + an ϕn = 0, i.e., para todo y ∈ G temos que (23.1) a1 ϕ1 (y) + . . . + an ϕn (y) = 0. Após reenumeração suponhmaos que a1 , · · · , ak sejam não nulos que a n-upla (a1 , · · · , ak , 0, · · · , 0) tenha o maior número de entradas nulas possı́veis. Seja x ∈ G tal que ϕ1 (x) 6= ϕk (x). Então para todo y ∈ G temos que (23.2) a1 ϕ1 (xy) + . . . + ak ϕk (xy) = a1 ϕ1 (x)ϕ1 (y) + . . . + ak ϕk (x)ϕk (y) = 0. Multiplicando a (23.1) por ϕk (x) e subtraindo de (23.2) obtemos b1 ϕ1 (y) + . . . + bk−1 ϕk−1 (y) = 0, onde bi = ai (ϕi (y) − ϕi (x)) e b1 6= 0. Em particular b1 ϕ1 + . . . + bk−1 ϕk−1 = 0 e esta combinação é não trivial possuindo um número de zeros maior que a combinação que possui o maior número de zeros. Isto é uma contradição. Corolário 23.6 (teorema de Dedekind). Sejam σ1 , · · · , σn ∈ Aut(K), então este conjunto é K-linearmente independente. Teorema 23.7 (teorema 90 de Hilbert). Seja L/K uma extensão cı́clica de grau n e σ um gerador de Aut(L/K). Dado β ∈ L temos que α (1) NL/K (β) = 1 se e somente se existe α ∈ L tal que β = σ(α) . (2) TL/K (α) = 0 se e somente se existe α ∈ L tal que β = α − σ(α). 23. EXTENSÕES CÍCLICAS 161 Demonstração. Lembremos que como Aut(L/K) = hσi, então NL/K (β) = n−1 Y i σ (β) e TL/K (β) = i=0 n−1 X σ i (β). i=0 Em particular, NL/K (σ(β)) = NL/K (β) e TL/K (σ(β)) = TL/K (β). Se existe α ∈ L α (resp. β = α − σ(α)) então NL/K (β) = 1 (resp. TL/K (β) = 0). tal que β = σ(α) Provemos as recı́procas separadamente. Suponhamos primeiro que NL/K (β) = 1. Pelo teorema de Dedekind, id, σ, · · · , σ n−1 são K-lienarmente independentes. Consideremos a K-combinação linear não trivial id + βσ + (βσ(β))σ 2 + . . . + (βσ(β) . . . σ n−2 (β))σ n−1 6= 0, pois o primeiro coeficiente é não nulo. Logo existe γ ∈ L tal que α := γ + βσ(γ) + (βσ(β))σ 2 (γ) + . . . + (βσ(β) . . . σ n−2 (β))σ n−1 (γ) 6= 0. Qn−1 Aplicando σ dos dois lados desta igualdade de notando que i=1 σ i (β) = β −1 e que σ n (γ) = γ concluimos que σ(α) = σ(γ) + σ(β)σ 2 (γ) + (σ(β)σ 2 (β))σ 3 (γ) + . . . + β −1 γ = β −1 (γ + βσ(γ) + (βσ(β))σ 2 (γ) + . . . + (βσ(β) . . . σ n−2 (β))σ n−1 (β)) = β −1 α. Suponhamos agora que TL/K (β) = 0. Como L/K é separável existe γ ∈ L tal que TL/K (γ) 6= 0 (ver exercı́cio no captı́tulo de extensões separáveis). Seja α := 1 (βσ(γ) + (β + σ(β))σ 2 (γ) + . . . + (β + σ(β) + . . . + σ n−2 (β))σ n−1 (γ). TL/K (γ) Observe que σ(α) = 1 (σ(β)σ 2 (γ)) + (σ(β) + σ 2 (β))σ 3 (γ) + . . . TL/K (γ) + (σ(β) + . . . + σ n−1 (β))σ n (γ)). Pn−1 Como σ n (γ) = γ e i=1 σ i (β) = −β concluimos que 1 (βγ + βσ(γ) + . . . + βσ n−1 (γ)) TL/K (γ) 1 = βTL/K (γ) = β. TL/K (γ) α − σ(α) = Teorema 23.8. Suponhamos que Pn (K) 6= ∅. Seja L/K uma extensão cı́clica de grau n. Então existe a ∈ K ∗ tal que L = K[Rxn −a ] e L = K[α] para qualquer α ∈ Rxn −a . Demonstração. Seja ζ ∈ Pn (K), então NL/K (ζ) = ζ n = 1. Pelo teorema 90 α de Hilbert existe α ∈ L tal que ζ = σ(α) , onde hσi = Aut(L/K). Em particular, σ(α) = ζ −1 α e σ(αn ) = σ(α)n = (ζ −1 )n αn = α, i.e., a = αn ∈ K. É claro que Rxn −a = {ζ i α | 0 ≤ i ≤ n − 1} ⊂ L, logo K[Rxn −a ] ⊂ L. Além disto Rxn −a ⊂ RPα|K , portanto xn −a = Pα|K , assim K[α] = K[Rxn −a ] e [K[α] : K] = n, portanto L = K[α]. 162 23. EXTENSÕES CÍCLICAS Proposição 23.9. Seja K um corpo de caracterı́stica p e a ∈ K. Então xp − x − a é irredutı́vel em K se e somente se não existe b ∈ K tal que bp − b = a. Demonstração. Se existe b ∈ K tal que bp −b = a, então xp −x−a possui uma raiz em K sendo portanto redutı́vel. Reciprocamente, suponha que f = xp − x − a seja redutı́vel em K[x]. Seja α ∈ Ω uma raiz de f , então Pα|K | (xp − x − a). Note que Y Rxp −x−a = {α + i | 0 ≤ i < p} e Pα|K = (x − α − i) i∈I para algum subconjunto I ⊂ {0, 1, · · · , p − 1}. Portanto o coeficiente de grau d − 1, onde 1 ≤ d = #I, é igual a dα + c com c ∈ {0, 1, · · · , p − 1}. Em particular, como dα + c ∈ K, concluimos que dα ∈ K e como d é inversı́vel, pois p - d, concluimos que α ∈ K, i.e., αp − α = a. Teorema 23.10. Seja a ∈ K ∗ tal que não existe α ∈ K com αp −α = a. Então a extensão K(Rxp −x−a )/K é cı́clica de grau p. Além disto K[Rxp −x−a ] = K[α] para todo α ∈ Rxp −x−a . Demonstração. Como L = K[Rxp −x−a ] é um corpo de decomposição, a extensão L/K é nornmal. Além disto D(xp − x − a) = −1, logo L/K é separável. As raı́zes de xp −x−a são da forma α+i para i = 0, · · · , p−1. Portanto, L = K[α]. Pela proposição anterior xp − x − a = Pα|K para algum α ∈ Rxp −x−a , portanto [L : K] = p. Definição 23.11. Uma extensão cı́clica da forma da forma K[Rxp −x−a ]/K em caracterı́stica p é dita uma extensão de Artin-Schreier. Observação 23.12. É possı́vel de forma semelhante ao que foi feito acima caracterizar extensões cı́clicas em caracterı́stica p de grau pn . Neste caso é necessário substituir α por um vetor, chamado um vetor de Witt, por isto estas extensões são ditas de Artin-Schreier-Witt. Vetores de Witt formam um anel que como espaço vetorial é isomorfo a K n , mas com outra soma e produto de tal forma que seja um anel em caracterı́stica 0. Tomando seu limite projetivo (veja capı́tulo de teoria de Galois infinita) obtemos o anel W(K) de vetores de Witt. É um anel com um único ideal maximal pW(K) cujo quociete é isomorfo a K. Assim pensamos que ele levanta K. Isto é similar ao fato dos anel inteiros p-ádicos Zp levantar Fp o corpo de p elementos. Vetores de Witt aparecem em várias partes na matemática. Para citar apenas duas. Serre introduziu a cohomologia com coeficientes nos feixes de vetores de Witt que pode ser vista como uma precursora da cohomologia étale. De outro lado, curvas sobre um corpo K de caracterı́stica p podem ser “deformadas” em curvas sobre o anel W(K). Teorema 23.13. Seja K um corpo de caracterı́stica p e L/K uma extensão cı́clica de grau p. Então existe a ∈ K tal que a 6= bp − b para todo b ∈ K e L = K[Rxp −x−a ]. Demonstração. Note que TL/K (1) = p = 0. Seja σ um gerador de Aut(L/K ). Pelo teorema 90 de Hilbert existe α ∈ L tal que 1 = α − σ(α), i.e., σ(α) = α − 1. Logo para todo 0 ≤ j < p, σ j (α) = α − j, em particular para todo i = 0, · · · , p − 1, α+i é raiz de Pα|K e além disto σ(αp −α) = αp +j −(α+j) = αp −α (pelo pequeno 23. EXTENSÕES CÍCLICAS 163 teorema de Fermat). Além disto, Rxp −x−a ⊂ RPα|K , logo Pα|K | xp − x − a, para a = αp − α ∈ K e Pα|K = xp − x − a. Em particular, L = K(Rxp −x−a ). CAPı́TULO 24 Solubilidade por radicais Este capı́tulo responde à questão original de Galois : quando uma equação polinomial com coeficientes racionais tem solução na forma radical. Observe que precisamos não só da gestalt da teoria de Galois mas também de extensões ciclotômicas e cı́clicas bem como da noção de grupos solúveis. Definição 24.1. Uma extensão galoisiana finita E/k é dita solúvel se e somente se Aut(E/k) é um grupo solúvel. Isto equivale a dizer que existe uma seqüência de corpos E = E0 ⊃ E1 ⊃ E 2 ⊃ · · · En = k tal que cada extensão Ei /Ei+1 é abeliana, ou equivalentemente cı́clica de grau primo. Extensões solúveis satisfazem às seguintes propriedades. Proposição 24.2. (1) Sejam k ⊂ F ⊂ E corpos tais que E/k e F/k sejam extensões galoisianas finitas. Então E/k é solúvel se e somente se E/F e F/k são solúveis. (2) Suponha que E/k seja solúvel e que K/k seja uma extensão finita qualquer com E, K ⊂ Ω e Ω corpo, então EK/K é solúvel. (3) Se E/k e K/k são solúveis, então EK/k é solúvel. Demonstração. (1) Basta utilizar a proposição 12.15 e notar que basta mostrar o resultado para os respectivos grupos de automorfismos, i.e., Aut(E/k) é solúvel se e somente se Aut(E/F ) e Aut(F/k) ∼ = Aut(E/k)/ Aut(E/F ) são solúveis (lembre que F/k é galoisiana se e somente se Aut(E/F ) C Aut(E/k). (2) Segue da proposição 21.13 que EK/K é galoisiana finita. Além disto Aut(EK/K) ∼ = Aut(E/E ∩ K) ⊂ Aut(E/k). Como Aut(E/k) é solúvel, pela proposição 12.15 concluimos que Aut(EK/K) também é solúvel. (3) Novamente, pela proposição 21.13, EK/k é galoisiana finita. Além disto, pela proposição 12.15, utilizando que Aut(EK/K) e Aut(K/k) ∼ = Aut(EK/k)/ Aut(EK/K) são solúveis, concluimos que Aut(EK/k) também o é. Portanto, EK/k é solúvel. Definição 24.3. Uma extensão finita separável F/k é dita solúvel por radicais se existe E/k finita tal que F ⊂ E e existe uma seqüência de corpos E = E0 ⊃ E 1 ⊃ · · · ⊃ En = k tal que cada extensão Ei /Ei+1 é de um dos 3 tipos seguintes: (1) Ei = Ei−1 [ζ], onde ζ ∈ Rxn −1 , para algum n ≥ 1. (2) Ei = Ei−1 [α], onde α ∈ Rxn −a , para algum n ≥ 1, se p - n, onde p = car(k) (esta condição é vazia se car(k) = 0) e a ∈ Ei−1 . 165 166 24. SOLUBILIDADE POR RADICAIS (3) Ei = Ei−1 [α], onde α ∈ Rxp −x−a , se car(K) = p > 0 e para algum a ∈ Ei−1 . Extensões solúveis por radicais satisfazem as seguintes propriedades. Em todas as propriedades abaixo suporemos que os corpos estejam todos contidos em um corpo Ω suficientemente grande, de tal forma a podermos tomar composita de corpos. Proposição 24.4. (1) Sejam k ⊂ F ⊂ E corpos com E/k separável finita. Então E/k é solúvel por radicais se e somente se E/F e F/k o são. (2) Suponha que E/k seja solúvel por radicais e seja K/k uma extensão finita. Então EK/K é solúvel por radicais. (3) Suponha que E/k e K/k sejam solúveis por radicais. Então EK/k é solúvel por radicais. Demonstração. (1) Suponha que F/k e E/F sejam solúveis por radicais. Logo existem F 0 /k finita tal que F 0 ⊃ F e seqüência de corpos F 0 = F0 ⊃ F1 ⊃ · · · ⊃ k, na qual cada extensão Fi /Fi−1 é de um dos 3 tipos anterioes. Similarmente, existem E 0 /F finita tal que E 0 ⊃ E e seqüência de corpos E 0 = E0 ⊃ E1 ⊃ · · · ⊃ F, onde cada extensão Ei /Ei−1 é de um dos 3 tipos acima. Tomando o compositum da segunda seqüência com F 0 e continuando pela segunda até obtemos uma seqüência de corpos E 0 F 0 = E0 F 0 ⊃ E1 F 0 ⊃ · · · ⊃ F 0 ⊃ F1 ⊃ · · · ⊃ k. Finalmente, observe que Ei F 0 = Ei−1 F 0 [ζ] ou Ei−1 F 0 [α], em qualquer caso recuperamos um dos 3 tipos anteriores. Suponha agora que E/k seja solúvel por radicais, ou seja existe E 0 /k finita com 0 E ⊃E e E 0 = E0 ⊃ E1 ⊃ · · · ⊃ k, com Ei = Ei−1 [α] ou Ei−1 [ζ]. Primeiro, como F ⊂ E ⊂ E 0 , segue imediatamente que F/k é solúvel por radicais. De outro lado, como acima, tomando o compositum da seqüência anterior com F concluimos também que E ⊂ E 0 ⊂ E 0 F e E/F é solúvel por radicais. (2) Mesmo argumento do último parágrafo, tomando agora o compositum da seqüência com K. (3) Segue dos 2 anteriores. Teorema 24.5. Seja E/k uma extensão galoisiana finita. Então E/k é solúvel por radicais se e somente se E/k é solúvel. Demonstração. Suponha que E/k seja solúvel. Neste caso existe uma seqüência de corpos E = E 0 ⊃ E1 ⊃ E2 ⊃ · · · ⊃ E n = k Q tal que cada extensão Ei /Ei+1 é cı́clica de grau primo `i . Seja m = i `i onde fazemos o produto apenas nos números primos `i tais que `i 6= p = car(k). Seja 24. SOLUBILIDADE POR RADICAIS 167 Ω um corpo algebricamente fechado contendo k e ζ ∈ Pm (Ω). Seja K := k[ζ]. Consideremos o compositum da seqüência de corpos acima com K, EK = L0 ⊃ E1 K = L1 ⊃ E2 K = L2 ⊃ · · · ⊃ En K = K. Cada extensão Li /Li+1 é galoisiana e temos que Aut(Li /Li+1 ) = Aut(Ei K/Ei+1 K) é isomorfo a um subgrupo de ordem > 1 de Aut(Ei /Ei+1 ). Portanto este subgrupo é igual ao próprio Aut(Ei /Ei+1 ), o qual é cı́clico de ordem `i . Mas neste caso, por construção existe ζ m/`i ∈ Ei−1 raiz `i -ésima da unidade, para `i 6= p. Portanto, a extensão Li /Li+1 é uma extensão de Kummer, se `i 6= p. Caso `i = p a extensão é automaticamente de Artin-Schreier. Portanto, cada extensão Li /Li+1 é de um dos 3 tipos acima, i.e., EK/K é solúvel por radicais. Trivialmente, K/k é solúvel por radicais. Do item (1) das propriedades anteriores concluimos que EK/k é solúvel por radicais, a fortiori E/k é solúvel por radicais (novamente o item (1) das propriedades acima, uma vez que E ⊂ EK). Reciprocamente, suponha que E/k seja solúvel por radicais. Então existe E 0 /k finita contendo E e uma seqüência de corpos E 0 = E 0 ⊃ E 1 ⊃ E 2 ⊃ · · · ⊃ En = k tal que cada Ei /Ei+1 é de um dos três tipos acima. Note que a priori a extensão Ei /Ei−1 não é galoisiana, isto falha no caso (2) acima. Seja m o produto de todos os números primos dividindo [E 0 : k] distintos de p = car(k) (caso p > 0). Seja ζ ∈ Wm (Ω) uma raiz primitiva m-ésima da unidade em um corpo algebricamente fechado Ω (como sempre supomos Ω suficientemente grande para conter todos os corpos considerados). Seja F := k[ζ] a m-ésima extensão ciclotômica de k. Considere agora o compositum da seqüência anterior com F dado por E 0 F ⊃ E1 F ⊃ · · · ⊃ F. Para cada i, seja Li := Ei F . Note que agora cada Li /Li−1 é galoisiano, pois corrigimos o caso Kummer acrescentando um elemento ζmi , uma raiz mi -ésima primitiva da unidade a Ei−1 , onde mi = [Ei : Ei−1 ], caso p - mi . Caso contrário nada há a fazer. Além disto neste caso Li = Li−1 [αi ] = Li−1 [Rxmi −ai ], onde αimi = ai . Finalmente, observe que E 0 F é o corpo de decomposição sobre k do polinômio Y Y f := (xmi − ai ) × (xp − x − ai ). i,p-mi i,mi =p Portanto, E 0 F/k é galoisiana (já que E 0 F/F é separável, pois cada Li /Li−1 o é, e F/k também é separável). A fortiori, E 0 F/F é solúvel. Trivialmente F/k é solúvel. Assim, pelas propriedades de extensões solúveis, E 0 F/k é solúvel. A fortiori, pela mesma razão, E/k é solúvel. Definição 24.6. Dado f ∈ Q[x] irredutı́vel. Este polinômio é dito solúvel por radicais se Q[Rf ]/Q é solúvel por radicais. Corolário 24.7 (teorema de Galois, post-mortem). Seja f ∈ Q[x] irredutı́vel. Então f é solúvel por radicais se e somente se Gal(f, K) for solúvel. Observação 24.8. Num capı́tulo posterior abordaremos o problema inverso de Galois, que permaence em aberto desde o século XIX. Este diz o seguinte. Dado um grupo finito G será que existe uma extensão galoisiana finita K/Q tal que 168 24. SOLUBILIDADE POR RADICAIS Gal(K/Q) seja G? Veremos que a geometria, via o teorema de irredutibilidade de Hilbert poderá nos dar informações relevantes para este problema. Um caso particular é aquele no qual o grupo G é um grupo solúvel. Nesta situação sabe-se que existe K. Isto é devido a S̆afarevic̆ e Iwasawa. Para mais sobre isto veja [Ser] Observação 24.9. Não é difı́cil provar que S4 e S3 são grupos solúveis. Além disto, para todo polinômio irredutı́vel f ∈ Q[x] de grau n temos que Aut(k(Rf )/k) é isomorfo a um subgrupo de Sn . Portanto, polinômios de graus 3 e 4 são sempre solúveis. Isto mostra que os algebristas árabes e italianos só podiam mesmo achar explicitamente as raı́zes na forma radical, o que não quer dizer que encontrar as fórmulas por eles obtidas fosse missão fácil. Contrariamente, equações de grau 5 não são necessariamente solúveis por radicais, uma vez que S5 não o é (veja [GaLe]. O teorema 21.20 nos diz que polinômios de grau primo p > 2 com exatamente 2 raı́zes reais têm grupo de Galois Sp . Assim, basta considerar um polinômio de grau 5 com 3 raı́zes reais. Parte 5 Tópicos adicionais CAPı́TULO 25 O problema inverso de Galois Problema 25.1. Seja G um grupo finito. Será que existe uma extensão galoisiana finita K/Q tal que Gal(K/Q) = G? Este problema permanece em aberto desde o século XIX. Entretanto reformulações geométricas não só geraram análogos desta questão em outras circunstâncias, bem como trouxeram de volta resultados para o problema original. Nossa primeira seção será justamente dedicada a mostrar que o grupo Sn de permutações de n elementos sempre é grupo de Galois de uma extensão do corpo de funções racionais K(x1 , · · · , xn ) para um corpo K qualquer. Em particular, tomando K = Q e utilizando o teorema de irredutibilidade de Hilbert, obteremos que Sn é grupo de Galois sobre Q, i.e., existe K/Q galoisiana finita tal que Sn = Gal(K/Q). Em seguida discutiremos desenvolvimentos na direção do problema inverso para outros grupos. 25.1. Grupo Sn Sejam Sn o grupo das permutações de n elementos, R um anel comutativo com unidade e A = R[x1 , · · · , xn ] o anel de polinômios em n variáveis com coeficientes em R. Para todo σ ∈ Sn e f (x1 , · · · , xn ) ∈ A definimos σ ∗ (f (x1 , · · · , xn )) = f (xσ(1) , · · · , xσ(n) ). Esta função é na verdade um automorfismo de A (verifique!). Dizemos que f é simétrico se e somente se σ ∗ (f ) = f para todo σ ∈ Sn . Por exemplo, as funções simétricas elementares s1 , · · · , sn nas variáveis x1 , · · · , xn são polinômios simétricos (veja capı́tulo de extensões finitas). É claro que nem todo polinômio simétrico é uma função simétrica elementar, por exemplo, (25.1) x21 + . . . + x2n . Entretanto, mostraremos que todo polinômio simétrico se escreve de forma única como polinômio nas funções simétricas elementares. Além disto não existem relações entre estas, ou seja, são algebricamente independentes (veja capı́tulo de teoria de transcendência). Teorema 25.2. Seja f ∈ A simétrico. Então existe um único g ∈ R[s1 , · · · , sn ] tal que f (x1 , · · · , xn ) = g(s1 , · · · , sn ). Do teorema segue imediatamente o seguinte corolário. Corolário 25.3. Não existe g ∈ R[s1 , · · · , sn ] \ {0} tal que g(s1 , · · · , sn ) = 0. Exemplo 25.4. Observe que o polinômio em (25.1) pode ser reescrito como x21 + . . . + x2n = s21 − 2s2 . 171 172 25. O PROBLEMA INVERSO DE GALOIS Considere o polinômio f (t) = (t − x1 ) . . . (t − xn ) = xn − s1 xn−1 + . . . + (−1)n sn ∈ A[t]. Definimos o discriminante de f (t) por Y D := (xi − xj )2 = (−1)n(n−1)/2 1≤i<j≤n Y (xi − xj ). 1≤i6=j≤n É imediato da definição que o D é um polinômio simétrico com coeficientes inteiros. É um dos mais importantes invariantes de um polinômio. Assim, segue do teorema, que podemos escrevê-lo de forma única como D(x1 , · · · , xn ) = ∆(s1 , · · · , sn ) ∈ Z[s1 , · · · , sn ]. Na prática é bastante laborioso de obter a expressão. Entretanto, se n = 2 temos (x1 − x2 )2 = s21 − 4s2 ; e para n = 3 temos (x1 − x2 )2 (x1 − x3 )2 (x2 − x3 )2 = s21 s22 − 4s32 − 4s31 s3 − 27s23 + 18s1 s2 s3 . É importante notar que estas igualdades são identidades no anel Z[x1 , · · · , xn ]. Assim, permanecem verdadeiras se substituimos as variáveis x1 , · · · , xn por constantes. Por exemplo, se R for um corpo K e α1 , · · · , αn forem elementos algébricos sobre K contidos em alguma extensão L de K, então (x − α1 ) . . . (x − αn ) = xn − a1 xn−1 + . . . + an , onde ai = si (α1 , · · · , αn ). Neste caso o discriminante do polinômio é dado por Y ∆(a1 , · · · , an ) = (αi − αj )2 . 1≤i<j≤n Em particular, f é separável se e somente se ∆(a1 , · · · , an ) 6= 0. Fica como exercı́cio verificar que esta definição de discriminante coincide com a definição anterior (capı́tulo de anéis e domı́nios). No caso do polinômio cúbico x3 − ax + b obtemos como discriminante −(4a3 + 27b2 ). Para a prova do teorema precisamos da noção de grau de um polinômio em várias variáveis. Se f ∈ A, então ele pode ser escrito como X f (x1 , · · · , xn ) = ai1 ···in xi11 . . . xinn , i1 ,··· ,in onde cada ai1 ···in pertence a R. O monômio xi11 . . . xinn tem grau i1 + . . . + in . O grau de f é definido como sendo o maior grau dos monômios com coeficiente não nulo. Por exemplo, o discriminante em 3 variáveis é um polinômio de grau 6. Demonstração do teorema. Demonstraremos o teorema por indução no número de variáveis n e no grau d de f . Comecemos com a existência. Se n = 1, nada há a fazer, pois x1 = s1 . Suponha que o teorema seja verdade para polinômios em n − 1 variáveis. Definimos a seguinte função ϕ : A = R[x1 , · · · , xn ] → R[x1 , · · · , xn−1 ] h 7→ h(x1 , · · · , xn−1 , 0). 25.1. GRUPO Sn 173 Observe que como f é simétrico com respeito a Sn , então ϕ(f ) é simétrico em relação a Sn−1 . Por hipótese de indução existe g 0 ∈ R[s01 , · · · , s0n−1 ] tal que ϕ(f (x1 , · · · , xn )) = g 0 (s01 , · · · , s0n−1 ), onde para 1 ≤ i ≤ n − 1, a função s0i denota a i-ésima função simétrica elementar nas variáveis x1 , · · · , xn−1 . Observe que para todo 1 ≤ i ≤ n − 1 temos ϕ(si (x1 , · · · , xn )) = s0i (x1 , · · · , xn−1 ). Seja p(x1 , · · · , xn ) := f (x1 , · · · , xn ) − g 0 (s01 , · · · , s0n−1 ). Como p é diferença de polinômios simétricos (um polinômio simétrico em n − 1 variáveis é simétrico em n variáveis), concluimos que p também é simétrico. Além disto, p(x1 , · · · , xn−1 , 0) = 0. Mas isto significa que p(x1 , · · · , xn ) é divisı́vel por xn . Similarmente, definindo a função ϕ anulando qualquer outra das variáveis, concluimos que para todo 1 ≤ i ≤ n o polinômio p(x1 , · · · , xn ) é divisı́vel por cada xi , a fortiori por x1 . . . xn = sn (x1 , · · · , xn ), digamos f (x1 , · · · , xn ) = g 0 (s01 , · · · , s0n−1 ) + sn h(x1 , · · · , xn ), onde h ∈ A. Por construção o grau de h é inferior ao grau de f . Além disto, como p(x1 , · · · , xn ) e sn são simétricos, concluimos que h também o é. Por indução no grau, temos que existe q ∈ R[s1 , · · · , sn ] tal que h(x1 , · · · , xn ) = q(s1 , · · · , sn ), assim f (x1 , · · · , xn ) = g 0 (s01 , · · · , s0n−1 ) + sn q(s1 , · · · , sn ) é uma expressão de f em termos de funções simétricas elementares. A unicidade também é provada com indução em n e no grau. Considere a função ψ : A = R[x1 , · · · , xn ] → R[s1 , · · · , sn ] f (x1 , · · · , xn ) 7→ f (s1 , · · · , sn ). Esta função é um homomorfismo de anéis (verifique!). A unicidade então é equivalente a injetividade de ψ. Suponha que f (x1 , · · · , xn ) ∈ ker(ψ), i.e., f (s1 , · · · , sn ) = 0. Aplicando ϕ a f (s1 , · · · , sn ) concluimos que f (s01 , · · · , s0n−1 ) = 0. Por indução no número de variáveis, concluimos que ϕ(f (x1 , · · · , xn ) = f (x1 , · · · , xn−1 , 0) = 0. Logo xn divide f (x1 , · · · , xn ). Similarmente, redefinindo ϕ de forma a anular qualquer outra das variáveis, temos que cada xi divide f (x1 , · · · , xn ), a fortiori x1 . . . xn = sn (x1 , · · · , xn ) divide f (x1 , · · · , xn ), digamos f (x1 , · · · , xn ) = sn (x1 , · · · , xn )h(x1 , · · · , xn ), para algum h ∈ A. Neste caso, por construção, o grau de h é menor que o grau de f . Além disto, 0 = f (s1 , · · · , sn ) = s1 . . . sn h(s1 , · · · , sn ) em R[s1 , · · · , sn ]. Concluimos portanto que h(s1 , · · · , sn ) = 0. Logo, por indução no grau, h(x1 , · · · , xn ) = 0, em particular, f (x1 , · · · , xn ) = 0. 174 25. O PROBLEMA INVERSO DE GALOIS Suponhamos agora que R seja um corpo F . Seja F (x1 , · · · , xn ) o corpo de frações do anel de polinômios F [x1 , · · · , xn ]. Este é dito o corpo de funções racionais em n variáveis com coeficientes em F . Analogamente, para todo σ ∈ Sn definimos σ ∗ (f (x1 , · · · , xn )) := f (xσ(1) , · · · , xσ(n) ) e dizemos que f é simétrica se e somente se σ ∗ (f ) = f para todo σ ∈ Sn . Teorema 25.5. Toda função simétrica f ∈ F (x1 , · · · , xn ) pode ser escrita de forma única como f (x1 , · · · , xn ) = g(s1 , · · · , sn ) ∈ F (s1 , · · · , sn ). Demonstração. Suponha que f (x1 , · · · , xn ) = f1 (x1 , · · · , xn ) , f2 (x1 , · · · , xn ) onde f1 , f2 ∈ A, seja simétrica. Seja G(x1 , · · · , xn ) := Y σ ∗ (f2 ). σ∈Sn Observe que G e Gf são polinômios simétricos em A. Ou seja existem únicos h1 , h2 ∈ R[s1 , · · · , sn ] tais que G = h1 e Gf = h2 . Logo f = h2 /h1 ∈ F (s1 , · · · , sn ) e esta expressão é única pela unicidade de h1 e h2 . Teorema 25.6. A extensão de corpos F (x1 , · · · , xn )/F (s1 , · · · , sn ) é galoisiana com grupo de Galois isomorfo a Sn . Demonstração. Seja L := F (s1 , · · · , sn ) e f (t) := (t − x1 ) . . . (t − xn ) = tn − s1 tn−1 + . . . + (−1)n sn ∈ L[t]. Então F (x1 , · · · , xn ) = L[Rf (t) ] é o corpo de decomposição de f (t) sobre L. Assim, a extensão acima é normal. É também separável, pois as variáveis x1 , · · · , xn são distintas, logo f (t) é separável. Portanto, a extensão é galoisiana. Como f (t) tem grau n, sabemos que Gal(F (x1 , · · · , xn )/L) é isomorfo a um subgrupo de Sn (ver capı́tulo de teoria de Galois). Por outro lado, F (x1 , · · · , xn )Sn ⊃ L. Isto significa que Sn ⊂ Gal(F (x1 , · · · , xn )/L). Logo Gal(F (x1 , · · · , xn )/L) ∼ = Sn . Para passarmos do teorema acima para um resultado sobre Q precisamos do teorema de irredutibilidade de Hilbert (veja [LaDio, chapter 9]. Teorema 25.7 (teorema de irredutiblidade de Hilbert). Seja L := Q(x1 , · · · , xn ) ⊃ R := Q[x1 , · · · , xn ] e f (t) ∈ L[t] irredutı́vel. Então existem infinitos homomorfismos λ : R → Q tais que λ∗ (f )(t) seja irredutı́vel em Q[t]. Teorema 25.8. Existe uma extensão galoisiana finita K de Q tal que Gal(K/ Q) ∼ = Sn . Demonstração. Pelo teorema 25.6 a extensão Q(x1 , · · · , xn )/Q(s1 , · · · , sn ) é galoisiana com grupo de Galois isomorfo a Sn . Seja α um elemento primitivo desta extensão e Pα|M o seu polinômio mı́nimo sobre M := Q(s1 , · · · , sn ). Pelo teorema de irredutibilidade de Hilbert existem infinitos homomorfismos λ : R → Q tais que λ∗ (Pα|M ) =: f seja irredutı́vel sobre Q[t]. Note que a extensão Q[Rf ]/Q é galoisiana de grau n!. É possı́vel mostrar com argumentos geométricos que podemos 25.3. MÉTODO GERAL 175 escolher λ de tal forma que Gal(Q[Rf ]/Q) seja ainda Sn (ver [SerMW, proposition 2, seção 9.2]). 25.2. Grupo An Para obter o grupo An como grupo de Galois sobre Q começamos novamente Q com a situação genérica. Seja D = 1≤i<j≤n (xi −xj )2 o discriminante do polinômio Q f (t) = (t − x1 ) . . . (t − xn ) = xn − s1 xn−1 + . . . + (−1)n sn . Seja δ := 1≤i<j≤n (xi − xj ). Observe que para todo σ ∈ Sn temos σ ∗ (δ) = ±δ. Se o sinal for positivo, dizemos que a permutação é par, senão dizemos que é ı́mpar. É claro que δ 2 = D eδ∈ / M := F (s1 , · · · , sn ). Assim, [M [δ] : M ] = 2. Além disto, denotando por An o subgrupo normal de ı́ndice 2 de Sn formado pelas permutações pares, temos que F (x1 , · · · , xn )An ⊃ M [δ]. Obtemos dessa forma o seguinte resultado. Teorema 25.9. A extensão F (x1 , · · · , xn )/M [δ] é galoisiana com grupo de Galois An . Teorema 25.10. Existe extensão galoisiana K/Q tal que Gal(K/Q) ∼ = An . Demonstração. A prova é como no caso Sn utilizando o fato adicional que podemos escolher λ de tal forma que λ(δ) ∈ / Q (ver [SerMW, seção 10.3]). 25.3. Método geral O que está ocorrendo em ambos os casos está longe de ser uma situação particular. Em primeiro lugar, o corpo de funções racionais F (x1 , · · · , xn ) é o corpo de funções racionais do espaço afim An (F ) = F n como variedade algébrica. O objetivo é primeiramente realizar um grupo finito G como grupo de Galois sobre este corpo. Isto nem sempre pode ser obtido, é quase tão difı́cil quanto o problema original. Entretanto, temos o seguinte resultado. Teorema 25.11. [SerMW, seção 10.1] Seja G um grupo finito. Suponha que exista uma extensão galoisiana finita L/Q(x1 , · · · , xn ) com grupo de Galois G. Então existe uma extensão galoisiana K/Q com grupo de Galois G. Além disto, se L é Q-regular, i.e., Q é algebricamente fechado em L, então existem uma infinidade de extensões linearmente disjuntas (para definição ver capı́tulo de teoria de transcendência). Observação 25.12. Utilizando a teoria de curvas elı́ticas é possı́vel provar que existe uma extensão Q-regular de Q(x) com grupo de Galois PSL2 (Fp ) = SL2 (Fp )/F∗p . Isto é devido a Shih (ver [SerMW, seção 10.4]). Na verdade estas extensões representam do ponto de vista geométrico recobrimentos galoisianos finitos de curvas definidas sobre Q com um número finito de pontos de ramificação. Isto remete a seguinte pergunta: quando um grupo finito pode ser grupo de Galois de um tal recobrimento com um conjunto prescrito de pontos de ramificação? Nesta generalidade a pergunta permanece em aberto, mas se considerarmos a pergunta sobre C, ela é respondida em termos topológicos através do chamado grupo fundamental algébrico, que neste caso é o completamento profinito do grupo topológico (para mais sobre grupos profinitos ver capı́tulo de teoria de Galois infinita). A reformulação desta pergunta para corpos algebricamente fechados de caracterı́stica positiva, só foi respondida na década de 90 por Raynaud e depois Harbater correspondendo a uma conjectura de Abhyankar. A resposta é que para que um grupo 176 25. O PROBLEMA INVERSO DE GALOIS G ocorra como grupo de Galois seu maior quociente primo com p deve se realizar sobre uma curva sobre C com mesmo número de pontos de ramificação (suposto pelo menos 1). Seu maior quociente primo com p nada mais é que o quociente de G pelo seu quase-p-subgrupo, i.e., o subgrupo gerado pelos seus p-subgrupos de Sylow. Observação 25.13. Um objeto extremamente importante em aritmética e relacionado com o problema inverso de Galois é o grupo de Galois absoluto GQ := Gal(Q/Q), onde Q = AC (Q). O fato de um grupo finito G ser grupo de Galois sobre Q equivale ao fato de G ser um quociente de GQ . Este tema está intimamente relacionado a resolver problemas de mergulhos para o grupo profinito GQ (para mais ver [Ser]). CAPı́TULO 26 Teoria de Galois infinita 26.1. Limite inverso Consideremos uma seqüência de grupos {Gn }n∈N e suponhamos que para cada n tenhamos um homomorfismo sobrejetivo de grupos fn : Gn Gn1 . Consideremos Q em n∈N Gn (onde a operação é componente a componente) o subconjunto de uplas da forma x = (x0 , x1 , x2 , · · · ) tais que fn (xn ) = xn−1 para todo n ∈ N. Como cada fn é um homomorfismo sobrejetivo, partindo de x1 ∈ G1 , tomando uma pré imagem sua x2 em G2 e assim sucessivamente, formamos pelo menos uma upla neste subconjunto que denotaremos por limn (Gn , fn ). Este conjunto é chamado o ←− limite inverso ou limite projetivo da famı́lia {Gn , fn } que é chamada de um sistema projetivo. Exemplo 26.1. Seja A um grupo abeliano, p um número primo e pA : A → A a multiplicação por p em A. Dizemos que A é p-divisı́vel , se pA for sobrejetivo. Neste caso tomaremos o limite projetivo considerando a seqüência constante An = A para todo n e fn = pA para todo n. O limite projetivo de (A, pA ) será denotado por Vp (A). Consideremos o subconjunto Tp (A) de Vp (A) formado pelas uplas tais que x1 = 0. Seja A[pn ] := ker(pnA ). Então Tp (A) = limn A[pn ]. Este é chamado ←− o subgrupo de Tate associado ao grupo p-divisı́vel A. O exemplo mais comum deste tipo de grupo é no contexto de variedades abelianas sobre corpos globais. Entretanto, o exemplo mais simples, é tomar µpn o grupo das raı́zes pn -ésimas da unidade em um corpo S algebricamente fechado Ω de caracterı́stica distinta de p, tomar A como µp∞ := n µpn e considerar Tp (µ) := limn µpn . ←− Exemplo 26.2. Dado um grupo G considere uma seqüência de subgrupos Hn de G tais que Hn ⊃ Hn−1 . Considere o homomorfismo sobrejetivo fn : G/Hn G/Hn−1 (projeção). Isto nos permite tomar o limite projetivo limn (G/Hn , fn ) ←− e observar que os homomorfismos anteriores implicam um homomorfismo natural g : G → limn Gn dado por x 7→ (· · · , xn , · · · ), onde xn := x + Hn . ←− Exemplo 26.3. Para todo n ≥ 0 considere Gn := Z/pn Z e o homomorfismo sobrejetivo de projeção fn : Z/pn+1 Z → Z/pn Z. O limite projetivo limn Z/pn Z é ←− chamado o anel Zp dos inteiros p-ádicos (para mais detalhes ver [Ne, chapter II]. Definiremos agora a noção de produto inverso de forma um pouco mais geral. Seja I um conjunto de ı́ndices dotado de uma ordem parcial i ≤ j. Diremos que I é direcionado se para quaisquer i, j ∈ I, existe k ∈ I tal que i ≤ k e j ≤ k. Suponhamos que I seja direcionado. Uma famı́lia inversa direcionada de grupos é uma famı́lia de grupos {Gi }i∈I e para cada par i ≤ j um homomorfismo Q fji : Gj → Gi tal que se k ≤ i ≤ j, então fjk = fji ◦ fik e fii = id. Seja G := i Gi com a operação compenente a componente. Seja Γ o subconjunto de G formado 177 178 26. TEORIA DE GALOIS INFINITA pelos elementos (xi ) tais que xi ∈ Gi satisfazendo a para todo j ≥ i, fji (xj ) = xi . Então Γ contém o elemento neutro e é um subgrupo de G dito o limite inverso da famı́lia e denotado por Γ = limi Gi . ←− Exemplo 26.4. Seja G um grupo e F o conjunto de subgrupos normais em G de ı́ndice finito. Se H, K ∈ F, então H ∩ K ∈ F, assim F é uma famı́lia direcionada (com respeito à inclusão). Consideramos o limite inverso limH∈F G/H. ←− Este subgrupo de G é o que se chama um grupo profinito (no sentido de ser limite de grupos finitos). Uma variante desta construção consiste em nos restringirmos à famı́lia Fp de subgrupos normais H de G cujo ı́ndice é uma potência de p. Podemos similarmente tomar o limite inverso limH∈F G/H, este grupo é chamado um grupo ←− p pro-p profinito. Exemplo 26.5. Logo em seguida consideraremos o contexto natural onde grupos profinitos aparecem, na teoria de Galois infinita. Seja k um corpo e A uma extensão infinita de k. Por exemplo, k = Q e A = Q. Seja G := Aut(A/k) o grupo de k-automorfismos de A. O limite inverso limH∈F G/H coincide na verdade com ←− G (vamos mostrar isto em seção posterior). Além disto os grupos quocientes G/H são na verdade grupos de automorfismos de extensões finitas K/k contidas em A. Analogamente, se X for uma superfı́cie compacta de Riemann de gênero g ≥ 2 e p : X 0 → X for a aplicação de recobrimento universal, F := C(X), F 0 := C(X 0 ) seus corpos de funções. Exites uma injeção natural π1 (X)top ,→ Aut(F 0 /F ) do grupo fundamental topológico de X (que é um grupo em 2g geradores com uma relação) e Gal(F 0 /F ) é o grupo profinito definido como limite projetivo com relação a subgrupos de ı́ndice finito de AutX (X 0 ). Chamamos a Aut(F 0 /F ) de grupo fundamental algébrico de X, que coincide com o completamento profinito de π1top (X) (ver seção seguinte). Grothendieck definiu isto de maneira geral para curvas sobre um corpo qualquer. Isto permitiu transpor a noção tradicional de grupo fundamental na topologia algébrica para a geometria algébrica. Permanece um grande mistério a estrutura dos grupos fundamentais algébricos de curvas, embora por exemplo conheça-se bem todos os quocientes finitos deste grupo, no caso de curvas afins (isto nada mais é que uma conjectura de Abhyankar, provada por M. Raynaud e D. Harbater nos anos 90, que diz que para que um grupo seja quociente é necessário e suficiente que seu maior quociente primo com p o seja). 26.2. Completamento de um grupo Seja G um grupo e suponhamos que {Hr } seja uma famı́lia de subgrupos normais de ı́ndice finito tais que Hr ⊂ Hr+1 para todo n. Uma seqüência de elementos {xn } em G é dita uma seqüência de Cauchy, se dado Hr existe N ≥ 1 tal que para quaiquer n, m ≥ N tenhamos xn x−1 m ∈ Hr . Dizemos que a seqüência {xn } é a seqüência nula se para todo Hr existir um N ≥ 1 tal que para todo n ≥ N tenhamos xn ∈ Hr . Fica como exercı́cio provar que o conjunto C de seqüências de Cauchy com operação termo a termo é um grupo e que as seqüências nulas N formam um sugrupo normal. O grupo quociente C/N é chamado o completamento de G com respeito às seqüências nulas e denotado por Ĝ. Observe que existe um homomorfismo natural T G → Ĝ dado por x 7→ (x, x, x, · · · ) mod N . O núcleo deste homomorfismo é igual a r Hr . Quando este núcleo é trivial temos uma injeção. 26.3. TEORIA DE GALOIS INFINITA 179 G/Hr . Teorema 26.6. Existe um isomorfismo de grupos Ĝ ∼ = lim ←−r Demonstração. Seja x = {xn } uma seqüência de Cauchy em G. Para todo n suficientemente grande a classe de xn mod Hr independe de n, denotamos esta classe por x(r). Assim, (x(1), x(2), · · · ) ∈ limr G/Hr . ←− Reciprocamente, todo elemento (x1 , x2 , · · · ) ∈ limn G/Hn , com xn ∈ G/Hn e ←− xn um representante de xn em G. A seqüência {xn } é uma seqüência de Cauchy, que fica como exercı́cio provar que está bem definida, a menos de seqüências nulas. Também fica como exercı́cio mostrar que a correspondência acima nos dá a bijeção requerida (que por construção é um homomorfismo). Podemos fazer a construção acima mais geralmente da seguinte forma. Seja F uma famı́lia, uma seqüência de Cauchy é uma famı́lia {xj }j∈J indexada por um conjunto arbitrário J tal que para cada H ∈ F existe j ∈ J tal que para k, k 0 ≥ j temos xk x−1 k0 ∈ H. Na prática trabalhamos realmente com seqüências, pois os grupos profinitos considerados na maior parte dos casos que trataremos têm uma base enumerável de abertos. Por exemplo, isto ocorre quando G é finitamente gerado. Mais geralmente, uma famı́lia {Hi } de subgrupos normais contida em F é dita cofinal em F se dado H ∈ F existir i tal que Hi ⊂ H. Suponhamos que exista uma famı́lia {Hi } cujos ı́ndices percorram um conjunto enumerável. Fica como exercı́cio G/H. mostrar que limi G/Hi ∼ = lim ←−H∈F ←− 26.3. Teoria de Galois infinita Estenderemos agora a teoria de Galois para extensões infinitas. Uma extensão algébrica infinita K/k é dita galoisiana, se for normal e separável (lembre que para definir normalidade e separabilidade precisamos apenas que a extensão K/k seja algébrica). Para toda subextensão finita F/k de K/k tal que F/k seja galoisiana, temos que # Gal(F/k) = [F : k]. Pela teoria geral K/F é galosiana (a separabilidade é clara, a normalidade, segue do fato que para qualquer α ∈ K temos Pα|K | Pα|k ). Seja H := Gal(K/F ) := Aut(K/F ). Então H tem ı́ndice finito em G := Gal(K/k). De fato, consideremos o homomorfismo sobrejetivo (pela normalidade) de restrição G → Gal(F/k) dado por σ 7→ σ|F . O núcleo deste homomorfismo é exatamente H, logo, pelo teorema dos homomorfismos, G/H ∼ = Gal(F/k), a fortiori, H tem ı́ndice finito em G. Pelas propriedades anteriores de limite projetivo, isto permite definir um homomorfismo de grupos G → limH∈F G/H, onde ←− F := {Gal(F/k) | F é uma extensão galoisiana finita de k}. Teorema 26.7. O homomorfismo G → limH∈F G/H é um isomorfismo de ←− grupos. Demonstração. Observemos inicialmente que o núcleo é trivial. De fato se σ pertence ao núcleo, então para toda extensão galoisina finita F/k contida em K temos que σ|F = 1. Mas como todo α ∈ K pertence a alguma extensão galoisiana finita F/k concluimos que σ = 1. Para ver a sobrejetividade, observe que um elemento (σH ) de limH G/H satisfaz ←− a compatibilidade σH 7→ σH 0 para H 0 ⊃ H. Isto nos permite definir σ ∈ G globalmente da seguinte forma. Seja α ∈ K, como observado, existe F/k galoisiana finita contida em K tal que α ∈ F . Seja H := Gal(K/F ) e σ(α) := σH (α). Observe que a condição de compatibilidade acima afirma justamente que σ(α) não 180 26. TEORIA DE GALOIS INFINITA depende da escolha de F . Portanto, isto define um elemento σ ∈ G. Além disto, por construção σ 7→ (σH ). Exemplo 26.8. Seja p um número primo e para todo inteiro n ≥ 1 consideremos Kn := Q(µpn ) o pn -ésimo corpo ciclotômico. Seja K := Q(µp∞ ). A extensão K/Q é abeliana infinita. Como para todo n ≥ 1 temos que Gal(Kn /Q) ∼ = (Z/pn Z)∗ concluimos que temos um isomorfismo de grupos Z∗p → Gal(K/Q). Este tipo de extensão cicltômica foi estudada por K. Iwasawa e está associada a funções L analı́ticas na topologia p-ádica. Exemplo 26.9. Similarmente, dada uma curva elı́tica E sobre Q consideramos a extensão ciclotômica Q(E[pn ]) gerada pelas coordenadas dos pontos de pn -torção de E, lembre que E[pn ] ∼ = (Z/pn Z)2 . Observe também que o grupo de Galois absoluto GQ := Gal(Q/Q) de Q age em E[pn ], para todo n, assim temos uma representação de GQ dada por ρn : GQ → GL(E[pn ]) ∼ = GL2 (Z/pn Z) e pelas construções anteoriores podemos tomar o limite projetivo destas representações, obtendo assim a representação p-ádica GQ → GL2 (Zp ). Na verdade o estudo destas representações remonta a trabalhos de Serre, Shimura e Lang-Trotter eQ um teorema profundo de Serre afirma que a representação galoisiana ρ : GQ → p GL2 (Zp ) tem imagem aberta, se E não tem multiplicação complexa, i.e., a imagem de GQ é um subgrupo de ı́ndice finito em GL2 (Zp ) para todo p sendo igual a GL2 (Zp ) para quase todo p. O mesmo tipo de problemática pode ser encontrado no caso de variedades abelianas, mas a extensão do teorema de Serre depende de um conjectura sobre o grupo de Mumford-Tate da variedade abeliana. Pode-se considerar também extensões ciclotômicas de extensões ciclotômicas. Isto é o conteúdo da seguinte conjectura devida a S̆afarevic̆. Conjectura 26.10. Seja k0 := Q(µ∞ ) o compositum de todas as extensões ciclotômicas de Q em Q. Seja k/k0 uma extensão finita e Gk := Gal(Q/k). Então Gk é isomorfo ao completamento de um grupo profinito livro em um número enumerável de geradores. É possı́vel formular um análogo desta conjectura para curvas elı́ticas substituindo Q(µ) por Q(E(Q)tor ). CAPı́TULO 27 Teoria de transcendência 27.1. Bases de trasncendência 27.2. Transcendência de e 27.3. Transcendência de π 27.4. Elementos de teoria de transcencência 181 Bibliografia - Livros [Ap] [Ar] [Co] [En] [GaLe] [Go] [Goss] [Ha] [IrRo] T. M. Apostol, Introduction to Analytic Number Theroy. M. Artin, Algebra. S. Collier Coutinho, Números Inteiros e Criptografia, SBM. O. Endler, Teoria de Corpos, IMPA. A. Garcia, Y. Lequain, Elementos de Álgebra, Projeto Euclides, IMPA. D. Gorenstein, Finite Groups D. Goss, The Basic Structures of the Arithmetic of Functions Fields J. Harris, Algebraic Geometry, Springer-Verlag. K. Ireland, M. Rosen, A Modern Introduction to Classical Number Theory, SpringerVerlag. [Kob] N. Koblitz, p-adic analysis. [La] S. Lang, Algebra, Springer-Verlag. [LaDio] S. Lang, Fundamentals of Diophantine Geometry [Li] E. L. Lima, Curso de Análise, vol. 1, Projeto Euclides, IMPA. [Lins] A. Lins Neto, Funções de uma variável complexa, projeto Euclides. [Lo] D. Lorenzini, An Invitation to Arithmetic Geometry, Graduate Studies in Mathematics, AMS, vol 9, 1996. [Mi] J. S. Milne, Étale Cohomology [Ne] J. Neukirch, Algebraic Number Theory [Ser] J.-P. Serre, Topics in Galois Theory [SerMW] J.-P. Serre, Lectures on the Mordell-Weil theorem [Sh] D. Shanks, Solved and Unsolved Problems in the Theory of Numbers [Si] W. Sierpinski, A Selection of Problems in the Theory of Numbers [Sil] J. Silverman, The Arithmetic of Elliptic Curves, GTM, Springer. [Sp] M. Spivak, Calculus. [vWa] van der Waerden, Algebra. 183 Bibliografia - Artigos [Le1] [Le2] [Ma] [We1] [We2] H. Lenstra H. Lenstra B. Mazur, Modular curves and the Eisenstein ideal, Pub. IHES, 1969. P. Deligne, Conjectures de Weil I, Pub. Math. IHES 43 (1974), 273-307. P. Deligne, Conjectures de Weil II, Pub. Math. IHES 52 (1981), 313-428. 185 Índice Remissivo K-automorfismos, 144 K-conjugados, 129 K-homomorfismos, 136 K-isomorfismo, 129 Z/nZ, 3 π(x), 27 ordp (n), 1 ϕα , 123 n-ésima extensão ciclotômica, 155 n-ésimo corpo ciclotômico, 155 polinômio ciclotômico, 157 p-divisı́vel, 177 p-grupo, 76 p-subgrupo de Sylow, 75 de corpos, 152 comprimento de série, 79 conúcleo de homomorfismo, 87 conexão de Galois, 149 congruência linear, 39 módulo ideais, 111 conjunto de relações, 87 de geradores, 87 dos p-subgrupos de Sylow, 76 dos conjugados, 74 indutivo, 3 conteúdo de polinômio, 107 corpo algebricamente fechado, 127 de decomposição, 143 de frações de um domı́nio, 106 de números, 157 finito, 137 perfeito, 134 correspondência de Galois, 150 critério de Eisenstein, 100 critérios de divisibilidade, 37 curva elı́tica, 90 algarismos, 37 algoritmo de Euclides, 7 anel, 9 comutativo com unidade, 10 de inteiros, 32 noetheriano, 88 quociente, 32 automorfismo de anéis, 112 de grupo, 64 interno, 64 axioma da boa ordenação, 1 cancelamento, 7 caracterı́stica p, 133 0, 133 centro de um grupo, 60 classe de equivalência, 2 lateral a direita, 54 lateral a esquerda, 54 compositum discriminante de polinômio, 172 divisı́vel, 7 domı́nio de integridade, 10 euclideano, 101 fatorial, 106 principal, 10 elemento 187 188 algébrico, 123 inseparável, 135 inversı́vel, 36 maximal, 3 neutro, 49 primitivo, 136 puramente inseparável, 139 separável, 134 transcendente, 123 elementos inversı́veis, 104 endomorfismo de anéis, 112 de grupo, 64 equação das classes de conjugação, 74 diofantina, 39 expoente de grupo abeliano, 56 de polinômio, 139 extensão abeliana, 159 algébrica, 124 cı́clica, 159 de Artin-Schreier, 162 de corpos, 119 de Kummer, 159 finita, 119 finitamente gerada, 125 galoisiana, 145, 150 normal, 143 separável, 134 simples, 136 solúvel, 165 solúvel por radicais, 166 transcendente, 124 fecho algébrico de K em Ω, 128 algébrico de K em L, 127 normal, 144 puramente inseparável, 140 separável, 136 funções aritméticas elementares, 15 função φ de Euler, 16 sobrejetiva, 1 de Mœbius, 15 injetiva, 1 zeta de Riemann, 30 funções simétricas elementares, 122 grau da extensão, 119 de inseparabilidade, 140 de monômio, 172 de polinômio, 93 ÍNDICE REMISSIVO de separabilidade, 140 grupo, 49 abeliano, 49 abeliano de torção, 85 cı́clico, 56 das raı́zes n-ésimas da unidade, 53 das raı́zes n-ésimas da unidade, 155 de Galois, 154 finito, 49 infinito, 49 linear, 49 metacı́clico, 68 profinito, 178 quociente, 60 simples, 79 solúvel, 81 hipótese de Riemann, 31 homomorfimso de grupos, 61 homomorfismo de anéis, 106, 112 de módulos, 86 ideais coprimos, 110 ideal, 9 maximal, 97, 111 primo, 112 principal, 10 soma, 110 imagem de homomorfismo, 112 indı́ce de um subgrupo, 54 indução finita, 19 inteiro em uma dada base, 37 livre de f -potência, 14 livre de quadrados, 13 inteiros gaussianos, 101 inverso, 49 isomorfismo de anéis, 112 de grupos, 62 lema chave, 55 da duplicação, 126 de Gauss, 99 de Krull, 3 de Zorn, 3 limite inverso, 177 superior, 3 máximo ÍNDICE REMISSIVO divisor comum, 8 máximo divisor comum de polinômios, 95 módulo finitamente gerado, 85 livre, 85 quociente, 85 sobre anel, 85 matriz de presentação, 87 matrizes, 49 monóide, 64 monômio, 172 multiplicação de Dirichlet, 15 multiplicidade de raiz, 133 núcleo de homomorfismo, 61, 112 número binomial, 1 composto, 11 de Fermat, 27 de Carmichael, 44 de divisores, 15 de Fermat, 23 de Mersenne, 27 primo, 11 números p-ádicos, 130 norma de elemento, 121 normalizador de um subgrupo, 75 ordem p-ádica, 1 de elemento, 55 de grupo, 49 parcial, 3 total, 3 parte inteira, 1 pequeno teorema de Fermat, 20 permutação de conjunto, 73 polinômio, 93 caracterı́stico, 120 inversı́vel, 94 irredutı́vel, 97 mı́nimo, 123 mônico, 95 primitivo, 107 puramente inseparável, 139 separável, 134 simétrico, 171 posto da curva elı́tica, 90 de um módulo, 85 primos em progressões aritméticas, 24 princı́pio da indução finita, 19 produto de ideais, 113 direto de grupos, 64 notável, 1 semi-direto de grupos, 66 pseudoprimo em uma dada base, 44 raı́zes n-ésimas da unidade, 53 primitivas n-ésimas da unidade, 55 raı́zes primitivas n-ésimas da unidade, 155 raiz de polinômio, 121 múltipla, 133 simples, 133 refinamento de série subnormal, 79 próprio, 79 relação binária, 2 de equivalência, 2 representação de grupo, 73 por conjugação, 73 por translação, 73 resto quadrático, 116 resultante de polinômios, 109 série de composição, 79 subnormal, 79 séries equivalentes, 79 sı́mbolo de Legendre, 116 separavelmente fechado, 140 sistema de congruências, 40 soma de divisores, 15 progressão geométrica, 1 subgrupo, 52 caracterı́stico, 64 dos comutadores, 60 gerado por subconjunto, 56 normal, 59 submódulo, 85 189 190 ÍNDICE REMISSIVO teorema 90 de Hilbert, 160 chinês dos restos, 41, 114 de inversão de Mœbius, 16 de Abel, 159 de Artin, 150 de Artin para homomorfismos, 160 de Cayley, 73 de Dedekind, 160 de Euclides, 20 de Korselt, 45 de Lagrange, 55 de Mazur, 90 de Mordell, 90 do isomorfismo de grupos, 62 fundamental da Álgebra, 128 fundamental da teoria de Galois, 150 teoremas de Sylow, 75 traço de elemento, 121 transitividade, 7 valor absoluto, 1