Álgebra
Amı́lcar Pacheco
Universidade Federal do Rio de Janeiro (Universidade do Brasil),
Departamento de Matemática Pura
E-mail address: [email protected]
Sumário
Capı́tulo 1. Preliminares
1.1. Relação de equivalência
1.2. Lema de Zorn e aplicações
1
2
3
Parte 1.
5
Números Inteiros
Capı́tulo 2. Algoritmos Euclideanos
2.1. O algoritmo euclideano para números inteiros
2.2. Máximo divisor comum
2.3. Anéis e ideais
7
7
8
9
Capı́tulo 3. Fatoração de inteiros
3.1. Existência
3.2. Unicidade
3.3. MDC e fatoração
3.4. Aplicações
3.5. Funções aritméticas elementares
11
11
11
12
13
15
Capı́tulo 4. Indução finita
4.1. Enunciados
4.2. Exemplos da indução na sua primeira forma
4.3. Exemplos da indução finita na sua segunda forma
19
19
19
20
Capı́tulo 5. Números primos
5.1. Infinidade de primos
5.2. Primos em progressões aritméticas
5.3. Infinidade de compostos por funções polinomiais
5.4. Números de Fermat e Mersenne
5.5. Contando números primos
5.6. Função zeta
23
23
24
26
27
27
30
Capı́tulo 6. Aritmética modular
6.1. Aritmética modular
6.2. Critérios de divisibilidade
6.3. Contando elementos inversı́veis
35
35
37
38
Capı́tulo 7. Sistemas de congruência
7.1. Equações diofantinas
7.2. Equações lineares
7.3. Sistemas de equações lineares
7.4. Teorema Chinês dos Restos
39
39
39
40
41
iii
iv
SUMÁRIO
7.5. Aplicação
41
Capı́tulo 8. Aplicações da teoria de grupos à teoria elementar dos números
8.1. Primalidade de números de Mersenne
8.2. Primalidade de números de Fermat
8.3. Números de Carmichael
8.4. Teorema da raiz primitiva
43
43
43
44
45
Parte 2.
47
Grupos
Capı́tulo 9. Teoria de Grupos I
9.1. Definição e exemplos
9.2. Subgrupos
9.3. Classes Laterais e Teorema de Lagrange
9.4. Ordem de elemento e expoente de grupo abeliano
49
49
52
54
55
Capı́tulo
10.1.
10.2.
10.3.
10.4.
10.5.
10. Teoria de grupos II
Subgrupos normais e grupos quocientes
Homomorfismo de grupos
Produtos de grupos
Grupos metacı́clicos
Classificação de grupos de ordem ≤ 11
59
59
61
64
68
70
Capı́tulo
11.1.
11.2.
11.3.
11. Teoremas de Sylow
Represesentações de grupos
Os teoremas de Sylow
Exemplos
73
73
75
77
Capı́tulo 12. Grupos solúveis
12.1. Teorema de Jordan-Hölder
12.2. Grupos solúveis
79
79
81
Capı́tulo
13.1.
13.2.
13.3.
13.4.
85
85
86
87
89
Parte 3.
13. Grupos abelianos finitamente gerados
Módulos sobre anéis
Diagonalização de matrizes
Geradores e relações para módulos
O teorema de estrutura
Anéis
Capı́tulo
14.1.
14.2.
14.3.
14. Anéis de polinômios
Algoritmo da divisão
Máximo divisor comum de polinômios
Fatoração única de polinômios
Capı́tulo
15.1.
15.2.
15.3.
15.4.
15.5.
15. Anéis e domı́nios
Domı́nios euclideanos
Domı́nios fatoriais
Fatores múltiplos e resultante
Anéis quocientes e teorema chinês dos restos
Aplicações
91
93
93
95
97
101
101
106
108
110
115
SUMÁRIO
Parte 4.
Corpos
Capı́tulo 16.
Capı́tulo
17.1.
17.2.
17.3.
17.4.
Extensões finitas
17. Extensões algébricas
Elementos algébricos e transcendentes
Extensões algébricas
Adjunção de raı́zes
Fechos algébricos
v
117
119
123
123
124
126
127
Capı́tulo 18. Extensões separáveis
18.1. Corpos Finitos
133
137
Capı́tulo 19.
139
Extensões puramente inseparáveis
Capı́tulo 20. Corpos de decomposição e extensões normais
20.1. Exemplos
143
146
Capı́tulo
21.1.
21.2.
21.3.
149
149
152
153
21. Teoria de Galois
Correspondência de Galois
Extensões e subgrupos normais
Coeficientes e raı́zes
Capı́tulo 22.
Extensões ciclotômicas
155
Capı́tulo 23.
Extensões cı́clicas
159
Capı́tulo 24.
Solubilidade por radicais
165
Parte 5.
Tópicos adicionais
169
Capı́tulo
25.1.
25.2.
25.3.
25. O problema inverso de Galois
Grupo Sn
Grupo An
Método geral
171
171
175
175
Capı́tulo
26.1.
26.2.
26.3.
26. Teoria de Galois infinita
Limite inverso
Completamento de um grupo
Teoria de Galois infinita
177
177
178
179
Capı́tulo
27.1.
27.2.
27.3.
27.4.
27. Teoria de transcendência
Bases de trasncendência
Transcendência de e
Transcendência de π
Elementos de teoria de transcencência
181
181
181
181
181
Bibliografia - Livros
183
Bibliografia - Artigos
185
Índice Remissivo
187
CAPı́TULO 1
Preliminares
Ao longo deste livro dentoraremos por N o conjunto dos números naturais, Z o
conjunto dos números inteiros, Q o conjunto dos números racionais, R o conjunto
dos números reais e C o conjunto dos números complexos. Para todo x ∈ C
denotamos por
√ |x| seu valor absoluto usual, i.e., se x = a + bi com a, b ∈ R,
então |x| := a2 + b2 . Para todo x ∈ R denotamos seu valor absoluto usual por
|x| := x, se x ≥ 0, e |x| := −x, se x < 0.
Sejam S e T conjuntos. Uma função f : S → T é dita injetiva toda vez que
x 6= y implicar f (x) 6= f (y). Isto também equivale a dizer que se f (x) = f (y),
então x = y. A função f é dita sobrejetiva, se f (S) = T .
Lema 1.1. Sejam S 0 e R conjuntos. Então existe um conjunto S10 e bijeção
ϕ0 : S 0 → S10 tal que S10 ∩ R = ∅.
Axioma 1.2 (axioma da boa ordenação). Todo subconjunto não vazio de N
possui um menor elemento.
Seja n ≥ 1 inteiro. Sejam x, y variáveis. Considere o produto notável
xn − y n = (x − y)(xn−1 + xn−2 y + . . . + xy n−2 + y n−1 .
Podemos obter dele a soma de n termos de uma progressão geométrica de razão q.
n−1
Digamos que os termos sejam a, aq, · · · , aq . Assim,
a + aq + . . . + aq n−1 = a
qn − 1
.
q−1
Basta na fórmula anterior tomar x = q e y = 1.
Para inteiros 1 ≤ m ≤ n definimos o número binomial
n
n!
:=
,
m
m!(n − m)!
onde n! := n(n − 1) . . . 1.
Lembre-se [Sp, p. 632] das seguintes expansões em séries
1
= 1 + x2 + x3 + . . . + xn + . . . ;
1−x
x2
x3
xn
log(1 − x) = x +
+
+ ... +
+ ... .
2!
3!
n!
Dado um número real x denotamos por dxe a parte inteira de x, ou seja, o
maior número inteiro menor ou igual a x.
Para todo inteiro n ≥ 1 e número primo p, a ordem p-ádica ordp (n) de n é
definida por pordp (n) é a potência exata de p que divide n.
1
2
1. PRELIMINARES
1.1. Relação de equivalência
Seja X um conjunto. Uma relação binária R é um subconjunto de X × X.
Dado um par (a, b) ∈ R dizemos que a é relacionado a b e denotamos por aRb. Por
exemplo, podemos tomar como X o conjunto de retas do plano e como R a relação
de ortogonalidade.
Uma relação de equivalência em um conjunto X é uma relação binária ∼ satisfazendo às seguintes condições:
(1) x ∼ x (reflexividade).
(2) Se x ∼ y, então y ∼ x (simetria).
(3) Se x ∼ y e y ∼ z, então x ∼ z (transitividade).
Exemplo 1.3. Seja X = Z e ∼ a relação ≡ (mod n) definida por: dados
a, b ∈ Z, a ≡ b (mod n) se e somente se n | (a − b), i.e., existe k ∈ Z tal que
a − b = kn. Isto define uma relação de equivalência. De fato,
(1) a − a = 0 = 0.n.
(2) Se a ≡ b (mod n), então existe k ∈ Z tal que a−b = kn, logo b−a = (−k)n
e b ≡ a (mod n).
(3) Se a ≡ b (mod n) e b ≡ c (mod n), então existem k, l ∈ Z tais que a − b =
kn e b − c = ln. Somando estas duas igualdades obtemos a − c = (k + l)n,
logo a ≡ c (mod n).
Exemplo 1.4. Seja X = Z × Z − {0}. Definimos dois pares (a, b), (c, d) ∈ X
como equivalentes, denotando (a, b) ∼ (c, d) se e somente se ad = bc. Isto define
uma relação de equivalência. De fato,
(1) ab = ba, logo (a, b) ∼ (a, b).
(2) Suponha que (a, b) ∼ (c, d), i.e., ad = bc. Logo cb = da, i.e., (c, d) ∼ (a, b).
(3) Suponha que (a, b) ∼ (c, d) e (c, d) ∼ (e, f ), i.e., ad = bc e cf = de. Logo
bcf
bde
af = bc
d f = d = d = be, i.e., (a, b) ∼ (e, f ).
Seja X um conjunto e ∼ uma relação de equivalência em X. Definimos a classe
[a] de um elemento a ∈ X por [a] = {b ∈ X | b ∼ a}. Note que [a] é um conjunto.
Lema 1.5. Seja X um conjunto e ∼ uma relação de equivalência em X. Dados
a, b ∈ X, temos que a ∼ b se e somente se [a] = [b].
Demonstração. Suponha que [a] = [b]. Observe que a ∈ [a], pois a ∼ a.
Logo a ∈ [b], i.e., b ∼ a, portanto a ∼ b.
Reciprocamente, suponha a ∼ b e c ∈ [a], i.e., c ∼ a. Por transitividade, c ∼ b,
i.e., c ∈ [b]. Suponha d ∈ [b], i.e., d ∼ b. Por simetria, b ∼ a, por transitividade,
d ∼ a, i.e., d ∈ [a].
Corolário 1.6. Seja X um conjunto e ∼ um relação de equivalência em X.
Então a b se e somente se [a] ∩ [b] = ∅.
Demonstração. Note que se a ∼ b, então [a] ∩ [b] = [a] = [b] 6= ∅. Por outro
lado, se existisse c ∈ [a] ∩ [b], então c ∼ a e c ∼ b. Por simetria, a ∼ c e por
transitividade a ∼ b, o que é uma contradição.
Corolário 1.7. Seja X um conjunto e e ∼ um relação de equivalência em X.
·
·
S
S
Então X = a [a], onde a [a] denota a união disjunta das classes de equivalência
em X.
1.2. LEMA DE ZORN E APLICAÇÕES
3
Demonstração. Observe que o lado direito está claramente contido no lado
esquerdo. Reciprocamente, pelo corolário anterior dado x ∈ X existe uma única
classe de equivalência [a] tal que x ∈ [a].
Seja X um conjunto e e ∼ um relação de equivalência em X. Definimos X :=
X/ ∼:= {[a] | a ∈ X} como o conjunto das classes de equivalência de ∼ em X. No
caso particular em que X = Z e ∼ é ≡ (mod n), denotamos a classe [a] de a ∈ Z
por a. Neste caso, X é denotado por Z/nZ.
1.2. Lema de Zorn e aplicações
Definição 1.8. Um conjunto M é dito parcialmente ordenado, se existe uma
relação ≤ em M satisfazendo às seguintes condições
(1) (reflexividade) a ≤ a, para todo a ∈ M.
(2) (Transitividade) Dados a, b, c ∈ M, se a ≤ b e b ≤ c, então a ≤ c.
(3) (Anti-simetria) Dados a, b ∈ M, se a ≤ b e b ≤ a, então a = b.
Esta ordem será dita total, se para quaisquer a, b ∈ M temos a ≤ b ou b ≤ a. Neste
caso dizemos que M é um conjunto totalmente ordenado.
Definição 1.9. Seja M um conjunto parcialmente ordenado. Um elemento
m ∈ M é dito um elemento maximal de M, se dado a ∈ M tal que a ≤ m, então
a = m. Um elemento c ∈ M é dito um limite superior para M, se para todo
a ∈ M temos a ≤ c. O conjunto M é dito indutivo, se todo subconjunto totalmente
ordenado L ⊂ M possui limite superior. Neste caso, M 6= ∅.
Lema 1.10 (lema de Zorn). (ver [vWa, §69]) Todo conjunto parcialmente ordenado indutivo possui elemento máximo.
Lema 1.11 (lema de Krull). Seja R um anel comutativo com unidade. Todo
ideal não nulo a de R está contido em algum ideal maximal m de R.
Demonstração. Considere o conjunto N de todos os ideais b ( R contendo
a. É imediato que este conjunto é parcialmente ordenado com respeito à relação de
inclusão de conjuntos. Seja L ⊂ N um subconjunto totalmente ordenado e
[
C :=
b.
b∈L
Segue de um exercı́cio do capı́ulo de domı́nios euclideanos que C é um ideal de R.
Além disto, este ideal é próprio, do contrário, existiria b ∈ L tal que 1 ∈ b, o que
contradiria b ( R. Por construção, o ideal C é um limite superior para L. Em
particular, pelo lema de Zorn, existe m elemento máximo de N. Novamente por
construação m é maximal e contém a.
Parte 1
Números Inteiros
CAPı́TULO 2
Algoritmos Euclideanos
O objetivo deste capı́tulo é descrever o algoritmo euclideano que permite dividir um número inteiro por outro, definir a noção de máximo divisor comum de
números inteiros e provar o algoritmo euclideano estendido que dá uma relação de
dependência linear entre o máximo divisor comum e os números inteiros através da
noção de ideais.
2.1. O algoritmo euclideano para números inteiros
Definição 2.1. Sejam a, b ∈ Z. Dizemos que a divide b ou que b é divisı́vel
por a e denotamos a | b se existe c ∈ Z tal que ac = b.
Proposição 2.2. A divisibilidade satisfaz as seguintes propriedades:
(1) (Cancelamento). Se c 6= 0 e ac | bc, então a | b.
(2) (Transitividade). Se a | b e b | c, então a | c.
Demonstração. (1) Existe α ∈ Z tal que αac = bc, i.e., c(b − αa) = 0. Mas
o produto de dois inteiros é igual a zero implica em que um dos inteiros é nulo.
Observe que c 6= 0, assim b = ac, i.e., a | b.
(2) Existem α, β ∈ Z tais que b = αa e c = βb, substituindo a primeira
igualdade na segunda, obtemos c = βαa, i.e., a | c.
Teorema 2.3 (algoritmo de Euclides). Sejam a, b ∈ Z com b 6= 0. Então
existem q, r ∈ Z tais que
a = bq + r, onde 0 ≤ |r| < |b|.
Se a, b ≥ 0, então q e r são unicamente determinados por a e b.
Demonstração. Suponha inicialmente que a, b ≥ 0. Se a < b tome q = 0 e
r = a. Suponha que a ≥ b. Considere o conjunto S := {k ≥ 1 inteiro | kb > a}. Este
conjunto é um subconjunto não vazio de N. Assim, pelo axioma da boa ordenação
(axioma 1.2) existe q + 1 ∈ S tal que q + 1 ≤ x para todo x ∈ S. Logo q ∈
/ S, i.e.,
a ≥ bq. Seja r := a − bq, portanto 0 ≤ r < (q + 1)b − b = b.
• Se a < 0 e b > 0, divida a0 := −a por b com quociente q 0 e resto r0 e tome
q := −q 0 e r := −r0 .
• Se a < 0 e b < 0, divida a0 := −a por b0 := −b com quociente q 0 e resto r0
e tome q := q 0 e r := −r0 .
• Se a > 0 e b < 0, divida a por b0 := −b com quociente q 0 e resto r0 e tome
q := −q e r := r0 .
Para provar a unicidade suponha que
a = bq1 + r1 = bq2 + r2 ,
7
onde
0 ≤ r1 , r2 < b.
8
2. ALGORITMOS EUCLIDEANOS
Basta provar que r1 = r2 , pois neste caso bq1 = bq2 e como b 6= 0, pela propriedade
do cancelamento, q1 = q2 . Suponha r1 < r2 . Neste caso,
r2 − r1 = b(q1 − q2 ) ≥ b,
mas
r2 − r1 ≤ r2 < b.
Similarmente, não podemos ter r1 > r2 .
2.2. Máximo divisor comum
Definição 2.4. Sejam a, b ∈ Z. Dizemos que d ∈ Z é um máximo divisor
comum de a e b, denotado por mdc(a, b) se
(1) d | a e d | b; (por isto d é dito um divisor comum de a e b.)
(2) Para todo d0 ∈ Z tal que d0 | a e d0 | b, d0 | d.
Observação 2.5.
• A noção de mdc está bem definida a menos de
sinal. De fato se e for um outro mdc de a e b, então por (2) e | d e d | e,
ou seja existem α, β ∈ Z tais que d = αe = αβd, portanto αβ = 1, i.e.,
α ∈ {±1}. Assim quando dizemos o mdc de a e b referimo-nos à escolha
de d positiva.
• mdc(a, b) = mdc(−a, −b) (exercı́cio).
• Se b | a, então mdc(a, b) = b (idem).
• Denote por Da,b o conjunto dos divisores comuns positivos de a e b. Note
que para qualquer x ∈ Da,b temos que x ≤ min{a, b}. Assim, este conjunto é finito. Fica novamente como exercı́cio verificar que mdc(a, b) é
justamente o elemento máximo de Da,b .
Lema 2.6. Sejam a, b ≥ 1 inteiros e a = bq + r onde 0 ≤ r < b a divisão de a
por b. Então mdc(a, b) = mdc(b, r).
Demonstração. Basta mostrar que os conjuntos Da,b e Db,r são coincidem.
De fato, neste caso seus elementos máximos são iguais, o que prova o lema. Seja
e ∈ Da,b , digamos a = eα e b = eβ para α, β ∈ Z. Logo r = a − bq = e(α − βq),
i.e., e | r, i.e., e ∈ Db,r , i.e., Da,b ⊂ Db,r . Seja f ∈ Db,r , digamos b = f β 0 e r = f γ
para β 0 , γ ∈ Z. Então a = bq + r = f (β 0 q + γ), i.e., f | a, i.e., f ∈ Da,b , i.e.,
Db,r ⊂ Da,b .
Teorema 2.7. Sejam a, b ≥ 1 inteiros. Consideremos a seqüência de divisões
sucessivas:
a = bq1 + r1 , 0 < r1 < b
b = r1 q2 + r2 , 0 < r2 < r1
(2.1)
..
.
..
.
rn−2 = rn−1 qn + rn , 0 < rn < rn−1
rn−1 = rn qn+1 ,
onde rn é o último resto não nulo na seqüência de divisões. Então mdc(a, b) = rn .
Demonstração. Notemos inicialmente que em (2.1) terı́amos que ter um
primeiro resto nulo, rn+1 , pois
b > r1 > r2 > · · · ≥ 1
e não existe uma seqüência estritamente descendente infinita de números inteiros
positivos.
2.3. ANÉIS E IDEAIS
9
Pelo lema anterior aplicado a cada linha de (2.1) obtemos
mdc(a, b) = mdc(b, r1 ) = · · · = mdc(rn−1 , rn ).
Mas rn | rn−1 , logo rn = mdc(rn , rn−1 ). A fortiori, rn = mdc(a, b).
Teorema 2.8 (algoritmo euclideano estendido). Sejam a, b ≥ 1 inteiros e d =
mdc(a, b). Existem s, t ∈ Z tais que d = sa + tb.
Demonstração. Começamos com a penúltima linha de (2.1),
rn = rn−2 + (−qn )rn−1 ,
tome A1 := −rn−1 e B1 := 1. Da linha seguinte temos
rn−1 = rn−3 + (−qn−1 )rn−2 ,
assim
rn = B1 rn−2 + A1 rn−1 = B1 rn−2 + A1 (rn−3 + (−qn−1 )rn−2 ).
Tome A2 := B1 − A1 qn−1 e B2 := A1 . A linha seguinte nos dá
rn−2 = rn−4 + (−qn−2 )rn−3 .
Substituindo na fórmula anterior,
rn = B2 rn−3 + A2 rn−2 = B2 rn−3 + A2 (rn−4 + (−qn−2 )rn−3 )
Tome A3 := B2 − A2 qn−2 e B3 := A2 . Repetindo o mesmo argumento obtemos
rn = Bn−2 r1 + An−2 r2 .
Mas r2 = b + (−q2 )r1 , donde
rn = Bn−2 r1 + An−2 (b + (−q2 )r1 ),
tome An−1 := Bn−2 − An−2 q2 e Bn−1 := An−2 . Finalmente a primeira divisão nos
dá, r1 = a + (−q1 )b e sustituindo na fórmula anterior obtemos
rn = Bn−1 b + An−1 (a + (−q1 )b).
Basta tomar s := An−1 e t := Bn−1 − An−1 q1 .
2.3. Anéis e ideais
Nesta seção daremos uma outra demonstração (conceitual) do algoritmo euclideano estendido. Para isto precisamos da noção de ideais no conjunto Z dos
números inteiros.
O conjunto Z dos números inteiros possui duas funções. A soma + : Z × Z → Z
de números inteiros (a, b) 7→ a + b que associa ao par (a, b) sua soma a + b. E o
produto de inteiros · : Z × Z → Z dada por (a, b) 7→ ab que associa ao par (a, b) o
seu produto ab. Dados inteiros a, b, c as seguintes propriedades são satisfeitas:
(1) (Associatividade da soma) a + (b + c) = (a + b) + c.
(2) (Comutatividade da soma) a + b = b + a.
(3) (Elemento neutro da soma) a + 0 = 0.
(4) (Inverso da soma) Dado a ∈ Z existe b ∈ Z tal que a + b = 0 e denotamos
b = −a.
(5) (Associatividade do produto) a(bc) = (ab)c.
(6) (Comutatividade do produto) ab = ba.
(7) (Elemento neutro do produto) 1a = a.
10
2. ALGORITMOS EUCLIDEANOS
(8) (Distributividade do produto em relação à soma) a(b + c) = ab + ac. Por
satisfazer estas propriedades Z é dito um anel comutativo com unidade.
Além disto a seguinte propriedade é satisfeita:
(9) (Cancelamento) Se ab = 0, então a = 0 ou b = 0. Por satisfazer esta
propriedade Z é dito um domı́nio de integridade.
Observação 2.9. Poderı́amos perguntar sobre a existência do inverso em Z
com relação ao produto. Ou seja, suponhamos que a, b ∈ Z são tais que ab =
1. Suponha a ≥ 1. Neste caso b = a1 ∈ Z também é um inteiro positivo, mas
a única possibilidade destra fração ser um número inteiro é a = 1 e neste caso
necessariamente b = 1. Se a < 0, seja a0 = −a e b0 = −b, logo ab = a0 b0 = 1 e pelo
caso anterior a0 = 1 e b0 = 1, i.e., a = b = −1. Assim os únicos números inteiros
que admitem inverso são ±1.
Definição 2.10. Um subconjunto I ⊂ Z de Z é dito um ideal de Z, se as
seguintes condições são satisfeitas:
(1) 0 ∈ I.
(2) (I é fechado com relação à soma) Dados a, b ∈ I, a + b ∈ I.
(3) (I é estável com relação à multiplicação de elementos de Z) Dado a ∈ I e
r ∈ Z, então ra ∈ I.
Fica como exercı́cio mostrar que os seguintes conjuntos são ideais de Z :
• I := 2Z = {2k | k ∈ Z} (o conjunto dos números pares).
• Seja n ≥ 1 inteiro e I := nZ = {nk | k ∈ Z} o conjunto dos múltiplos de
n.
• Sejam n1 , · · · , nk ≥ 1 inteiros. Seja I := n1 Z + . . . + nk Z = {n1 a1 + . . . +
nk ak | a1 , · · · , ak ∈ Z} o conjunto dos números que são somas de múltiplos
de n1 com múltiplos de n2 , etc., com múltiplos de nk .
Proposição 2.11. Todo ideal I 6= (0) de Z é da forma dZ para algum d ≥ 1.
Por isto dizemos que I é um ideal principal e que Z é um domı́nio principal.
Demonstração. Observemos que I ∩ N 6= ∅. Dado a ∈ I, se a ≥ 1 nada há
a fazer. Senão, ou seja, dado a < 0 em I, então −a = (−1)a ∈ I pela propriedade
(3) de ideais, mas −a ≥ 1. Pelo axioma da boa ordenação existe d ∈ I ∩ N tal que
d ≤ k para todo k ∈ I ∩ N. Afirmamos que I = dZ.
De um lado, como d ∈ I, pela propriedade (3) de ideais, para todo k ∈ Z,
dk ∈ I, i.e., dZ ⊂ I. De outro lado, dado a ∈ I, digamos a ≥ 1, pelo algoritmo
euclideano, existem q, r ∈ Z tais que a = qn + r, onde 0 ≤ r < n. Se r > 0, então
r = a + (−q)n ∈ I, pois a, (−q)n ∈ I, mas isto contradiz o fato de d ser o menor
inteiro positivo em I. Assim, r = 0 e n | a, portanto a ∈ nZ. Se a < 0, a mesma
prova mostra que se a0 = −a, d | a0 , logo d | a, e assim I ⊂ nZ.
CAPı́TULO 3
Fatoração de inteiros
Neste capı́tulo mostramos que todo número inteiro fatora-se de forma única
como produto de números primos
3.1. Existência
Definição 3.1. Seja p ≥ 2 inteiro. Dizemos que p é um número primo, se
para todo inteiro b ≥ 1 tal que b | p, então b = 1 ou b = p, i.e., os únicos divisores
positivos de p são 1 e p. Os números inteiros que não primos são chamados de
números compostos, i.e., n ≥ 1 é composto se e somente se existem 1 < a, b < n
tais que n = ab.
Teorema 3.2 (teorema fundamental da aritmética - primeira versão). Seja
n ≥ 1 inteiro, existem p1 , · · · , pk números primos (não necessariamente distintos)
tais que
n = p1 · · · pk .
Demonstração. Se n é primo nada há a fazer. Suponhamos que n seja composto. Todo divisor d de n satisfaz d ≤ n, assim o conjunto dos divisores positivos
de n é finito. Seja p1 o menor divisor positivo de n. Afirmamos que p1 é primo.
Se p1 não fosse primo, terı́amos que existem 1 < a, b < p1 tais que p1 = ab, em
particular a | n, mas isto contradiz a minimalidade de p1 .
Seja n1 := pn1 < n. Se n1 é igual a 1 ou primo, então n = n1 p1 já é a fatoração
procurada. Senão, com o mesmo argumento anterior, o menor divisor positivo p2
de n1 é primo. Seja n2 := np21 = p1np2 < n1 . Se n2 é igual a 1 ou primo, então
n = n2 p2 p1 é a fatoração procurada. Senão prosseguimos. Note que temos uma
seqüência estritamente decrescente n > n1 > n2 > · · · de inteiros positivos, assim
existe k ≥ 1 tal que nk = 1, i.e., n = p1 · · · pk .
3.2. Unicidade
Lema 3.3. Seja p ≥ 2 um número primo e a, b ∈ Z \ {0}. Se p | ab, então p | a
ou p | b.
Demonstração. Note que dado um número primo p, então mdc(a, p) = 1
equivale a p - a, pois os únicos divisores positivos de p são 1 e p. Suponha que
p - a, i.e., pelo algoritmo euclideano estendido, existem s, t ∈ Z tais que 1 = sa + tp.
Multiplicando ambos os lados por b obtemos b = sab + tpb. Mas ab = αp, pois
p | ab, para algum α ∈ Z. Logo b = p(sα + tb), i.e., p | b.
Observação 3.4. O lema anterior pode ser estendido imediatamente para um
produto qualquer de inteiros, i.e., se p | a1 · · · an , então existe 1 ≤ i ≤ n tal que
p | ai .
11
12
3. FATORAÇÃO DE INTEIROS
Teorema 3.5 (teorema fundamental da aritmética - segunda versão). Seja
n ≥ 1 inteiro, então existem únicos números primos
p1 < · · · < pr e inteiros e1 , · · · , er ≥ 1
tais que
n = pe11 · · · perr .
Demonstração. Já provamos anteriormente a existência da fatoração, agrupando os primos e colocando-os em ordem temos a expressão acima. Suponha que
existam outros primos
q1 < · · · < qs e inteiros f1 , · · · , fs ≥ 1
tais que
n = pe11 · · · perr = q1f1 · · · qsfs .
Pela observação anterior temos que existe algum 1 ≤ j ≤ s tal que p1 | qj . Mas
ambos são primos, logo p1 = qj . O mesmo argumento acima mostra que existe
1 ≤ i ≤ r tal que q1 = pi . Afirmamos que j = 1. Caso contrário, ou seja j > 1,
q1 = pi ≥ p1 = qj , o que contradiz a ordenação dos números primos q’s. Logo
j = 1. Afirmamos também que e1 = f1 . Suponha, por exemplo, que e1 > f1 . Neste
caso, cancelando pf11 dos dois lados da equação acima obtemos
pe11 −f1 pe22 · · · perr = q2f2 · · · qsfs .
Repetindo a argumentação anterior obtemos que q2 = pi para algum 1 < i ≤ r.
Mas dessa forma, o fator primo p1 do lado esquerdo não cancelará com nenhum
fator primo do lado direito. Portanto, e1 = f1 .
Isto nos fornece a igualdade
pe22 · · · perr = q2f2 · · · qsfs .
Pelo mesmo argumento anterior, p2 = q2 e e2 = f2 . Assim sucessivamente concluimos que o número de fatores primos em ambos os lados é igual, i.e., r = s e
para cada 1 ≤ i ≤ r, pi = qi e ei = fi .
3.3. MDC e fatoração
Proposição 3.6. Sejam a, b ≥ 1 inteiros,
a = pe11 · · · pekk e b = pf11 · · · pfkk
suas fatorações, com ei , fi ≥ 0 para 0 ≤ i ≤ k. Seja gi = min{ei , fi } e
d = pg11 · · · pgkk .
Então d = mdc(a, b).
Demonstração. Notemos que d é um divisor comum de a e b, pois
a = dpe11 −g1 · · · pkek −gk e b = dpf11 −g1 · · · pfkk −gk ,
uma vez que para cada i, fi − gi , ei − gi ≥ 0. Seja d0 ≥ 1 um divisor comum de a e
b, i.e.,
d = ph1 1 · · · phk k
para 0 ≤ hi ≤ ei , fi . Em particular, hi ≤ gi . Assim,
d = d0 p1g1 −h1 · · · pgkk −hk .
3.4. APLICAÇÕES
13
3.4. Aplicações
Proposição 3.7. Seja p ≥ 2 um número primo. Então
√
p∈
/ Q.
Demonstração. Seja x ∈ Q \ {0}. Então x = ab com a, b ∈ Z \ {0}. Note
que a = da0 e b = db0 , onde d = mdc(a, b) e que mdc(a0 , b0 ) = 1. Simplificando d
0
obtemos que x = ab0 . Assim, dividindo pelo mdc, suporemos sempre que dado um
número x ∈ Q \ {0}, x é da forma ab com mdc(a, b) = 1.
√
√
Suponha que p ∈ Q, i.e., existem a, b ∈ Z tais que p = ab e mdc(a, b) = 1.
Logo a2 = pb2 e p | a2 . Pelo lema 3.3 concluimos que p | a, digamos a = pα, para
algum α ∈ Z. Substituindo na igualdade anterior concluimos que p2 α2 = pb2 , i.e.,
pα2 = b2 . Mas isto implica em p | b2 . Novamente, pelo lema 3.3, obtemos que p | b,
mas isto é impossı́vel pois mdc(a, b) = 1.
Definição 3.8. Seja n ≥ 1 inteiro. Dizemos que n é livre de quadrados se sua
fatoração é da forma
n = p1 · · · pk .
Lema 3.9. Seja n ≥ 1 inteiro, então existem Q, a ≥ 1 inteiros tais que n = a2 Q,
onde Q é livre de quadrados.
Demonstração. Fatoramos n como
n = pe11 · · · pekk .
Pelo algoritmo euclideano, para cada 1 ≤ i ≤ k, existem qi , ri ∈ Z tais que ei =
2qi + ri , onde 0 ≤ ri < 2. Assim
2qk rk
1 r1
n = p2q
1 p1 · · · pk p k
e tomando Q := pr11 · · · prkk , excluindo os primos com expoente zero, temos que Q é
livre de quadrados. O que sobra é a2 com a := pq11 · · · pqkk , i.e., n = a2 Q.
√
/ Q.
Proposição 3.10. Seja n ≥ 1 inteiro livre de quadrados, então n ∈
√
Demonstração. Suponha que n = ab com a, b ∈ Z e mdc(a, b) = 1. Seja
n = p1 · · · p k
a fatoração de n. Então
a2 = p1 · · · pk b2 .
Logo para cada 1 ≤ i ≤ r temos que pi | a2 . Pelo lema 3.3 concluimos que pi | a,
digamos a = pi αi para αi ∈ Z. Substituindo na igualdade anterior obtemos
p2i αi2 = p1 · · · pk b2 .
Simplificando pi na igualdade acima, obtemos
pi αi2 = p1 · · · pi−1 pi+1 · · · pk b2 = cb2 ,
onde c := p1 · · · pi−1 pi+1 · · · pk . Como pi - c, pois pi não pode dividir nenhum dos
fatores de c uma vez que p1 < · · · < pk , ou seja são todos distintos, concluimos que
pi | b2 . Novamente pelo lema 3.3 temos que pi | b, o que contradiz mdc(a, b) = 1. √
/ Q.
Proposição 3.11. Seja f ≥ 2 inteiro e p ≥ 2 primo. Então f p ∈
14
3. FATORAÇÃO DE INTEIROS
Demonstração. Suponha que
√
f
p=
f
a
b com
f
a, b ∈ Z e mdc(a, b) = 1. Então
a = pb
e p | af . Pela observação 3.4 concluimos que p | a, digamos a = pα. Substituindo
na igualdade anterior obtemos
pf αf = pbf ,
simplificando a igualdade anterior por p, concluimos que
pf −1 αf = bf .
Como f ≥ 2 temos que p aparece na fatoração do lado esquerdo, em particular,
p | bf . Novamente, pela observação 3.4 concluimos que p | b, mas isto contradiz
mdc(a, b) = 1.
Definição 3.12. Sejam n ≥ 1 e f ≥ 2 inteiros. Dizemos que n é livre de
f -potências se a fatoração de n é da forma
n = pe11 · · · pekk
com 1 ≤ ei < f para todo 1 ≤ i ≤ k.
Lema 3.13. Seja n ≥ 1 inteiro, então existem Q, a ≥ 1 inteiros tais que n =
af Q com Q livre de f -potências.
Demonstração. Seja
n = pe11 · · · pekk
a fatoração de n. Pelo algoritmo euclideano, para cada 1 ≤ i ≤ k, existem qi , ri ∈ Z
tais que ei = f qi + ri , onde 1 ≤ ei < f . Assim escrevemos
n = pf1 q1 pr11 · · · pfk qk prkk .
Como anteriormente Q := pr11 · · · prkk é livre de f -potências e tomando a :=
pq11 · · · pfkk concluimos que n = af Q.
Proposição 3.14. √
Sejam n ≥ 1 e f ≥ 2 inteiros. Suponhamos que n seja livre
/ Q.
de f -potências. Então f n ∈
Demonstração. Seja
n = pe11 · · · pekk
√
a fatoração de n, onde 1 ≤ ei < f para todo i ≤ i ≤ k. Suponhamos que f n =
com a, b ∈ Z e mdc(a, b) = 1. Então
a
b
af = pe11 · · · pekk bf .
Logo para cada 1 ≤ i ≤ k pi | af . Pela observação 3.4 concluimos que pi | a,
digamos a = pi αi para αi ∈ Z. Substituindo na igualdade anterior obtemos
pfi αif = pe11 · · · pekk bf .
Cancelando pei i em ambos os lados da igualdade acima e denotando
e
e
i−1
i+1
c := pe11 · · · pi−1
pi+1
· · · pekk ,
obtemos
pif −ei αif = cbf .
Como anteriormente pi - c uma vez que pi não divide nenhum fator de c. Logo
pi | bf . Novamente pela observação 3.4 concluimos que pi | b, mas isto contradiz
mdc(a, b) = 1.
3.5. FUNÇÕES ARITMÉTICAS ELEMENTARES
15
3.5. Funções aritméticas elementares
Para todo número inteiro n ≥ 1 denotemos por ν(n) o número de divisores
inteiros positivos de n e por σ(n) a soma de todos estes divisores, i.e.,
X
ν(n) := #{d ≥ 1 | d | n} e σ(n) :=
d.
d≥1,d|n
Utilizaremos a fatoração única para obter fórmulas explı́citas para estes dois números.
Proposição 3.15. Seja n = pa1 1 · · · par r a fatoração de n em números primos.
Então
pa1 +1 − 1
par +1 − 1
ν(n) = (a1 + 1) · · · (ar + 1) e σ(n) = 1
··· r
.
p1 − 1
pr − 1
Demonstração. Note que d | n se e somente se d fatora-se como
d = pb11 · · · pbrr com 0 ≤ bi ≤ ai para todo 1 ≤ i ≤ r.
Assim, os divisores positivos de n correspondem bijetivamente as r-uplas (b1 , · · · , br )
satisfazendo a 0 ≤ bi ≤ ai para todo 1 ≤ i ≤ r. A quantidade destas r-uplas é
exatamente (a1 + 1) · · · (ar + 1).
Para a segunda igualdade observe que
!
!
X
X
X
b1
b1
br
br
σ(n) =
p1 · · · pr =
p1 · · ·
pr
b1
(b1 ,··· ,br )
br
e que cada soma no segundo membro é a soma dos termos de uma progressão
geométrica, disto segue a fórmula para σ(n).
3.5.1. Função de Mœbius. Definimos a função de Mœbius µ : N \ {0} → Z
por µ(1) := 1, µ(n) := 0, se n não é livre de quadrados, caso contrário, i.e.,
n = p1 · · · pr , onde os pi ’s são primos distintos definimos µ(n) := (−1)r .
Proposição 3.16. Se n > 1, então
X
µ(d) = 0.
d≥1,d|n
Demonstração. Seja n = pa1 1 · · · par r a fatoração de n. Pela definição de µ
temos que
X
X
µ(d) =
µ(p11 . . . prr ),
d≥1,d|n
(1 ,··· ,r )
onde os i ’s são 0 ou 1. Portanto,
X
r
r
µ(d) = 1 − r +
−
+ . . . + (−1)r = (1 − 1)r = 0.
2
3
d≥1,d|n
Para entender melhor a função de Mœbius precisamos introduzir a multiplicação de Dirichlet. Sejam f, g : N \ {0} → C, definimos
X
f ◦ g(n) :=
f (d1 )g(d2 ).
d1 ,d2 ≥1,d1 d2 =n
16
3. FATORAÇÃO DE INTEIROS
Este produto é associativo. Isto segue do seguinte exercı́cio
X
f ◦ (g ◦ h)(n) = (f ◦ g) ◦ h(n) =
f (d1 )g(d2 )h(d3 ).
d1 ,d2 ,d3 ≥1,d1 d2 d3 =n
Definimos a função 1 : N \ {0} → Z por 1(1) := 1 e 1(n) := 0, se n > 1. Segue
da definição que para toda função f : N \ {0} → C temos f ◦ 1 = 1 ◦f = f . Defina
também a função I : N \ {0} → Z por I(n)
P := 1 para todo n. Novamente, por esta
definição obtemos f ◦ I(n) = I ◦ f (n) = d≥1,d|n f (d).
Lema 3.17. I ◦ µ = µ ◦ I = 1.
Demonstraç
ão. É claro que µ ◦ I(1) = µ(1)I(1) = 1. Se n > 1, então
P
µ ◦ I(n) = d≥1,d|n µ(d) = 0. A prova para I ◦ µ é idêntica.
Teorema 3.18 (teorema de inversão de Mœbius). Seja
X
F (n) :=
f (d).
d≥1,d min d
Então
X
f (n) =
µ(d)F (n/d).
d≥1,d|n
Demonstração. Por definição F = f ◦I. Logo, F ◦µ = (f ◦I)◦µ = f ◦(I ◦µ) =
f ◦ 1 = f , i.e.,
X
f (n) = F ◦ µ(n) =
µ(d)F (n/d).
d≥1,d|n
O teorema de inversão de Mœbius tem diversas aplicações, dentre elas a função
φ de Euler definida da seguinte forma. Seja n ≥ 1 inteiro, φ(n) denota o número
de inteiros positivos d ≤ n tais que mdc(d, n) = 1. É claro que se p for um número
primo φ(p) = p − 1.
Proposição 3.19.
X
φ(d) = n
d≥1,d|n
Demonstração. Consideremos as n frações 1/n, 2/n, · · · , (n−1)/n, n/n. Podemos reduzir cada uma delas a forma mı́nima cancelando os fatores primos comuns
do numerador e denominador. Assim, cada uma delas será igual a uma fração a/b
com mdc(a, b) = 1. Os denominadores serão sempre divisores de n. O número de
frações na forma mı́nima com denominador d, pela definição da função φ, é igual a
φ(d). Disto segue a proposição.
Proposição 3.20. Se n = pa1 1 . . . par r , então
1
1
φ(n) = n 1 −
... 1 −
.
p1
pr − 1
Demonstração. Como
n=
X
d≥1,d|n
φ(d),
3.5. FUNÇÕES ARITMÉTICAS ELEMENTARES
17
pelo teorema de inversão de Mœbius temos
X
X n X n
φ(n) =
µ(d)n/d = n −
+
+ ...
pi i<j pi pj
i
d≥1,d|n
1
1
=n 1−
... 1 −
p1
pr − 1
CAPı́TULO 4
Indução finita
Neste capı́tulo apresentamos o método da indução finita. Este método é utilizado em diversas circunstâncias em matemáticas para provar afirmativas que dependem “indutivamente” dos números naturais.
4.1. Enunciados
Axioma 4.1 (princı́pio da indução finita na sua primeira forma). Seja A(n)
uma afirmativa sobre números naturais n ∈ N. Suponha que
(1) exista n0 ∈ N tal que A(n0 ) seja verdadeira.
(2) Dado k ≥ n0 , toda vez que A(k) for verdade, então A(k + 1) também o
será.
Então para todo n ≥ n0 a afirmativa A(n) é verdadeira.
Axioma 4.2 (princı́pio da indução finita na sua segunda forma). Seja A(n)
uma afirmativa sobre números naturais n ∈ N. Suponha que
(1) exista n0 ∈ N tal que A(n0 ) seja verdadeira.
(2) Se A(k) é verdadeira para todo n0 ≤ k < n então A(n) também é verdadeira.
Logo para todo n ≥ n0 a afirmativa A(n) é verdadeira.
4.2. Exemplos da indução na sua primeira forma
Exemplo 4.3. Para todo inteiro n ≥ 1 temos
n
X
n(n + 1)
.
i=
2
i=1
Demonstração.
(1) Para n = 1 temos que 1 =
Pn
(2) Suponha que i=1 i = n(n+1)
. Então
2
n+1
X
i=1
i=
n
X
i=1
i + (n + 1) =
1.2
2 .
n(n + 1)
(n + 1)(n + 2)
+ (n + 1) =
.
2
2
Lema 4.4. Seja p um número primo e 1 ≤ i < p inteiro, então o binomial
é divisı́vel por p.
Demonstração. Por definição
p
p(p − 1) · · · (p − i + 1)
=
∈ Z.
i
i(i − 1) · · · 1
19
p
i
20
4. INDUÇÃO FINITA
Note que p não divide nenhum dos fatores do denominador, pois i < p. Logo
podemos colocar p para fora da fração e o que sobra
(p − 1) · · · (p − 1 + i)
i(i − 1) · · · 1
também é inteiro.
Exemplo 4.5. Seja p um número primo. Para todo inteiro n ≥ 1 temos que p
divide np − n.
Demonstração.
(1) Para n = 1 temos que p divide 1p − 1 = 0.
p
(2) Suponha que p | (n − n). Então
p−1 X
p i
p
(n + 1) − (n + 1) =
n + (np − n).
i
i=1
Pelo Lema 4.4 e pela hipótese de p | (np − n) concluimos que p | ((n +
1)p − (n + 1)).
Teorema 4.6 (pequeno teorema de Fermat). Seja p um número primo e a ∈ Z.
Então p | (ap − a).
Demonstração. O exemplo mostra o teorema para inteiros positivos. Seja
m < 0 inteiro, digamos m = −n para n ≥ 1. Suponha p > 2. Neste caso,
mp − m = (−n)p − (−n) = −(np − n) que é divisı́vel por p. No caso de p = 2 temos
que se n2 − n = 2α, então m2 − m = n2 + n = n + 2α + n = 2(α + 1).
Observação 4.7. O teorema anterior é na verdade equivalente para um inteiro
a não divisı́vel por p a p | (ap−1 −1). De fato, suponha que ap −a = a(ap−1 −1) = αp
para α ∈ Z. Se p - a, então pelo Lema 3.3 concluimos que p | (ap−1 − 1).
4.3. Exemplos da indução finita na sua segunda forma
Ordenamos os números primos
p1 = 2 < p2 = 3 < p3 = 5 · · · < pn · · · ,
onde pn denota o n-ésimo número primo. Seja P o conjunto dos números primos.
Teorema 4.8 (Euclides). O conjunto P é infinito.
Demonstração. Suponhamos que P seja finito, digamos com k elementos,
P = {p1 < · · · < pk }.
Seja
M := p1 · · · pk + 1.
Notemos que M > p1 · · · pk ≥ 2pk > pk , logo M tem que ser um número composto.
Pelo teorema fundamental da aritmética M é produto de números primos. Logo
os únicos primos que podem aparecer na sua fatoração são p1 , · · · , pk , digamos que
pi | M , i.e., existe αi ≥ 1 inteiro tal que M = αi pi . Retornando à definição de M
obtemos
pi (αi − p1 · · · pi−1 pi+1 · · · pk ) = 1.
Os fatores do lado esquerdo são ambos inteiros, o primeiro é positivo e o produto é
positivo. Logo a expressão entre parênteses é positiva. Por outro lado pi ≥ 2, logo
4.3. EXEMPLOS DA INDUÇÃO FINITA NA SUA SEGUNDA FORMA
21
o lado esquerdo é pelo menos 2, enquanto o lado direito é 1, o que é impossı́vel. A
contradição vem do fato de termos suposto P finito, portanto P é infinito.
No próximo capı́tulo daremos outras demonstrações deste teorema bem como
discutiremos em maior profundidade os números primos.
n
Exemplo 4.9. Para todo inteiro n ≥ 1 temos pn ≤ 22 .
Demonstração.
(1) Observe que p1 = 2 ≤ 22 = 4.
m
(2) Suponha que para todo 1 ≤ m < n tenhamos pm ≤ 22 . A demonstração
do teorema de Euclides mostra que M := p1 · · · pn−1 + 1 não pode ser divisı́vel por nenhum dos primos p1 , · · · , pn−1 . Logo M só pode ser divisı́vel
por primos maiores que pn−1 , em particular, pn ≤ M . Assim,
2
pn ≤ p1 · · · pn−1 + 1 ≤ 22 + . . . 2n−1 + 1.
n−1
Mas 22 + . . . + 2n−1 = 2(1 + . . . + 2n−2 ) = 2 2 2−1−1 = 2n − 2. Portanto,
n
n
n
n
n
pn ≤ 22 −2 +1. Basta mostrar que 22 −2 +1 ≤ 22 , i.e., 4 ≤ 22 +2 −22 =
n
22 (4 − 1), o que é verdade.
Exemplo 4.10 (algoritmo de Euclides). Seja b ≥ 1 inteiro. Para todo inteiro
n ≥ 1 existem q, r ∈ Z tais que n = bq + r para 0 ≤ r < n.
Demonstração.
(1) Se n < b tome q = 0 e r = n. Se n = b tome q = 1
e r = 0.
(2) Suponhamos que n > b. Então 1 ≤ n − b < n. Por hipótese de indução,
para todo 1 ≤ m < n existem qm , rm ∈ Z tais que m = bqm + rm , onde
0 ≤ rm < n. Em particular, existem q 0 , r0 ∈ Z tais que n − b = q 0 b + r0
onde 0 ≤ r0 < b. Logo n = (q 0 + 1)b + r0 e basta tomar q = q 0 + 1 e r = r0 .
CAPı́TULO 5
Números primos
No capı́tulo anterior provamos que o conjunto dos números primos é infinito.
Daremos 3 outras demonstrações para este fato. Cada qual tem seu mérito próprio.
A prova apresentada no capı́tulo sobre indução finita é a original de Euclides.
Provaremos também que existe uma infinidade de números primos em certas progressões aritméticas e que funções polinomiais não lineares produzem uma infinidade
de números compostos.
5.1. Infinidade de primos
Seja P o conjunto dos números primos.
Teorema 5.1 (Euclides). O conjunto P é infinito.
2a. Demonstração. Suponhamos que P seja finito, digamos P = {p1 , · · · ,
pk }. Seja n ≥ 1 inteiro. Pelo Lema 3.9, n = mQ2 , com m, Q ≥ 1 inteiros e m
livre de quadrados. Por um lado a quantidade de números inteiros positivos até n é
exatamente n. Por outro, m = pe11 · · · pekk , onde ei ∈ {0, 1}, para 1 ≤ i ≤ k. Assim,
escolher m é equivalente a escolher os expoentes ei , e como tenho duas escolhas
para cada i, o número
de escolhas possı́veis para m é no máximo 2k √
. Observemos
√
n, √
portanto,
também que Q ≤ n, logo o número de escolhas√para Q é no máximo
√
o número de escolhas para n é no máximo 2k n, i.e., n ≤ 2k n, i.e., n ≤ 2k ,
i.e., n ≤ 22k . Mas k é fixo, é a cardinalidade do conjunto de números primos, e n é
um inteiro qualquer, i.e., estamos mostrando que o conjunto dos inteiros positivos
é limitado, o que é impossı́vel. Portanto, P é infinito.
n
3a. Demonstração. Seja F (n) := 22 + 1 o n-ésimo número de Fermat.
Mostramos anteriormente (exercı́cio do capı́tulo sobre algoritmo de Euclides) que
se n > m ≥ 1, então mdc(F (n), F (m)) = 1. Começamos escolhendo um fator primo
q1 de F (1). Pelo resultado anterior, todo fator primo de F (2) é distinto de q1 , escolhemos um destes fatores primos, digamos q2 . Suponhamos que para todo 1 ≤ m < n
tenhamos escolhido para cada F (m) um fator primo distinto. Novamente pelo resultado anterior todo fator primo de F (n) é distinto de q1 , · · · , qn−1 , escolhemos um
destes fatores primos, digamos qn . Provamos assim (via a Indução na sua segunda
forma) que para todo n ≥ 1 temos um número primo qn fator de F (n) distinto de
q1 , · · · , qn−1 . Produzimos assim um subconjunto infinito {q1 , · · · , qn , · · · } ⊂ P de
P. Em particular, P é infinito.
Uma quarta demonstração é conseqüência do seguinte teorema.
Teorema 5.2 (*). A série
X1
p
p∈P
23
24
5. NÚMEROS PRIMOS
diverge.
Para a noção de divergência de série veja [Li, Capı́tulo IV].
Demonstração. Sejam n ≥ 1 inteiro e p1 , · · · , pl(n) os números primos menores ou iguais a n. Seja
l(n)
Y 1
λ(n) :=
.
1 − pi
i=1
Segue das Preliminares que
X 1
1
,
=
1 − pi
pai i
ai ≥0
logo
λ(n) =
X
pa1
(a1 ,··· ,al(n) ) 1
1
al(n) ,
. . . pl(n)
onde a l(n)-upla (a1 , · · · , al(n) ) é formada de inteiros não negativos. Em particular,
como
1
1
1 + + . . . + < λ(n),
2
n
concluimos que λ(n) → ∞ quando n → ∞ (ver [Li, Capı́tulo IV, Exemplos 23]).
Em particular, P é um conjunto infinito.
Calculando o logartimo de λ(n) (ver Preliminares) obtemos
log(λ(n)) = −
l(n)
X
log(1 − pi ) =
i=1
l(n)
X
X
i=1 m≥1
1
mpm
i
l(n)
=
XX 1
1
1
+
.
+ ... +
p1
pl(n) i=1
mpm
i
m≥2
Note que
X
m≥2
X 1
1
1
2
1
<
= 2
−1 ≤ p2 .
m
mpi
pm
p
1
−
p
i
i
i
i
m≥2
Logo,
!
1
1
1
1
log(λ(n)) <
+ ... +
+2
+ ... + 2
.
p1
pl(n)
p21
pl(n)
P
Segue de [Li, Capı́tulo IV, Exemplo 29] que n≥1 n−2 converge, a fortiori o mesmo
P
P
−1
vale para i≥1 p−2
convergisse, existiria uma constante
i . Dessa forma, se
p∈P p
M
M
tal
que
log(λ(n))
<
M
,
i.e.,
λ(n)
<
e
,
mas
λ(n) → ∞, quando n → ∞. Assim,
P
−1
p
não
pode
convergir.
p∈P
5.2. Primos em progressões aritméticas
Nos próximos 3 parágrafos procuramos estudar fórmulas “simples” que “caracterizem” os números primos. Na verdade procuramos funções f : N → N cuja
imagem contenha “muitos” números primos. Começaremos pela função linear, digamos f (n) = an + b com a, b ≥ 1 inteiros. Note que f (N) é uma progressão
aritmética com primeiro elemento a + b e razão b.
5.2. PRIMOS EM PROGRESSÕES ARITMÉTICAS
25
Lema 5.3. Existem infinitos números primos da forma 4n + 3 com n ≥ 1
inteiro.
Demonstração. Seja p > 2 um número primo. Comecemos analisando os
possı́veis restos da divisão de p por 4. Pelo algoritmo da divisão existem q, r ∈ Z
tais que p = 4q + r com 0 ≤ r < 4. Como p é primo as únicas possibilidades para
r são 1 e 3.
Seja P4,3 o conjunto dos números primos maiores ou iguais a 7 da forma 4n + 3.
Suponha que P4,3 seja infinito, digamos P4,3 = {p1 < · · · < pk }. Seja
M := 4p1 · · · pk + 3.
Observe que M deixa resto 3 na divisão por 4. Observe também que M >
4p1 · · · pk > 4pk > pk , logo (como pk é o maior número primo que deixa resto
3 na divisão por 4) M é composto. Pelo teorema fundamental da aritmética M
fatora-se em um produto de primos.
Note que se a, b ≥ 1 são inteiros que deixam resto 1 na divisão por 4, então o
mesmo ocorre para ab. De fato, se a = 4x + 1, b = 4y + 1, então
ab = 4(4xy + x + y) + 1.
Fica como exercı́cio verificar (utilizando a primeira forma da indução finita) que o
mesmo vale para um produto finito a1 · · · an de inteiros positivos cada qual deixando
resto 1 na divisão por 4.
Assim, não é possı́vel que todo fator de M deixe resto 1 na divisão por 4,
i.e., existe algum 1 ≤ i ≤ k tal que pi | M , i.e., M = pi αi para αi ≥ 1 inteiro.
Retornando à definição de M obtemos
pi (αi − 4p1 · · · pi−1 pi+1 · · · pk ) = 3.
No lado esquerdo temos um produto de um número inteiro positivo por outro cujo
produto também é um inteiro positivo, logo o número inteiro entre parentêses é um
inteiro positivo. Como p1 ≥ 7, o lado esquerdo é pelo menos 7, o que é impossı́vel.
Portanto P4,3 é infinito.
Lema 5.4. Existem infinitos números primos da forma 6n + 5 com n ≥ 1
inteiro.
Demonstração. Seja p > 2 um número primo. Pelo algoritmo da divisão
existem q, r ∈ Z tais que p = 6q + r com 0 ≤ r < 6. Como p é primo, r só pode ser
1 ou 5.
Seja P6,5 o conjunto dos números primos maiores ou iguais a 11 da forma 6n+5
para n ≥ 1 inteiro. Suponha que P6,5 seja finito, digamos P6,5 = {p1 < · · · < pk }.
Seja
M := 6p1 · · · pk + 5.
Note que M deixa resto 5 na divisão por 6. Note também que M > 6p1 · · · pk >
6pk > pk . Como pk é o maior número primo que deixa resto 5 na divisão por 6
obtemos que M é composto.
Observe que se a, b ≥ 1 são inteiros que deixam resto 1 na divisão por 6, então
o mesmo ocorre com ab. De fato, se a = 6x + 1, b = 6y + 1, então
ab = 6(6xy + x + y) + 1.
Fica como exercı́cio mostrar que o mesmo vale para um produto finito a1 · · · an de
inteiros positivos cada qual deixando resto 1 na divisão por 6.
26
5. NÚMEROS PRIMOS
Assim não é possı́vel que todo fator de M deixe resto 1 na divisão por 6, i.e.,
existe 1 ≤ i ≤ k tal que pi | M , M = pi αi para αi ≥ 1 inteiro. Retornando à
definição de M obtemos
pi (αi − 6p1 · · · pi−1 pi+1 · · · pk ) = 5.
No lado esquerdo temos um produto de um número inteiro positivo por outro cujo
produto também é um inteiro positivo, logo o número inteiro entre parentêses é um
inteiro positivo. Como p1 ≥ 11, o lado esquerdo é pelo menos 11, o que é impossı́vel.
Portanto P6,5 é infinito.
No parágrafo sobre função zeta a seguir enunciaremos um teorema devido a
Dirichlet que generaliza os dois lemas anteriores.
5.3. Infinidade de compostos por funções polinomiais
Queremos agora analisar o que ocorre se a função considerada anteriormente
for polinomial. Veremos que em geral o fenômeno se contrapõe ao caso linear, ou
seja, é possı́vel apenas garantir uma infinidade de números compostos na imagem
de f .
Teorema 5.5. Seja
f (n) := ad n+ ad−1 nd−1 + . . . + a1 n + a0 ,
onde ad , · · · , a0 ∈ Z com ad > 0. Então existem infinitos números compostos da
forma f (n).
Demonstração. Se para todo n ≥ 1, f (n) for composto nada há a fazer.
Caso contrário, seja n0 ∈ N tal que f (n0 ) = p número primo. Seja h ≥ 1 inteiro e
f (n0 + hp) = ad (n0 + hp)d + ad−1 (n0 + hp)d−1 + . . . + a1 (n0 + hp) + a0 .
Note que a soma dos termos constantes (considerando a expressão acima como um
polinômio em h) é igual a
ad nd0 + ad−1 n0d−1 + . . . + a1 n0 + a0 = p.
Logo,
f (n0 + hp) = p(1 + a1 h + a2 (2n0 h + h2 p) + . . .
+ ad−1 ((d − 1)n0d−2 h + . . . + (d − 1)n0 hd−2 pd−3 + hd−1 pd−2 )
+ ad (dnd−1
h + . . . + dn0 hd−1 pd−2 + hd pd−1 )).
0
Observe que o termo lı́der da expressão acima como polinômio em h é igual a
ad pd−1 p > 0. Assim para um inteiro h ≥ 1 suficiente grande a expressão entre
parênteses do lado direito menos 1 é sempre positiva, portanto f (n0 +hp) = p(1+α)
com α ≥ 1 inteiro. Em particular, f (n0 + hp) é sempre composto para todo h ≥ 1
suficientemente grande.
Para o caso d = 2 a cota para h é h > −(2an0 + b)/(ap) (faça a conta neste
caso!).
5.5. CONTANDO NÚMEROS PRIMOS
27
5.4. Números de Fermat e Mersenne
Nesta seção apresentamos os números de Fermat e Mersenne e começamos a
discussão de quando podem ser números primos. No capı́tulo subseqüente sobre
aplicações da teoria de grupos à aritmética elementar descreveremos de forma mais
precisa critérios para decidir quando estes números são primos.
n
Para todo n ≥ 1 inteiro seja F (n) := 22 + 1 o n-ésimo número de Fermat.
Fermat afirmava que todo número desta forma era primo. Na verdade o que deve
ter ocorrido é que ele calculou os quatro primeiros que realmente são. Entretanto,
Euler mostrou que 641 | F (5). Daremos uma demonstração disto posteriormente.
Para todo n ≥ 1 inteiro seja M (n) := 2n − 1 o n-ésimo número de Mersenne.
Lema 5.6. Se n é composto, então M (n) também é composto.
Demonstração. Suponha que n = ab com 1 < a, b < n. Então
2n − 1 = (2a )b − 1 = (2a − 1)(2a(b−1) + 2a(b−2) + . . . + 2a + 1)
o que mostra que M (a) | M (n).
Observação 5.7. Se quisermos que um número de Mersenne seja primo, devemos nos restringir àqueles números de Mersenne cujo ı́ndice n seja um número
primo. Mersenne produziu uma lista incompleta e incorreta de M (p)’s para p primo
tais que M (p) é primo. Novamente, produziremos a posteriori uma lista ocrreta, a
menos da complexidade computacional, utilizando teoria de grupos.
5.5. Contando números primos
Para todo número real x > 1 seja π(x) := #{p | número primo com p ≤ x}.
O teorema de Euclides nos garante que limx→∞ π(x) = ∞ (para a noção de limite
veja [Li, capı́tulo IV]). Nosso objetivo é determinar uma estimativa elementar para
a função π(x) que conta a quantidade de números primos menores ou iguais a um
dado número real maior que 1. Note que se 1 < x ≤ y, então π(x) ≤ π(y). Seja pn
o n-ésimo número primo. Então π(pn ) = n.
Proposição 5.8. Seja log(x) o logaritmo na base e. Então
π(x) ≥ log(log(x)).
Demonstração. Já obtivemos anteriormente (via indução finita) que pn ≤
n
m
22 . Para todo x > 1 real fixado o conjunto {m ≥ 1 | inteiro, ee ≤ x} é finito.
n−1
n
Seja n − 1 seu maior elemento, i.e., ee
≤ x < ee . Observe que
ee
n−1
n
≥ 22 para n ≥ 4.
De fato, basta mostrar que
en−1 ≥ 2n log(2), ou seja , n − 1 ≥ n log(2) + log(log(2)),
o que é verdade pois log(2) < 1. Logo
π(x) ≥ π(ee
n−1
n
) ≥ π(22 ) ≥ π(pn ) = n ≥ log(log(x)).
Utilizaremos o método da segunda demonstração do teorema de Euclides para
refinar à proposição anterior. Para todo inteiro n ≥ 1 seja γ(n) o conjunto dos
divisores primos de n.
28
5. NÚMEROS PRIMOS
Proposição 5.9.
log(dxe)
,
2 log(2)
onde dxe denota a parte inteira de x (para a definição ver Preliminares).
π(x) ≥
Demonstração. Para qualquer conjunto de números primos S denotamos
por fS (x) o número de inteiros positivos n ≤ x tais que γ(n) ⊂ S. Suponha que
S seja finito de √
cardinalidade t. Escrevemos n = m2 s com s livre de quadrados.
Note que m√≤ x. Além disto temos no máximo 2t escolhas para s. Portanto,
fS (x) ≤ 2t x. Seja m := π(x), assim pm+1 > x. Se S = {p1 , · · · , pm }, então
√
fS (x) = dxe. Em particular, dxe ≤ 2π(x) x e disto segue a proposição.
P O método acima nos dá uma nova demonstração do teorema 5.2. De fato, se
p∈P 1/p fosse convergente, então existiria n ≥ 1 tal que
X 1
1
< .
p
2
j
j>n
Seja S := {p1 , · · · , pn } e x ≥ 1 inteiro. Então x−fS (x) é igual ao número de inteiros
positivos m ≤ x tais que γ(m) 6⊂ S. Em outras palavras, contamos o número de
inteiros 1 ≤ m ≤ x para os quais existe j > n tal que pj | m. Para cada primo pj
existem dx/pj e múltiplos de pj menores ou iguais a x. Portanto,
X x X x
x
x − fS (x) ≤
< .
≤
pj
p
2
j>n
j>n j
√
√
A fortiori, fS (x) ≥ x/2. Mas, fS (x) ≤ 2n x. Logo, 2n ≥ x/2, o que é impossı́vel
pois n é fixo e x é variável.
Intimamente relacionada à função π(x) temos a seguinte função
X
θ(x) :=
log(p).
p∈P,p≤x
Utilizaremos θ(x) para limitar π(x). Seja θ(1) := 0.
Proposição 5.10.
θ(x) < (4 log(2))x.
Demonstração. Considere o binomial
2n
(n + 1) . . . 2n
=
.
n
1.2 . . . n
Este número é um inteiro divisı́vel por todo número primo n < p < 2n. Além disto,
como
2n X
2n
2n
(1 + 1)2n =
, então 22n >
.
j
n
j=0
Em conseqüência,
2n
2
>
2n
n
>
Y
p.
n<p<2n
Calculando o logartimo,
2n log(2) >
X
n<p<2n
log(p) = θ(2n) − θ(n).
5.5. CONTANDO NÚMEROS PRIMOS
29
Somando esta relação para n = 1, 2, 4, · · · , 2m−1 obtemos
θ(2m ) < log(2)(2m+1 − 2) < log(2)2m+1 .
Como na demonstração da proposição 5.8 existe m ≥ 1 tal que 2m−1 < x ≤ 2m ,
donde
θ(x) ≤ θ(2m ) < log(2)2m+1 = (4 log(2))2m−1 < (4 log(2))x.
Proposição 5.11. Existe um real c1 > 0 tal que
x
π1 (x) < c1
, para x ≥ 2.
log(x)
Demonstração. Observe que
X
√
√
√
√
√
θ(x) ≥
log(p) ≥ log( x)(π(x) − π( x)) ≥ log( x)π(x) − x log( x).
√
x<p≤x
Logo,
√
2θ(x) √
x
+ x ≤ (8 log(2))
+ x,
log(x)
log(x)
onde a última desigualdade
segue da proposição anterior. O resultado segue da
√
observação que x < 2x/ log(x) para x ≥ 2.
π(x) ≤
Corolário 5.12.
π(x)
= 0.
x
Nosso objetivo agora é obter uma cota inferior para a função π(x). Para isto
comecemos observando que
2n
n+1 n+2
n+n
=
...
≥ 2n .
n
1
2
n
lim
x→∞
Por um exercı́cio deste capı́tulo temos
X
tp 2n
(2n)!
2n
n
ordp
=
−2 j
,
= ordp
2
j
(n!)
p
p
n
j=1
onde tp denota o maior inteiro tal que ptp ≤ 2n. Logo, tp = dlog(2n)/ log(p)e. Além
disto, d2xe − 2dxe é sempre 0 ou 1, assim
2n
log(2n)
ordp
≤
.
log(p)
n
Proposição 5.13 (*). Existe real c2 > 0 tal que
x
π(x) > c2
.
log(x)
Demonstração. Pelo que foi feito anteriormente,
Y
2n
2n ≤
≤
ptp .
n
p<2n
Calculando o logaritmo obtemos,
X
X log(2n) n log(2) ≤
tp log(p) =
log(p).
log(p)
p<2n
p<2n
30
5. NÚMEROS PRIMOS
√
Se log(p) > (1/2) log(2n), i.e., p > 2n, então dlog(2n)/ log(p)e = 1. Assim,
X log(2n) X
√
n log(2) ≤
log(p) +
log(p) ≤ 2n log(2n) + θ(2n)
log(p)
√
√
p≤ 2n
2n<p<2n
√
√
Portanto, θ(2n) ≥ n log(2) − 2n log(2n). Mas, limn→∞ ( 2n log(2n))/n = 0.
Assim, existe uma constante real T > 0 tal que para n suficientemente grande
θ(2n) > T n. Toamndo x suficientemente grande e tal que 2n ≤ x < 2n + 1 obtemos
x−1
> Cx,
2
para algum real C > 0 conveniente. Portanto, existe real c2 > 0 tal que θ(x) > c2 x
para todo x ≥ 2. Para completar a prova observamos que
X
log(p) ≤ π(x) log(x).
θ(x) =
θ(x) ≥ θ(2n) > T n > T
p≤x
Portanto,
π(x) ≥
θ(x)
x
> c2
.
log(x)
log(x)
5.5.1. Comentários. As duas proposições anteriores são devidas a C̆ebychef
(1852). O seguinte teorema suplanta ambas (cf. [Ap, chapter 4], este resultado
depende de teoria analı́tica dos números).
Teorema 5.14 (teorema dos números primos).
x
lim π(x) =
.
x→∞
log(x)
O teorema dos números primos foi conjecturado por Gauss na idade de 15 ou 16
anos. A prova correta surgiu apenas em 1896 por Hadamard e de la Vallé Poussin
utilizando a função zeta de Riemann, que introduziremos no parágrafo seguinte.
Existem uma infinidade de problemas abertos sobre os números primos. Para
mencionar apenas dois :
• Existem infinitos números primos da forma n2 + 1?
• (Primos gêmeos) Existem infinitos pares de números primos da forma
(p, p + 2)?
Para mais problemas abertos veja [Si] e [Sh].
5.6. Função zeta
Nesta seção descreveremos sem prova diversos fatos a respeito da função zeta de
Riemann (para a prova destes fatos ver [IrRo, chapter 16]). Esta função é definida
por
X
ζ(s) :=
n−s , onde s ∈ C, <(s) > 1.
n≥1
Esta série converge em <(s) > 1 e converge uniformemente para <(s) ≥ 1 + δ
para todo δ > 0 (para a noção de convergência ver [Li, cap’ıtulo IV]). A primeira
propriedade é que ela admite uma expansão em produto euleriano.
5.6. FUNÇÃO ZETA
31
Proposição 5.15. Para <(s) > 1 temos
Y
1
ζ(s) =
.
1 − p−s
p∈P
Particularmente importante
P é o comportamento assintótico desta função quando s → 1. Considerando que n≥1 1/n diverge suspeitamos que ζ(s) → ∞ quando
s → 1. Lembre que ζ(s) é uma função de uma variável complexa.
Proposição 5.16. Suponha que <(s) > 1. Então
lim (s − 1)ζ(s) = 1.
s→1
A proposição na verdade diz que ζ(s) é uma função meromorfa com um pólo
simples em s = 1 (para mais detalhes ver [Ap, chapter 12]).
Corolário 5.17. Quando s → 1 temos
log(s)
→ 1.
(log(s − 1))−1
Proposição 5.18.
ζ(s) =
X 1
+ R(s),
ps
p∈P
onde R(s) fica limitada quando s → 1.
Dado um subconjunto S do conjunto dos números primos P, dizemos que S
tem densidade de Dirichlet se o limite
P
−s
p∈S p
lim
s→1 (log(s − 1))−1
existe. Neste caso este limite é denotado por d(S) e é chamado a densidade de
Dirichlet de S. Esta densidade satisfaz as seguintes propriedades.
Proposição 5.19. Seja S um subconjunto do conjunto P dos números primos.
Então
(1) Se S é finito, então d(S) = 0.
(2) Se S contém todos os números primos, exceto um número finito deles,
então d(S) = 1.
(3) Se S = S1 ∪ S2 com S1 ∩ S2 = ∅, então d(S1 ∪ S2 ) = d(S1 ) + d(S2 ).
Teorema 5.20 (teorema das progressões aritméticas de Dirichlet). Sejam a ∈
Z e m ≥ 1 inteiro tais que mdc(a, m) = 1. Seja P(a; m) o subconjunto do conjunto
P dos números primos que contém os primos p tais que p ≡ a (mod m). Então
d(P(a; m)) = 1/φ(m). A fortiori, P(a; m) é infinito.
5.6.1. Comentários (*). Riemann propôs a seguinte conjectura (que permanece em aberto até hoje).
Conjectura 5.21 (hipótese de Riemann). Todos os zeros da função zeta de
Riemann ζ(s) estão contidos na reta <(s) = 1/2.
Sabe-se que na reta <(s) = 1/2 existe uma infinidade de zeros da função zeta
e que estes são simétricos em relação à reta =(s) = 0. A veracidade da hipótese de
Riemann implica em maiores informações sobre a distribuição dos números primos
(para mais sobre isto ver [Ap, chapter13]).
32
5. NÚMEROS PRIMOS
O inteiro positivo n nada mais é que a cardinalidade do anel Z/nZ da aritmética modular (a ser introducido no próximo capı́tulo). Esta analogia faz com
que Dedekind considere a seguinte extensão da função zeta. Seja K uma extensão
finita do corpo dos racionais Q (ver a parte referente à teoria de corpos). Existe
um subconjunto OK de K que cumpre o mesmo papel de Z com relação a Q. Este
conjunto é chamado o anel de inteiros de K. Ele tem (entre outras propriedades
importantes) a caracterı́stica que o anel quociente OK /I (onde I é um ideal de
OK , para mais sobre anel quocientes ver a parte de anéis) é um conjunto finito cuja
cardinalidade é denotada por N (I). Assim, Dedekind define a função zeta de K
por
X
ζK (s) :=
N (I)−s , onde <(s) > 1,
I
e I percorre todos os ideais de OK . Novamente conjectura-se que os zeros desta
função estão na reta <(s) = 1/2, o que permanece em aberto. Note que ζQ nada
mais é que a função zeta de Riemann.
Nos anos 20 e 30 do século XX, E. Artin, H. Hasse e A. Weil consideraram um
análogo “geométrico” desta situação. Nele o papel de Q era ocupado pelo corpo de
funções racionais em uma variável Fq (τ ) sobre um corpo finito Fq de q elementos
(ver parte de corpos). Neste contexto, L é uma extensão finita de Fq (τ ). O corpo
L possui também um subanel com propriedades similares a OK (quando K é uma
extensão finita de Q). Isto permite a construção de uma função zeta associada a
L. Similarmente, pode-se formular como acima uma “hipótese de Riemann” para
L. Esta é chamada uma “hipótese de Riemann para curvas” porque L nada mais
é que o corpo de funções racionais de uma curva sobre um corpo finito (para mais
sobre curvas sobre corpos finitos e a hipótese de Riemann neste contexto ver [Lo]).
Após casos particulares da hipótese de Riemann para curvas terem sido tratados
por Artin e Hasse, Weil utilizando variedades abelianas e representações `-ádicas
obtém em 1948 a prova da “hipótese de Riemann para curvas” de forma geral.
No ano seguinte (1949) Weil propõe uma vasta generalização deste resultado
substituindo Fq (τ ) por um corpo de funções κ em n variáveis sobre Fq . Neste caso
a extensão finita L de κ nada mais é que o corpo de funções de uma variedade
algébrica sobre Fq (para variedades algébricas ver [Ha]). De maneira visionária
Weil percebe que uma prova da hipótese de Riemann neste contexto mais geral
seria conseqüência de uma teoria de cohomologia suficientemente “rica” para reproduzir as propriedades da cohomologia singular sobre os complexos. Segundo
muitos, as conjecturas de Weil foram sem sobra de dúvida o problema matemático
mais profundo após a segunda guerra mundial. Na busca da cohomologia perdida,
os primeiros passos foram dados por J.-P. Serre introduzindo a cohomologia de feixes
de vetores de Witt. Mas foi A. Grothendieck que compreendeu que a função zeta
traz em si algo de novo que não havia sido percebido pelos gêometras algébricos,
desde de os italianos do século XIX. Ela necessitava de uma base variável, ou seja, a
variedade algébrica era considerada simultaneamente sobre todos os corpos finitos
Fqn . Para isto introduziu o conceito que revoluciona completamente a geometria
algébrica no século XX, a teoria de esquemas. Com a contribuição de inúmeros
matemáticos além de Serre e Grothendieck, dentre eles M. Artin, J.-L. Verdier e
L. Illusie, as teoria de esquemas e de cohomologia evoluiram, permitindo que se
descobrisse que a “cohomologia apropriada”, a cohomologia étale (para mais sobre a cohomologia étale veja [Mi]), e que finalmente em 1973, um ex-aluno de
5.6. FUNÇÃO ZETA
33
Grothendieck, P. Deligne provasse finalmente as conjecturas de Weil (para os resultados de Deligne veja [We1] e [We2]). Entretanto, o mestre não ficou satisfeito. Na
verdade Grothendieck havia formulado um programa muito mais amplo, “as conjecturas standard”, das quais as conjecturas de Weil eram um corolário. Infelizmente,
este programa nunca foi atingido.
CAPı́TULO 6
Aritmética modular
6.1. Aritmética modular
Definimos uma função soma de classes ⊕ : Z/nZ × Z/nZ → Z/nZ por a ⊕ b :=
a + b.
Lema 6.1. Esta função está bem definida, i.e., se a0 ≡ a (mod n) e b0 ≡ a
(mod n), então a0 + b0 = a + b.
Demonstração. Suponha a0 ≡ a (mod n) e b0 ≡ b (mod n), i.e., existem
k, l ∈ Z tais que a0 − a = kn e b0 − b = ln. Somando estas igualdades, (a0 + b0 ) −
(a + b) = (k + l)n, i.e., a0 + b0 ≡ a + b (mod n), i.e., a0 + b0 = a + b.
Definimos também um função produto de classes : Z/nZ × Z/nZ → Z/nZ
por a b := ab.
Lema 6.2. Esta função também está bem definida, i.e., se a0 ≡ a (mod n) e
b0 ≡ b (mod n), então a0 b0 = ab.
Demonstração. Sejam k, l ∈ Z tais que a0 − a = kn e b0 − b = ln. Logo
a b − ab = a0 b0 − a0 b + a0 b − ab = a0 (b0 − b) + b(a0 − a) = (a0 l + bk)n, i.e., a0 b0 ≡ ab
(mod n), i.e., a0 b0 = ab.
0 0
Proposição 6.3. O conjunto Z/nZ munido das operações ⊕ e é um anel
comutativo com unidade.
Demonstração. Precisamos provar que as 8 propriedades de 2.3 são satisfeitas. Elas são herdadas das mesmas propriedades para inteiros como segue abaixo.
(1) a ⊕ (b ⊕ c) = a ⊕ b + c = a + (b + c) = (a + b) + c = a + b ⊕ c = (a ⊕ b) ⊕ c.
(2) a ⊕ b = a + b = b + a = b ⊕ a.
(3) Note que 0 = n = {kn | k ∈ Z} = nZ é o conjunto dos inteiros que são
múltiplos de n. Observe que a ⊕ 0 = a + 0 = a.
(4) a ⊕ n − a = a + n − a = n = 0.
(5) a (b c) = a bc = a(bc) = (ab)c = ab c = (a b) c.
(6) a b = ab = ba = b a.
(7) a 1 = a.1 = a.
(8) a (b ⊕ c) = a b + c = a(b + c) = ab + ac = ab ⊕ ac = (a b) ⊕ (a c).
A propriedade de cancelamento em um anel garante que este é um domı́nio de
integridade. Nem sempre Z/nZ é um domı́nio de integridade. Para simplificar a
notação escreveremos + no lugar de ⊕ e ab no lugar de a b.
Proposição 6.4. Z/nZ é um domı́nio de integridade se e somente se n = p é
um número primo.
35
36
6. ARITMÉTICA MODULAR
Demonstração. Suponha que Z/nZ seja um domı́nio de integridade. Suponha que n = ab com 1 ≤ a, b ≤ n. Então n = 0 = ab = ab. Pela propriedade do
cancelamento, a = 0 ou b = 0. No primeiro caso existe α ≥ 1 inteiro tal que a = nα,
logo n = nαb, i.e., 1 = αb, i.e., b = 1 e a = n. No segundo caso existe β ≥ 1 inteiro
tal que b = nβ, logo n = anβ, i.e., 1 = aβ, i.e., a = 1 e b = n. Portanto, n é primo.
Suponha que n = p seja primo. Suponha ab = 0, i.e., ab = 0, i.e., p | ab.
Pelo Lema 3.3, p | a ou p | b, i.e., a = 0 ou b = 0, i.e., vale a propriedade de
cancelamento.
Um elemento a ∈ Z/nZ é dito inversı́vel, se existe b ∈ Z/nZ tal que ab = 1. Denotamos por (Z/nZ)∗ o subconjunto de Z/nZ formado pelos elementos inversı́veis.
Um domı́nio de integridade D é dito um corpo, se para todo a ∈ D\{0} existe b ∈ D
tal que ab = 1. Assim, Z/nZ é um corpo se e somente se (Z/nZ)∗ = Z/nZ \ {0}.
Proposição 6.5. Z/nZ é um corpo se e somente se n = p é um número primo.
Demonstração. Suponha que Z/nZ seja um corpo. Seja n = ab com 1 ≤
a, b ≤ n inteiros. Suponha que a < n. Neste caso, a 6= 0. Por hipótese, existe
c ∈ Z/nZ tal que ac = 1. Note que n = 0 = ab = ab. Multiplicando esta igualdade
por c dos dois lados obtemos 0 = b, i.e., b = n. Neste caso a = 1. Se a = n, então
necessariamente b = 1 e portanto n é primo.
Reciprocamente, suponha que n = p seja primo. Seja a ∈ Z/nZ \ {0}, i.e., p - a.
Logo mdc(a, p) = 1. Pelo algoritmo euclideano estendido, existem r, s ∈ Z tais que
ra + sp = 1, i.e., ra ≡ 1 (mod p), i.e., ra = ra = 1, i.e., a ∈ (Z/nZ)∗ .
A princı́pio Z/nZ é o conjunto de todas as classes a para a ∈ Z. Definido desta
forma Z/nZ poderia ser infinito. Isto não ocorre.
Proposição 6.6. Z/nZ = {0, · · · , n − 1} e #Z/nZ = n.
Demonstração. Por definição o conjunto do lado direito está contido no conjunto do lado esquerdo. O que temos que provar é a inclusão oposta. Suponha que
a ∈ Z/nZ. Note que podemos sempre supor que a ≥ 0, basta tomar um múltiplo
kn de n suficientemente grande tal que a0 = a + kn ≥ 0, uma vez que a = a0 . Pelo
algoritmo da divisão, existem q, r ∈ Z tais que a = qn + r com 0 ≤ r < n, i.e., a ≡ r
(mod n), i.e., a = r ∈ {0, · · · , n − 1}.
Mostraremos agora que quaisquer duas classes no conjunto da direita são distintas. Sejam 0 ≤ a < b < n inteiros. Logo 0 ≤ b − a < b < n, i.e., b 6≡ a (mod n),
i.e., b 6= a.
O conjunto (Z/nZ)∗ dos inversı́veis em Z/nZ pode ser caracterizado também
da seguinte forma.
Proposição 6.7. (Z/nZ)∗ = {a ∈ Z/nZ | mdc(a, n) = 1}.
Demonstração. Seja a ∈ (Z/nZ)∗ , i.e., existe b ∈ Z/nZ tal que ab = ab = 1,
i.e., existe k ∈ Z tal que ab − kn = 1. Seja d = mdc(a, n) ≥ 1. Logo d | 1, mas isto
só é possı́vel se d = 1.
Seja a ∈ Z/nZ tal que mdc(a, n) = 1. Pelo algoritmo euclideano estendido,
existem r, s ∈ Z tais que ra + sn = 1, i.e., ra ≡ 1 (mod n), i.e., ra = r a = 1, i.e.,
a ∈ (Z/nZ)∗ .
6.2. CRITÉRIOS DE DIVISIBILIDADE
37
6.2. Critérios de divisibilidade
Utilizaremos a aritmética modular para demonstrar critérios de divisibilidade.
6.2.1. Expansão de um inteiro em uma dada base. Sejam a ≥ 0 e b ≥ 1
inteiros. Seja n ≥ 1 inteiro tal que bn seja a maior potência positiva de b menor ou
igual a a, i.e.,
bn ≤ a < bn+1 .
Pelo algoritmo da divisão existem qn , rn ∈ Z tais que
a = qn bn + rn , onde 0 ≤ rn < bn .
Observemos que
0 ≤ qn < b.
A primeira desigualdade é clara, porque qn bn é o maior múltiplo positivo de bn que
é menor ou igual a a. Suponha que qn ≥ b. Logo
a ≥ bn+1 + rn ≥ bn+1 ,
o que não é possı́vel. Em seguida, dividimos rn por q n−1 , i.e., existem qn−1 , rn−1 ∈
Z tais que
rn = qn−1 bn−1 + rn−1 , onde 0 ≤ rn−1 < bn−1 .
Novamente,
0 ≤ qn−1 < b.
Não precisamos repetir o argumento da primeira desigualdade, pois é o mesmo.
Para a segunda, se qn−1 ≥ b, terı́amos
rn ≥ bn + rn−1 ≥ bn ,
o que não é possı́vel. Substituindo na primeira igualdade obtemos
a = qn bn + qn−1 bn−1 + rn−1 .
Novamente, pelo algoritmo da divisão existem qn−2 , rn−2 ∈ Z tais que
rn−1 = qn−2 bn−2 + rn−2 , onde0 ≤ rn−2 < bn−2 .
Se qn−2 ≥ b, então
rn−1 ≥ bn−1 + rn−2 ≥ bn−1 ,
o que é impossı́vel. Portanto, 0 ≤ qn−2 < b. Prosseguindo sucessivamente obtemos
(6.1)
a = qn bn + qn−1 bn−1 + . . . + q1 b + q0 ,
onde 0 ≤ qi < b para todo 0 ≤ i ≤ n. A expressão (6.1) é chamada a expansão de
a na base b. Denotamos esta expansão por ab := (qn · · · q0 )b .
Seja a ≥ 0 inteiro e a = an .10n + . . . + a1 .10 + a0 sua expansão na base 10. Os
elementos an , · · · , a0 são chamados os algarismos de a e a := (an · · · a0 )10 .
Pn
Exemplo 6.8. Um inteiro a ≥ 0 é divisı́vel por 3 se e somente se i=0 ai ≡ 0
(mod 3). De fato, 10 ≡ 1 (mod 3), pois
− 1 = 9 = 3.3. Logo para todo n ≥ 0,
P10
n
10n ≡ 1n =P
1 (mod 3). Portanto, a ≡ i=0 ai (mod 3). Logo a ≡ 0 (mod 3) se e
n
somente se i=0 ai ≡ 0 (mod 3).
Pn
Exemplo 6.9. Um inteiro a ≥ 0 é divisı́vel por 11 se e somente se i=0 (−1)ai
≡ 0 (mod 11). De fato, 10 ≡ −1 (mod 11), pois 10
(−1) = 11. Logo para todo
P−
n
n ≥ 1, 10n ≡ (−1)n (mod 11) e portanto, aP≡
i=0 (−1)ai (mod 11). Consen
quentemente, a ≡ 0 (mod 11) se e somente se i=0 (−1)ai ≡ 0 (mod 11).
38
6. ARITMÉTICA MODULAR
Exemplo 6.10. O critério de divisibilidade por 7 é um pouco mais intrincado.
A razão é a seguinte: 10 ≡ 3 (mod 7), pois 10 − 3 = 7. Logo 102 ≡ 32 ≡ 2
(mod 7), pois 9 − 2 = 7; 103 ≡ 3.2 = 6 (mod 7); 104 ≡ 6.3 ≡ 4 (mod 7), pois
18 − 4 = 14 = 2.7; 105 ≡ 4.3 ≡ 5 (mod 7), pois 12 − 5 = 7; 106 ≡ 5.3 ≡ 1 (mod 7),
pois 15 − 1 = 14 = 2.7. Suponha para simplificar que n = 5, i.e., a tem apenas 6
algarismos. Aplicando o mesmo raciocı́nio acima obtemos que a ≡ 0 (mod 7) se e
somente se 5a5 + 4a4 + 6a3 + 2a2 + 3a1 + a0 ≡ 0 (mod 7).
6.3. Contando elementos inversı́veis
No capı́tulo de fatoração de inteiros introduzimos a função φ de Euler. Pela
proposição 6.7 a definição dada anteriormente coincide com φ(n) := #(Z/nZ)∗ .
Nesta seção vamos calcular no caso em que n é primo ou potência de primo. No
capı́tulo seguinte, usando o teorema chinês dos restos, faremos o cálculo geral.
Lema 6.11. Seja p um número primo. Então
φ(p) = p − 1.
Demonstração. Provamos anteriormente que quando n = p é primo (Z/pZ)∗
= Z/pZ \ {0}, logo φ(p) = #(Z/pZ) − 1 = p − 1.
Lema 6.12. Seja p um número primo e r ≥ 1 inteiro. Então
φ(pr ) = pr−1 (p − 1).
Demonstração. Pela proposição 6.7, a ∈ (Z/pr Z)∗ se e somente se mdc(a, pr )
= 1, i.e., p - a. Ao invés de contarmos estes elementos contaremos aqueles que são
divisı́veis por p e subtairemos do total pr este número. Expandimos a na base p,
i.e.,
a = qr−1 pr−1 + . . . + q1 p + q0 , onde 0 ≤ qi < p
é inteiro para todo 0 ≤ i ≤ r − 1. Assim, p | a se e somente se q0 = 0. Para cada
qi com 1 ≤ i ≤ r − 1 temos exatamente p escolhas. Logo o total de escolhas para a
tal que p | a é pr−1 . Portanto, φ(pr ) = pr − pr−1 = pr−1 (p − 1).
CAPı́TULO 7
Sistemas de congruência
7.1. Equações diofantinas
Uma equação diofantina é uma equação polinomial em um número finito de
variáveis cujos coeficientes são números inteiros e/ou racionais e procuramos soluções inteiras e/ou racionais. Nesta seção daremos um exemplo de como utilizar a
aritmética modular para provar que uma dada equação diofantina não tem soluções
inteiras.
Exemplo 7.1. Seja f (x, y) = x3 − 711y 3 = 5. Perguntamos se existem pares
(a, b) ∈ Z × Z tais que f (a, b) = 0. Mostraremos que não pode existir um tal par
(a, b). De fato, suponha que exista. Logo a3 ≡ 5 (mod 9). Calculemos os cubos
3
3
3
3
2
de todos os elementos de Z/9Z. 1 = 1; 2 = 8, 3 = 0, 4 = 4 4 = 74 = 1;
3
3
3
3
3
3
3
3
3
3
3
5 = −4 = −4 = 8; 6 = −3 = −3 = 0; 7 = −2 = −2 = 1; 8 = −1 = 8.
3
Portanto, não existe a ∈ Z tal que a ≡ 5 (mod 9), logo não pode existir (a, b) ∈
Z × Z tal que f (a, b) = 0.
7.2. Equações lineares
Teorema 7.2. Sejam a, b ∈ Z, a 6= 0 e n ≥ 1 inteiro. A equação ax ≡ b
(mod n) tem solução se e somente se d := mdc(a, n) | b.
Demonstração. Suponha que x0 ∈ Z seja uma solução da equação. Como d
divide a e n, denotamos a = a0 d e n = n0 d, onde n0 , a0 ∈ Z. Logo existe k ∈ Z tal
que ax0 − b = kn, i.e., d(a0 x0 − kn0 ) = b, assim d | b.
Reciprocamente, suponha que d | b, digamos b = db0 . Pelo algoritmo euclideano
estendido, existem t, s ∈ Z tais que ta + sn = d. Multiplicando ambos os lados por
b0 obtemos a(tb0 ) + snb0 = db0 = b, i.e., a(tb0 ) ≡ b (mod n), i.e., tb0 é uma solução
da equação.
Observação 7.3. Observe que se x0 ∈ Z é uma solução de ax ≡ b (mod n),
então para todo y0 ≡ x0 (mod n), concluimos que y0 também é solução da equação
(assim dizemos que a classe x0 de x0 é uma solução para ax = b). De fato, y0 =
x0 +kn para algum k ∈ Z e ax0 = b+ln para algum l ∈ Z. Logo ay0 = b+ln+akn =
b + (l + ak)n, i.e., ay0 ≡ b (mod n).
Teorema 7.4. Suponha que a equação ax ≡ b (mod n) admita uma solução
x0 ∈ Z. O número de soluções (módulo n) de ax ≡ b (mod n) é d e elas são dadas
pelas classes cujos representantes são x0 , x0 + n0 , · · · , x0 + (d − 1)n0 .
Demonstração. Provemos inicialmente que cada um desses elementos é solução. Escrevemos y0 = x0 + kn0 para algum 0 ≤ k ≤ d − 1 inteiro. Logo ay0 =
ax0 + akn0 = b + ln + akn0 = b + ln + a0 dkn0 = b + ln + a0 kn = b + n(l + a0 k), i.e.,
ay0 ≡ b (mod n). Em seguida observemos que se 0 ≤ k < r ≤ d − 1 são números
39
40
7. SISTEMAS DE CONGRUÊNCIA
inteiros, então x0 + kn0 6≡ x0 + rn0 (mod n). De fato, 0 < (x0 + rn0 ) − (x0 + kn0 ) =
n0 (r − k) < n0 d = n, logo n - ((x0 + rn0 ) − (x0 + kn0 ) = n0 (r − k)).
7.3. Sistemas de equações lineares
Teorema 7.5. Sejam m, n ≥ 1 inteiros tais que mdc(m, n) = 1 e a, b ∈ Z.
Existe x ∈ Z tal que o sistema
(
x ≡ a (mod m)
x≡b
(mod n)
tenha solução.
Demonstração. Pelo algoritmo euclideano estendido existem t, s ∈ Z tais
que tm + sn = 1. Logo
tm ≡ 1
(mod n) e sn ≡ 1
(mod m).
Seja x0 := asn + btm. Observe que
x0 ≡ asn
(mod m) ≡ a (mod m) e x0 ≡ btm
(mod n) ≡ b
(mod n).
Teorema 7.6. Sejam m1 , · · · , mr ≥ 1 inteiros tais que para todo 1 ≤ i 6= j ≤ r,
mdc(mi , mj ) = 1. Sejam a1 , · · · , ar ∈ Z. Existe x ∈ Z tal que o sistema


 x ≡ a1 (mod m1 )
···
(7.1)

 x ≡ a (mod m )
r
r
tenha solução.
Demonstração. Seja
m := m1 · · · mr
e para todo 1 ≤ i ≤ r, seja
ni :=
m
= m1 · · · mi−1 mi+1 · · · mr .
mi
Como para cada j 6= i, mdc(mj , mi ) = 1, temos que mdc(ni , mi ) = 1. Pelo
algoritmo euclideano estendido existem ti , si ∈ Z tais que ti ni + si mi = 1, i.e.,
ti n i ≡ 1
(mod mi )
e para todo j 6= i, como ni ≡ 0 (mod mj ), então
ti ni ≡ 0
(mod mj ).
Tome
x0 := a1 t1 n1 + . . . + ar tr nr .
De fato, para todo 1 ≤ i ≤ r, temos
x0 ≡ ai ti ni
(mod mi ) ≡ ai
(mod mi ),
uma vez que
aj tj nj ≡ 0
(mod mi ) para i 6= j.
7.5. APLICAÇÃO
41
7.4. Teorema Chinês dos Restos
Notação. Dado n ≥ 1 inteiro e a ∈ Z denotaremos nesta seção a classe de a
módulo n por a + nZ. Isto é motivado pelo fato que um elemento é equivalente a
a módulo n se e somente se ele difere de a por um múltiplo de n.
Teorema 7.7. Sejam m1 , · · · , mr ≥ 1 inteiros tais que para todo 1 ≤ i 6= j ≤ r,
mdc(mi , mj ) = 1. Seja m := m1 · · · mr . Existe uma bijeção
ϕ:
Z
Z
Z
→
× ... ×
mZ
m1 Z
mr Z
definida por
ϕ(a + mZ) = (a + m1 Z, · · · , a + mr Z).
Seja ψ a restrição de ϕ a (Z/mZ)∗ , então
∗
∗
∗
Z
Z
Z
ψ:
→
× ... ×
mZ
m1 Z
mr Z
também é uma bijeção.
Demonstração. Provemos inicialmente que ϕ está bem definida. De fato, se
b ≡ a (mod m), então para todo 1 ≤ i ≤ r, mi | m | (b − a), logo b ≡ a (mod mi ),
i.e., b + mi Z = a + mi Z.
Provemos agora que ϕ é injetiva. Suponha que ϕ(a + mZ) = ϕ(b + mZ), i.e.,
para todo 1 ≤ i ≤ r, a ≡ b (mod mi ). Como para i 6= j, mdc(mi , mj ) = 1,
concluimos que m | (a − b), i.e., a + mZ = b + mZ.
Provar que ϕ é sobrejetiva equivale a dizer que para todo (a1 + m1 Z, · · · , ar +
mr Z) ∈ Z/m1 Z × . . . × Z/mr Z é da forma ϕ(x + mZ) para algum x ∈ Z, i.e., que
o sistema (7.1) tema solução, o que já foi provado.
Provemos agora que um elemento inversı́vel módulo m tem imagem cujas
componentes são inversı́veis com respeito aos respectivos módulos. Suponha que
a + mZ ∈ (Z/mZ)∗ , i.e., mdc(a, m) = 1. Como m = m1 · · · mr , concluimos que
para cada 1 ≤ i ≤ r, mdc(a, mi ) = 1, i.e., a + mi Z ∈ (Z/mi Z)∗ . Como ψ é obtida
restringindo ϕ a um subconjunto do domı́nio, concluimos que ψ também é injetiva.
Quanto a sobrejetividade, seja (a1 + m1 Z, · · · , ar + mr Z) ∈ (Z/m1 Z)∗ × . . . ×
(Z/mr Z)∗ . Pela parte anterior sabemos que existe x ∈ Z tal que ϕ(x+mZ) = (a1 +
m1 Z, · · · , ar +mr Z). Observemos que na verdade x+mZ ∈ (Z/mZ)∗ . De fato, para
cada 1 ≤ i ≤ r, x + mi Z = ai + mi Z, i.e., x ≡ ai (mod mi ), mas mdc(ai , mi ) = 1,
logo mdc(x, mi ) = 1 para todo 1 ≤ i ≤ r. Como m = m1 · · · mr e mdc(mi , mj ) = 1
para i 6= j obtemos que mdc(x, m) = 1, i.e., x + mZ ∈ (Z/mZ)∗ .
Corolário 7.8. Para todo n ≥ 1 inteiro seja φ(n) = #(Z/nZ)∗ . Então
φ(m) = φ(m1 ) · · · φ(mr ).
7.5. Aplicação
Seja n = pe11 · · · perr a fatoração do inteiro n ≥ 1. Pelo corolário 7.8 e pelo lema
6.12,
(7.2) φ(n) = φ(pe11 ) · · · φ(perr ) = p1e1 −1 (p1 − 1) · · · prer −1 (pr − 1)
Y
1
1
1
= pe11 1 −
· · · perr 1 −
=n
1−
.
p1
pr
p
p|n
42
7. SISTEMAS DE CONGRUÊNCIA
Vamos utilizar a fórmula (7.2) para uma aplicação.
Proposição 7.9. Suponha que φ(n) = p seja um número primo. Então n = 3,
4 ou 6.
Qr Demonstração. Se r > 2, então ei = 1 para todo 1 ≤ i ≤ r. Logo φ(n) =
i=1 (pi − 1). Como r > 2 existem pelo menos dois primos ı́mpares na fatoração,
logo 4 | φ(n), o que não é possı́vel. Logo r ≤ 2. Suponhamos inicialmente r = 2,
i.e., φ(n) = pe11 −1 (p1 − 1)pe22 −1 (p2 − 1). Se p1 , p2 > 2 então (novamente) 4 | φ(n).
Logo p1 = 2 e φ(n) = 2e1 −1 p2e2 −1 (p2 − 1). Se e1 > 1, como p2 > 2, então 4 | φ(n).
Assim, e1 = 1 e φ(n) = p2e2 −1 (p2 − 1). Se e2 > 1, então φ(n) tem 2 e p2 como
fatores primos. Assim, e2 = 1 e φ(n) = pe22 −1 . Novamente, como este número é
primo, e2 = 1 e φ(n) = p2 − 1. Mas este número é par e primo, logo p2 = 3 e n = 6.
Suponhamos que r = 1, i.e., φ(n) = pe11 −1 (p1 − 1). Se p1 = 2, então φ(n) =
2e1 −1 . A única forma deste número ser primo é e1 = 2, logo n = 4. Suponha
p1 > 2. Se e1 > 1, então φ(n) tem 2 fatores primos p1 e 2 (pois p1 − 1 é par),
impossı́vel. Assim, e1 = 1 e φ(n) = p1 − 1. Isto já foi feito anteriormente, i.e.,
p1 = 3 e n = 3.
CAPı́TULO 8
Aplicações da teoria de grupos à teoria elementar
dos números
Neste capı́tulo desenvolveremos aplicações da teoria de grupos à aritmética
elementar. Utilizaremos os resultados do capı́tulo 9.
8.1. Primalidade de números de Mersenne
Para todo inteiro n ≥ 1, seja Mn := 2n − 1 o n-ésimo número de Mersenne.
Nosso objetivo é utilizar a teoria de grupos para determinar se Mn é primo ou obter
seu menor fator primo. Já provamos anteriormente que se n é composto, então Mn
também o é. Assim, consideraremos apenas Mp para p primo.
Seja q um fator primo de Mp , i.e., 2p ≡ 1 (mod q). Portanto em (Z/qZ)∗ temos
p
2 = 1, i.e., o(2) | p. Como p é primo temos que o(2) = 1 ou p. O primeiro caso
não pode ocorrer, pois 2 6= 1. Logo o(2) = p. Pelo teorema de Lagrange,
o(2) = p | #(Z/qZ)∗ = φ(q) = q − 1,
i.e., existe k ≥ 1 inteiro tal que q = 1 + kp.
Proposição 8.1. Todo fator primo de Mp é da forma 1+kp para algum inteiro
k ≥ 1.
Provamos√anteriormente que o menor fator primo de um número inteiro n ≥ 1
é no máximo n. Logo
√
2p/2 − 1
.
q ≤ 2p − 1 < 2p/2 , i.e. , k <
p
Dessa forma para determinar um fator primo de Mp testamos para cada inteiro k
tal que
2p/2 − 1
1≤k<
p
se 1 + kp é primo e se divide Mp . Se para cada k pelo menos um desses fatos não
ocorrer então Mp é um número primo.
8.2. Primalidade de números de Fermat
n
Para todo inteiro n ≥ 1, seja Fn := 22 + 1 o n-ésimo número de Fermat. Seja
n
n+1
q um fator primo de Fn . Então 22 ≡ −1 (mod q), logo 22
≡ 1 (mod q), i.e.,
2
2n+1
= 1 em (Z/qZ)∗ . Neste caso
o(2) | (2n+1 ), i.e. , o(2) = 2d para 1 ≤ d ≤ n + 1.
Afirmamos que d = n + 1. De fato, se d < n + 1, então
2n
2
2d
= (2 )2
43
n−d
= 1,
44
8. APLICAÇÕES DA TEORIA DE GRUPOS
o que é um absurdo, portanto o(2) = 2n+1 . Pelo teorema de Lagrange,
o(2) = 2n+1 | #(Z/qZ)∗ = φ(q) = q − 1,
i.e., existe k ≥ 1 tal que q = 1 + k2n+1 .
Proposição 8.2. Todo fator primo de Fn é da forma 1 + k2n+1 para algum
inteiro k ≥ 1.
Como no caso dos números de Mersenne, temos que
√ n
p n
22 + 1 − 1
2
q ≤ 2 + 1, i.e. , k ≤
.
2n+1
Dessa forma para determinar um fator primo de Fn testamos para cada inteiro k
tal que
√ n
22 + 1 − 1
1≤k<
2n+1
n+1
se 1 + k2
é primo e se divide Fn . Se para cada k pelo menos um desses fatos
não ocorrer então Fn é um número primo.
8.3. Números de Carmichael
O pequeno teorema de Fermat afirma que se p é um número primo e a ∈ Z
tal que p - a, então ap−1 ≡ 1 (mod p). Assim, isto funciona para todo 1 ≤ a < p
inteiro. Isto motiva a seguinte definição.
Definição 8.3. Seja n ≥ 3 inteiro ı́mpar e 1 ≤ b < n inteiro. Dizemos que n
é pseudoprimo na base b se bn−1 ≡ 1 (mod n).
Observação 8.4. Segue do pequeno teorema de Fermat que um número primo
p é pseudoprimo em toda base 1 ≤ b < p. Observe que a princı́pio para um número
composto n não podemos esperar que ele seja pseudoprimo em toda base. De fato,
seja d = mdc(b, n). Suponha que d > 1 e que n seja pseudoprimo na base b, i.e.,
existe k ∈ Z tal que bn−1 − 1 = kn. Logo d | 1, o que não é possı́vel. Assim
verificaremos a congruência apenas para as bases b tais que mdc(b, n) = 1, i.e.,
b ∈ (Z/nZ)∗ .
Definição 8.5. Seja n ≥ 3 ı́mpar composto. Suponha que para todo inteiro
1 ≤ b < n tal que mdc(b, n) = 1 tenhamos bn−1 ≡ 1 (mod n). Dizemos que n é um
número de Carmichael.
Exemplo 8.6. 561 é o menor número de Carmichael. É claro que provar isto
diretamente é trabalhoso, precisamos para cada inteiro
1 ≤ b < 561 tal que mdc(b, 561) = 1
verificar que
b560 ≡ 1
(mod 561).
Ao invés disto observemos que
561 = 3.11.17.
Dizer que
b560 ≡ 1
(mod 561)
8.4. TEOREMA DA RAIZ PRIMITIVA
45
equivale a dizer que 561 | (b560 − 1), i.e., que 3 | (b560 − 1), 11 | (b560 − 1) e
17 | (b560 − 1). Como mdc(b, 561) = 1, concluimos que mdc(b, 3) = mdc(b, 11) =
mdc(b, 17) = 1. Aplicando o pequeno teorema de Fermat concluimos que
b2 ≡ 1
b10 ≡ 1
b
16
≡1
(mod 3), logo b560 = (b2 )280 ≡ 1
(mod 3);
(mod 11), logo b560 = (b10 )56 ≡ 1
(mod 11);
(mod 17), logo b560 = (b16 )35 ≡ 1
(mod 17).
Generalizaremos agora o procedimento do exemplo, de forma a provar, a partir
da fatoração de n, que n é um número de Carmichael.
Teorema 8.7 (teorema de Korselt). Seja n ≥ 3 ı́mpar composto. n é um
número de Carmichael se e somente se
(1) n é livre de quadrados.
(2) Para todo fator primo p de n, (p − 1) | (n − 1).
Demonstração. Suponha que as 2 condições acima sejam satisfeitas. Seja
1 ≤ b < n inteiro tal que mdc(b, n) = 1. Afirmamos que para todo fator primo p de
n, temos bn−1 ≡ 1 (mod p).
De fato, como mdc(b, n) = 1, então mdc(b, p) = 1. Pelo pequeno teorema de
Fermat, bp−1 ≡ 1 (mod p). Por hipótese, existe k ∈ Z tal que n − 1 = k(p − 1),
logo bn−1 = (bp−1 )k ≡ 1 (mod p). Além disto temos que n fatora-se n = p1 · · · pr .
Como os pi ’s são distintos e para todo 1 ≤ i ≤ r, pi | (bn−1 − 1), concluimos que
n | (bn−1 − 1), i.e., bn−1 ≡ 1 (mod n).
Reciprocamente, seja p um fator primo de n e suponhamos que p2 | n. Observe
que
n−1
X n − 1
n−1
(p − 1)
=
(−1)n−1−i pi ≡ (n − 1)(−1)n−2 p + 1 6≡ 1 (mod p2 ),
i
i=0
logo (p − 1)n−1 6≡ 1 (mod n), portanto n não pode ser um número de Carmichael.
Observe que efetivamente, mdc(p − 1, n) = 1, pois se este mdc fosse igual a d,
concluiriamos que d | 1, assim d = 1.
Para provar a validade da segunda condição precisamos do teorema da raiz
primitiva que provaremos na seção seguinte. Ele afirma que se p é um número
primo, então o grupo (Z/pZ)∗ é um grupo cı́clico.
De fato, seja a um gerador de (Z/pZ)∗ . Então mdc(a, n) = 1 e uma vez que n é
um número de Carmichael, temos an−1 ≡ 1 (mod n). A fortiori, an−1 ≡ 1 (mod p).
Ou seja, an−1 = 1 em (Z/pZ)∗ . Logo, pelo lema chave, p − 1 = o(a) | (n − 1). 8.4. Teorema da raiz primitiva
Seja n ≥ 3 inteiro ı́mpar. Provamos anteriormente que φ(n) < n, i.e., φ(n) ≤
n − 1. Note que φ(n) conta exatamente a quantidade de classes a ∈ (Z/nZ)∗ tais
que mdc(a, n) = 1. Assim, φ(n) = n − 1 se e somente se n é primo. Se existir
uma classe a ∈ (Z/nZ)∗ tal que o(a) = n − 1, então (pelo teorema de Lagrange)
(n − 1) | φ(n), logo vale n − 1 = φ(n). Portanto, se (Z/nZ)∗ for cı́clico, então n é
primo. O objetivo deste capı́tulo é mostrar a recı́proca deste resultado.
Teorema 8.8 (teorema da raiz primitiva). Se p é primo, então (Z/pZ)∗ é
cı́clico.
46
8. APLICAÇÕES DA TEORIA DE GRUPOS
Note que (Z/4Z)∗ é cı́clico de ordem 2. Utilizando o teorema chinês dos restos
temos (como conseqüência do teorema da raiz primitiva) que (Z/2pZ)∗ também é
cı́clico para p primo.
Demonstração. Seja a1 ∈ (Z/pZ)∗ e d1 := o(a1 ). Se d1 = p − 1, acabou.
Senão, seja H1 o subgrupo cı́clico de (Z/pZ)∗ gerado por a1 . Temos que H1 $
(Z/pZ)∗ . Note que H1 coincide exatamente com as soluções de xd1 − 1 em (Z/pZ)∗ .
Seja b1 ∈ (Z/pZ)∗ \ H1 . Pelo mesmo argumento da prova da proposição 9.36 temos
que existe a2 ∈ (Z/pZ)∗ tal que o(a2 ) = mmc(o(a1 ), o(b1 )) > o(a1 ). Se o(a2 ) = p−1
acabou. Senão repetimos o argumento acima obtendo um elemento a3 cuja ordem
é estritamente maior que o(a2 ). Como todas essas ordens são no máximo p − 1 não
podemos ter uma seqüência estritamente crescente infinita de números menores que
p − 1. Portanto existe i tal que o(bi ) = p − 1.
Parte 2
Grupos
CAPı́TULO 9
Teoria de Grupos I
9.1. Definição e exemplos
Definição 9.1. Um grupo é um conjunto G munido de uma operação ∗ :
G × G → G dada por (x, y) 7→ x ∗ y satisfazendo às seguintes propriedades:
(1) (associatividade) para todo x, y, z ∈ G, x ∗ (y ∗ z) = (x ∗ y) ∗ z.
(2) (Elemento neutro) existe e ∈ G tal que e ∗ x = x ∗ e = x para todo x ∈ G.
(3) (Inverso) para todo x ∈ G existe y ∈ G tal que x ∗ y = y ∗ x = e.
O grupo G é dito abeliano ou comutativo se além disto x ∗ y = y ∗ x para todo
x, y ∈ G.
Em seguida daremos exemplos de grupos. Para fixar a notação suponha que
a operação seja de “multiplicação” e que o inverso de um elemento x ∈ G seja
denotado por x−1 .
Observação 9.2. Seja G um grupo e x, y ∈ G. Afirmamos que
(xy)−1 = y −1 x−1 .
De fato,
xy(y −1 x−1 ) = x(yy −1 )x−1 = xx−1 = 1
y −1 x−1 (xy) = y −1 (x−1 x)y = y −1 y = 1.
Definição 9.3. Um grupo G é dito finito se possui um número finito de elementos, caso contrário é dito infinito. Se G for um grupo finito, o número de
elementos de G é chamado a ordem de G e denotado por #G.
Exemplo 9.4 (grupos abelianos infinitos). Z, Q, R, C e ∗ = +.
Exemplo 9.5 (grupos abelianos infinitos). Q \ {0}, R \ {0}, C \ {0} e ∗ = . .
Exemplo 9.6. Seja
M2 (R) :=
a b
c d
| a, b, c, d ∈ R
o conjunto das matrizes 2 × 2 com entradas reais. Este conjunto é um grupo com
a operação sendo a soma de matrizes. Seja
a b
GL2 (R) :=
∈ M2 (R) | ad − bc 6= 0 .
c d
Todas estas matrizes são inversı́veis com respeito à multiplicação de matrizes. Assim GL2 (R) munido do produto de matrizes é um grupo chamado grupo linearem
49
50
9. TEORIA DE GRUPOS I
dimensão 2 sobre os reais. Ambos os grupos são infinitos. O primeiro é abeliano.
Notemos que GL2 (R) não é comutativo. De fato,
0 1
1 0
1 1
=
e
1 0
1 1
1 0
1 0
0 1
0 1
=
.
1 1
1 0
1 1
Exemplo 9.7. Seja G = Z/nZ e ∗ = ⊕. Este é um grupo abeliano de ordem
n. Seja G = (Z/nZ)∗ e ∗ = . Este é um grupo de ordem φ(n).
Exemplo 9.8. Denotamos por S∆ o grupo das simetrias do triângulo equilátero. A operação será ◦, a composição de funções. Fixemos os vértices do triângulo
no cı́rculo unitário
S1 := {z ∈ C | |z| = 1} por V1 = e2πi , V2 = e2πi/3 e V3 = e4πi/3 .
Cada simetria será uma função bijetiva f : {V1 , V2 , V3 } → {V1 , V2 , V3 } dada por
f (Vi ) = Vσ(i) , onde denotamos f na forma matricial por
1
2
3
.
σ(1) σ(2) σ(3)
Denotamos α := R2π/3 a rotação de 2π/3 que é dada por
1 2 3
α=
.
2 3 1
A rotação de 4π/3, R4π/3 = R2π/3 ◦ R2π/3 que será denotada por α2 é dada por
1 2 3
2
.
α =
3 1 2
Finalmente a rotação de 2π = 6π/3 nada mais é que id e é denotada por α3 , assim
α3 = id. Além disto temos as simetrias em relação às retas que passam pelos
vértices e pelo centro do lado oposto, denotamos estas retas por li para i = 1, 2, 3.
Seja β := Sl3 a simetria em relação à reta l3 ,
1 2 3
β=
.
2 1 3
Note que β 2 = id. Seja Sl1 a simetria em relação à reta l1 ,
1 2 3
Sl1 =
.
1 3 2
Novamente Sl23 = id. Finalmente,
Sl2 =
1
3
2
1
3
2
e Sl22 = id. Assim, S∆ = {id, α, α2 , β, Sl1 , Sl2 }. Para provar que S∆ é um grupo
precisamos verificar as 3 propriedades da definição. A associatividade segue do
fato de composição de funções ser associativa. O elemento neutro segue do fato
que a composição da identidade com qualquer função ser a qualquer função. Basta
portanto verificar os inversos. De
α3 = αα2 = id
9.1. DEFINIÇÃO E EXEMPLOS
51
concluimos que
α−1 = α2 e que (α2 )−1 = α.
De
β 2 = ββ = id,
concluimos que
β −1 = β.
Antes de verificarmos os dois restantes calculemos
1 2 3
1 2 3
1 2 3
αβ =
=
= Sl 1 e
2 3 1
2 1 3
1 3 2
1 2 3
1 2 3
1 2 3
2
α β=
=
= Sl 2 .
3 1 2
2 1 3
3 2 1
Geometricamente já verificamos que (αβ)2 = (α2 β)2 = id, logo (αβ)−1 = αβ e
(α2 β)−1 = α2 β. Dessa forma S∆ é um grupo de ordem 6. Vamos ver isto de forma
puramente algébrica e aproveitar para mostrar que S∆ não é abeliano. Calculemos,
1 2 3
1 2 3
1 2 3
(9.1)
βα =
=
= α2 β.
2 1 3
2 3 1
3 2 1
Pela observação 9.2 e por (9.1) temos que
(αβ)−1 = β −1 α−1 = βα2 = α2 βα = α4 β = αβ
e
(α2 β)−1 = β −1 (α2 )−1 = βα = α2 β.
Exemplo 9.9. O grupo S das simetrias do quadrado. Denotamos os vértices
por
V1 = e2πi , V2 = eπi/2 , V3 = eπi e V4 = e3πi/2 .
Seja α := Rπ/2 a rotação por π/2 que é dada por
1 2 3 4
α=
,
2 3 4 1
a rotação de π é dada por
Rπ := α2 =
1
3
2
4
4
,
2
3
1
a rotação de 3π/2 é dada por
R3π/2 := α3 =
1
4
2
1
3
2
4
3
e a rotação de 2π é dada por R2π := α4 = id. Temos também a simetria em relação
às retas l1 , respectivamente l3 , passando por divindo ao meio os lados V1 V4 e V2 V3 ,
respectivamente V1 V2 e V3 V4 . Assim,
1 2 3 4
β := Sl3 =
2 1 4 3
e
1 2 3 4
Sl1 =
.
4 3 2 1
52
9. TEORIA DE GRUPOS I
Notemos que geometricamente β 2 = Sl21 = id. Finalmente temos as simetrias em
relação às diagonais d1 , respectivamente d2 , dada por V1 V3 , respectivamente V2 V4 .
Assim,
1 2 3 4
Sd1 =
1 4 3 2
e
1 2 3 4
Sd2 =
.
3 2 1 4
Novamente, geometricamente Sd21 = Sd22 = id. O conjunto S fica portanto dado
por S = {id, α, α2 , α3 , β, Sl1 , Sd1 , Sd2 }. Como no exemplo anterior, para provar
que é um grupo basta calcular os inversos. Inicialmente,
α4 = αα3 = α2 α2 = id,
logo
α−1 = α3 , (α3 )−1 = α e (α2 )−1 = α2 .
Os demais já foram calculados geometricamente. Mostraremos que este grupo não
é abeliano e refaremos os cálculos algebricamente. Calculemos,
1 2 3 4
1 2 3 4
1 2 3 4
αβ =
=
= Sd1 ,
2 3 4 1
2 1 4 3
1 4 3 2
1 2 3 4
1 2 3 4
1 2 3 4
α2 β =
=
= Sl1 e
3 4 1 2
2 1 4 3
4 3 2 1
1 2 3 4
1 2 3 4
1 2 3 4
3
α β=
=
= Sd2 .
4 1 2 3
2 1 4 3
3 2 1 4
A primeira observação é que
1 2 3 4
1
βα =
2 1 4 3
2
2
3
3
4
4
1
=
1
3
2
2
3
1
4
= α3 β.
4
Logo,
(αβ)−1 = β −1 α−1 = βα3 = α3 βα2 = α6 βα = α2 α3 β = αβ,
(α2 β)−1 = β −1 (α2 )−1 = βα2 = α3 βα = α6 β = α2 β
3
−1
(α β)
=β
−1
3 −1
(α )
e
3
= βα = α β.
9.2. Subgrupos
Definição 9.10. Seja G um grupo, um subconjunto H de G é dito um subgrupo de G, se 1 ∈ H, dados x, y ∈ H, xy ∈ H e dado x ∈ H, x−1 ∈ H.
Exemplo 9.11. Seja G = Z e n ≥ 1. Note que nZ é um subgrupo de Z. De
fato, 0 = n.0 ∈ nZ, x = nk, y = nl, k, l ∈ Z, então x + y = n(k + l) ∈ nZ
e −x = n(−k) ∈ nZ. Afirmamos mais, que todo subgrupo de Z é da forma nZ
para algum n ≥ 1. De fato, seja H ⊂ Z um subgrupo. Por definição H ∩ N 6= ∅.
Seja n o menor elemento de H ∩ N. É claro que nZ ⊂ H, pela definição de H.
Reciprocamente, se x ∈ H ∩ N. Pelo algoritmo da divisão existem q, r ∈ Z tais que
x = nq + r com 0 ≤ r < n. Note que r = x − nq ∈ H. Assim r = 0 e x ∈ nZ. Se
x ∈ H e x < 0, seja y = −x ∈ H ∩ N. Pelo que foi feito anteriormente, y = kn, em
particular x = −y = (−k)n ∈ nZ.
9.2. SUBGRUPOS
53
Exemplo 9.12. Seja n ≥ 1 inteiro e
µn := {z ∈ C | z n = 1}.
Afirmamos que este é um subgrupo de C \ {0}. De fato, 1n = 1, logo 1 ∈ µn , se
x, y ∈ µn , então
(xy)n = xn y n = 1,
logo xy ∈ µn e se x ∈ µn , então x−1 C \ {0}, logo
(x−1 )n = (xn )−1 = 1
e x−1 ∈ µn . Este é um grupo abeliano chamado o grupo das raı́zes n-ésimas da
unidade. Seja ζ := e2πi/n , ζ ∈ µn e o menor inteiro positivo m ≥ 1 tal que ζ m = 1
é n. Afirmamos que
µn = {1, ζ, · · · , ζ n−1 }.
De fato, a inclusão ⊃ é clara. Se z ∈ µn , então |z| = 1 e z = eiθ , onde θ = k2π
para k ∈ Z. Se k ≥ 1, então, pelo algoritmo da divisão, existem q, r ∈ Z tais que
k = qn + r com 0 ≤ r < n. Logo
z = ζ k = (ζ n )q ζ r = ζ r
e z ∈ {1, ζ, · · · , ζ n−1 }. Se k < 0, digamos k = −l, então ζ l ∈ {1, ζ, · · · , ζ n−1 }, e
z = ζ k = ζ −l = ζ n−l ∈ {1, ζ, · · · , ζ n−1 }. Finalmente, temos uma bijeção
µn → Z/nZ dada por ζ k 7→ k.
De fato, a sobrejetividade segue da definição de Z/nZ. E a injetividade uma vez
que se k = l, então n | (k − l), o que só é possı́vel se k = l.
Exemplo 9.13. Seja G := GL2 (R) e
a 0
D2 (R) :=
| ad 6= 0
0 d
o conjunto das matrizes diagonais. Este é um subgrupo de GL2 (R), pois
1 0
∈ D2 (R),
0 1
se A, B ∈ D2 (R), digamos
A=
a 0
0 d
eB=
a0
0
0
,
d0
então
aa0
0
0
dd0
a−1
0
0
AB =
−1
A
=
d−1
∈ D2 (R),
∈ D2 (R).
Exemplo 9.14. Seja G := S , então {1, α, α2 , α3 } é um subgrupo de S , como
também {1, β}.
54
9. TEORIA DE GRUPOS I
9.3. Classes Laterais e Teorema de Lagrange
Definição 9.15. Seja G um grupo e H um subgrupo de G. Dados x, y ∈ G
definimos x ∼D y se e somente se x = yα, para algum α ∈ H. Definimos também
x ∼E y se e somente se x = αy para algum α ∈ H.
Observação 9.16. As relações binárias ∼E e ∼D são relações de equivalência.
De fato, x = x.1, logo x ∼D x. Se x ∼D y, então x = yα, para algum α ∈ H,
logo y = xα−1 e como H é um subgrupo de G, α−1 ∈ H, portanto y ∼D x. Se
x ∼D y e y ∼D z, então x = yα e y = zβ, para α, β ∈ H. Logo x = zβα e βα ∈ H,
pois H é um subgrupo de G, donde x ∼D z. Fica como exercı́cio fazer a mesma
demonstração para ∼E .
Definição 9.17. Dado x ∈ G denotamos por
xH := {xα | α ∈ H}
sua classe de equivalência com relação a ∼D , esta é chamada de classe lateral a
direita de x em H. Seja
CLD := {xH | x ∈ G}
o conjunto das classes laterais a direita de H em G. Similarmente, definimos a
classe lateral a esquerda de x em H por
Hx := {αx | α ∈ H}
e
CLE := {Hx | x ∈ G}
o conjunto das classes laterais a esquerda de H em G.
Lema 9.18. Existe uma bijeção
ϕ : CLD → CLE dada por ϕ(xH) = Hx−1 .
Demonstração. Dado y ∈ G, existe x ∈ G tal que y = x−1 , logo Hy =
Hx = ϕ(xH) e ϕ é sobrejetiva. Se ϕ(xH) = ϕ(yH), então Hx−1 = Hy −1 , i.e.,
existe α ∈ H tal que x−1 = αy −1 , i.e., x = yα, i.e., x ∼D y, i.e., xH = yH,
portanto ϕ é injetiva.
−1
A partir de agora nesta seção suponhamos que G seja um grupo finito. Observe
que
(9.2)
G=
·
[
x∈G
xH =
·
[
Hx.
x∈G
Concluimos que o número de classes laterais (a direita ou a esquerda) de H em G
também é finito. Denotamos este número por (G : H) e chamamos o ı́ndice de H
em G.
Lema 9.19. Para todo x ∈ G, existe uma bijeção
ψ : H → xH dada por α 7→ xα.
Demonstração. Pela definição de xH concluimos que ψ é sobrejetiva. Se
ψ(α) = ψ(β), i.e., xα = xβ, multiplicando os dois lados por x−1 a esquerda,
obtemos que α = β, portanto, ψ é injetiva.
9.4. ORDEM DE ELEMENTO E EXPOENTE DE GRUPO ABELIANO
55
Teorema 9.20 (teorema de Lagrange). Seja G um grupo finito e H um subgrupo de G. Então
#G = (G : H)|H|.
Demonstração. Segue imediatamente de (9.2) e do lema 9.19.
Corolário 9.21. Seja H um grupo finito e H um subgrupo de G. Então |H|
divide |G|.
9.4. Ordem de elemento e expoente de grupo abeliano
Definição 9.22. Seja G um grupo e x ∈ G. Definimos
o(x) := min{n ≥ 1 | xn = 1, n ∈ Z}
ou o(x) = ∞ caso não exista n ≥ 1 inteiro satisfazendo xn = 1. O número o(x) é
chamado a ordem de x.
Exemplo 9.23. Seja G = Z e x = 1. Como para todo n ≥ 1, nx 6= 0,
concluimos que o(1) = ∞.
Lema 9.24 (lema chave). Seja x ∈ G de ordem n. Suponha que exista t ≥ 1
tal que xt = 1. Então n | t.
Demonstração. Pelo algoritmo de euclides existem q, r ∈ Z tais que t =
qn + r com 0 ≤ r < n. Logo
1 = xt = xqn xr = xr ,
assim pela definição da ordem de x concluimos que r = 0.
Exemplo 9.25. Seja G := µn para n ≥ 1 inteiro e x := ζ = e2πi/n . Então
o(ζ) = n. Afirmamos mais ainda que
o(ζ i ) = n se e somente se mdc(i, n) = 1 para 0 ≤ i < n.
De fato, se mdc(i, n) = d > 1, então i = di0 e n = dn0 com n0 < n. Por outro lado
0
0
0
0
0
0
(ζ i )n = ζ in = ζ i dn = ζ i n = (ζ n )i = 1,
mas isto contradiz o(ζ i ) = n. Reciprocamente, suponha que 1 ≤ o(ζ i ) = m < n.
Então ζ im = 1, i.e., pelo lema chave im = kn para algum k ≥ 1 inteiro. Como
m < n, então existe algum fator primo p de n tal que p | i, logo mdc(i, n) > 1.
Além disto temos uma bijeção entre
Pn := {ζ i | mdc(i, n) = 1}
e (Z/nZ)∗ dada por ζ i 7→ i. Por definição de (Z/nZ)∗ esta aplicação é sobrejetiva
e a injetividade segue de i = j implicar em n | (i − j) o que apenas ocorre se i = j.
O conjunto Pn é chamado o conjunto das raı́zes primitivas n-ésimas da unidade.
Mostramos em particular que #Pn = φ(n).
Exemplo 9.26. Seja G = GL2 (R) e
0
x=
1
1
.
0
É imediato verificar que o(x) = 2.
Exemplo 9.27. Seja G := S e x = α, então o(α) = 4.
56
9. TEORIA DE GRUPOS I
Observação 9.28. Seja G um grupo e suponha que para todo x ∈ G, o(x) = 2.
Então G é abeliano. De fato, o(x) = 2 significa que x2 = 1, i.e., x−1 = x. Assim,
xy = x−1 y −1 = (yx)−1 = yx.
Definição 9.29. Seja G um conjunto e S um subonjunto de G contendo 1.
Seja
hSi := {x1 · · · xr | ai ∈ S ou a−1
∈ S}.
i
Lema 9.30. hSi é um subgrupo de G.
Demonstração. De fato, 1 ∈ hSi. Se x, y ∈ hSi, então x = x1 · · · xr com
xi ∈ S ou x−1
∈ S e y = y1 · · · ys tal que jj ∈ S ou yj−1 ∈ S. Logo xy ∈ hSi.
i
Finalmente, se x ∈ S, então
−1
x−1 = x−1
r · · · x1
−1
e x−1
∈ S ou (x−1
= xi ∈ S. Logo x−1 ∈ hSi.
i
i )
Definição 9.31. O subgrupo hSi é chamado o subgrupo de G gerado por S.
Estamos particularmente interessados no caso em que S = {α}. Neste caso dizemos
que o grupo hSi é um grupo cı́clico. Distinguimos duas situações. Na primeira
o(α) = n < ∞. Neste caso, hαi = {1, α, · · · , αn−1 } e este conjunto corresponde
bijetivamente a Z/nZ por αi 7→ i. O segundo caso é aquele no qual o(α) = ∞.
Neste caso hαi = {αr | r ∈ Z} e corresponde bijetivamente a Z por αr 7→ r.
Corolário 9.32 (corolário 2 do teorema de Lagrange). Seja G um grupo finito
e x ∈ G. Então o(x) | #G.
Demonstração. Pelo exemplo anterior, o(x) < ∞ e o(x) = #hxi. Pelo teorema de Lagrange #hxi | #G.
Definição 9.33. Seja G um grupo abeliano. Definimos o expoente de G por
exp(G) := mmc{o(z) | z ∈ G} ou ∞, se existir z ∈ G tal que o(z) = ∞.
Observação 9.34. É claro que se G é finito, então exp(G) < ∞. Mas a
recı́proca não é verdade. Por exemplo se G = Z/2Z × . . . Z/2Z × . . ., então para
cada x ∈ G \ {1}, onde 1 = (0, · · · , 0, · · · ), o(x) = 2, logo exp(G) = 2, mas G é
infinito.
Proposição 9.35. Seja G um grupo abeliano e z1 , · · · , zr ∈ G tais que o(zi ) <
∞ para todo i. Então
(i) o(z1 · · · zr ) | mmc{o(z1 ), · · · , o(zr )} | o(z1 ) · · · o(zr ).
(ii) Se para todo i 6= j, mdc(o(zi ), o(zj )) = 1, então o(z1 · · · zr ) = o(z1 ) · · ·
o(zr ).
Demonstração. (i) Seja M := mmc{o(z1 ), · · · , o(zr )}. Então, (z1 · · · zr )M =
· · · zrM = 1, pelo lema chave concluimos que o(z1 · · · zr ) | M . A outra divisibilidade é imediata.
(ii) A segunda igualdade é uma propriedade dos inteiros positivos (basta lembrar que o mmc é obtido tomando o maior expoente na fatoração em números
primos). Vamos provar a primeira igualdade por indução em r. A primeira etapa
é provar para r = 2.
z1M
9.4. ORDEM DE ELEMENTO E EXPOENTE DE GRUPO ABELIANO
57
Seja N := o(z1 z2 ). Como G é abeliano, então
1 = (z1 z2 )N = z1N z2N , i.e. , z1−N = z2N .
Mas isto significa que z1−N = z2N ∈ hz1 i ∩ hz2 i, mas esta interseção é igual a {1},
pois mdc(o(z1 ), o(z2 )) = 1. Portanto, z1N = z2N = 1, mas isto implica que M | N .
Suponhamos que tenhamos provado que o(z1 · · · zr−1 ) = o(z1 ) · · · o(zr−1 ) com
mdc(o(zi ), o(zj )) = 1 para i 6= j. Utilizando que G é abeliano, e estendo a definição
de N para r fatores, temos que
1 = (z1 . . . zr−1 )N zrN , i.e. , (z1 . . . zr−1 )N = zr−N .
Mas isto significa que (z1 . . . zr−1 )N = zr−N ∈ hz1 , · · · , zr−1 i ∩ hzr i, mas este grupo
é trivial pois a ordem do primeiro grupo é igual a o(z1 ) . . . o(zr−1 ) e a ordem do
segundo é igual a o(zr ) e mdc(o(zi ), o(zj )) = 1, se i 6= j. Assim, (z1 . . . zr−1 )N =
zrN = 1, donde M | N .
Observe que pelo teorema de Lagrange, se G for finito, então exp(G) | #G.
Proposição 9.36. Seja G um grupo abeliano tal que exp(G) < ∞. Então
(a) Existe y ∈ G tal que exp(G) = o(y).
(b) G é cı́clico se e somente se exp(G) = #G.
Demonstração. (a) Seja exp(G) = pe11 · · · perr a fatoração de exp(G). Por
definição para todo i = 1, · · · , r existe yi ∈ G tal que o(yi ) = pei i qi tal que pi - qi .
Note que se zi = yiqi , então o(zi ) = pei i . Neste caso, pelo ı́tem (ii) da proposição
9.35 temos que se y = z1 · · · zr , então o(y) = exp(G).
(b) Se G for cı́clico, então existe x ∈ G tal que hxi = G e o(x) = #G. Por outro
lado, pelo ı́tem anterior, existe y ∈ G tal que o(y) = exp(G). Mas, exp(G) | #G e
o(x) | exp(G), logo exp(G) = #G. Reciprocamente, se vale a igualdade, pelo ı́tem
anterior existe y ∈ G tal que o(y) = exp(G) = #G, logo G é cı́clico.
CAPı́TULO 10
Teoria de grupos II
10.1. Subgrupos normais e grupos quocientes
Seja G um grupo e H um subgrupo de G. Seja
G/H := {xH | x ∈ G}
o conjunto das classes laterais a direita de H em G. Analogamente ao caso em que
G = Z e H = nZ, para n ≥ 1 inteiro, queremos definir em G/H uma estrutura de
grupo. Para isto precisamos de uma propriedade adicional de H. Se copiarmos o
que foi feito anteriormente a idéia é definir a função
ψ : G/H × G/H → G/H
dada por
(xH, yH) 7→ xyH.
O problema é verificar que ψ está bem definida. Sejam x0 , y 0 ∈ G tais que x0 H = xH
e y 0 H = yH, i.e., x0 = xα e y 0 = yβ para α, β ∈ H. Assim
x0 y 0 = xαyβ.
Mas a princı́pio G não é comutativo e não podemos trocar y com α para concluir
que ψ está bem definida.
Definição 10.1. Um subgrupo H de um grupo G é dito normal se e somente
se para todo x ∈ G temos xHx−1 ⊂ H. Denotamos H C G.
Lema 10.2. Seja G um grupo e H um subgrupo de G. As seguintes condições
são equivalentes:
(i) H C G.
(ii) Para todo x ∈ G, xHx−1 = H.
(iii) Para todo x ∈ G, xH = Hx.
Demonstração. Suponha que H CG. A inclusão ⊂ já está feita por definição.
Uma vez que (x−1 )−1 = x, segue também da definição que x−1 Hx ⊂ H, i.e.,
H ⊂ xHx−1 . Assim vale (ii).
Suponha que para todo x ∈ G, xHx−1 = H. Seja α ∈ H. Por hipótese
−1
xαx = β ∈ H, logo xα = βx ∈ Hx. Reciprocamente, como x−1 αx = γ ∈ H,
então αx = xγ ∈ xH. Disto segue (iii).
Suponha que para todo x ∈ G, xH = Hx. Por hipótese para todo α ∈ H existe
β ∈ H tal que xαx−1 = βxx−1 = β. Donde (i).
Suponhamos que H C G, pelo lema 10.2, existe γ ∈ H tal que
x0 y 0 = xαyβ = xyγβ ∈ xyH,
pois γβ ∈ H. Assim x0 y 0 H = xyH e ψ está bem definida.
59
60
10. TEORIA DE GRUPOS II
Definição 10.3. Seja G um grupo e H C G um subgrupo de normal de G. O
conjunto G/H e a função ψ definem uma estrutura de grupo em G/H chamado o
grupo quociente.
Exemplo 10.4. Seja G um grupo finito e H um subgrupo de G. Suponha que
(G : H) = 2. Afirmamos que H C G. De fato, como (G : H) = 2, isto significa que
temos apenas suas classes laterais a direita, a saber, H e xH para x ∈
/ H. Também
sabemos que o número de elementos de CLD é igual ao de CLE, logo as únicas
classes laterais a direita são H e Hx, como Hx 6= H e xH 6= H, concluimos que
xH = Hx, para todo x ∈ G − H. Esta igualdade também é imediata se x ∈ H.
Logo H C G.
Exemplo 10.5. Seja G = S e H = {1, α, α2 , α3 }. Temos que H C G, pois
(G : H) = |G|/|H| = 2, pelo teorema de Lagrange e pelo exemplo anterior.
Exemplo 10.6. Seja G um grupo. Definimos por
Z(G) := {x ∈ G | xy = yx para todo y ∈ G},
o centro de G. Afirmamos que Z(G) C G.
Primeiro temos que verificar que Z(G) é realmente um subgrupo de G. De
fato, 1.y = y.1 = y para todo y ∈ G, logo 1 ∈ Z(G). Se x, z ∈ Z(G) e y ∈ G,
então xzy = xyz = yxz, i.e., xz ∈ Z(G). Se x ∈ Z(G), então para todo y ∈ G,
x−1 y = (y −1 x)−1 = (xy −1 )−1 = yx−1 , i.e., x−1 ∈ Z(G).
Finalmente, dado x ∈ G e y ∈ Z(G), temos que xyx−1 = yxx−1 = y ∈ Z(G),
i.e., Z(G) C G. Podemos ainda dizer mais, se H é um subgrupo de Z(G) então
H C G. De fato, automaticamente H é um subgrupo de G, além disto como para
todo x ∈ G e y ∈ H temos que xyx−1 = yxx−1 = y ∈ H, pois H ⊂ Z(G).
Note que G é abeliano se e somente se Z(G) = G. Assim, o quanto maior for
o centro de G, mais G estará próximo a ser abeliano.
Exemplo 10.7. Seja G um grupo. Denotamos por [G, G] o subgrupo de G
gerado pelo conjunto
{xyx−1 y −1 | x, y ∈ G}.
Este grupo é chamado o subgrupo dos comutadores.
Note que G é abeliano se e somente se [G, G] = {1}. Assim, o quanto menor
for o subgrupo dos comutadores, mais G estará próximo a ser abeliano.
Afirmamos também que [G, G] C G. Seja α ∈ [G, G], digamos
α = α1 · · · αr ,
onde para todo i,
−1
−1
αi = xi yi x−1
ou αi−1 = xi yi x−1
i yi
i yi ,
para xi yi ∈ G. A última igualdade se reescreve como αi = yi xi yi−1 x−1
i . Seja z ∈ G,
então
zyz −1 = zα1 z −1 · · · zαr z −1
e observe que para cada i temos
−1 −1
zαi z −1 = zxi yi x−1
∈ {xyx−1 y −1 | x, y ∈ G} ou
i yi z
−1
zαi z −1 = zyi xi yi−1 x−1
∈ {xyx−1 y −1 | x, y ∈ G}.
i z
10.2. HOMOMORFISMO DE GRUPOS
61
Observação 10.8. Observe também que G/[G, G] é um grupo abeliano. Além
disto, se H C G for tal que G/H é abeliano, então H contém [G, G]. De fato, se
dados x, y ∈ G temos xyH = xHyH = yHxH = yxH, então existe α ∈ H tal que
x−1 y −1 xy ∈ H. Consequentemente, todo elemento de [G, G] está contido em H.
10.2. Homomorfismo de grupos
Sejam G e G dois grupos. O objetivo é compará-los e verificar que suas estruturas são as mesmas.
Definição 10.9. Um homomorfismo de grupos é uma função f : G → G tal
que f (xy) = f (x)f (y).
Observação 10.10.
(a) Seja 1G o elemento neutro de G e 1G o elemento
neutro de G. Então f (1G ) = 1G . De fato, f (1G ) = f (1G 1G ) = f (1G )
f (1G ), logo f (1G ) = 1G .
(b) Para todo x ∈ G temos que f (x−1 ) = f (x)−1 . De fato, f (x)f (x−1 ) =
f (xx−1 ) = f (1G ) = 1G e f (x−1 )f (x) = f (x−1 x) = f (1G ) = 1G .
Exemplo 10.11.
(1) Seja G = G = Z, n ≥ 1 inteiro e f : Z → Z definida
por f (x) = nx. f é um homomorfismo. De fato, f (x + y) = n(x + y) =
nx + ny = f (x) + f (y).
(2) Seja G um grupo e H um subgrupo normal de G e f : G → G/H
definida por f (x) = xH é um homomorfismo. De fato, f (xy) = (xy)H =
(xH)(yH) = f (x)f (y), por definição de produto de classes.
(3) Seja G um grupo e fixemos a ∈ G. Consideremos a função Ia : G → G
definida por Ia (x) = axa−1 . Esta função é um homomorfismo. De fato,
Ia (xy) = a(xy)a−1 = (axa−1 )(aya−1 ) = Ia (x)Ia (y).
A partir de agora deixaremos ao cargo do leitor identificar quando a unidade
referida por 1 está em G ou em G.
Proposição 10.12. Seja f : G → G um homomorfismo de grupos e
ker(f ) := {x ∈ G | f (x) = 1}
o núcleo
(i)
(ii)
(iii)
(iv)
(v)
(vi)
(vii)
de f .
ker(f ) C G.
f é injetiva se e somente se ker(f ) = {1}.
f (G) é um subgrupo de H.
f −1 (f (H)) = H ker(f ).
Seja H < G tal que f −1 (H) ⊃ ker(f ). Então f (f −1 (H)) = H ∩ f (G).
Se x ∈ G é tal que o(x) < ∞ então o(f (x)) < ∞ e o(f (x)) | o(x).
Se H C G, então f (H) C f (G). Se H C f (G), então f −1 (H) C G.
Demonstração. (i) Seja a ∈ G e x ∈ ker(f ), então f (axa−1 ) = f (a)f (x)
f (a ) = f (a)f (a)−1 = 1, i.e., axa−1 ∈ ker(f ).
(ii) Suponha que f seja injetiva e x ∈ ker(f ). Logo f (x) = 1 = f (1), i.e., x = 1.
Reciprocamente, se ker(f ) = {1} e se f (x) = f (y), então f (x)f (y)−1 = f (xy −1 ) =
1, i.e., xy −1 ∈ ker(f ), logo xy −1 = 1, i.e., x = y.
(iii) É claro que 1 = f (1) ∈ f (G). Sejam x, y ∈ f (G), i.e., existem a, b ∈ G
tais que x = f (a) e y = f (b). Logo xy = f (a)f (b) = f (ab) ∈ f (G). Se x ∈ f (G),
digamos x = f (a) para a ∈ G, então x−1 = f (a)−1 = f (a−1 ) ∈ f (G).
−1
62
10. TEORIA DE GRUPOS II
Para provar a propriedade (iv) precisamos do seguinte lema.
Lema 10.13. Sejam H e K subgrupos de um grupo G. Definimos
HK := {ab | a ∈ H, b ∈ K}.
Então HK < G se e somente se HK = KH. Além disto, se H C G ou K C G,
então HK < G.
Demonstração. Suponha que HK < G. Seja α ∈ HK. Então α−1 ∈ HK,
digamos α−1 = ab. Assim α = (α−1 )−1 = b−1 a−1 ∈ KH, i.e., HK ⊂ KH. Seja
α ∈ KH, digamos α = ab. Logo α−1 = b−1 a−1 ∈ HK. Como HK < G, então
α = (α−1 )−1 ∈ HK, i.e., KH ⊂ HK.
Reciprocamente, suponha que HK = KH. Então 1 = 1.1 ∈ HK. Se x, y ∈
HK, digamos x = ab e y = cd, então xy = abcd = ac0 b0 d ∈ HK, onde bc = c0 b0 ∈
HK, uma vez que HK = KH. Se x = ab ∈ HK, então x−1 = b−1 a−1 = a0 b0 ∈
HK, pela mesma razão.
Suponha que H C G (o outro caso é análogo). Seja x = ab ∈ HK. Então
x = bb−1 ab = b(b−1 ab) = ba0 ∈ KH, logo HK ⊂ KH. Se x = ab ∈ KH, então
x = abaa−1 = (aba−1 )a = b0 a ∈ HK, i.e., KH ⊂ HK.
Continuação da prova da proposição. (iv) Notemos inicialmente que como ker(f ) C G, H ker(f ) < G. Seja a ∈ f −1 (f (H)), i.e., f (a) = f (b) ∈ f (H). Logo
f (a)f (b)−1 = f (ab−1 ) = 1, i.e., ab−1 = c ∈ ker(f ), i.e., a = bc = c0 b0 ∈ H ker(f ).
Reciprocamente, se x = ab ∈ H ker(f ), então f (x) = f (ab) = f (a)f (b) = f (a) ∈
f (H), i.e., x ∈ f −1 (f (H)).
(v) Seja x ∈ f (f −1 (H)), i.e., x = f (a) para a ∈ f −1 (H), i.e., f (a) = y ∈ H.
Portanto, x ∈ H ∩ f (G). Reciprocamente, suponha que x ∈ H ∩ f (G). Logo
x = f (a) ∈ H, i.e., a ∈ f −1 (H), logo x ∈ f (f −1 (H)).
(vi) Seja d = o(x), logo xd = 1 e f (xd ) = f (x)d = f (1) = 1, pelo lema chave,
o(f (x)) | o(x), em particular o(f (x)) < ∞.
(vii) Suponha que H C G e sejam a ∈ G e x ∈ H. Logo axa−1 ∈ H. Por outro
lado, f (x) ∈ f (H) e f (a) ∈ f (G) ⊂ G. Assim, f (axa−1 ) = f (a)f (x)f (a)−1 ∈ f (H).
Suponha que H C f (G). Sejam x ∈ f −1 (H) e a ∈ G, i.e., f (x) = y ∈ H. Como
H C f (G), então f (a)yf (a)−1 ∈ H, mas f (a)yf (a)−1 = f (axa−1 ), i.e., axa−1 ∈
f −1 (H).
Definição 10.14. Seja f : G → G um homomorfismo de grupos. Se f é bijetivo
dizemos que f é um isomorfismo de grupos.
Teorema 10.15 (teorema do isomorfismo de grupos). Seja f : G → G um
homomorfismo de grupo. Então f induz um isomorfismo de grupos ϕ : G/ ker(f ) →
f (G) definido por
ϕ(x ker(f )) := f (x).
Além disto existe uma bijeção entre os seguintes conjuntos
{H < G | H ⊃ ker(f )} e {H < f (G)}.
Demonstração. Notemos inicialmente que ϕ está bem definido. De fato, se
x = ya para a ∈ ker(f ), então ϕ(x ker(f )) = f (x) = f (ya) = f (y)f (a) = f (y) =
ϕ(y ker(f )). Além disto, pela sua própria definição ϕ é sobrejetivo. Quanto a
10.2. HOMOMORFISMO DE GRUPOS
63
injetividade, se ϕ(x ker(f )) = ϕ(y ker(f )), então f (x) = f (y), i.e., f (x)f (y)−1 =
f (xy −1 ) = 1, i.e., xy −1 ∈ ker(f ), logo x ker(f ) = y ker(f ).
A bijeção entre os dois conjuntos é dada pelas funções ψ1 : H 7→ f (H) e
ψ2 : H 7→ f −1 (H). De fato, ψ2 ◦ ψ1 (H) = ψ2 (f (H)) = f −1 (f (H)) = H ker(f ) = H,
pois H ⊃ ker(f ). Reciprocamente, ψ1 ◦ ψ2 (H) = ψ1 (f −1 (H)) = f (f −1 (H)) =
H ∩ f (G) = H, pois H < f (G).
Corolário 10.16. Seja f : G → G um homomorfismo de grupos e H < G.
Então existe um isomorfismo de grupos
ψ:
H
→ f (H) dado por ψ(x(H ∩ ker(f ))) := f (x).
(H ∩ ker(f ))
Demonstração. É imediato verificar que ker(f ) ∩ H C H. Logo o grupo
quociente faz sentido. A função ψ está bem definida, pois se x = ya para a ∈ H ∩
ker(f ), então ψ(x(ker(f ) ∩ H)) = f (x) = f (ya) = f (y)f (a) = f (y) = ψ(y(ker(f ) ∩
H)). Por definição ψ é sobrejetiva. Se ψ(x(ker(f ) ∩ H)) = ψ(y(ker(f ) ∩ H)), então
f (x) = f (y), i.e., f (xy −1 ) = f (x)f (y)−1 = 1, i.e., xy −1 ∈ ker(f ) ∩ H.
Proposição 10.17. Seja H C G e
G
o homomorfismo quociente f (x) := xH.
H
Existe uma bijeção entre os conjuntos
f :G→
{K C G | K ⊃ H} e {H C G/H}.
Demonstração. Definimos as funções que dão a bijeção por ψ1 : K 7→ K/H
e ψ2 : H 7→ f −1 (H). De fato, ψ2 ◦ψ1 (K) = ψ2 (K/H) = f −1 (K/H) = f −1 (f (K)) =
K ker(f ) = KH = K, pois K ⊃ H e ψ1 ◦ ψ2 (H) = ψ1 (f −1 (H)) = f (f −1 (H)) =
H ∩ f (G) = H ∩ G/H = H.
Proposição 10.18. Sejam G um grupo, H C G e K < G. Então existe um
isomorfismo de grupos
K
KH
ϕ:
→
.
(K ∩ H)
H
Demonstração. Seja f : K → KH/H o homomorfismo quociente f (x) :=
xH. Afirmamos que f é sobrejetivo. De fato, se abH ∈ KH/H, então abH =
aH = f (a). Afirmamos também que ker(f ) = H ∩ K. De fato, se a ∈ ker(f ), então
f (a) = aH ∈ H, i.e., a ∈ H ∩ K. Portanto, o resultado é uma conseqüência do
teorema do isomorfismo.
Proposição 10.19. Sejam K < H < G grupos com H C G e K C G (em
particular K C H). Então existe um isomorfismo de grupos
ϕ:
G/K
G
→ .
H/K
H
Demonstração. Seja f : G/K → G/H definida por f (xK) := xH. Observemos que f está bem definida. Seja x = ya para a ∈ K. Então f (xK) = xH =
(ya)H = (yH)(aH) = yH, pois a ∈ K ⊂ H. ker(f ) = {xK | xH = H} = {xK | x ∈
H} = H/K. f é sobrejetiva por definição. Assim o resultado segue do teorema do
isomorfismo.
64
10. TEORIA DE GRUPOS II
Definição 10.20. Seja G um grupo. Um homomorfismo de grupos f : G → G
é chamado um endomorfismo de grupos e denotamos por End(G) o conjunto dos
endomorfismos de G que é um monóide com respeito à composição de funções. Um
monóide tem todas as propriedades de grupo exceto a existência do inverso. Se f
for bijetivo então dizemos que f é um automorfismo de G e denotamos por Aut(G)
o conjunto dos automorfismos de G. Este é um grupo com respeito à composição
de funções.
Observação 10.21. Para todo a ∈ G, Ia : G → G definida por Ia (x) := axa−1
é um automorfismo de G chamado um automorfismo interno de G. O conjunto
G := {Ia | a ∈ G} dos automorfismos internos de G também é um grupo com
respeito à composição de funções. Fica como exercı́cio mostrar que I(G) C Aut(G).
Definição 10.22. Seja G um grupo e H < G. Dizemos que H é um subgrupo
caracterı́stico de G se para todo σ ∈ Aut(G) temos σ(H) ⊂ H, i.e., para todo
x ∈ H, σ(x) ∈ H.
Observação 10.23. Notemos que se H for subgrupo caracterı́stico de G, então
H C G, pois a última afirmativa equivale a dizer que Ia (H) ⊂ H para todo a ∈ H.
Proposição 10.24. Se K for subgrupo caracterı́stico de H e H C G, então
K C G.
Demonstração. Queremos mostrar que para todo a ∈ G, Ia (K) ⊂ K. A
restrição de Ia a H nos dá uma função Ja : H → G definida por Ja (x) := axa−1 .
Por hipótese H C G, logo axa−1 ∈ H e Ja ∈ Aut(H) (não podemos garantir que
Ja ∈ I(H), pois não necessariamente a ∈ H). Por hipótese, K é caracterı́stico em
H, logo Ja (K) = Ia|H (K) = K.
10.3. Produtos de grupos
10.3.1. Produto direto. Sejam G1 , · · · , Gn grupos. Definimos no produto
cartesiano G1 × . . . × Gn uma estrutura de grupo da seguinte forma:
(x1 , · · · , xn ).(y1 , · · · , yn ) := (x1 y1 , · · · , xn yn ).
É fácil verificar que esta operação é associativa, o elemento neutro é (1, · · · , 1) e o
−1
inverso de (x1 , · · · , xn ) é (x−1
1 , · · · , xn ). Assim o conjunto G1 × . . . × Gn passa a
ter uma estrutura de grupo e é chamado o produto direto dos grupos G1 , · · · , Gn e
é denotado por G1 ⊕ . . . ⊕ Gn .
∼ G1 ⊕ . . . ⊕ Gn se
Teorema 10.25. Sejam G, G1 , · · · , Gn grupos. Então G =
e somente se existem subgrupos H1 , · · · , Hn de G tais que para todo i, Hi ∼
= Gi , e
além disto
(1) G = H1 . . . Hn .
(2) Hi C G para todo i = 1, · · · , n.
(3) Hi ∩ (H1 . . . Hi1 Hi+1 . . . Hn ) = {1} para todo i = 1, · · · , n.
Demonstração. Suponhamos que exista um isomorfismo ϕ : G → G1 ⊕ . . . ⊕
Gn . Seja
Hi := ϕ−1 ({1} × . . . × Gi × . . . {1}).
Definimos a seguinte função
ϕi : Hi → Gi dada por ϕi (xi ) := yi ,
10.3. PRODUTOS DE GRUPOS
65
onde xi = ϕ((1, · · · , yi , · · · , 1)). Esta função é um isomorfismo de grupos. De fato,
se zi = ϕ−1 ((1, · · · , wi , · · · , 1)), então
ϕi (xi zi ) = yi wi = ϕi (xi )ϕi (yi ),
pois xi zi = ϕ−1 ((1, · · · , zi wi , · · · , 1)). Além disto ϕi é injetiva, pois se yi = 1, então
xi = 1. Finalmente é sobrejetiva pois para todo yi ∈ Gi , xi = ϕ−1 ((1, · · · , yi , · · · ,
1)) e ϕi (xi ) = yi .
(1) Dado x ∈ G seja ϕ(x) := (x1 , · · · , xn ). Então ϕ(x) = (x1 , · · · , 1). . . . .(1, · · ·
, xn ). Seja yi = ϕ−1 ((1, · · · , xi , · · · , 1)), então x = y1 . . . yn , onde yi ∈ Hi para todo
i = 1, · · · , n.
(2) Seja x ∈ G e yi ∈ Hi temos que provar que xyi x−1 ∈ Hi . Calculemos
−1
ϕ(xyi x−1 ) = ϕ(x)ϕ(yi )ϕ(x)−1 = (x1 , · · · , xn ).(1, · · · , zi , · · · , 1).(x−1
1 , · · · , xn )
−1
−1
−1
= (x1 x−1
1 , · · · , xi zi xi , · · · , xn xn ) = (1, · · · , xi zi xi , · · · , 1).
Portanto, xyi x−1 = ϕ−1 ((1, · · · , xi zi x−1
i , · · · , 1)) ∈ Hi .
(3) Seja xi ∈ Hi ∩ (H1 . . . Hi−1 Hi+1 . . . Hn ). Assim, por um lado xi = ϕ−1 ((1,
· · · , yi , · · · , 1)) e por outro lado xi = ϕ−1 ((z1 , · · · , zi−1 , 1, zi+1 , · · · , zn )). Como ϕ
é um isomorfismo concluimos que zj = 1 para todo j e que yi = 1, portanto xi = 1.
Reciprocamente, suponhamos que as 3 condições acima sejam satisfeitas. Para
provar a recı́proca utilizaremos o ı́tem 2 do lema seguinte. Afirmamos que G ∼
=
H1 ⊕ . . . ⊕ Hn . De fato, consideremos a função
ψ : G → H1 ⊕ . . . ⊕ Hn dada por ψ(x) = ψ(x1 . . . xn ) := (x1 , · · · , xn ).
Esta função é um isomorfismo. Observe que pelo lema abaixo
ψ(xy) = ψ(x1 . . . xn y1 . . . yn ) = ψ(x1 y1 x2 . . . xn y2 . . . yn ) = · · · = ψ(x1 y1 . . . xn yn )
= (x1 y1 , · · · , xn yn ) = (x1 , · · · , xn ).(y1 , · · · , yn ) = ψ(x)ψ(y).
Se ψ(x) = (1, · · · , 1), então x = 1 . . . 1 = 1, logo ψ é injetiva. Para todo (x1 , · · · , xn )
∈ H1 ⊕. . .⊕Hn se x = x1 · · · xn temos que ψ(x) = (x1 , · · · , xn ), logo ψ é sobrejetiva.
Lema 10.26. As 3 condições acima são equivalentes às seguintes duas condições:
(a) Para todo x ∈ G existem únicos xi ∈ Hi para i = 1, · · · , n tais que
x = x1 . . . xn .
(b) Para todo i 6= j, x ∈ Hi e y ∈ Hj , xy = yx.
Demonstração. Suponha que as 3 condições anteriores sejam satisfeitas. Assim para todo x ∈ G podemos escrever x = x1 . . . xn . Suponhamos que x =
y1 . . . yn , então
−1
y1−1 x1 = y2 . . . yn x−1
n . . . x2 .
Como Hi C G temos que para todo x ∈ G, xHi = Hi x, i.e., dado αi ∈ Hi temos
que xαi = βi x para algum βi ∈ Hi . Logo
−1
−1
(yn x−1
n )xn−1 = zn−1 (yn xn )
para algum zn−1 ∈ Hn−1 . Repetindo o argumento concluimos que
−1
−1
y1−1 x1 = y2 . . . yn x−1
n . . . x2 = z2 . . . zn−1 (yn xn ) ∈ H2 . . . Hn ∩ H1 = {1},
portanto x1 = y1 . Pelo mesmo argumento xi = yi para todo i = 2, · · · , n.
66
10. TEORIA DE GRUPOS II
Como Hi , Hj C G temos que xyx−1 ∈ Hj , logo xyx−1 y −1 ∈ Hj e yx−1 y −1 ∈
Hi , logo xyx−1 y −1 ∈ Hi , portanto xy = yx, já que
Hi ∩ Hj ⊂ Hi ∩ (H1 . . . Hi−1 Hi+1 . . . Hn ) = {1}.
Reciprocamente, suponha as duas últimas condições satisfeitas. A primeira
condição do teorema segue automaticamente de (a). Seja x = x1 . . . xn ∈ G, yi ∈ Hi
e zi = xi yi x−1
i . Então, por (b),
−1
−1
xyi x−1 = x1 . . . xn yi x−1
n . . . x1 = x1 . . . xn−1 yi xn−1 . . . x1 = · · ·
−1
−1
−1
= x1 . . . xi yi x−1
i . . . x1 = x1 . . . xi−2 zi xi−2 . . . x1 = · · · = zi ∈ Hi .
Finalmente, se xi ∈ Hi ∩ (H1 . . . Hi−1 Hi+1 . . . Hn , pela unicidade de (a) temos que
xi = 1.
10.3.2. Produtos semi-diretos de grupos. Na seção anterior dados dois
grupos H e K construimos o produto direto H ⊕ K com a operação componente
a componente. Nesta seção modificaremos levemente o procedimento. Lembre
que Aut(K) (o conjunto dos automorfismos de K) é um grupo com respeito a
composição de automorfismos. Suponhamos que seja dado um homomorfismo de
grupo σ : H → Aut(K). Definimos no produto cartesiano H×K uma nova operação
da seguinte forma:
(x, y) σ (z, w) := (xz, yσ(x)(w)),
note que σ(x) : K → K é um automorfismo de K, logo σ(x)(w) ∈ K.
Afirmamos que H × K com a operação σ é um grupo, chamado o produto
semi-direto de H e K com respeito a σ e denotado por H nσ K. De fato,
((x1 , y1 ) σ (x2 , y2 )) σ (x3 , y3 ) = (x1 x2 , y1 σ(x1 )(y2 )) σ (x3 , y3 )
= ((x1 x2 )x3 , (y1 σ(x1 )(y2 ))σ(x1 x2 )(y3 ))
= (x1 (x2 x3 ), (y1 σ(x1 )(y2 ))(σ(x1 )(σ(x2 )(y3 ))))
= (x1 (x2 x3 ), y1 σ(x1 )(y2 σ(x2 )(y3 )))
= (x1 , y1 ) σ (x2 x3 , y2 σ(x2 )(y3 ))
= (x1 , y1 ) σ ((x2 , y2 ) σ (x3 , y3 )).
O elemento neutro é (1, 1). De fato,
(1, 1) σ (x, y) = (x, σ(1)(y)) = (x, y) e
(x, y) σ (1, 1) = (x, yσ(x)(1)) = (x, y).
O inverso de (x, y) é (x−1 , σ(x−1 )(y −1 )). De fato,
(x, y) (x−1 , σ(x−1 )(y −1 )) = (1, yσ(x)(σ(x−1 )(y −1 ))) = (1, yy −1 ) = (1, 1) e
(x−1 , σ(x−1 )(y −1 )) σ (x, y) = (1, σ(x−1 )(y −1 )σ(x−1 )(y))
= (1, σ(x−1 )(y −1 y)) = (1, σ(x−1 )(1)) = (1, 1).
Proposição 10.27.
(a)
(x, y)n = (xn ,
n−1
Y
σ(xi )(y)).
i=0
Conseqüentemente, (x, 1)n = (xn , 1) e (1, y)n = (1, y n ).
(b) (1, y) σ (x, 1) = (x, y).
10.3. PRODUTOS DE GRUPOS
67
(c) {1} nσ K C H nσ K.
(d) H nσ {1} ⊂ H nσ K é um subgrupo. Este subgrupo é normal, se σ = id.
Demonstração. (a) Vamos provar por indução. Para n = 2,
(x, y) σ (x, y) = (x2 , yσ(x)(y)).
Suponha que o resultado vale para n. Então
(x, y)n+1 = (x, y)n σ (x, y) = (xn ,
n−1
Y
σ(xi )(y)) σ (x, y))
i=0
= (xn+1 ,
n−1
Y
σ(xi )(y)σ(xn )(y)) = (xn+1 ,
i=0
n
Y
σ(xi )(y)).
i=0
(2) Segue da definição.
(3) Primeiro verifiquemos que {1} nσ K é de fato um subgrupo de H nσ K. É
claro que (1, 1) ∈ {1} nσ K. Se (1, x), (1, y) ∈ {1} nσ K, então
(1, x) σ (1, y) = (1, xσ(1)(y)) = (1, xy) ∈ {1} nσ K.
Além disto
(1, x)−1 = (1, σ(1)(x−1 )) = (1, x−1 ) ∈ {1} nσ K.
Dado (x, y) ∈ H nσ K e (1, z) ∈ {1} nσ K, então
(x, y) σ (1, z) σ (x, y)−1 = (x, yσ(x)(z)) σ (x−1 , σ(x−1 )(y −1 ))
= (1, yσ(x)(z)σ(x)(σ(x−1 (y −1 ))))
= (1, yσ(x)(zσ(x−1 (y −1 )))) ∈ {1} nσ K.
(4) É claro que (1, 1) ∈ H nσ {1}. Se (x, 1), (y, 1) ∈ H nσ {1}, então
(x, 1) σ (y, 1) = (xy, σ(x)(1)) = (xy, 1) ∈ H nσ {1}.
Além disto
(x, 1)−1 = (x−1 , σ(x−1 )(1)) = (x−1 , 1) ∈ H nσ {1}.
Exemplo 10.28. Lembremos que S3 = {1, α, α2 , β, αβ, α2 β} é caracterizado
por o(α) = 3, o(β) = 2 e βα = α2 β, i.e., βαβ −1 = α2 . Neste caso K = hαi =
{1, α, α2 } e H = hβi = {1, β}. Isto permite-nos definir o seguinte homomorfismo
σ : H → Aut K por σ(β)(α) := α2
(verifique que isto é um homorfismo de grupo). Seja a = (1, α) e b = (β, 1).
Verifiquemos que estes satisfazem à descrição de S3 , portanto H nσ K ∼
= S3 . De
fato,
a3 = (1, α3 ) = (1, 1),
b2 = (β 2 , 1) = (1, 1) e
ba = (β, 1) (1, α) = (β, σ(β)(α)) = (β, α2 ) e
a2 b = (1, α2 ) σ (β, 1) = (β.α2 σ(1)(1)) = (β, α2 ) = ba.
68
10. TEORIA DE GRUPOS II
Lema 10.29. Seja H = hαi um grupo cı́clico de ordem n, K = hβi um grupo
cı́clico de ordem m. Então existem bijeções
Hom(K, Aut(H)) → {τ ∈ Aut(H) | o(τ ) | m}
σ 7→ σ(β)
e
{τ ∈ Aut(H) | o(τ ) | m} → {1 ≤ s ≤ n − 1 | sm ≡ 1
(mod n)}
s
τ 7→ s, onde τ (α) = α .
Demonstração. Note que a primeira função está de fato bem definida, pois
σ(β)m = σ(β m ) = σ(1) = id. É injetiva pois 2 automorfismos calculados no
gerador β de H são necessariamente iguais. Se τ ∈ Aut(H) satisfaz o(τ ) | m, então
τ (α)m = τ (αm ) = 1, logo αm = 1, pelo lema chave o(α) = n | m, logo existe um
homomorfismo σ : K → Aut(H) tal que σ(β) = τ .
Para a segunda, basta observar que Aut(H) → (Z/nZ)∗ dada por τ 7→ s, onde
τ (α) = αs é um isomorfismo de grupos. Neste isomorfismo o(τ ) | m se e somente
se sm ≡ 1 (mod n).
Como conseqüência deste lema temos que se existem inteiros m, n, s ≥ 0 tais que
sm ≡ 1 (mod n), então existe um grupo G com #G = nm, G = hα, βi, o(α) = n,
o(β) = m e βαβ −1 = αs . De fato, da condição numérica e do lema sabemos que o
automorfismo τ : hαi → hαi por τ (α) = αs tem ordem o(τ ) | m. Logo existe um
homomorfismo σ : hβi → Aut(hαi). Basta tomar o produto semi-direto hβi nσ hαi
para obter um tal G.
Para mais tipos de produtos de grupos veja [Go, chapter 2].
10.4. Grupos metacı́clicos
O objetivo desta seção é descrever grupos metacı́clicos que generalizam o D4 e
S3 .
Teorema 10.30. Seja G um grupo finito, s ≥ 1 inteiro, a, b ∈ G tais que
ba = as b (i.e., Ib (a) = as ). Seja G um grupo e α, β ∈ G. Sejam m, n ≥ 1 inteiros
tais que an = 1 e bm ∈ hai.
(1) Para todo s, t ≥ 1 temos
t
bt ar = ars bt .
Em particular,
ha, bi = {ai bj | 0 ≤ i ≤ n − 1, 0 ≤ j ≤ m − 1}.
Além disto, se m e n forem escolhidos mı́nimos para esta propriedade,
temos que #ha, bi = mn.
(2) Supondo m e n mı́nimos, seja u ≥ 0 tal que bm = au . Então existe um
homomorfismo f : ha, bi → G tal que f (a) = α e f (b) = β se e somente se
βα = αs β, αn = 1 e β m = αu .
Demonstração. (1) Vamos provar por indução. Vamos supor primeiro que
t
r = 0 e provar que Ibt (ar ) = ars . Se t = 1, então já sabemos que Ib (a) = as .
Suponhamos que isto valha para t − 1. Então
Ibt (ar ) = Ib ◦ Ibt−1 (ar ) = Ib (ars
t−1
) = Ib (a)rs
t−1
= (as )rs
t−1
t
= ars .
10.4. GRUPOS METACÍCLICOS
69
Por definição, ha, bi é formado por produtos de elementos que são iguais a a (ou
a−1 ) e b (ou b−1 ). Utilizando o resultado acima, podemos sempre colocar a potência
de a em primeiro lugar e escrever ai bj para i, j ∈ Z. Além disto, pelas hipóteses
sobre m e n obtemos que basta tomar 0 ≤ i ≤ n − 1 e 0 ≤ j ≤ m − 1. Observemos
também que se m e n forem mı́nimos então os elementos de
ha, bi = {ai bj | 0 ≤ i ≤ n − 1, 0 ≤ j ≤ m − 1}
são todos distintos, portanto sua ordem é mn. De fato, se ai bj = ak bl , então
ai−k = bl−j ∈ hai, digamos que l ≥ j. Neste caso, l − j < m, logo l = j e ai−k = 1,
bem como ak−i . Tomando o expoente positivo dentre os 2 e notando que este
expoente é menor que n concluimos que i = k.
(2) É claro que
αn = f (a)n = f (an ) = f (1) = 1,
β m = f (b)m = f (bm ) = f (au ) = f (a)u = αu e que
βα = f (b)f (a) = f (ba) = f (as b) = f (a)s f (b) = αs β.
Para verificar a recı́proca basta definir
f : ha, bi → G por f (ai bj ) := αi β j
e provar que isto realmente é um homomorfismo. De fato,
j
j
j
f (ai bj ak bl ) = f (ai aks bj bl ) = f (ai+ks bj+l ) = αi+ks β j+l
j
= αi (αks β j )β l = αi β j αk β l = f (ai bj )f (ak bl ).
Teorema 10.31. Sejam m, n, s, u ≥ 0 inteiros. Existe um grupo G de ordem
nm e a, b ∈ G tais que G = ha, bi, an = 1, bm = au e ba = as b se e somente se
sm ≡ 1 (mod n) e u(s − 1) ≡ 0 (mod n).
m
Demonstração. Note que pelo teorema anterior, bm a = as bm . Mas, bm =
m
m
u
a , logo bm a = abm = as bm , em particular as −1 = 1 e pelo lema chave, n |
(sm − 1). De novo pelo teorema anterior, bau = aus b. Mas au = bm , logo bau =
au b = aus b, i.e., au(s−1) = 1, assim n | (u(s − 1)). A recı́proca segue da construção
do final da seção anterior.
Proposição 10.32. Sejam m, n, s, u ≥ 0 inteiros, G um grupo de ordem nm.
Suponha que existam a, b ∈ G tais que G = ha, bi, ba = as b, an = 1 e bm = au .
Então a função
Aut(G) → {(α, β) ∈ G × G | G = hα, βi, βα = αs β, αn = 1, β m = αu }
f 7→ (f (a), f (b))
é bijetiva.
Demonstração. Segue do primeiro teorema que f (a) e f (b) satisfazem as
condiç ões do conjundo do lado direito. A função é injetiva, pois a e b geram G,
assim um homomorfismo fica unicamente determinado pelo seu valor nos geradores.
Novamente o primeiro teorema mostra que a função é sobrejetiva.
70
10. TEORIA DE GRUPOS II
10.5. Classificação de grupos de ordem ≤ 11
Comecemos observando que todo grupo cı́clico de ordem n é isomorfo a Z/nZ.
De fato, se G é cı́clico de ordem n significa que G = {1, a, · · · , an−1 } para algum
gerador a de G. Consideremos a função f : G → Z/nZ definida por f (a) = 1.
Exercı́cio: verifique que esta função é um isomorfismo de grupos.
10.5.1. Grupos de ordem : 2,3,5,7,11. Estes números são primos, logo
(pelo teoream de Lagrange) todo a ∈ G − {1} tem ordem p, portanto G é cı́clico,
i.e., G ∼
= Z/nZ.
10.5.2. Grupos de ordem 4. Se existe a ∈ G tal que o(a) = 4, então G é
cı́clico. Logo G ∼
= Z/4Z.
Suponhamos que para todo a ∈ G − {1}, o(a) = 2 (que é a única possibilidade
pelo teorema de Lagrange). Portanto G é um grupo abeliano. Seja a ∈ G − {1} e
b ∈ G − hai. Assim, G = {1, a, b, ab}. Neste caso a função f : G → Z/2Z × Z/2Z
definida por f (1) = (0, 0), f (a) = (1, 0), f (b) = (0, 1) e f (ab) = (1, 1) é um
isomorfismo de grupos.
10.5.3. Grupos de ordem 6. Se existe a ∈ G tal que o(a) = 6, então G é
cı́clico e G ∼
= Z/6Z.
Suponhamos que não exista a ∈ G tal que o(a) = 6. Pelo teorema de Lagrange,
para todo a 6= 1 as possibilidades para a sua ordem são 2 e 3.
Lema 10.33. Existe a ∈ G tal que o(a) = 3.
Demonstração. De fato, suponhamos que para todo a ∈ G − {1} tenhamos
o(a) = 2. Seja a ∈ G − {1} e b ∈ G − hai. Neste caso, ha, bi é um subgrupo de G
de ordem 4, o que contradiz o teorema de Lagrange.
Lema 10.34. Existe b ∈ G tal que o(b) = 2.
Demonstração. De fato, suponhamos que para todo b ∈ G − {1} tenhamos
o(b) = 3. Seja a ∈ G tal que o(a) = 3 e b ∈ G − hai. O subgrupo ha, bi de G tem
ordem 9, o que novamente contradiz o teorema de Lagrange.
Utilizando os valores das ordens de a e b vemos que G = {1, a, a2 , b, ab, a2 b} e
que ba 6= 1, a, a2 , b. Assim, ba = ab ou a2 b. No primeiro caso, G é abeliano e a
função f : G → Z/3Z × Z/2Z definida por f (1) = (0, 1), f (a) = (1, 0), f (a2 ) =
(2, 0), f (b) = (0, 1), f (ab) = (1, 1), f (a2 b) = (2, 1) é um isomorfismo de grupos.
Mas pelo teorema chinês dos restos, Z/3Z × Z/2Z ∼
= Z/6Z, assim descartamos este
caso. O caso em que ba = a2 b é exatamente o caso em que G ∼
= S3 .
10.5.4. Grupos de ordem 8. Se existe a ∈ G tal que o(a) = 8 então G é
cı́clico e G ∼
= Z/8Z.
Suponha que para todo a ∈ G − {1}, o(a) = 2. Neste caso G é abeliano. Seja
a ∈ G tal que o(a) = 2, seja b ∈ G − hai e c ∈ G − ha, bi. Note que o subgrupo
ha, b, ci = {1, a, b, c, ab, ac, bc, abc} tem ordem 8, logo G = ha, b, ci. Observe também
que f : G → Z/2Z × Z/2Z × Z/2Z definida por f (1) = (0, 0, 0), f (a) = (1, 0, 0),
f (b) = (0, 1, 0), f (c) = (0, 0, 1), f (ab) = (1, 1, 0), f (ac) = (1, 0, 1), f (bc) = (0, 1, 1)
e f (abc) = (1, 1, 1) é um isomorfismo de grupos.
Assim, suponha que exista a ∈ G tal que o(a) = 4. Seja b ∈ G − hai. Note
que ha, bi = {1, a, a2 , a3 , b, ab, a2 b, a3 b} e que estes elementos são distintos, portanto
10.5. CLASSIFICAÇÃO DE GRUPOS DE ORDEM ≤ 11
71
G = ha, bi. Observe também que como (G : hai = 8/4 = 2, então (bhai)2 = hai, i.e.,
b2 hai. Observe também que trivialmente b2 6= b, ab, a2 b, a3 b e ba 6= 1, a, a2 , a3 , b.
Pelo segundo teorema as únicas possibilidades para u e s tais que b2 = au e ba = as b
são u = 0 ou 2 e s = 1 ou 3.
Se u = 0 e s = 1, temos que ba = ab e o(b) = 2. O grupo G é abeliano. A função
f : G → Z/4Z × Z/2Z definida por f (1) = (0, 0), f (a) = (1, 0), f (a2 ) = (2, 0),
f (a3 ) = (3, 0), f (b) = (0, 1), f (ab) = (1, 1), f (a2 b) = (2, 1) e f (a3 b) = (3, 1) é um
isomorfismo de grupos.
Se u = 0 e s = 3, temos que ba = a3 b e o(b) = 2, neste caso G ∼
= D4 .
Se u = 2 e s = 0, temos que ba = ab e b2 = a2 . O grupo G é abeliano. A função
f : G → Z/4Z × Z/2Z definida por f (1) = (0, 0), f (a) = (1, 0), f (a2 ) = (2, 0),
f (a3 ) = (3, 0), f (ab) = (0, 1), f (b) = (3, 1), f (a2 b) = (1, 1) e f (a3 b) = (2, 1) é um
isomorfismo de grupos.
Finalmente, se u = 2 e s = 3, temos que ba = a3 b e b2 = a2 . Neste caso G é
isomorfo ao grupo Q dos quaternions descrito da seguinte forma. Q é um subgrupo
das matrizes 2 × 2 com entradas complexas e determinante não nulo. Ele é definido
por
1 0
i 0
0 1
0 i
,±
.
±
,±
, ±
0 1
0 −i
−1 0
i 0
Basta tomar
i 0
0 1
a=
eb=
.
0 −i
−1 0
10.5.5. Grupos de ordem 9. Se existe a ∈ G tal que o(a) = 9, então G é
cı́clico e G ∼
= Z/9Z.
Caso isto não ocorra para todo a ∈ G − {1}, o(a) = 3. Seja b ∈ G − hai. Note
que o subgrupo ha, bi = {1, a, a2 , b, b2 , ab, ab2 , a2 b, a2 b2 } de G tem ordem 9, portanto
sendo igual ao próprio grupo G. Observe também que ba 6= 1, a, a2 , b, b2 . Assim, e
pelo segundo teorema, ba = ab, logo G é abeliano. Neste caso G ∼
= Z/3Z × Z/3Z
(exercı́cio: determine explicitamente o isomorfismo, como nos casos anteriores).
10.5.6. Grupos de ordem 10. Se existe a ∈ G tal que o(a) = 10, G é cı́clico
eG∼
= Z/10Z.
Caso contrário, como nos casos anteriores existem a, b ∈ G tais que o(a) = 5 e
o(b) = 2 (verifique!). Pelo segundo teorema as únicas possibilidades para ba = as b
são s = 1 ou 4. No primeiro caso, G é abeliano e G ∼
= Z/5Z × Z/2Z, mas este é
isomorfo a Z/10Z, assim não consideramos este caso. No outro caso, G ∼
= D5 , o
grupo diedral de ordem 10.
10.5.7. Grupos diedrais. Estes grupos têm ordem 2n, um elemento a de
ordem n e outro elemento b de ordem 2 satisfazendo a ba = an−1 b.
CAPı́TULO 11
Teoremas de Sylow
11.1. Represesentações de grupos
Seja G um grupo finito e S um conjunto finito. Denotamos por Perm(S) o
conjunto das permutações de S, i.e., das funções f : S → S bijetivas. Este conjunto
forma um grupo com respeito à composição de funções. Uma representação de G
por permutação é um homomorfismo de grupos ρ : G → Perm(S).
Exemplo 11.1. Tomemos como S o próprio grupo G e consideremos para todo
x ∈ G o automorfismo interno Ix de G definido por Ix (a) := xax−1 . Assim definimos a função ρ : G → Aut(G) dada por ρ(x) := Ix . Verifiquemos que esta função
é um homomorfismo de grupos. Esta representação é chamada a representação de
G por conjugação. De fato, dado a ∈ G temos
ρ(xy)(a) = (xy)a(xy)−1 = xyay −1 x−1 = xIy (a)x−1 = Ix (Iy (a)) = (Ix ◦ Iy )(a).
Outra representação com S = G é a translação ρ : G → Aut(G) dada por
ρ(x)(a) := xa para todo a ∈ G. De fato, ρ(x) é um automorfismo de G (exercı́cio)
e
ρ(xy)(a) = xya = xρ(y)(a) = ρ(x)(ρ(y)(a)) = (ρ(x) ◦ ρ(y))(a).
Esta representação de G é chamada representação por translação.
Observe que neste último caso a função ρ é injetiva. De fato se ρ(x) = id,
então xa = a para todo a ∈ G. Isto significa que x = 1. Como conseqüência deste
resultado temos o teorema de Cayley.
Teorema 11.2 (teorema de Cayley). Seja G um grupo de ordem n, então G é
isomorfo a um subgrupo do grupo Sn das permutações de n elementos.
Demonstração. Tome a representação ρ por translação em G e conclua que
G∼
= ρ(G) com ρ(G) subgrupo de Sn .
Exemplo 11.3. Seja S o conjunto de subgrupos de G e consideremos a função
ρ : G → Perm(S) dada por ρ(x)(H) := xHx−1 . Observemos que ρ(x) é de fato
uma bijeção em S (exercı́cio) e que
ρ(xy)(H) = xyHy −1 x−1 = xρ(y)(H)x−1 = ρ(x)(ρ(y)(H)) = (ρ(x) ◦ ρ(y))(H).
Observe que como #H = #xHx−1 , então podemos restringir a representação
anterior ao conjunto dos subgrupos H de G com ordem fixada n.
Exemplo 11.4. Seja H um subgrupo de G e S o conjunto das classes laterais
a direita de H em G, i.e., S := {aH ; a ∈ G}. Consideremos a função ρ : G →
Perm(G) dada por ρ(x)(aH) := xaH. De novo fica como exercı́cio verificar que
ρ(x) é de fato uma permutação de S. Além disto
ρ(xy)(aH) = xy(aH) = xρ(y)(aH) = ρ(x)(ρ(y)(aH)) = (ρ(x) ◦ ρ(y))(aH).
73
74
11. TEOREMAS DE SYLOW
Dada uma representação por permutação ρ : G → Perm(S) definimos a órbita
Oa de um elemento a ∈ S por
Oa := {ρ(x)(a) ; x ∈ G}.
O estabilizador de a é definido por
E(a) := {x ∈ G ; ρ(x)(a) = a}.
Observemos que E(a) é um subgrupo de G. De fato, 1 ∈ E(a), pois ρ(1) = id e
portanto ρ(1)(a) = a, i.e., ρ(1) ∈ E(a). Se x, y ∈ E(a), então
ρ(xy)(a) = ρ(x)(ρ(y)(a)) = ρ(x)(a) = a, i.e., xy ∈ E(a).
Finalmente, ρ(x−1 ) = ρ(x)−1 , pois ρ é um homomorfismo. Portanto, ρ(x−1 )(a) =
ρ(x)−1 (a) = a, i.e., x−1 ∈ E(a). Pelo teorema de Lagrange temos que #E(a) divide
#G. É menos imediato que o mesmo ocorre com #Oa . Isto segue da proposição
seguinte.
Proposição 11.5. Existe uma bijeção
ϕ : Oa → {C.L.D.} dada por ϕ(ρ(x)(a)) := xE(a),
o conjunto do lado direito é o conjunto das classes laterais a direita de E(a) em G.
Em particular (novamente pelo teorema de Lagrange), #Oa divide #G.
Demonstração. Inicialmente, ϕ está bem definida pois se ρ(x)(a) = ρ(y)(a),
então ρ(xy −1 )(a) = a, i.e., xy −1 ∈ E(a), i.e., xE(a) = yE(a). A função é injetiva
uma vez que se ϕ(ρ(x)(a)) = ϕ(ρ(y)(a)), i.e., xE(a) = yE(a), então xy −1 ∈ E(a),
logo ρ(xy −1 )(a) = a, i.e., ρ(x)(a) = ρ(y)(a). Finalmente, pela própria definição do
conjunto do lado direito, ϕ é sobrejetiva.
Dada uma representação ρ : G → Perm(S) definimos a seguinte relação de
equivalência (verifique!) :
a ∼ b se e somente se existe x ∈ G tal que ρ(x)(a) = b.
Em particular, a classe de equivalência de a nada mais é que a sua órbita Oa . Além
disto o conjunto S fica escrito como a união disjunta das órbitas Oa .
Comecemos considerando o caso do exemplo 11.1. Neste caso
Oa = {xax−1 ; x ∈ G}
é o conjunto dos conjugados de G. Assim,
Oa = {a} se e somente se a ∈ Z(G).
Desta forma obtemos a equação das classes de conjugação
X
(11.1)
#G = #Z(G) +
#Oa .
a∈Z(G)
/
Ainda neste exemplo, o estabilizador E(a) de a é chamado o centralizador de a
dado por
Z(a) = {x ∈ G ; xa = ax}.
No caso do exemplo 11.3, a órbita de H é dada por
OH = {xHx−1 ; x ∈ G}
11.2. OS TEOREMAS DE SYLOW
75
é chamado o conjunto dos conjugados de H e o estabilizador de H é chamado o
normalizador de H em G denotado por
NG (H) = {x ∈ G ; xHx−1 = H}.
Observemos que H C G se e somente se NG (H) = G. Além disto da própria
definição H C NG (H). O grupo NG (H) também se caracteriza como sendo o
maior subgrupo de G no qual H é normal. De fato, se K ⊂ G for um subgrupo
e H C K, então para todo x ∈ K temos xHx−1 = H, i.e., x ∈ NG (H), i.e.,
K ⊂ NG (H).
11.2. Os teoremas de Sylow
Seja G um grupo finito e p um número primo. Suponhamos que p | #G,
digamos #G = pn b, onde p - b.
Teorema 11.6 (primeiro teorema de Sylow). Para todo 0 ≤ m ≤ n existe um
subgrupo H de G de ordem pm .
Definição 11.7. Um subgrupo de G de ordem pn é chamado um p-subgrupo
de Sylow de G.
Lema 11.8 (lema de Cauchy). Seja G um grupo abeliano e suponha que p | #G,
então existe x ∈ G tal que o(x) = p.
Observe que o primeiro teorema de Sylow generaliza o lema de Cauchy para
grupos não necessariamente abelianos.
Demonstração. A prova será por indução na ordem de G. Se #G = 1,
por vacuidade nada há a fazer. Suponha que o resultado seja verdade para todo
subgrupo de ordem menor que a ordem de G. Se #G = p nada há a fazer, o grupo
é cı́clico e basta tomar um gerador. Suponhamos que |G| 6= p.
Afirmamos que existe um subgrupo H de G tal que 1 < #H < #G. De fato,
seja x ∈ H − {1}. Se hxi =
6 G, tome H = hyi. Caso hxi = G, tome H = hxp i.
Se p | #H, então por hipótese de indução existe x ∈ H com o(x) = p, em
particular x ∈ G. Caso p - #H, então p | #G/H e #G/H < #G.
Novamente por hipótese de indução existe x ∈ G/H tal que o(x) = p. Consideremos o homomorfismo sobrejetivo ϕ : G G/H. Seja r = o(x). Então
o(x) = p | r, digamos r = kp. Desta forma o(xk ) = p.
demonstração do primeiro teorema de Sylow. Novamente a prova será por indução na ordem de G. Se #G = 1, nada há a fazer. Suponhamos que
o resultado seja verdade para todo grupo de ordem menor que #G. Se existe um
subgrupo próprio H de G tal que pm | #H, então por hipótese de indução temos
que existe um subgrupo de H de ordem pm , em particular existe um subgrupo de
G desta ordem.
Suponhamos que não exista subgrupo próprio de G cuja ordem seja divisı́vel
por pm . A equação das classes de conjugação afirma que
X
#G = #Z(G) +
(G : E(a)).
a∈Z(G)
/
Para todo a ∈
/ Z(a) temos que (G : E(a)) = #Oa > 1, logo #E(a) < #G. Por
hipótese pm - |E(a)|, assim p | (G : E(a)). Em particular, p | #Z(G).
76
11. TEOREMAS DE SYLOW
Como Z(G) é abeliano, concluimos do lema de Cauchy que existe x ∈ Z(G) tal
que o(x) = p. Note que como x ∈ Z(G), então hxi C G, portanto o grupo G/hxi
tem ordem pn−1 b < #G. Por hipótese de indução existe K subgrupo de G/hxi tal
que #K = pm−1 . Consideremos o homomorfismo canônico ϕ : G G/hxi. Então
H = ϕ−1 (K) é um subgrupo de G de ordem pm .
Lembremos que dado um grupo qualquer (não necessariamente finito) G e um
número primo p, dizemos que G é um p-grupo se todo elemento de G tem ordem
potência de p. Utilizaremos o primeiro teorema de Sylow para provar a seguinte
proposição.
Proposição 11.9. Um grupo finito G é um p-grupo se e somente se #G é
potência de p.
Demonstração. É claro que se #G é potência de p, então G é um p-grupo.
Reciprocamente, se existisse um primo ` 6= p tal que ` | #G, então pelo primeiro
teorema de Sylow, existe x ∈ G tal que o(x) = `, em particular G não é um
p-grupo.
Seja S o conjunto dos p-subgrupos de Sylow de G. Consideremos a representação por conjugação ρ : G → Perm(S) definida por ρ(x)(S) = xSx−1 . A parte
mais importante do segundo teorema de Sylow afirma que esta representação é
transitiva, i.e.,
S = OS = {xSx−1 ; x ∈ G}.
Seja np := #S.
Teorema 11.10 (segundo teorema de Sylow).
(1) S = OS , para algum
S ∈ S.
(2) Se P ⊂ G é um p-subgrupo, então existe S ∈ S tal que P ⊂ S.
(3) Se S ∈ S, então np = (G : NG (S)).
Para provar este teorema precisamos do seguinte lema.
Lema 11.11. Seja S ∈ S e P ⊂ G um p-subgrupo. Então P ∩ NG (S) = P ∩ S.
Demonstração. Suponhamos que P ∩NG (S) ' P ∩S, seja x ∈ P ∩NG (S)−S.
Como P é um p-grupo temos que o(x) = pr para algum r ≥ 1. Além disto S C
NG (S), logo hxiS é um subgrupo de NG (S). Mais ainda, #hxiS = o(x)#S/#hxi ∩
S = pr+n /#hxi ∩ S. Observe que o denominador é < pr , pois x ∈
/ S, o que é uma
contradição uma vez que a ordem de hxiS supera a ordem de S.
Demonstração do segundo teorema de Sylow. Seja C o conjunto dos
subgrupos de G e consideremos a representação por conjugação ρ : G → Perm(C)
definida por ρ(x)(H) = xHx−1 . Por definição a órbita OS (para S ∈ S) de S é o
conjunto dos conjugados de S e #OS = (G : NG (S)).
Provemos os 2 primeiros ı́tens. Denotemos OS = T . A restrição ϑ : P →
Perm(T ) desta representação a um p-subgrupo P de G dá uma representação sobre
o conjunto T dada por ϑ(x) = xaSa−1 x−1 , para aSa−1 ∈ T . Sejam O1 , · · · , Ok as
órbitas desta representação. Assim cada Oi é a órbita de Si = yi Syi−1 com relação
a ϑ. Lembre qie #Oi = (P : NG (Si ) ∩ P ). Pelo lema anterior (P : NG (Si ) ∩ P ) =
(P : Si ∩ P ). Assim,
#T =
k
X
i=1
#Oi =
k
X
i=1
(P : Si ∩ P ).
11.3. EXEMPLOS
77
Como #S = pn e S ⊂ NG (S), então p - #T = (G : NG (S)). Por outro lado, como
P é um p-grupo finito, para todo i = 1, · · · , k, (P : Si ∩ P ) é potência de p. Mas
isto ocorre se e somente se existe i tal que P = Si ∩ P , i.e., P ⊂ Si , isto prova (2).
Para (1) note que T ⊂ S. Para a inclusão inversa, aplicando (2) a qualquer S 0 ∈ S
temos que existe i tal que S 0 ⊂ Si , i.e., S 0 = Si = yi Syi−1 , i.e., S 0 ∈ T .
Finalmente, para provar (3), por (1) temos que np = #T = (G : NG (S)) | b. Teorema 11.12 (terceiro teorema de Sylow). np | b e np ≡ 1 (mod p).
Demonstração. A primeira afirmativa já foi provada no teorema anterior.
Para a segunda, aplique a última equação para P = S obtendo
(G : NG (S)) =
k
X
(S : S ∩ Si ).
i=1
Como S é um p-grupo o resultado é imediato.
11.3. Exemplos
Determinemos o número de p-subgrupos de Sylow para grupos de certas ordens.
Observe que np = 1 se e somente se existe um único p-subgrupo de Sylow normal
em G.
Exemplo 11.13. Seja G um grupo de ordem 56 = 23 7. Pelo terceiro teorema
de Sylow, n7 | 8 e n7 ≡ 1 (mod 7). Então n7 = 1 ou 8. No primeiro caso temos um
único 7-subgrupo de Sylow H7 normal em G. No segundo caso, cada 7-subgrupo
de Sylow de G produz 6 elementos de ordem 7. Assim terı́amos 48 elementos de
ordem 7. Portanto, os demais 8 elementos constituem o único 2-subgrupo de Sylow
de G. Isto não poderia ser visto diretamente pelo terceiro teorema de Sylow, pois
n2 | 7 e n2 ≡ 1 (mod 2), logo a princı́pio não poderı́amos excluir a possibilidade
n2 = 7. Neste caso o 2-subgrupo de Sylow H2 de G é normal em G.
Exemplo 11.14. Seja G um grupo de ordem 22 .7.13. Aplicando o terceiro
teorema de Sylow obtemos n13 | 22 .7 e n13 ≡ 1 (mod 13). Portanto temos duas
possibilidades n13 = 1 e n13 = 14. Vamos excluir a última. Seja H13 um 13subgrupo de Sylow de G. Aplicando o terceiro teorema de Sylow temos n7 | 22 .13
e n7 ≡ 1 (mod 7), logo n7 = 1, ou seja há um único 7-subgrupo de Sylow H7 de
G (portanto normal em G). A fortiori, H13 H7 é um subgrupo de G. Aplicando
o terceiro teorema de Sylow a este grupo obtemos n13 = (G : NG (H13 )) ≤ (G :
H13 H7 ) = 4. Assim, n13 = 1.
CAPı́TULO 12
Grupos solúveis
12.1. Teorema de Jordan-Hölder
Definição 12.1. Seja G um grupo. Uma série subnormal de G é uma seqüência
de grupos
G = G0 B G1 B G2 B · · · B Gn = {1},
onde cada Gi é normal no subgrupo anterior Gi−1 . Denotamos por
Gn−1
G 0 G1
,
,··· ,
Q :=
G1 G2
Gn
o conjunto dos quocientes de da série cuja cardinalidade l é dita o comprimento da
série.
Um refinamente de uma série subnormal é uma outra série subnormal obtida a
partir desta inserindo subgrupos normais, por exemplo,
Gi B Hi B Gi+1 .
Um refinamento é dito próprio, se o comprimento da nova série for superior ao
da original. Uma série subnormal é dita uma série de composição, se não admite
refinamento próprio. Duas séries subnormais são distas equivalentes se existe uma
bijeção entre o conjunto dos quocientes das duas séries.
O objetivo desta seção é mostrar que todas as séries de composição de um
grupo dado são equivalentes (Teorema de Jordan-Hölder).
Definição 12.2. Um grupo G é dito simples, se seus únicos subgrupos normais
são {1} e G. Por exemplo todo grupo de ordem prima é simples.
Observe que uma série subnormal é uma série de composição se e somente se
cada quociente Gi /Gi+1 é um grupo simples. Nem todo grupo admite uma série de
composição. Por exemplo, se G = Z e os subgrupos Gi = pi Z para i ≥ 1. A série
Z B pZ B {0}
pode ser infinitamente refinada inserindo sucessivamente os grupos pi Z para todo
i ≥ 2.
Lema 12.3. Seja G um grupo finito de ordem maior que 1, então existe um
subgrupo normal próprio H de G que é maximal para esta propriedade, i.e., para
todo subgrupo K normal próprio de G temos que K ⊂ H.
Demonstração. É claro que {1} é um subgrupo próprio normal de G. Se {1}
for maximal no sentido acima, nada há a fazer. Caso contrário, existe H1 ' {1}
que é um subgrupo próprio normal em G. Se H1 for maximal, acabou, senão
prosseguimos. Não podemos prosseguir indefinidamente pois G é finito.
79
80
12. GRUPOS SOLÚVEIS
Proposição 12.4. Todo grupo finito admite uma série de composição.
Demonstração. Pelo lema anterior, existe um subgrupo maximal normal
próprio G1 de G. Similarmente, aplicando o lema sucessivamente a G1 , G2 , etc,
obtemos que cada Gi possui um subgrupo maximal normal próprio Gi+1 e uma
série subnormal
G = G0 B G1 B G2 B · · · ,
que não pode ser infinita, pois G é finito e as ordens dos grupos Gi ’s são estritamente
decrescentes. Logo existe n ≥ 1 tal que Gn = {1}. Além disto, pela maximalidade
dos grupos Gi+1 ’s em Gi , concluimos que todos os quocientes Gi /Gi+1 são grupos
simples. Isto equivale a dizer que a série é uma série de composição.
Exemplo 12.5. Consideremos a seguinte série subnormal
Z
B h5i B h10i B {0}.
G=
30Z
Esta série é na verdade uma série de composição, pois o conjunto dos quocientes é
Z Z Z
,
,
,
5Z 2Z 3Z
ou seja, cada quociente é cı́clico de ordem prima, portanto simples. Ela é refinamento das séries subnormais
G B h5i B {0}, e
G B h10i B {0}.
Além disto esta série é equivalente às seguintes séries de composição
Z
B h2i B h6i B {0} e
G=
30Z
Z
B h2i B h10i B {0}.
G=
30Z
Lema 12.6 (lema de Zassenhaus). Sejam H, H1 , K, K1 subgrupos de um grupo
G tais que H1 C H e K1 C K. Então
(1) H1 (H ∩ K1 ) C H1 (H ∩ K) e K1 (H1 ∩ K) C K1 (H ∩ K).
(2)
H1 (H ∩ K) ∼ K1 (H ∩ K)
.
=
H1 (H ∩ K1 )
K1 (H1 ∩ K)
Demonstração. (1) Mostremos o primeiro fato o segundo é análogo. Queremos mostrar que dados x ∈ H1 e y ∈ H ∩ K temos
xy(H1 (H ∩ K1 ))y −1 x−1 = H1 (H ∩ K1 ).
De fato,
xy(H1 (H ∩ K1 ))y −1 x−1 = x(yH1 y −1 )(y(H ∩ K1 )y −1 )x−1 = x(H1 (H ∩ K1 )x−1 ,
onde na primeira identidade usamos que y ∈ H e H1 C H e na segunda que
y ∈ H ∩ K e K1 C K. Mas x ∈ H1 , portanto
x(H1 (H ∩ K1 )x−1 = H1 (H ∩ K1 )x−1 .
Como H1 C H, então
H1 (H ∩ K1 ) = (H ∩ K1 )H1
12.2. GRUPOS SOLÚVEIS
81
e este é um subgrupo de G. Assim,
x(H1 (H ∩ K1 )x−1 = ((H ∩ K1 )H1 )x−1 = (H ∩ K1 )H1 = H1 (H ∩ K1 ),
onde novamente usamos que x−1 ∈ H1 .
(2) Fica como exercı́cio provar o seguinte fato:
se A e B são grupos e A C AB, então (A/B)A = B/(A ∩ B).
Tomemos A = H1 (H ∩ K1 ) e B = H ∩ K. Neste caso
AB = H1 (H ∩ K) e A ∩ B = (H ∩ K1 )(H1 ∩ K).
Assim, pelo fato,
H1 (H ∩ K) ∼
H ∩K
.
=
H1 (H ∩ K1 )
(H ∩ K1 )(H1 ∩ K)
Similarmente, o outro quociente procurado também é isomorfo a este último grupo.
Teorema 12.7 (teorema de Schreier). Duas séries subnormais de um grupo G
possuem refinamentos equivalentes.
Demonstração. Consideremos as seguintes séries subnormais
G = G0 B G1 B G2 B · · · B Gn = {0} e
G = H0 B H1 B H2 B · · · B Hm = {0}.
Refinemos a primeira utilizando os grupos da segunda da seguinte forma
Gi = Gi+1 (Gi ∩ H0 ) B Gi+1 (Gi ∩ H1 ) B · · · Gi+1 (Gi ∩ Hm ) = Gi+1 ,
o fato de cada passada ser normal segue do ı́tem (1) do lema de Zassenhaus. Da
mesma forma refinamos a segunda utilizando os grupos da primeira
Hj = Hj+1 (G0 ∩ Hj ) B Hj+1 (G1 ∩ Hj ) B · · · B Hj+1 (Gn ∩ Hj ) = Hj+1 .
A equivalência entre estas séries segue o ı́tem (2) do lema de Zassenhaus.
Corolário 12.8 (teorema de Jordan-Hölder). Duas séries de composição de
um grupo dado são equivalentes.
Demonstração. Segue imediatamente do teorema de Schreier.
12.2. Grupos solúveis
Definição 12.9. Seja G um grupo. Denotamos por G0 = [G, G] o subgrupo
dos comutadores e definimos indutivamente G(0) = G, G(i+1) = (G(i) )0 .
Teorema 12.10. Seja G um grupo. As seguintes condições são equivalentes
(i) G possui uma série subnormal com quocientes abelianos.
(ii) Existe n tal que G(n) = {1}.
Se além disto G for finito, então estas condições equivalem a
(iii) O grupo G admite uma série de composição com quocientes abelianos (logo
cı́clicos de ordem prima).
Definição 12.11. Um grupo satisfazendo às condições equivalentes acima é
dito um grupo solúvel.
82
12. GRUPOS SOLÚVEIS
Demonstração. Suponha (i). Pela observação 10.8, se H C G for tal que
G/H é abeliano, então H ⊃ G0 . Assim, como G0 /G1 é abeliano, G1 ⊃ G0 =
G(1) . Em seguida, como G1 /G2 é abeliano, então G2 ⊃ (G1 )0 = G(2) . Assim
sucessivamente, Gi ⊃ G(i) . Donde, G(n) = {1}.
Suponha (ii). Basta notar que por definição a série subnormal
G = G(0) B G(1) B G(2) B · · · B G(n) = {1}
tem quocientes abelianos.
Suponha agora que G seja um grupo finito. No próximo capı́tulo mostraremos
que todo grupo abeliano finito pode ser escrito como produto de grupos cı́clicos da
forma Z/nZ para n ≥ 1 inteiro. Observemos que as duas formulações de (iii) de
fato equivalem-se. Já observamos antes que todo grupo cı́clico de ordem prima é
simples. Reciprocamente, se um grupo abeliano finito é simples, pelo que foi dito
anteriormente, ele só pode ser um grupo cı́clico da forma Z/nZ para algum inteiro
n ≥ 1, já que se tivesse mais de um fator cı́clico, por exemplo, Z/mZ × Z/nZ, então
{0} × Z/nZ seria um subgrupo normal não trivial. Mas pelo teorema chinês dos
restos, todo grupo cı́clico fatora-se como produto de grupos cı́clicos Z/pr Z, onde p
é primo e r ≥ 1 inteiro. Assim, ficamos reduzidos ao caso em que G = Z/pr Z. Mas
se r > 1, este grupo admite como subgrupo normal não trivial o grupo pZ/pr Z,
logo não poderia ser simples.
Se G for um grupo finito é claro que (iii) implica (i). Por outro lado qualquer
refinamento de uma série subnormal com quocientes abelianos também tem quocientes abelianos. Além disto, já foi visto anteriormente que toda série subnormal
de um grupo finito admite uma série de composição.
Segue imediatamente do teorema que grupos abelianos são solúveis. Para ver
que p-grupos finitos (onde p denota um número primo) são também solúveis precisaremos da seguinte proposição.
Proposição 12.12. Seja G um grupo de ordem pm e H um subgrupo de G de
ordem pr , onde r < m. Então
(1) existe um subgrupo K de G de ordem pr+1 contendo H.
(2) Todo subgrupo L de G de ordem pr+1 contendo H satisfaz : H C L. Em
particular, H ( NG (H).
Demonstração. Provemos o seguinte resultado mais forte que (1) por indução
na ordem de G: existe um subgrupo H de G de ordem pr+1 tal que H C K.
Se #G = 1, nada há a fazer. Senão, suponhamos o resultado seja verdade para
todo grupo de ordem menor que #G. Como Z(G) 6= {1}, utilizando o lema de
Cauchy (cf. capı́tulo sobre teoremas de Sylow) escolhemos um elemento x ∈ Z(G)
de ordem p. Note que hxi C G e x ∈ NG (H).
Se x ∈
/ H, então, o subgrupo K = Hhxi satisfaz às condições desejadas, pois
hxi ∩ H = {1}. Caso x ∈ H, o grupo G/hxi tem ordem estritamente menor que G,
logo por hipótese de indução existe um subgrupo K 0 de G/hxi tal que #K 0 = pr .
Seja K a pré-imagem de K 0 pelo homomorfismo canônico ϕ : G → G/hxi. O
subgrupo K 0 de G satisfaz às condições da afirmativa mais forte.
Finalmente, o segundo ı́tem segue do primeiro.
Corolário 12.13. Seja G um grupo de ordem pm (onde p denota um número
primo). Então existem subgrupos H0 = {1}, H2 , · · · , Hm = G tais que Hi C Hi+1 e
tais que Hi+1 /Hi é cı́clico de ordem p, para i = 0, · · · , m − 1.
12.2. GRUPOS SOLÚVEIS
83
Demonstração. Aplique a proposição a H0 = {1} obtendo H1 e ordem p,
em seguida aplique-a novamente a H1 e assim sucessivamente.
Observação 12.14. Segue do teorema 12.10 e do corolário anterior que todo
p-grupo finito é solúvel.
Proposição 12.15. Seja G um grupo e H um subgrupo de G.
(1) Se G for solúvel, então H é solúvel.
(2) Se H C G então G é solúvel se e somente se H e G/H são solúveis.
Demonstração. (1) Suponha que G seja solúvel. Note que para todo i, G(i) ⊃
H . Portanto, H (n) = {1} e H é solúvel.
(2) Seja ϕ : G → G/H o homomorfismo quociente. Observe que ϕ(G0 ) =
ϕ(G)0 = (G/H)0 . Suponha que G seja solúvel. Por (1) H é solúvel. Além disto,
indutivamente, para todo i, ϕ(G(i) ) = (G/H)(i) , a fortiori, (G/H)(n) = {1}, i.e.,
G/H é solúvel. Reciprocamente, suponha que H e G/H sejam solúveis. Isto
significa que existe n tal que H (n) = {1} e m tal que (G/H)(m) = {1}. Da última
igualdade segue que G(m) ⊂ ker(ϕ) = H. Aplicando indutivamente esta derradeira
igualdade obtemos G(m+j) ⊂ H (j) . Portanto G(m+n) ⊂ H (n) = {1}, i.e., G é
solúvel.
(i)
CAPı́TULO 13
Grupos abelianos finitamente gerados
13.1. Módulos sobre anéis
Seja R um anel comutativo com unidade. Um R-módulo M é um grupo aditivo
munido de uma função R × M → M tal que a(x + y) = ax + ay e (a + b)x = ax + bx,
para a, b ∈ R e x, y ∈ M . Quando R é um corpo (como os reais) recuperamos a
noção de espaço vetorial.
Dizemos que um suconjunto
Pn S de M gera M se para todo x ∈ M existem
x1 , · · · , xn ∈ S tal que x = i=1 ai xi , onde ai ∈ R para i = 1, · · · , n. O conjunto
S é dito o conjunto de geradores de M . O módulo M é dito finitamente gerado, se
S for finito.
Dados x1 , · · · , sn ∈ M dizemos
Pnque eles são R-linearmente independentes se
para qualquer combinação linear i=1 ai xi = 0 com ai ∈ R tivermos ai = 0 para
i = 1, · · · , n. O módulo M é dito um R módulo livre se possui um conjunto
de geradores linearmente independentes. Novamente, quando R é um corpo, um
conjunto de geradores linearmente independentes nada mais é que a base de um
espaço vetorial. Quando o conjunto de geradores S é finito e estes são R-linearmente
independentes, da mesma forma que na álgebra linear podemos mostrar que o
número de elementos do conjunto gerador não depende da particular escolha do
conjunto. Este número é chamado o posto do módulo (que corresponde à noção de
dimensão de espaço vetorial)..
Observemos que a noção de Z-módulo equivale a de grupo abeliano. De fato,
todo Z-módulo por definição é um grupo abeliano. Reciprocamente, todo grupo
abeliano G admite uma estrutura de Z-módulo. De fato, denotando G aditivamente,
podemos considerar a soma de n > 0 vezes um elemento x de G que é o elemento
nx ∈ G. Para n = −m < 0, nx nada mais é que m vezes o elemento −x, portanto
também um elemento de G.
Ao contrário de espaços vetoriais nem todo Z-módulo livre é finito. De fato,
para todo n ≥ 1, Z/nZ é um Z-módulo livre de posto 1 gerado por 1. Na verdade
isto corresponde a noção de grupo abeliano de torção. Um grupo abeliano G é de
torção se e somente todo elemento de G é de ordem finita. Veremos que o teorema
em questão diz inicialmente que todo grupo abeliano finitamente gerado se quebra
em um pedaço de torção que descreveremos completamente e uma parte livre que
é isomorfa a r cópias de Z, onde r é exatamente o posto do grupo como Z-módulo.
Similarmente ao caso de espaços vetoriais temos noções de submódulos e de
módulos quocientes. Seja M um R-módulo. Um subconjunto N de M é dito um
R-submódulo de N se for um sugrupo e se para todo a ∈ R e x ∈ N , ax ∈ N .
Para todo x ∈ M definimos x := x + N := {x + v | v ∈ N } chamada a classe de x
com respeito a N . Como conjunto o módulo quociente M/N é definido como sendo
{x | x ∈ M }. Definimos uma estrutura de R-módulo em M/N da maneira usual. A
85
86
13. GRUPOS ABELIANOS FINITAMENTE GERADOS
soma é definida por x ⊕ y := x + y e a multiplicação por escalar por ax := ax, para
todo a ∈ R. Fica como exercı́cio verificar que estas operações estão efetivamente
bem definidas.
Dados V e W R-módulos uma função ϕ : V → W é dito um homomorfismo
de R-módulos se for um homomorfismo de grupos e se para todo a ∈ R e x ∈ V
temos ϕ(ax) = aϕ(x). Da mesma forma definimos o núcleo de ϕ por N (ϕ) := {x ∈
V | ϕ(x) = 0}. Já sabemos que N (ϕ) é um subgrupo de V . Além disto ele é um
R-submódulo, pois para todo a ∈ R e x ∈ N (ϕ) temos ϕ(ax) = aϕ(x) = 0, i.e.,
ax ∈ N (ϕ). A imagem ϕ(V ) de φ é um R-submódulo de W (exercı́cio).
Teorema 13.1 (teorema dos homomorfismos). Seja ϕ : V → W um homomorfismo de R-módulos. Então ϕ induz um isomorfismo de R-módulos Φ : V /N (ϕ) →
ϕ(V ) dado por Φ(x) := ϕ(x).
Demonstração. Já sabemos que Φ é isomorfismo de grupos. Basta verificar
que é um homomorfismo de R-módulos. De fato, dado a ∈ R temos que Φ(ax) =
Φ(ax) = ϕ(ax) = aϕ(x) = aΦ(x).
Para todo n ≥ 1 o produto cartesiano Rn é naturalmente um R-módulo somando as coordenadas e multiplicando as coordenadas por um escalar em R. Um
homorfismo de R-módulos ϕ : Rm → Rn é determinado pela multiplicação de um
vetor por uma matriz n × m com coordenadas em R. De fato, tomemos como
conjunto gerador linearmente independente em cada um dos R-módulos a base
canônica, então da mesma forma que na álgebra linear, se e1 , · · · , em é uma
Pbase de
Rm e f1 , · · · , fn é uma base de Rn , então ϕ fica determinado por ϕ(ei ) = j aij fj ,
onde aij ∈ R.
Definimos o grupo GLn (R) como o subgrupo das matrizes quadradas de ordem
n com entradas em R. Observemos que este equivale ao grupo das matrizes cujo
determinante é um elemento inversı́vel em R. De fato, seja A ∈ GLn (R). Então
existe B ∈ Mn (R) tal que AB = Id, em particular det(A) det(B) = 1, i.e., det(A) ∈
R∗ . Reciprocamente, se det(A) = δ ∈ R∗ e Adj(A) denota a adjunta de A (que
é construı́da como na álgebra linear, pois as operações elemetares por linhas são
precisamente as mesmas tomando cuidado de escolher os escalares pertencendo a
um anel R ao invés de um corpo). Assim a regra de Cramer nos informa que
δ Id = A Adj(A). A fortiori, Id = A(δ −1 Adj(A)), assim δ −1 Ajd(A) é a inversa de
A (observe que podemos tomar δ −1 , pois δ é inversı́vel em R).
13.2. Diagonalização de matrizes
Teorema 13.2. Seja A ∈ Mn×m (Z) então existem matrizes Q ∈ GLn (Z) e
P ∈ GLm (Z) tais que A0 = QAP −1 é diagonal da seguinte forma:

 
d1 0 · · · 0
 0 d 2 · · · 0  

 0
. . .
 ,


 0

0 · · · dr
0
0
onde d1 | d2 | · · · | dr .
Demonstração. As matrizes Q e P provêem (como na álgebra linear) da
multiplicação de matrizes elementares que correspondem as operações elementares
por linhas e por colunas.
13.3. GERADORES E RELAÇÕES PARA MÓDULOS
87
Etapa 1. Trocando linhas e colunas (e eventualmente multiplicando uma linha
ou coluna por -1) podemos supor que a11 ≥ 0 é uma entrada de menor valor absoluto
(claro que pode haver outra entrada com o mesmo valor absoluto).
Etapa 2. Transformamos os demais elementos da primeira coluna em 0 da
seguinte forma. Para todo i > 1 dividimos ai1 = a11 q + r, onde 0 ≤ r < a11 .
Substituı́mos a i-ésima linha por menos ela mais q vezes a primeira, ou seja trocamos
ai1 por r. Se r = 0 nada mais precisamos fazer. Senão permutamos levando r para
a primeira posição (1,1) e retornamos à etapa anterior. Em um número finito de
passos obteremos r = 0. Repetimos o argumento para as demais entradas da linha.
Similarmente, repetimos o argumento para colunas e zeramos o restante da primeira
linha.
Etapa 3. Seja B a matriz restante eliminando as primeiras linha e coluna. Se
existe uma entrada b de B que não seja divisı́vel por a11 , somamos a coluna correspondente com a primeira coluna e retornamos à etapa 2. Após um número finito
de passos todos os elementos de B são divisı́veis por a11 e aplicamos as 3 etapas a
B.
Note que na demonstração anterior além das operações elementares por linhas
que valem para qualquer anel, utilizamos tão somente o algoritmo da divisão para
os inteiros. Isto permite-nos generalizar o resultado da seguinte forma.
Teorema 13.3. Seja R um domı́nio euclideano e A ∈ Mn×m (R). Então existem matrizes Q ∈ GLn (R) e P ∈ GLm (R) tais que A0 = QAP −1 é diagonal da
forma indicada no teorema anterior.
Notemos que este processo se aplica particularmente à matriz de um homomorfismo de R-módulos ϕ : Rm → Rn .
13.3. Geradores e relações para módulos
Seja ϕ : Rn → Rm um homomorfismo de R-módulos cuja matriz na base
canônica é A ∈ Mm×n (R). A base canônica de Rn é chamado o conjunto de
geradores e o núcleo N (ϕ) de ϕ é dito o conjunto de relações. A imagem de ϕ é
dada por multiplicação por A, assim denotamos ϕ(Rn ) := ARn . O conúcleo de ϕ
é definido por Rm /ARn . Neste caso dizemos que a matriz A presenta o conúcleo
de ϕ, ou em outras palavras, A é a matriz de presentação do conúcleo de ϕ.
Mostraremos agora que todo R-módulo finitamente gerado V pode ser presentado por alguma matriz. Inicialmente observemos que se v1 , · · · , vn é um conjunto de geradores de V então temos um homomorfismo sobrejetivo canônico de
R-módulos ϕ : Rn → V dado por ϕ(ei ) =P
vi , onde e1 , · · · , en é a base canônica de
n
Rn . De fato, para todo v ∈ V temos v = i=1 ai vi com a1 , · · · , an ∈ R. Portanto,
V = ARn . Seja W = N (ϕ). Mostraremos em seguida que W é também um Rmódulo finitamente gerado. Neste caso, digamos que seja gerado por w1 , · · · , wm ,
temos também um homomorfismo sobrejetivo ψ : Rm → W de R-módulos e o
W = BRm . Pelo teorema dos homomorfismos, V ∼
= Rn /W = Rn /BRm , assim a
matriz B presenta V . A idéia do teorema será diagonalizar a matriz B como na
seção anterior e obter daı́ a decomposição do módulo.
Lema 13.4. Seja ϕ : V → W um homomorfismo de R-módulos.
(1) Se ker(ϕ) e ϕ(V ) são finitamente gerados, então V também é finitamente
gerado. Se V é finitamente gerado e ϕ é sobrejetivo, então W é finitamente gerado.
88
13. GRUPOS ABELIANOS FINITAMENTE GERADOS
(2) Seja W um R-submódulo de V . Se W e V /W são finitamente gerados,
então V também é finitamente gerado. Se V é finitamente gerado, então
V /W é finitamente gerado.
Demonstração. (1) Seja u1 , · · · , uk um conjunto de geradores de ker(ϕ) e
w1 , · · · , wm um conjunto de geradores de W . Para todo i = 1, · · · , m seja vi ∈ V
tal que ϕ(vi ) = wi . Afirmamos
que (u1 , · · · , uk ; v1 , · · · , vm ) geram V . De
P
P fato, dado
v ∈ V temos ϕ(v) = i ai wi com ai ∈ R para i = 1, · · · , P
m. Seja v 0 = i ai vi ∈ V .
Então ϕ(v 0 ) = ϕ(v), i.e., v 0 − v ∈ ker(ϕ), i.e., v 0 − v = j bj uj para bj ∈ R para
todo j = 1, · · · , k. Para a segunda parte, se v1 , · · · , vnPgeram V , como todoP
w∈W
é da forma w = ϕ(v), para algum v ∈ V , então w = i ai ϕ(vi ), onde v = i ai vi ,
e ϕ(v1 ), · · · , ϕ(vn ) forma um conjunto de geradores de W .
(2) Segue de (1) aplicado ao homomorfismo quociente canônico ϕ : V → V /W .
Proposição 13.5. Seja V um R-módulo. As seguintes condições são equivalentes:
(1) Todo R-submódulo W de V é finitamente gerado.
(2) Não existe seqüência estritamente crescente de R-submódulos de V : W1
W2 · · ·
Demonstração. Suponha que a condição (2) seja satisfeita e que W 6= 0. Seja
w1 ∈ W − {0}. Se w1 gera W acabou. Senão seja w2 ∈ W − Rw1 . Se Rw1 + Rw2 =
W , acabou, w1 e w2 geram W . Senão seja w3 ∈ W − (RW1 + Rw2 ). Prosseguindo
desta forma o conjunto de R-módulos Wi = Rw1 +. . .+Rwi é estritamente crescente.
Por hipótese existe k tal que Wk = W , em particular w1 , · · · , wk geram W .
Reciprocamente suponha (1).
S Seja W1 ⊂ W2 ⊂ · · · uma seqüência de Rsubmódulos de V . A união U = i Wi também é um R-submódulo de V (exercı́cio).
Por hipótese U é finitamente gerado, digamos por u1 , · · · , un . Seja j o maior ı́ndice
tal que ui ∈ Wj para todo i. Logo Wj ⊂ U ⊂ Wj , i.e., U = Wj e a seqüência
estaciona.
Definição 13.6. Um anel R tal que todo módulo satisfaça as condições anteriores é chamado um anel noetheriano.
Proposição 13.7. Seja R um anel noetheriano e V um R-módulo finitamente
gerado. Então todo submódulo W de V também é finitamente gerado.
Demonstração. Observemos inicialmente que basta provar a proposição no
caso em que V = Rn . De fato, como V é finitamente gerado, então existe um
homomorfismo sobrejetivo ϕ : Rn → V . Seja W ⊂ V um submódulo. Então
ϕ−1 (W ) = W 0 é um submódulo de Rn , por hipótese é finitamente gerado. Pelo
lema anterior concluimos que W também é finitamente gerado.
Provemos por indução em n. Para n = 1 isto segue da proposição anterior. Consideremos o homomorfismo de projeção ϕ : Rn → Rn−1 dado por
ϕ((a1 , · · · , an )) = (a1 , · · · , an−1 ). O seu núcleo constitui-se dos vetores da forma
(0, · · · , 0, an ). Seja W um submódulo de Rn e seja ψ a restrição de ϕ a W , digamos ψ : W → Rn−1 . Por hipótese de indução ψ(W ) é finitamente gerado. Além
disto, ker(ψ) = ker(ϕ) ∩ W é um submódulo de ker(ϕ) ∼
= R, portanto também é
finitamente gerado. Assim, o resultado segue da proposição anterior.
13.4. O TEOREMA DE ESTRUTURA
89
13.4. O teorema de estrutura
Já fizemos tudo que era necessário para obter nosso resultado principal neste
capı́tulo. Antes só mais um pouco de notação. Sejam W1 , · · · , Wn submódulos de
um R-módulo V . Definimos W1 +. . .+Wn := {w1 +. . .+wn | wi ∈ Wi , i = 1, · · · , n}.
Fica como exercı́cio verificar que W1 + . . . + Wn é um R-submódulo
de V . Dizemos
P
que esta soma é direta de para qualquer relação linear i ai wi = 0, com ai ∈ R,
temos ai = 0 para todo i. Neste caso escrevemos W1 ⊕ . . . ⊕ Wn .
Teorema 13.8. (teorema de estrutura de grupos abelianos finitamente gerados)
Seja G um grupo abeliano finitamente gerado. Então
G∼
= (Z/d1 Z) ⊕ . . . ⊕ (Z/dk Z) ⊕ Zr , onde d1 | d2 | · · · | dr
são inteiros positivos, r é o posto de G como Z-módulo e
Gtor = (Z/d1 Z) ⊕ . . . ⊕ (Z/dk Z)
é o subgrupo de torção de G, i.e., o conjunto dos elementos de ordem finita.
Demonstração. Já vimos anteriormente que G é presentado por uma matriz
A ∈ Mn×m (Z), i.e., G = Rn /ARm e que tal matriz pode ser diagonalizada com a
propriedade acima para suas entradas d1 , · · · , dk . As relações do grupo s são dadas
por di vi = 0 para i = 1, · · · , k para um conjunto de geradores v1 , · · · , vn , Seja L
o submódulo gerado por vk+1 , · · · , vn . Como não há relações entre estes vetores
vemos que L é um Z-módulo livre de posto n − k, i.e., L ∼
= Zn−k . Afirmamos que
G = C1 ⊕ . . . ⊕ Ck ⊕ L, onde Ci = hvi i ∼
= Z/di Z.
É claro, pela presentação de G, que estes submódulos geram G. Ou seja, G é igual
à soma destes. Queremos mostrar que a soma é direta. De fato, se houvesse uma
relação
z1 + . . . + zk + w = 0,
com zi ∈ Ci e w ∈ L, então podemos reescrê-la da forma
k
X
i=i
ri vi +
n
X
ri vi = 0,
i=k+1
onde 0 ≤ ri < di para i = 1, · · · , k e ri ∈ Z para i = k + 1, · · · , n. Como
não há relação envolvendo os últimos n − k vetores concluimos que ri = 0 para
i = k + 1, · · · , n. Além disto pelas relações acima a única possibilidade para que
para os demais di | ri é ri = 0 para cada i. Portanto, não há relações entre os
módulos acima.
Lembremos que no processo de diagonalização das matrizes tudo funcionava
bem para qualquer domı́nio euclideano. Assim no teorema acima podemos substituir a noção de grupo abeliano finitamtente gerado pela noção de R-módulo
finitamente gerado sobre um domı́nio euclideano R.
13.4.1. Um teorema de Mordell. Grupos abelianos finitamente gerados
surgem naturalmente na aritmética. Uma curva elı́tica sobre os complexos pode
ser pensada como o conjunto de pontos em C2 que são soluções de uma equação da
forma
y 2 = x3 + ax + b,
90
13. GRUPOS ABELIANOS FINITAMENTE GERADOS
onde x3 + ax + b não admite raı́zes múltiplas e a priori estamos supondo a, b ∈ C.
Ocorre que existe uma estrutura de grupo abeliano na curva elı́tica que pode ser
definida geometricamente por meio de interseções com retas. Se considerarmos
o caso em que a, b ∈ Q, ou seja uma curva elı́tica definida sobre os racionais,
existe um célebre teorema devido a Mordell que afirma que o conjunto de soluções
(x0 , y0 ) ∈ Q2 da equação é um grupo abeliano finitamente gerado, digamos
E(Q)tor ⊕ Zr .
O inteiro (misterioso) r é chamado o posto da curva elı́tica. Não se sabe por
exemplo se é possı́vel existir curvas elı́ticas com posto arbitrariamente grande, o
recorde é 24.
A este objeto (a curva elı́tica) está associado a uma função de natureza analı́tica
chamada a L-série de Hasse-Weil da curva elı́tica. A famosa conjectura de Birch
e Swinnerton-Dyer afirma que a ordem de anulamento desta função em s = 1 é
exatamente o posto. Ela surgiu a partir de evidências computacionais.
De outro lado podemos nos perguntar o que é conhecido sobre o grupo de
torção. A resposta é tudo. Um belo e profundo resultado devido a Mazur mostra
que existem exatamente 16 grupos abelianos que podem ser grupos de torção de
curvas elı́ticas sobre os racioanis e que cada um desses grupos efetivamente ocorre.
Para mais informações sobre curva elı́ticas e o teorema de Mordell ver [Sil].
Para o teorema de Mazur ver [Ma].
Parte 3
Anéis
CAPı́TULO 14
Anéis de polinômios
14.1. Algoritmo da divisão
Seja K um corpo. Um polinômio definido sobre K é uma expressão da forma
f (x) = an xn + . . . + a1 x + a0 ,
onde a0 , · · · , an ∈ K. Identificamos f (x) a um vetor (a0 , · · · , an , 0, · · · , 0, · · · ). Se
f 6= 0 e n ≥ 0 for o maior inteiro tal que an 6= 0, dizemos então que n é o grau de
f . O conjunto de todos os polinômios definidos sobre K é denotado por K[x].
Seja g(x) = bm xm + . . . + b1 x + b0 . Suponhamos que n ≥ m. Definimos a soma
de f, g ∈ K[x] por
(f + g)(x) := (an + bn )xn + . . . + (a1 + b1 )x + a0 + b0 ,
onde bj = 0 para todo j > m. Se f + g 6= 0, então
grau(f + g) ≤ max{grau(f ), grau(g)}.
Note que se f = x3 +x+1 e g = −x3 +x2 −2, então grau(f +g) = 2 < 3. Definimos
o produto de f e g por
X
(f g)(x) := cn+m xn+m + . . . + c1 x + c0 , onde ci =
aj bl .
j+l=i
Assim, se f, g 6= 0, grau(f g) = grau(f ) + grau(g).
Afirmamos que K[x] é um domı́nio de integridade. Observemos inicialmente
que K[x] é um espaço vetorial com a operação de multiplicação por escalar sendo a
multiplicação por um polinômio constante de grau zero. Verifique que de fato isto
faz de K[x] um espaço vetorial. Em particular, temos as propriedades aditivas de
K[x] como anel.
A associatividade
do produto é provada da seguinte forma. Sejam f, g ∈ K[x].
Pr
Seja h(x) = i=0 ci xi . Então
fg =
n+m
X
di xi , onde di =
i=0
X
aj bl ,
j+l=i
logo
(f g)h =
n+m+r
X
ei xi , onde ei =
i=0
X
X
aα bβ cl
j+l=i α+β=j
=
X
α+β+l=i
93
aα bβ cl .
94
14. ANÉIS DE POLINÔMIOS
Por outro lado,
gh =
m+r
X
X
= Ai xi , onde Ai =
i=0
bj cl ,
j+l=i
logo
f (gh) =
n+m+r
X
X
Bi xi , onde Bi =
i=0
X
aα bβ cl
α+l=i β+j=l
X
=
aα bβ cl .
α+β+l=i
A comutatividade do produto segue da mesma propriedade para os elementos
de K. O elemento neutro do produto é o polinômio constante f = 1. Fica como
exercı́cio verificar que a soma distribui em relação ao produto, i.e.,
f (g + h) = f h + gh.
Sejam f, g ∈ K[x] tais que f g = 0, mas f 6= 0 de grau n. Provaremos agora
que isto implica em g = 0. De fato, começando pelo coeficiente de xn+m temos que
an bm = 0, logo bm = 0.
Em seguida, para o coeficiente de xn+m−1 temos
an bm−1 + an−1 bm = an bm−1 = 0, logo bm−1 = 0.
Para o coeficiente de xn+m−2 temos
an bm−2 + an−1 bm−1 + an−2 bm = an bm−2 = 0, logo bm−2 = 0.
Assim sucessivamente, todos os coeficientes de g são nulos. Portanto, g = 0.
Dizemos que f ∈ K[x] é inversı́vel se existe g ∈ K[x] tal que f g = 1. Note que
neste caso, o lado esquerdo da equação tem grau n + m e o lado direito tem grau
0, logo n = m = 0 e f, g ∈ K ∗ = K \ {0}, pois K é um corpo.
Teorema 14.1 (algoritmo da divisão). Sejam f, g ∈ K[x], g 6= 0, então existem
únicos q, r ∈ K[x] tais que f = qg + r, onde r = 0 ou grau(r) < grau(g).
Pn
Pm
Demonstração. Sejam f = i=0 ai xi e g = j=0 bj xj . Definimos
f1 := f −
an n−m
x
g.
bm
Se f1 = 0, acabou, tome
an n−m
x
.
bm
Se f1 6= 0, então n1 = grau(f1 ) < n = grau(f ). Se n1 < m, acabou, tome
an n−m
r = f1 e q =
x
.
bm
Suponha que n1 ≥ m. Seja
n1
X
f1 :=
a1,i xi .
r=0eq=
i=0
Defina
f2 := f1 −
a1,n1 n1 −m
x
g.
bm
14.2. MÁXIMO DIVISOR COMUM DE POLINÔMIOS
95
Se f2 = 0, acabou, tome
1
(an xn−m + a1,n1 xn1 −m ).
bm
Se f2 6= 0, então n2 = grau(f2 ) < n1 . Se n2 < m, acabou, tome
1
r = f2 e q =
(an xn−m + a1,n1 xn1 −m ).
bm
Prosseguindo obtemos uma seqüência de polinômios fi com graus estritamente decrescentes, assim pelo menos para algum t ≥ 1 temos ft 6= 0 e grau(ft ) < m, neste
ponto o algoritmo acaba, tome
1
(an xn−m + a1,n1 xn1 −m + . . . + at−1,nt−1 xnt−1 −m ).
r = ft e q =
bm
Suponha que tenhamos realizado duas divisões
r=0eq=
f = q 1 g + r1 = q 2 g + r2 ,
onde para i = 1, 2, ri = 0 ou grau(ri ) < m. Se r1 = r2 , então q1 g = q2 g = 0, e como
g 6= 0, então q1 = q2 . Suponhamos que r1 6= r2 . Neste caso, grau(r1 − r2 ) < m.
Por outro lado
r1 − r2 = (q2 − q1 )g
e grau((q2 − q1 )g) ≥ grau(g), o que é impossı́vel.
14.2. Máximo divisor comum de polinômios
Sejam f, g ∈ K[x] − {0}. Dizemos que f divide g e denotamos por f | g se
existe
h ∈ K[x] tal que f h = g.
Notemos que esta propriedade é transitiva, i.e.,
se f | g e g | h, então f | h.
De fato, se g = f α e h = gβ, onde α, β ∈ K[x], então h = f αβ, i.e., f | h.
Se h 6= 0 e f h | gh, então f | h,
pois se gh = f hα para α ∈ K[x], então h(g − f α) = 0 e como h 6= 0 e K[x] é
domı́nio de integridade, então g = f α. Além disto,
se f | g e g | f, então f = ag,
para algum a ∈ K ∗ , pois de f = gα e g = f β obtemos que 1 = αβ, mas a última
igualdade só ocorre se α, β ∈ K ∗ .
Definição 14.2. Sejam f, g ∈ K[x] − {0}, dizemos que d ∈ K[x] é um mdc de
f e g se
(1) d | f e d | g.
(2) Para todo d0 ∈ K[x] tal que d0 | f e d0 | g, temos d0 | d.
Pn
Dizemos que f = i=0 ai xi ∈ K[x] é um polinômio mônico, se an = 1.
Observação 14.3. Dado um outro mdc e de f e g, pela condição (2) temos
que d | e e e | d, portanto d = ae, onde a ∈ K ∗ . A maneira de tornar canônica
a escolha do mdc é exigir que ele seja um polinômio mônico e neste caso podemos
dizer que d = mdc(f, g) é o mdc de f e g.
96
14. ANÉIS DE POLINÔMIOS
Observe que se f | g e f então f é um mdc de f e g. A etapa seguinte é obter
o mdc de maneira algorı́timica. Para isto introduzimos um lema simples.
Lema 14.4. Sejam f, g ∈ K[x] − {0} e q, r ∈ K[x] tais que
f = qg + r, onde r = 0 ou grau(r) < grau(g).
Então
mdc(f, g) = mdc(g, r).
Demonstração. Seja Df,g (resp. Dg,r ) o conjunto dos divisores comuns de
f e g (resp. g e r). Seja d = mdc(f, g). Logo para todo d0 ∈ Df,g \ {0} temos
grau(d0 ) ≤ grau(d). Assim d é o elemento em Df,g mônico de grau máximo possı́vel.
Similarmente, e = mdc(g, r) é o elemento mônico em Dg,r de grau máximo possı́vel.
Mostraremos agora que Df,g = Dg,r , conseqüentemente d = e.
Seja A ∈ Df,g , logo f = Aα e g = Aβ, onde α, β ∈ K[x]. Segue da equação do
enunciado que
r = A(α − qβ),
em particular A ∈ Dg,r . A inclusão oposta segue pelo mesmo argumento.
Teorema 14.5. Sejam f, g ∈ K[x] \ {0} e r1 , · · · , rn ∈ K[x] os restos não
nulos na seqüência de divisões
f = q1 g + r1 , onde grau(r1 ) < grau(b)
(14.1)
g = q2 r1 + r2 , onde grau(r2 ) < grau(r1 )
···
rn2 = qn rn−1 + rn , onde grau(rn ) < grau(rn−1 )
rn−1 = qn+1 rn .
Esta seqüência é finita pois os graus são estritamente decrescentes. Então rn é um
mdc de f e g.
Demonstração. A última linha nos diz que rn é um mdc de rn e rn−1 .
Logo rn = mdc(rn−1 , rn ). Pelo lema 14.4 concluimos que rn = mdc(rn−1 , rn−2 )
e prosseguindo nas linhas anteriores temos que rn = mdc(r2 , r1 ) = mdc(r1 , g) =
mdc(f, g).
Teorema 14.6 (algoritmo euclideano estendido). Sejam f, g ∈ K[x] \ {0} e
d = mdc(a, b). Então existem α, β ∈ K[x] tais que
d = f α + gβ.
Demonstração. Do teorema anterior temos que d = rn . A penúltima equação nos dá
rn = rn−2 − qn rn−1 .
Tomando A1 = −qn e B1 = 1 reescrevemos
rn = B1 rn−2 + A1 rn−1 .
Utilizando a equação antecedente a esta obtemos
rn = B1 rn−2 + A1 (rn−3 − qn−1 rn−2 ) = B2 rn−3 + A2 rn−2 ,
onde B2 = A1 e A2 = B1 − A1 qn−1 . Prosseguindo ao longo das demais divisões
obtemos
rn = Bn−3 r1 + An−3 r2 = Bn−3 r1 + An−3 (g − q2 r1 ) = Bn−2 g + An−2 r1 ,
14.3. FATORAÇÃO ÚNICA DE POLINÔMIOS
97
onde Bn−2 = An−3 e An−2 = Bn−3 − An−3 q2 . Pela equação antecedente temos que
rn = Bn−2 g + An−2 (f − gq1 ) = α0 f + β 0 g,
onde α0 = An−2 e β 0 = Bn−2 − An−2 q1 .
Nosso objetivo agora é dar uma prova mais conceitual do algoritmo euclideano
estendido usando a noção de ideal.
Definição 14.7. Um subconjunto I ⊂ K[x] é dito um ideal de K[x] se
(1) O ∈ I.
(2) Se f, g ∈ I, então f + g ∈ I.
(3) Se f ∈ I e α ∈ K[x], então f α ∈ I.
Fica como exercı́cio verificar que os seguintes conjuntos são ideais:
(i) Seja f ∈ K[x] e I := (f ) := {f α | α ∈ K[x]} o conjunto dos múltiplos de
f.
(ii) Sejam f, g ∈ K[x] e I := (f ) + (g) := {f α + gβ | α, β ∈ K[x]}.
(iii) Sejam f1 , · · · , fn ∈ K[x] e I := (f1 ) + . . . + (fn ) := {f1 α1 + . . . + fn αn | α1 ,
· · · , αn ∈ K[x]}.
Teorema 14.8. O domı́nio K[x] é principal, i.e., todo ideal I de K[x] é da
forma (f ) para algum f ∈ K[x].
Demonstração. Seja I um ideal de K[x]. Se I = (0) nada há a fazer. Suponhamos que I 6= (0). Pelo axioma da boa ordenação existe um único f ∈ I − {0}
mônico de grau mı́nimo. Afirmamos que I = (f ). De fato, como f ∈ I, para todo
f α ∈ (f ), pelo ı́tem (3) da definição de ideal, f α ∈ I. Assim (f ) ⊂ I. Para provar
a inclusão oposta precisamos do algoritmo da divisão. Seja g ∈ I \ {0}. Então
existem q, r ∈ K[x] tais que g = qf + r, onde r = 0 ou grau(r) < grau(f ). Note
que r ∈ I, pois g, f ∈ I. Logo, se r 6= 0 vioları́amos a minimalidade do grau de f .
Portanto, r = 0 e g ∈ (f ).
Aplicando este teorema ao ı́tem (ii) anterior, obtemos que existe um único
d ∈ K[x] mônico tal que (f ) + (g) = (d). Afirmamos que d = mdc(f, g). De fato,
f = 1.f + 0.g ∈ (f ) + (g) = (d), logo f = αd, para α ∈ K[x], i.e., d | f . Da
mesma forma d | g. Se d0 | f e d0 | g, para d0 ∈ K[x], então d = αf + βg, para
α, β ∈ K[x], se reescreve como d = (αα0 + ββ 0 )d0 , para α0 , β 0 ∈ K[x], i.e., d0 | d,
logo d = mdc(f, g). Observe também que de passagem provamos que d = αf + βg
que é a igualdade do algoritmo euclideano estendido.
14.3. Fatoração única de polinômios
Seja f ∈ K[x] \ {0}. Dizemos que f é irredutı́vel se dados g, h ∈ K[x] \ {0} tais
que f = gh então f ∈ K ∗ ou g ∈ K ∗ . Por exemplo x3 − 2 é irredutı́vel em Q[x],
pois sendo um polinômio de grau 3 só seria redutı́vel se um dos fatores tivesse grau
1 e outro grau 2 ou se tivermos 3 fatores de grau 1. Mas como x3 − 2 √
é mônico
√
3
isto
equivale
a
este
polinômio
ter
uma
raiz
racional.
Mas
suas
raı́zes
são
2, 3 2α
√
e 3 2α2 que não não números racionais,
Por outro lado, em
√ onde α√= exp(2πi/3).
√
C[x] temos a fatoração x3 − 2 = (x − 3 2)(x − 3 2α)(x − 3 2α2 ), assim esta noção
é relativa ao corpo considerado.
Seja I ⊂ K[x] um ideal não nulo. I é dito um ideal maximal de K[x] se dado
um ideal J de K[x] tal que I ⊂ J ⊂ K[x], então J = I ou J = K[x].
98
14. ANÉIS DE POLINÔMIOS
Proposição 14.9. Seja f ∈ K[x] \ {0}. Então f é irredutı́vel se e somente se
(f ) é maximal.
Demonstração. Suponha que f seja irredutı́vel. Seja J um ideal de K[x] tal
que (f ) ⊂ J ⊂ K[x]. Pelo Teorema 14.8 temos que existe g ∈ K[x] tal que J = (g).
Logo f = gA, para A ∈ K[x]. Pela irredutibilidade de f temos que g ∈ K ∗ ou
A ∈ K ∗ . No primeiro caso, 1 = gg −1 ∈ (g), assim (g) = K[x]. No segundo caso,
g = A−1 f ∈ (f ), em particular (g) = (f ).
Reciprocamente, suponhamos que (f ) seja maximal e que f = gh para g, h ∈
K[x]\{0}. Então (f ) ⊂ (g) ⊂ K[x]. Pela maximalidade de (f ), temos que (g) = (f )
ou (g) = K[x]. No primeiro caso, g = af para algum a ∈ K ∗ , logo 1 = ah e a
fortiori h ∈ K ∗ . No segundo caso, 1 = gg −1 ∈ (g) e assim g ∈ K ∗ .
Lema 14.10. Seja f ∈ K[x] irredutı́vel tal que f | gh para g, h ∈ K[x] \ {0}.
Então f | g ou f | h.
Demonstração. Suponha que f - g, i.e., mdc(f, g) = 1. Pelo algoritmo
euclideano estendido existem A, B ∈ K[x] tais que 1 = Af + Bg. Logo, h =
Af h + Bgh, e como f | gh, concluimos que f | h.
Teorema 14.11. Seja f ∈ K[x]\{0}. Então existem únicos u ∈ K ∗ , p1 , · · · , pr
∈ K[x] polinômios irredutı́veis mônicos tais que grau(p1 ) < · · · < grau(pr ) e inteiros
e1 , · · · , er tais que
f = upe11 . . . perr .
Demonstração. Provavemos primeiro a existência da fatoração. Se f ∈ K ∗
ou f é irredutı́vel nada há a fazer. Suponha que grau(f ) ≥ 1 e f seja redutı́vel.
Seja Df o conjunto dos dvisores de f em K[x]. Pelo axioma da boa ordenação
existe q1 ∈ Df tal que grau(q1 ) ≤ grau(A) para todo A ∈ Df . Afirmamos que q1 é
irredutı́vel. Se isto não ocorresse, um fator B de q1 teria grau menor que grau(q1 )
e além disto pertenceria a Df , o que é impossı́vel. Seja
f1 :=
f
.
q1
Se f1 ∈ K ∗ ou f1 for irredutı́vel acabou. Senão, seja q2 ∈ Df1 tal que grau(q2 ) ≤
grau(A) para todo A ∈ Df1 . Pelo mesmo argumento anterior q2 é irredutı́vel. Seja
f2 :=
f
f1
=
.
q2
q1 q2
Se f2 ∈ K ∗ ou f2 for irredutı́vel acabou. Senão prosseguimos. Note que grau(f ) >
grau(f1 ) > grau(f2 ) > · · · ≥ 0. Assim, existe r ≥ 1 tal que fr ∈ K ∗ , digamos
fr = u. Portanto,
f = uq1 · · · qr
é a fatoração desejada. Observe também que este processo é algorı́tmico e que não
fizemos qualquer hipótese sobre os qi ’s serem distintos.
Agrupando os polinômios irredutı́veis iguais temos uma fatoração como no
enunciado. Provemos agora sua unicidade. Suponha que tenhamos duas fatorações
como acima, digamos
e
f = upe11 · · · prf = vq1g1 · · · qsgs ,
14.3. FATORAÇÃO ÚNICA DE POLINÔMIOS
99
onde v ∈ K ∗ , q1 , · · · , qs são irredutı́veis com grau(q1 ) < · · · < grau(qs ) e g1 , · · · , gs
≥ 1 são inteiros. Observe que
p1 | vq1g1 · · · qsgs ,
logo pelo lema 14.10 existe j tal que p1 | qj . Como ambos são irredutı́veis mônicos
isto ocorre se e somente se qj = p1 .
Afirmamos que j = 1. Suponha que j > 1. Neste caso, pelo mesmo argumento
existe i tal que q1 = bi pi para bi ∈ K ∗ . Se i = 1, então
grau(q1 ) = grau(p1 ) = grau(qj ),
o que é impossı́vel. Se i > 1, então
grau(q1 ) = grau(pi ) > grau(p1 ) = grau(qj ),
o que também é impossı́vel. Portanto q1 = a1 p1 e além disto e1 = g1 . Dividindo os
dois lados por pe11 obtemos a igualdade
upe22 · · · perr = vq2g2 · · · qsgs .
O mesmo argumento acima mostra que q2 = p2 e que e2 = g2 . Novamente dividindo
os dois lados por pe22 obtemos
upe33 · · · perr = vq3g3 · · · qsgs .
Assim aplicando sucessivamente o argumento temos que r = s, ei = gi para todo i,
qi = ai pi , onde ai ∈ K ∗ , e u = v.
Nosso objetivo agora é obter um critério de irredutibilidade de polinômios em
Q[x] em termos dos seus coeficientes.
Lema 14.12 (lema de Gauss). Seja f ∈ Z[x] irredutı́vel. Então f é irredutı́vel
em Q[x].
Demonstração. Suponha que f = gh com g, h ∈ Q[x] e grau(g), grau(h) ≥
1. Multiplicando os dois lados pelo produto m dos denominadores de todos os
coeficientes de g e h obtemos
mf = g1 h1 ,
onde g1 , h1 ∈ Z[z] e grau(g1 ) = grau(g) e grau(h1 ) = grau(h). Seja p um fator
primo de m.
Afirmamos que p divide todos os coeficientes de g1 ou todos os coeficientes de
h1 . Escrevemos explicitamente
n
m
X
X
g1 =
ai xi e h1 =
bj xj .
i=0
j=0
Suponhamos que existam i e j tais que p - ai e p - bj . Além disto escolhamos estes
i e j minimais para esta propriedade. Consideremos o coeficiente de xi+j de mf
dado por
ci+j = a0 bi+j + . . . + ai−1 bj+1 + ai bj + ai+1 bj−1 + . . . + ai+j b0 .
Assim p divide todas as parcelas exceto ai bj , mas como p | ci+j isto nos dá uma
contradição. Portanto, p | ai para todo i ou p | bj para todo j. Suponhamos o
primeiro caso, dividindo por p dos dois lados temos que
m
f = g2 h1 .
p
100
14. ANÉIS DE POLINÔMIOS
Repetindo o argumento, cancelamos todos os fatores primos de m obtendo
f = g ∗ h∗ ,
onde g ∗ , h∗ ∈ Z[x] e grau(g ∗ ) = grau(g) e grau(h∗ ) = grau(h). Portanto f é
redutı́vel em Z[x].
Proposição 14.13 (critério de Eisenstein). Seja
n
X
f=
ai xi ∈ Z[x] \ {0}.
i=0
Suponhamos que exista um número primo p tal que p | ai para todo i 6= n e p2 - a0 .
Então f é irredutı́vem em Q[x].
Demonstração. Pelo lema de Gauss basta mostrar que f é irredutı́vel em
Z[x]. Suponhamos que f = gh com g, h ∈ Z[x] e grau(g), grau(h) ≥ 1, digamos
s
r
X
X
bj xj .
ai xi e h =
g=
i=0
j=0
Como p - an = br cs então p - br e p - cs . Por outro lado segue de p | a0 = b0 c0 e
p2 - a0 que p | b0 ou p | c0 e apenas uma destas opções ocorre. Digamos que p | b0 e
p - c0 . Seja i ≤ r o menor inteiro tal que p - bi . O coeficiente de xi em f é dado por
ai = b0 ci + b1 ci−1 + . . . + bi−1 c1 + bi c0 ,
assim p divide todas as parcelas exceto a última, portanto p - ai . Mas isto só pode
ocorrer para i = n, mas i ≤ r < n.
Utilizando o critério de Eisenstein vemos que todo polinômio xn − p para p um
número primo é irredutı́vel em Z[x]. Um exemplo menos óbvio é f (x) = xp−1 +. . .+
x + 1. Não existe a priori um primo para o qual possamos aplicar o critério. A idéia
é considerar o automorfismo de K[x] definido por x 7→ x + 1. Assim dado g ∈ K[x]
temos que g(x) é irredutı́vel se e somente se g(x + 1) é irredutı́vel. Aplicando isto a
f , observamos (exercı́cio) que f (x + 1) tem todos os coeficientes, exceto o lı́der que
é 1, divisı́veis por p e o coeficiente constante é igual a p, portanto não é divisı́vel
por p2 .
CAPı́TULO 15
Anéis e domı́nios
15.1. Domı́nios euclideanos
Seja D um domı́nio de integridade e ϕ : D \ {0} → N uma função tal que
ϕ(ab) ≥ ϕ(a),
para todos a, b ∈ D \ {0}. Dizemos que (D, ϕ) é um domı́nio euclideano, se para
todo a, b ∈ D com b 6= 0 temos
a = bq + r, onde r = 0 ou ϕ(r) < ϕ(b).
Como exemplos temos (Z, | |) e (K[x], grau). Em um domı́nio de integridade D
dizemos que b | a (para a, b ∈ D) se existe c ∈ D tal que a = bc.
Exemplo 15.1. Um outro exemplo é o anel dos inteiros gaussianos,
Z[i] := {a + bi | a, b ∈ Z}, onde i2 = −1.
Definimos também
ϕ(a + bi) := a2 + b2 .
Note que se a + bi, c + di ∈ Z[i] \ {0}, então
ϕ((a + bi)(c + di)) = ϕ((ac − bd) + i(ad + bc)i) = (ac − bd)2 + (ad + bc)2
= a2 c2 + b2 d2 + a2 d2 + b2 c2 = a2 (c2 + d2 ) + b2 (c2 + d2 )
= (a2 + b2 )(c2 + d2 ) = ϕ(a + bi)ϕ(c + di).
Em particular a condição
ϕ((a + bi)(c + di)) ≥ ϕ(a + bi)
é satisfeita. Afirmamos que (Z[i], ϕ) é um domı́nio euclideano. De fato, dados
a + bi, c + di ∈ Z[i] com c + di 6= 0 queremos mostrar que existem q = q0 + iq1 e
r = r0 + ir1 em Z[i] tais que
a + bi = q(c + di) + r, onde r = 0 ou ϕ(r) < ϕ(c + di).
Se c + di divide a + bi basta tomar
a + bi
.
c + di
Suponhamos portanto que isto não ocorra, i.e., procuramos r 6= 0 satisfazendo a
r=0eq=
ϕ(r) = ϕ(a + bi − q(c + di)) < ϕ(c + di),
i.e., (utilizando a multiplicatividade de ϕ)
a + bi
ϕ
− q < ϕ(1) = 1.
c + di
101
102
15. ANÉIS E DOMÍNIOS
Normalizando (a + bi)/(c + di) obtemos
(a + bi)(c − di)
= α + iβ,
c2 + d2
onde α, β ∈ Q. Assim queremos mostrar que
ϕ(α + iβ − q) = (α − q0 )2 + (β − q1 )2 < 1.
Note que como α ∈ Q, então existe q0 ∈ Z tal que |α − q0 | ≤ 12 . Da mesma forma,
existe q1 ∈ Z tal que |β − q1 | ≤ 12 . Portanto,
1 1
1
+ = < 1.
4 4
2
Definimos portanto q como q0 + iq1 e r como a + bi − (c + di)q.
(α − q0 )2 + (β − q1 )2 ≤
Exemplo 15.2. Outro exemplo é o anel
√
√
Z[ 2] := {a + b 2 | a, b ∈ Z}.
Para este anel definimos
√
ϕ(a + b 2) := a2 − 2b2 .
Observemos que
√
√
√
ϕ((a + b 2)(c + d 2)) = ϕ((ac + 2bd) + (ad + bc) 2) = (ac + 2bd)2 − 2(ad + bc)2
= a2 c2 + 4b2 d2 − 2a2 d2 − 2b2 c2 = a2 (c2 − 2d2 ) − 2b2 (c2 − 2d2 )
√
√
= (a2 − 2b2 )(c2 − 2d2 ) = ϕ(a + b 2)ϕ(c + d 2).
Portanto,
√
√
√
ϕ((a + b 2)(c + d 2)) ≥ ϕ(a + b 2).
√
√
√
√
√
Dados a + b 2, c + d 2 ∈ Z[ 2] com c + d 2 6= 0 queremos obter q, r ∈ Z[ 2] tais
que
√
√
√
a + b 2 = (c + d 2)q + r, onde r = 0 ou ϕ(r) < ϕ(c + d 2).
√
√
Se (c + d 2) | (a + b 2) tomamos
√
a+b 2
√
r=0eq=
.
c+d 2
Caso isto não ocorra procuramos r 6= 0 tal que
√
√
√
ϕ(r) = ϕ(a + b 2 − q(c + d 2)) < ϕ(c + d 2),
i.e.,
!
√
a+b 2
√ − q < ϕ(1) = 1.
ϕ
c+d 2
√
√
Normalizando (a + b 2)/(c + d 2) obtemos
√
√
√
(a + b 2)(c − d 2)
= α + β 2,
2
2
c − 2d
onde α, β ∈ Q. Assim queremos mostrar que
(α − q0 )2 − 2(β − q1 )2 < 1
15.1. DOMÍNIOS EUCLIDEANOS
103
para q0 , q1 ∈ Z. Novamente podemos escolher q0 , q1 ∈ Z tais que |α − q0 | ≤
|β − q1 | ≤ 21 . Além disto
(α − q0 )2 − 2(β − q1 )2 ≤ (α − q0 )2 ≤
1
2
e
1
< 1.
4
Observação 15.3. Estes exemplos são na verdade casos particulares da seguinte situação mais geral. Seja K ⊃ Q um corpo contendo Q que como Q-espaço
vetorial é de dimensão finita. Um tal corpo é chamado um corpo de números. Os
elementos α ∈ K que satisfazem uma equação do tipo
αn +
n−1
X
ai αi = 0 tais que ai ∈ Z
i=0
são chamados inteiros algébricos de K e o conjunto de todos os inteiros algébricos
forma uma anel (dos inteiros algébricos de K) denotado por OK . A pergunta é
quando OK com uma função ϕ apropriada é um domı́nio euclideano. A resposta
é como no caso anterior geométrica. Tudo depende da representação logarı́tmica
de K em um R espaço vetorial Rn de dimensão finita. Existem critérios nos quais
podemos mostrar que para certos corpos de números K existem funções ϕK tais
que (OK , ϕK ) é um domı́nio euclideano. Para mais sobre esta questão ver [Le1] e
[Le2].
Observação 15.4. Mostraremos agora que como no caso dos inteiros e dos
polinômios domı́nios euclideanos são principais e fatoriais. Um caso clássico de
corpo de números ligado a teoria de números é o corpo
(n−1
)
X
i
Q[ζn ] :=
ai ζ | ai ∈ Q para todo i ,
i=0
onde ζ = exp(2πi/n). Este corpo é chamado o n-ésimo corpo ciclotômico. Kummer,
no fim do século XIX, pensou erradamente ter “provado” o último teorema de
Fermat (i.e., que a equação xn + y n = z n não possui soluções inteiras não triviais
para n > 2), e seu erro foi exatamente ter “achado” que OK era principal, o que é
falso.
Teorema 15.5. Seja (D, ϕ) um domı́nio euclideano. Então D é principal, i.e.,
todo ideal I ⊂ D é da forma I = (a) = {aα | α ∈ D}.
Demonstração. Se I = (0) nada há a fazer. Suponhamos que I 6= (0) e seja
a ∈ I \ {0} tal que ϕ(a) ≤ ϕ(α) para todo α ∈ I \ {0}. Afirmamos que I = (a).
A inclusão (a) ⊂ I é imediata da definição de ideal. Suponhamos que b ∈ I. Por
hipótese existem q, r ∈ D tais que b = aq + r, onde r = 0 ou ϕ(r) < ϕ(a). Se r 6= 0,
então r = b − aq ∈ I, mas isto contradiz a escolha de a. Logo r = 0 e b ∈ (a). Teorema 15.6. Seja (D, ϕ) um domı́nio euclideano. Então D é principal, i.e.,
todo ideal I ⊂ D é da forma I = (a) = {aα | α ∈ D}.
Demonstração. Se I = (0) nada há a fazer. Suponhamos que I 6= (0) e seja
a ∈ I \ {0} tal que ϕ(a) ≤ ϕ(α) para todo α ∈ I \ {0}. Afirmamos que I = (a).
A inclusão (a) ⊂ I é imediata da definição de ideal. Suponhamos que b ∈ I. Por
hipótese existem q, r ∈ D tais que b = aq + r, onde r = 0 ou ϕ(r) < ϕ(a). Se r 6= 0,
então r = b − aq ∈ I, mas isto contradiz a escolha de a. Logo r = 0 e b ∈ (a). 104
15. ANÉIS E DOMÍNIOS
Seja D um domı́nio de integridade. Denotamos por D∗ o conjunto dos elementos
inversı́veis de D. i.e., o conjunto dos elementos a ∈ D tais que existe b ∈ D tal
que ab = 1. Por exemplo, Z∗ = {±1} e K[x]∗ = K ∗ . Se D = Z[i], notemos que
se a + bi ∈ Z[i]∗ então existe c + di ∈ Z[i] tal que (a + bi)(c + di) = 1. Logo
(a2 + b2 )(c2 + d2 ) = 1, i.e., a2 + b2 = 1. Mas no cı́rculo x2 + y 2 = 1 os únicos
pontos com coordenadas inteiras são ±1 e ±i. Reciprocamente, estes elementos são
claramente inversı́veis, portanto Z[i]∗ = {±1, ±i}.
Um elemento a ∈ D é dito irredutı́vel, se toda vez que a = bc com b, c ∈ D
então b ∈ D∗ ou c ∈ D∗ .
Lema 15.7. Seja (D, ϕ) um domı́nio euclideano. Então a ∈ D∗ se e somente
se ϕ(a) = ϕ(1).
Demonstração. Observemos que ϕ(a) = ϕ(a.1) ≥ ϕ(1) para todo a ∈ D \
{0}. Por outro lado se a ∈ D∗ , então existe b ∈ D \ {0} tal que ab = 1, logo
ϕ(1) = ϕ(ab) ≥ ϕ(a), o que mostra que ϕ(a) = ϕ(1). Suponha que ϕ(a) = ϕ(1)
para a ∈ D \ {0}. Por hipótese existem q, r ∈ D tais que 1 = qa + r com r = 0
ou ϕ(r) < ϕ(a). Assim, se r 6= 0, então ϕ(r) < ϕ(1) o que é impossı́vel. Portanto,
r = 0 e 1 = aq, i.e., a ∈ D∗ .
Teorema 15.8. Seja (D, ϕ) um domı́nio euclideano e a ∈ D \ {0}. Então
existem u ∈ D∗ e p1 , · · · , pr ∈ D \ {0} irredutı́veis tais que a = up1 · · · pr .
Demonstração. Se a ∈ D∗ ou a for irredutı́vel nada há a fazer. Suponhamos
a∈
/ D∗ redutı́vel. Seja Da o conjunto dos divisores d de a em D. Seja p1 ∈ Da \ {0}
tal que ϕ(p1 ) ≤ ϕ(b) para todo b ∈ Da . Afirmamos que p1 é irredutı́vel. De fato,
caso contrário, p1 = cd, c, d ∈
/ D∗ e ϕ(p1 ) = ϕ(cd) ≥ ϕ(d). Se ϕ(cd) = ϕ(d), por
hipótese existem q, r ∈ D tais que d = qcd + r com r = 0 ou ϕ(r) < ϕ(cd) = ϕ(d).
Se r 6= 0, então r = d(1 − qc) e ϕ(r) ≥ ϕ(d), o que é impossı́vel, assim r = 0, mas
neste caso qc = 1, logo c ∈ D∗ , o que também é impossı́vel. Assim ϕ(cd) > ϕ(d) e
d ∈ Da , mas isto contradiz a minimalidade de p1 . Portanto, p1 é irredutı́vel.
Seja
a
a1 := .
p1
Se a1 ∈ D∗ ou a1 é irredutı́vel então nada há a fazer. Caso contrário, repetindo o
argumento existe p2 ∈ Da1 irredutı́vel tal que ϕ(p2 ) ≤ ϕ(b) para todo b ∈ Da1 \ {0}.
Seja
a
a1
=
.
a2 :=
p2
p1 p 2
Novamente, se a2 ∈ D∗ ou a2 for irredutı́vel acabou. Caso contrário prosseguimos.
Observe que ϕ(a) > ϕ(a1 ) > ϕ(a2 ) > · · · ≥ ϕ(1), pois os elementos pi ’s são
irredutı́veis. Portanto, existe r tal que ϕ(ar ) = ϕ(1), i.e., ar ∈ D∗ e neste caso
a = up1 · · · pr com u = ar .
Definição 15.9. Sejam a, b ∈ D \ {0}. Definimos um mdc d de a e b por
(1) d | a e d | b.
(2) Para todo d0 ∈ D \ {0} tal que d0 | a e d0 | b, temos que d0 | d.
15.1. DOMÍNIOS EUCLIDEANOS
105
Observação 15.10. Observe que se d e e são mdc’s de a e b então d | e e
e | d, i.e., d = Ae e e = Bd para A, B ∈ D, assim d = BAd e portanto A, B ∈ D∗ .
Logo a menos de multiplicação por um elemento inversı́vel a noção de mdc está
bem definida.
Observação 15.11. Seja
I := (a) + (b) := {aα + bβ | α, β ∈ D}
o ideal gerado por a e b. Como (D, ϕ) é principal, concluimos que existe d ∈ D \{0}
tal que (d) = I. Afirmamos que d = mdc(a, b). De fato, a = 1.a + 0.b ∈ I, logo
a = dα, i.e., d | a. Pelo mesmo argumento d | b. Por outro lado existem s, t ∈ D
tais que d = as + bt (o algoritmo euclideano estendido). Se d0 | a e d0 | b, então
a = Ad0 e b = Bd0 para A, B ∈ D, portanto d = d0 (sA + tB), i.e., d0 | d.
Lema 15.12. Seja p ∈ D irredutı́vel e suponha que p | ab para a, b ∈ D. Então
p | a ou p | b.
Demonstração. Suponha que p - a, então mdc(p, a) = 1 e existem s, t ∈ D
tais que 1 = sp + ta. Multiplicando por b e utilizando que ab = αp para α ∈ D,
obtemos b = spb + tαp, logo p | b.
Teorema 15.13. Seja (D, ϕ) um domı́nio euclideano e a ∈ D \ {0}. Então
existem únicos (a menos de inversı́veis) u ∈ D∗ , p1 , · · · , pr ∈ D irredutı́veis com
ϕ(p1 ) < · · · < ϕ(pr ) e inteiros e1 , · · · , er ≥ 1 tais que
a = upe11 · · · perr .
Demonstração. Suponha que possamos fatorar a de duas maneiras distintas
a = upe11 · · · perr = vq1f1 · · · qsfs ,
para v ∈ D∗ , q1 , · · · , qs ∈ D irredutı́veis com ϕ(q1 ) < · · · < ϕ(qs ). Observe que
p1 | vq1f1 · · · qsfs .
Pelo lema anterior existe i tal que p1 | qi . Como ambos são irredutı́veis isto significa
que existe ai ∈ D∗ tal que qi = ai p1 . Afirmamos que i = i.
De fato, suponha que i > 1. Pelo mesmo argumento existe j tal que p1 = bj qj
com bj ∈ D∗ . Se j = 1, então ϕ(p1 ) = ϕ(q1 ) < ϕ(qi ) = ϕ(p1 ) o que é impossı́vel. Se
j > 1, então ϕ(p1 ) = ϕ(qi ) > ϕ(q1 ) = ϕ(pi ) o que também é impossı́vel. Também
temos que ter e1 = f1 , pois se por exemplo f1 > e1 , então após cancelar p1 terı́amos
que ter q1 = apj para j > 1 o que novamente é impossı́vel.
Dividindo ambos os lados por pe11 obtemos
uae11 pe22 · · · perr = vq2f2 · · · qsfs .
Repetindo o argumento anterior, q2 = a2 p2 para a2 ∈ D∗ e e2 = f2 , dividindo
ambos os lados por pe22 obtemos
uae11 ae22 pe33 · · · perr = vq3f3 · · · qsfs .
Repetindo o argumento obtemos que r = s e para todo i = 1, · · · , r temos que
qi = ai pi para ai ∈ D∗ e
u = vae11 · · · aerr .
106
15. ANÉIS E DOMÍNIOS
15.2. Domı́nios fatoriais
Definição 15.14. Seja D um domı́nio de integridade. Definimos em D :=
D × (D \ {0}) a seguinte relação de equivalência:
(a, b) ∼ (c, d) se e somente se ad = bc.
Seja K := D/ ∼ o conjunto das classes de equivalência de D. A classe de equivalência
do par (a, b) é denotada pela fração ab . Definimos em D operações de soma e produto
por
c
ad + bc a
c
ac
a
+ :=
e + = .
b
d
cd
b
d
bd
Com estas operações K é um corpo. O inverso de a/b 6= 0 é b/a.
Definição 15.15. Sejam A e B dois anéis (sempre comutativos com elemento
neutro para o produto). Uma função f : A → B é dita um homomorfismo de anéis
se f (x + y) = f (x) + f (y) e f (xy) = f (x)f (y) para todos x, y ∈ A. O núcleo N (f )
de f é definido como o subconjunto dos elementos a ∈ A tais que f (a) = 0. Note
que 0 ∈ N (f ). Observe também que N (f ) é um ideal de A. De fato, se x, y ∈ N (f ),
então f (x + y) = f (x) + f (y) = 0, i.e., x + y ∈ N (f ). Se x ∈ N (f ) e a ∈ A, então
f (x, y) = f (x)f (y) = 0, i.e., xa ∈ N (f ).
Lema 15.16. f é injetivo se e somente se N (f ) = (0).
Demonstração. Se f é injetivo e x ∈ N (f ), então f (x) = 0 = f (0), logo
x = 0. Se N (f ) = (0) e f (x) = f (y), então f (x − y) = 0, i.e., x − y ∈ N (f ), i.e.,
x = y.
Observação 15.17. Um homomorfismo f : A → B é dito um isomorfismo se
for um homomorfismo bijetivo. Consideremos o homomorfismo de anéis ϕ : D → K
definido por ϕ(a) := a/1. Este é um homomorfismo injetivo, pois se a/1 = 0/1,
então a = 0. Por isto D é isomorfo a sua imagem e K é dito o corpo de frações de
D e denotado por fr(D).
Definição 15.18. Um domı́nio de integridade D é dito fatorial quando para
todo a ∈ D \ {0} podemos escrever a de maneira única
a = upe11 · · · perr ,
onde u ∈ D∗ , p1 , · · · , pr ∈ D são irredutı́veis e e1 , · · · , er ≥ 1 são inteiros, onde a
unicidade é a menos de multiplicação por um elemento de D∗ ou de permutação dos
irredutı́veis. No caso de um domı́nio euclideano, a função ϕ determina a ordem dos
elementos irredutı́veis, assim não podemos permutá-los e a a unicidade é a menos
de multiplicação por inversı́veis. Dois elementos a, b ∈ D são ditos associados
(denotado por a ∼ b), se a = ub onde u ∈ D∗ .
Definição 15.19. Seja D[x] o anel de polinômios com coeficientes em D, i.e.,
são os elementos da forma
n
X
f=
ai xi tais que ai ∈ D para todo i.
i=0
Seja K := fr(D) seu corpo de frações. O conteúdo c(f ) de f ∈ D[x] é definido por
c(f ) := mdc(an , · · · , a0 ).
15.2. DOMÍNIOS FATORIAIS
107
Sendo um mdc, o elemento c(f ) é único a menos de multiplicação por elemento de
D∗ . Um polinômio f ∈ D[x] é dito primitivo, se c(f ) = 1.
Lema 15.20 (lema de Gauss generalizado). Seja D um domı́nio fatorial e K
seu corpo de frações.
(1) Se f, g ∈ D[x], então c(f g) = c(f )c(g).
(2) Se f, g ∈ D[x] são primitivos, então f é associado a g em D[x] se e
somente se ele o for em K[x].
(3) Seja f ∈ D[x] primitivo. Então f é irredutı́vel em D[x] se e somente se
f é irredutı́vel em K[x].
Demonstração. (1) Podemos sempre escrever f = c(f )f1 para f1 ∈ D[x]
primitivo. Logo,
f g = c(f )c(g)f1 g1 e c(f g) = c(f )c(g)c(f1 g1 ).
Afirmamos que c(f1 g1 ) = 1. Escrevamos explicitamente
f1 =
n
X
ai xi e g1 =
i=0
m
X
bi xi .
i=0
Seja
f1 g1 =
n+m
X
cj xj .
i=0
Seja p ∈ D irredutı́vel. Como c(f1 ) = c(g1 ) = 1 existe i tal que p - ai e l tal que
p - bl . Escolhamos i e l mı́nimos com esta propriedade. Então
ci+l = ai+l b0 + ai+l−1 b1 + . . . + ai+1 bl−1 + ai bl + ai−1 bl+1 + . . . + a0 bi+l
não pode ser divisı́vel por p. Em particular, p - c(f1 g1 ) e c(f1 g1 ) = 1.
(2) É claro que que se f é associado a g em D[x] também o é em K[x]. Provemos
a recı́proca. Ou seja, suponhamos que f = ug para u ∈ K ∗ e K = fr(D). Digamos
que u = ab . Logo
bf = ag, c(bf ) = bc(f ) = b e c(ag) = ac(g) = a,
i.e., b = va para v ∈ D∗ , portanto f é associado a g em D[x].
(3) É claro que se f é irredutı́vel em K[x] ele também o é em D[x]. Suponha
que f seja redutı́vel em K[x], digamos f = gh para g, h ∈ K[x] tais que grau(g),
grau(h) ≥ 1. Eliminando os denominadores de g e h obtemos a ∈ D \ {0} tal que
af = g1 h1 para g1 , h1 ∈ D[x] e grau(g1 ) = grau(g) e grau(h1 ) = grau(h). Note que
c(af ) = ac(f ) = a e c(g1 h1 ) = c(g1 )c(h1 ),
∗
logo existe u ∈ D tal que a = c(g1 )c(h1 )u. Além disto, escrevendo g1 = c(g1 )g1∗ e
h1 = c(h1 )h∗1 com g1∗ , h∗1 ∈ D[x] primitivos temos que
af = c(g1 )c(h1 )g1∗ h∗1 ,
i.e., f = u−1 g1∗ h∗1 o que contradiz o fato de f ser irredutı́vel em D[x].
Teorema 15.21. Seja D um domı́nio fatorial. Então D[x] também é um
domı́nio fatorial.
108
15. ANÉIS E DOMÍNIOS
Demonstração. Seja f ∈ D[x] \ {0}. Se f ∈ D∗ ou f for irredutı́vel nada há
a fazer. Caso contrário fatoramos
f = upe11 · · · perr
com u ∈ K ∗ , p1 , · · · , pr ∈ K[x] irredutı́veis, grau(p1 ) < · · · < grau(pr ) e e1 , · · · , er
≥ 1 inteiros. Multiplicando pelo produto dos denominadores obtemos a ∈ D \ {0}
tal que
af = vq1e1 · · · qrer ,
onde v ∈ D \ {0} e q1 , · · · , qr ∈ D[x] irredutı́veis em K[x] e grau(qi ) = grau(pi )
para todo i. Para todo i escreva qi = c(qi )qi∗ com qi∗ ∈ D[x] primitivo e irredutı́vel
em K[x]. Pelo lema de Gauss qi∗ é irredutı́vel em D[x] para todo i. Assim,
af = vc(q1 )e1 · · · c(qr )er (q1∗ )e1 · · · (qr∗ )er .
Mas c(af ) = ac(f ) e
c(vc(q1 )e1 · · · c(qr )er (q1∗ )e1 · · · (qr∗ )er ) = vc(q1 )e1 · · · c(qr )er .
Logo existe w ∈ D∗ tal que
ac(f ) = wvc(q1 )e1 · · · c(qr )er .
Em particular,
f = w−1 (q1∗ )e1 · · · (qr∗ )er
o que mostra que D[x] é fatorial.
Teorema 15.22 (critério de Eisenstein generalizado). Seja D um domı́nio fatorial, K = fr(D) seu corpo de frações,
f=
n
X
ai xi ∈ D[x] − {0}
i=0
primitivo e p ∈ D irredutı́vel. Se p | ai para i = 0, · · · , n − 1, p - an e p2 - a0 , então
f é irredutı́vel em K[x].
Demonstração. A prova é igual ao caso em que D = Z que foi feita anteriormente, substituindo o lema de Gauss pela sua generalização.
15.3. Fatores múltiplos e resultante
Proposição 15.23. Sejam f, g ∈ K[x] \ K. Então existe h ∈ K[x] \ K irredutı́vel tal que
h|f eh|g
se e somente se existem u, v ∈ K[x] \ {0} tais que
ug = vf, grau(u) < grau(f ) e grau(v) < grau(g).
Demonstração. Suponhamos que exista h como acima, i.e., f = hf1 e g =
hg1 com f1 , g1 ∈ K[x] e grau(f1 ) < grau(f ) e grau(g1 ) < grau(g). Logo f1 g = g1 f
e tomamos u = f1 e v = g1 .
Reciprocamente, suponhamos a segunda condição satisfeita. Como grau(u) <
grau(f ) e pela unicidade da fatoração de polinômios temos que existe algum fator
irredutı́vel h de f tal que h | g.
15.3. FATORES MÚLTIPLOS E RESULTANTE
109
Definição 15.24. Sejam
f=
n
X
ai xi e g =
i=0
m
X
bj xj .
j=0
A resultante Res(f, g) é definida como o determinante

an an−1
···
a1
a0

a
a
·
·
·
a1
a0
n
n−1


.
.
.
.
.
.
.
..

.
.
.


an an−1 · · ·

bm bm−1 · · ·
b1
b0


b
b
·
·
·
b1
b0
m
m−1


.
.
.
.
..
..
..
..

bm bm−1 · · ·
da seguinte matriz

..
.
a1
..
.
b1





a0 
,






b0
onde as linhas com os coeficientes ai ’s são repetidas m vezes e as linhas com os
coeficientes bj ’s são repetidas n vezes, ou seja a matriz é (n + m) × (n + m). As
demais entradas da matriz são todas nulas.
Observação 15.25. Seja
u=
r
X
i
ci x e v =
i=0
s
X
dj xj ,
j=0
onde r ≤ n − 1 e s ≤ m − 1. Para facilitar a notação tomaremos os coeficientes de
u (resp. v) até n − 1 (resp. m − 1) com a convenção que se i > r (resp. j > s)
então ci = 0 (resp. dj = 0). A igualdade ug = vf resulta em um sistema linear
homogêneo
an dm−1 − bm cn−1 = 0
an dm−2 + an−1 dm−1 − bm cn−2 − bm−1 cn−1 = 0
······
a1 d0 + a0 d1 − b1 c0 − b0 c1 = 0
a0 d0 − b0 c0 = 0
cuja matriz transposta é igual a

an
an−1
···

a
a
n
n−1


..

.



−bm −bm−1
···


−b
−b
m
m−1


.
..


a1
···
..
.
a0
a1
..
.
an
−b1
···
..
.
an−1
−b0
−b1
..
.
···
.
a1
−b0
..
.
..
−bm
−bm−1
···
a0
..
.
..
.
−b1





a0 
.






−b0
Portanto, o determinante da matriz do sistema é igual a (−1)n Res(f, g). Da álgebra
linear o sistema tem solução não trivial se e somente se o determinante da matriz do
sistema é nulo, o que equivale a Res(f, g) = 0. A existência de solução não trivial
110
15. ANÉIS E DOMÍNIOS
equivale justamente a existência de u e v satisfazendo à condição acima. Dessa
forma temos o teorema seguinte.
Teorema 15.26. Sejam f, g ∈ K[x] \ K, então existe h ∈ K[x] \ K irredutı́vel
tal que h | f e h | g se e somente se Res(f, g) = 0.
Definição 15.27. Definimos formalmente a derivação de polinômios D : K[x]
→ K[x] por
!
n
n
X
X
i
D
ai x :=
iai xi .
i=0
i=1
Esta função satisfaz as seguintes propriedades:
(1) D(f + g) = D(f ) + D(g), para f, g ∈ K[x];
(2) D(af ) = aD(f ), para a ∈ K e f ∈ K[x];
(3) (regra de Leibniz) D(f g) = f D(g) + D(f )g, para f, g ∈ K[x].
Dizemos que um fator irredutı́vel f de g ∈ K[x] − K é múltiplo se f 2 | g.
Proposição 15.28. Seja g ∈ K[x]\K e f ∈ K[x]\K um polinômio irredutı́vel.
Então f é fator múltiplo de g se e somente se f | D(g).
Demonstração. Suponha que f seja fator múltiplo de g, então f 2 | g, i.e.,
g = Af 2 para algum A ∈ K[x]. Logo D(g) = D(A)f 2 + 2Af D(f ), portanto
f | D(g).
Reciprocamente, suponha que f | D(g), digamos g = f A e D(g) = f B para
A, B ∈ K[x]. Derivando a primeira igualdade, D(g) = f D(A) + D(f )A, substituindo temos que f (B − D(A)) = D(f )A. Se D(f ) = 0 então trivialmente
D(f ) | g. Suponhamos que D(f ) 6= 0. Neste caso grau(D(f )) < grau(f ) e como f é
irredutı́vel, pela unicidade da fatoração de polinômios, concluimos que f é um fator
de A, digamos A = f C para C ∈ K[x]. Assim g = f 2 C e f é um fator múltiplo de
g.
Definição 15.29. Definimos o discriminante de f ∈ K[x] \ {0} por disc(f ) :=
Res(f, D(f )). Assim concluimos a seguinte proposição.
Proposição 15.30. Seja f ∈ K[x] \ K, então f possui fator múltiplo se e
somente se disc(f ) = 0.
15.4. Anéis quocientes e teorema chinês dos restos
Seja A um anel (sempre comutativo com unidade) e I, J ⊂ A ideais de A
definimos o ideal soma I + J por
I + J := {a + b | a ∈ I e b ∈ J}.
Fica como exercı́cio verificar que I + J é de fato um ideal de A. Dizemos que os
ideais I e J são coprimos se
I + J = A, i.e., se existem a ∈ I e b ∈ J tais que 1 = a + b.
Por exemplo, se A = Z, I = nZ e J = mZ com n, m ≥ 1 inteiros, temos que
I e J são coprimos se e somente se mdc(m, n) = 1. De fato, se os ideais forem
coprimos, então existem s, t ∈ Z tais que 1 = sn + tm. Assim, qualquer divisor
primo comum de n e m dividiria também 1, o que é impossı́vel. Reciprocamente,
se mdc(n, m) = 1, então pelo algoritmo euclideano estendido existem s, t ∈ Z tais
que 1 = sn + tm, a fortiori 1 ∈ I + J.
15.4. ANÉIS QUOCIENTES E TEOREMA CHINÊS DOS RESTOS
111
Definição 15.31. Seja A um anel e I um ideal de A. Definimos em A a
seguinte relação. Dados a, b ∈ A dizemos que
a≡b
(mod I) se a − b = α ∈ I,
dizemos neste caso que a é equivalente a b módulo I. Fica como exercı́cio verificar
que isto define de fato uma relação de equivalência. A classe de equivalência de
a ∈ A módulo I será denotada por
a + I := {a + α | α ∈ I}.
O conjunto de classes de equivalência será denotado por A/I. Quando A = Z e
I = nZ a relação acima é apenas a relação de congruência módulo n, uma vez que
Z é um domı́nio principal.
Definição 15.32. Definimos em A/I uma estrutura de anel da seguinte forma:
(a + I) ⊕ (b + I) := (a + b) + I e (a + I) (b + I) := (ab) + I.
Observação 15.33. Verifiquemos que estas operações estão bem definidas.
Sejam a0 , b0 ∈ A tais que a0 ≡ a (mod I) e b0 ≡ b (mod I), i.e., a0 − a = α ∈ I e
b0 − b = β ∈ I. Assim,
(a0 + b0 ) − (a + b) = α + β ∈ I
e em particular a0 + b0 ≡ a + b (mod I) (o que equivale a (a0 + b0 ) + I = (a + b) + I).
Também temos que
a0 b0 − ab = a0 b0 − a0 b + a0 b − ab = a0 (b0 − b) + b(a0 − a) = a0 β + bα ∈ I,
portanto a0 b0 ≡ ab (mod I) (ou equivalentemente, (a0 b0 ) + I = (ab) + I). Deixamos
também como exercı́cio verificar (exatamente como no caso dos inteiros módulo n)
que o conjunto A/I com as operações ⊕ e é um anel. Note que o elemento neutro
para a soma é a classe I e o elemento neutro para o produto é a classe 1 + I.
15.4.1. Ideais primos e maximais.
Definição 15.34. Um ideal I de um anel A é dito maximal se para todo ideal
J de A tal que I ⊂ J ⊂ A temos J = I ou J = A.
Proposição 15.35. Um ideal I de A é maximal se e somente se o anel quociente A/I é um corpo.
Demonstração. Suponha que I seja um ideal maximal de A. Seja a + I 6= I
uma classe em A/I. Isto equivale a a ∈
/ I. O conjunto (a) = {xa | x ∈ A} é um
ideal de A e pelo que foi feito anteriormente o conjunto J = I + (a) também é um
ideal de A. Além disto, I
J. Pela maximalidade de I concluimos que J = A,
i.e., que existem t ∈ I e s ∈ A tais que 1 = t + sa, i.e., sa ≡ 1 (mod I), i.e.,
(sa) + I = (s + I) (a + I) = 1 + I, i.e., a + I admite inverso multiplicativo.
Reciprocamente, suponha que A/I seja um corpo. Seja J um ideal de A tal
que I
J. Seja a ∈ J − I. Então a + I 6= I e por hipótese existe b ∈ A tal que
(a + I) (b + I) = 1 + I, i.e., (ab) + I = 1 + I, i.e., existe t ∈ I tal que ab − 1 = t.
Em outras palavras 1 = t − ab ∈ J, logo A = J e I é maximal.
Definição 15.36. Um ideal I de A é dito um ideal primo se dados a, b ∈ A
tais que ab ∈ I, então a ∈ I ou b ∈ I. Note que quando A = Z e p é um número
primo o ideal pZ é um ideal primo de Z.
112
15. ANÉIS E DOMÍNIOS
Proposição 15.37. Um ideal I de A é primo se e somente se o anel quociente
A/I é um domı́nio de integridade.
Demonstração. Suponha que I seja um ideal primo de A. Sejam a+I, b+I ∈
tais que (a + I) (b + I) = I, i.e., (ab + I) = I, i.e., ab ∈ I. Como I é primo,
temos que a ∈ I ou b ∈ I, i.e., a + I = I ou b + I = I.
Reciprocamente, suponha que A/I seja um domı́nio de integridade. Sejam
a, b ∈ A tais que ab ∈ I, i.e., (ab) + I = (a + I) (b + I) = I. Por hipótese, a + I = I
ou b + I = I, i.e., a ∈ I ou b ∈ I.
A
I
15.4.2. Homomorfismo de anéis.
Definição 15.38. Sejam A e B anéis e f : A → B uma função. Esta função é
dito um homomorfismo de anéis se
f (a + b) = f (a) + f (b) e f (ab) = f (a)f (b).
Observe que f (0) = f (0 + 0) = f (0) + f (0), portanto f (0) = 0. Se além disto
A for um domı́nio de integridade e f não for a função nula, então f (1) = 1. De
fato, f (1) = f (1.1) = f (1)f (1), i.e., f (1)(f (1) − 1) = 0. Se A é um domı́nio de
integridade, então f (1) = 0 ou f (1) = 1. No primeiro caso a função é identicamente
nula, pois f (a) = f (1.a) = f (1)f (a) = 0. Observe também que como 0 = f (0) =
f (a + (−a)) = f (a) + f (−a), então f (−a) = −f (a).
Definição 15.39. Um homomorfismo f : A → B é dito um isomorfismo se for
bijetivo. Um homomorfismo f : A → A é dito um endomorfismo de A. Se este
endomorfismo for bijetivo ele é dito um automorfismo de A. Seja f : A → B um
homomorfismo de anéis. O núcleo N (f ) de f é definido por {a ∈ A | f (a) = 0}.
Fica como exercı́cio mostrar que N (f ) é um ideal de A. A imagem f (A) de f é um
subanel de B (isto também é um exercı́cio).
Lema 15.40. Seja f : A → B um homomorfismo de anéis. Então f é injetivo
se e somente se N (f ) = (0).
Demonstração. Suponha que f seja injetivo e que a ∈ N (f ). Logo f (a) =
0 = f (0), pela injetividade de f concluimos que a = 0. Reciprocamente, suponha
que N (f ) = (0). Sejam a, b ∈ A tais que f (a) = f (b). Então f (a − b) = 0, i.e.,
a − b ∈ N (f ), em particular a = b.
Teorema 15.41 (teorema dos homomorfimos). Seja f : A → B um homomorfismo de anéis. Então f induz um isomorfismo ϕ : A/N (f ) → f (A) (em outras
palavras A/N (f ) ∼
= f (A), i.e., estes dois anéis são isomorfos).
Demonstração. A função ϕ é definida por
ϕ(a + N (f )) := f (a).
Verifiquemos inicialmente que ϕ está bem definida. Seja a0 ∈ A tal que a0 ≡ a
(mod N (f )), i.e., a0 − a = α ∈ N (f ). Logo f (a0 ) = f (a), i.e., ϕ(a0 + N (f )) =
ϕ(a + N (f )).
Esta função é um homomorfismo, pois
ϕ((a + N (f )) ⊕ (b + N (f ))) = ϕ((a + b) + N (f )) = f (a + b) = f (a) + f (b)
= ϕ(a + N (f )) + ϕ(b + N (f )) e
ϕ((a + N (f )) (b + N (f ))) = ϕ((ab) + N (f )) = f (ab)
= f (a)f (b) = ϕ(a + N (f ))ϕ(b + N (f )).
15.4. ANÉIS QUOCIENTES E TEOREMA CHINÊS DOS RESTOS
113
Esta função é sobrejetiva, pois para todo y ∈ f (A), temos que y = f (a) para a ∈ A,
portanto y = ϕ(a + N (f )). Esta função também é injetiva, pois se ϕ(a + N (f )) =
f (a) = 0, então a ∈ N (f ), i.e., a + N (f ) = N (f ).
15.4.3. Teorema chinês dos restos.
Proposição 15.42. Sejam I, J ideais de A tais que I + J = A e a, b ∈ A.
Então existe x ∈ A tal que
(
x ≡ a (mod I)
x≡b
(mod J).
Demonstração. Por hipótese existem α ∈ I e β ∈ J tais que 1 = α + β.
Então β ≡ 1 (mod I) e α ≡ 1 (mod J). Em particular, aβ ≡ a (mod I) e bα ≡ b
(mod J). Basta tomar x = aβ + bα.
Vamos generalizar o resultado anterior para um número qualquer de ideais.
Para isto precisamos da noção de produto de ideais. Sejam I1 , · · · , Ir ideais de A.
Seja
I1 . . . Ir := {a1,1 · · · ar,1 + . . . + a1,n . . . ar,n | onde ai,j ∈ Ii , para todo i}.
Fica como exercı́cio mostrar que I1 . . . Ir é efetivamente um ideal de A.
Proposição 15.43. Sejam I1 , · · · , Ir ideais de A tais que para todo α 6= β
tenhamos Iα + Iβ = A. Sejam a1 , · · · , ar ∈ A. Então existe x ∈ A tal que

x ≡ a1 (mod I1 )



..
..
.
.



x ≡ ar (mod Ir ).
Demonstração. Denotamos
J := I1 . . . Ir e para cada ν, Jν := I1 . . . Iν−1 Iν+1 . . . Ir .
Afirmamos que
(15.1)
Iν + Jν = A.
De fato, sabemos que para cada α 6= ν existem λα ∈ Iα e λν(α) ∈ Iν tais que
λα + λν(α) = 1. Note que utilizamos o ı́ndice ν(α) para dizer que o elemento
λν(α) efetivamente depende da escolha de α, uma vez que os ideais são dois a dois
coprimos. Seja
γν := λ1 . . . λν−1 λν+1 . . . λr ∈ Jν .
Então
Y
(λα + λν(α) ) = γν + δν ,
α6=ν
onde δν ∈ Iν . Da igualdade (15.1) obtemos que para cada ν vale γν ≡ 1 (mod Iν )
e γν ≡ 0 (mod Iα ) para α 6= ν. Finalmente, x := a1 γ1 + . . . + ar γr é uma solução
do sistema.
Lema 15.44. Sejam I1 , · · · , Ir ideais de A tais que para todo α 6= β tenhamos
Iα + Iβ = A. Então
I1 . . . Ir = I1 ∩ . . . ∩ Ir .
114
15. ANÉIS E DOMÍNIOS
Demonstração. Provemos o resultado por indução em r. Suponhamos inicialmente r = 2. Assim, um elemento de I1 I2 é da forma
a1,1 a2,1 + . . . + a1,n a2,n ,
onde a1,ν ∈ I1 (resp. a2,ν ∈ I2 ) para cada ν. Note que cada parcela a1,ν a2,ν
pertence a I1 ∩ I2 , pela definição de ideal. Logo I1 I2 ⊂ I1 ∩ I2 . Basta provar a
inclusão oposta. Por hipótese existem γ1 ∈ I1 e γ2 ∈ I2 tais que 1 = γ1 + γ2 . Seja
a ∈ I1 ∩ I2 , logo a = γ1 a + aγ2 ∈ I1 I2 .
Suponha agora o resultado provado para r − 1 fatores, vamos prová-lo para
r fatores. Novamente, pela própria definição de produto de ideais temos que
I1 . . . Ir ⊂ I1 ∩ . . . ∩ Ir . Basta provar a inclusão oposta. Da demonstração da
proposição anterior concluimos que I1 . . . Ir−1 e Ir são coprimos. Logo existe
γr ∈ I1 . . . Ir−1 e δr ∈ Ir tal que γr + δr = 1. Seja a ∈ I1 ∩ · · · ∩ Ir . Note
que para todo t ≥ 1 temos também que at ∈ I1 ∩ · · · ∩ Ir . Então
ar = γr ar + a . . . a(aδr ) ∈ I1 + . . . + Ir ,
onde a repete-se r − 1 vezes no produto acima.
Teorema 15.45 (teorema chinês dos restos). Sejam I1 , · · · Ir ideais de A tais
que Iα + Iβ = A, para α 6= β. Então
(1) existe um isomorfismo de anéis
A
∼ A × ... × A.
=
I1 . . . Ir
I1
Ir
(2) Este isomorfismo restringe-se a um isomorfismo de grupos
∗ ∗
∗
A
A
A
∼
× ... ×
.
=
I1 . . . Ir
I1
Ir
Demonstração. Definimos
ϕ:
A
A
A
→
× ... ×
por
I1 · · · Ir
I1
Ir
ϕ(a + I1 . . . Ir ) := (a + I1 , · · · , a + Ir ).
Verifiquemos que esta função está bem definida. De fato, se b − a = α ∈ I1 . . . Ir =
I1 ∩. . . Ir (pelo lema anterior), então b ≡ a (mod Iν ) para todo ν, i.e., b+Iν = a+Iν
para todo ν.
Afirmamos que ϕ é um homomorfismo. De fato,
ϕ((a + I1 . . . Ir ) ⊕ (b + I1 . . . Ir )) = ϕ((a + b) + I1 . . . Ir )
= ((a + b) + I1 , · · · , (a + b) + Ir )
= ((a + I1 ) ⊕ (b + I1 ), · · · , (a + Ir ) ⊕ (b + Ir ))
= (a + I1 , · · · , a + Ir ) ⊕ (b + I1 , · · · , b + Ir ) e
ϕ((a + I1 . . . Ir ) (b + I1 . . . Ir )) = ϕ((ab) + I1 . . . Ir )
= ((ab) + I1 , · · · , (ab) + Ir )
= ((a + I1 ) (b + I1 ), · · · , (a + Ir ) (b + Ir ))
= (a + I1 , · · · , a + Ir ) (b + I1 , · · · , b + Ir ).
15.5. APLICAÇÕES
115
Esta função é sobrejetiva. De fato, dado
(a1 + I1 , · · · , ar + Ir ) ∈
A
A
× ... × ,
I1
Ir
pela proposição anterior existe x ∈ A tal que x ≡ aν (mod Iν ) para todo ν, i.e.,
x+Iν = aν +Iν para todo ν. Portanto, (a1 +I1 , · · · , ar +Ir ) = (x+I1 , · · · , x+Ir ) =
ϕ(x + I1 . . . Ir ).
Finalmente, ϕ é injetiva. De fato, se (a + I1 , · · · , a + Ir ) = (I1 , · · · , Ir ), então
a ∈ I1 ∩ . . . ∩ Ir = I1 . . . Ir .
Suponhamos que a + I1 . . . Ir ∈ (A/I1 . . . Ir )∗ , i.e., que exista b + I1 . . . Ir ∈
(A/I1 . . . Ir ) tal que
(a + I1 . . . Ir ) (b + I1 . . . Ir ) = (ab) + I1 . . . Ir = 1 + I1 . . . Ir ,
i.e., ab − 1 = c ∈ I1 . . . Ir = I1 ∩ . . . ∩ Ir . Logo ab ≡ 1 (mod Iν ) para todo ν,
i.e., (a + Iν ) · (b + Iν ) = 1 + Iν para todo ν. Portanto (a + I1 , · · · , a + Ir ) ∈
(A/I1 )∗ × . . . × (A/Ir )∗ .
É claro que a restrição de ϕ (A/I1 . . . Ir )∗ é um homomorfismo injetivo. Resta
provar a sua sobrejetividade. Seja (a1 + I1 , · · · , ar + Ir ) ∈ (A/I1 )∗ × . . . × (A/Ir )∗ .
Pela parte anterior sabemos que existe x ∈ A tal que aν + Iν = x + Iν para todo ν.
Basta provar que x + I1 . . . Ir ∈ (A/I1 . . . Ir )∗ . Mas para todo ν existe αν ∈ A tais
que αν x ≡ 1 (mod Iν ), pois x é inversı́vel simultaneamente módulo cada Iν . Ou
seja, αν x − 1 = δν ∈ Iν para cada ν. Assim,
Y
Y
(αν x − 1) = xz + (−1)r 1 =
δν ∈ I1 . . . Ir ,
ν
ν
para algum z ∈ A, i.e., xz ≡ ±1 (mod I1 . . . Ir ). Substituindo, se necessário, z por
−z, concluimos que x ∈ (A/I1 . . . Ir )∗ .
15.5. Aplicações
15.5.1. Soma de quadrados.
Teorema 15.46 (Fermat). Seja p um número primo. As seguintes condições
são equivalentes:
(i) p = 2 ou p ≡ 1 (mod 4).
(ii) Existe a ∈ Z tal que a2 ≡ −1 (mod p).
(iii) p é redutı́vel em Z[i].
(iv) p = a2 + b2 com a, b ∈ Z.
Demonstração. Suponha (i). Se p = 2, tome a = 1 e lembre que 1 ≡ −1
(mod 2). Suponhamos que p = 4n + 1. Pelo pequeno teorema de Fermat para todo
a ∈ Z tal que p - a temos que ap−1 ≡ 1 (mod p). Em outras palavras, temos a
fatoração xp−1 − 1 = (x − 1) · · · (x − p − 1). Por outro lado, xp−1 − 1 = x4n − 1 =
2n
(x2n −1)(x2n +1). Ou seja, existe b ∈ {1, · · · , p − 1} tal que b = −1, i.e., b2n ≡ −1
(mod p). Tome a = bn .
Suponha (ii). Seja k ∈ Z tal que a2 = −1 + kp. Logo (a − i)(a + i) = kp.
Suponhamos que p | (a + i), i.e, que existam c, d ∈ Z tais qeu p(c + di) = a + i.
Em particular, pd = 1 e p | 1 o que é impossı́vel. Portanto, p - (a + i). Pelo mesmo
argumento p - (a − i). Mas Z[i] é um domı́nio euclideano, logo fatorial, assim p não
pode ser um irredutı́vel am Z[i].
116
15. ANÉIS E DOMÍNIOS
Suponha que p = (a + bi)(c + di) com a2 + b2 6= 1 e c2 + d2 6= 1. Pela
multiplicatividade da norma, p2 = N (p) = N (a + bi)N (a + di) = (a2 + b2 )(c2 + d2 ),
mas a única possibilidade para que isto ocorra é que a2 + b2 = c2 + d2 = p.
Suponhamos (iv) e que p > 2. Dado a ∈ Z temos que a2 ≡ 0 ou 1 (mod 4).
Assim, as possibilidades para a2 + b2 (mod 4) são 0, 1 ou 2. Mas como p é primo
apenas a segunda possibilidade pode acontecer.
15.5.2. Lei de reciprocidade quadrática.
Definição 15.47. Vamos reescrever o ı́tem (ii) do teorema de outra forma.
Seja a ∈ Z, dizemos que a é resto quadrático módulo p se existe b ∈ Z tal que
b2 ≡ a (mod p). Assim em (ii) estamos dizendo que -1 é resto quadrático módulo
p. Dado a ∈ Z e um número primo p tal que p - a, definimos o sı́mbolo de Legendre
de a em p por
a
= 1, se a é resto quadrático módulo p,
p
a
= −1, caso contrário.
p
Assim o teorema afirma que p é soma de quadrados se e somente se (−1/p) = 1.
Um importante teorema na teoria dos números (que não demonstraremos aqui)
é a lei de reciprocidade quadrática (cf [IrRo, chapter 5]).
Teorema 15.48 (lei de reciprocidade quadrática). Sejam p, q > 2 primos distintos. Enão
p−1 q−1
p
q
= (−1) 2 2 .
q
p
Uma maneira de interpretar esta lei é uma fórmula de inverter o sı́mbolo de
Legendre, ou seja,
p−1 q−1
q
p
2
2
= (−1)
.
p
q
Por exemplo, se p, q ≡ 1 (mod 4), então
q
p
= 1 se e somente se
= 1.
p
q
Se p, q ≡ 3 (mod 4), então
p
q
= 1 se e somente se
= −1.
q
p
Finalmente se p ≡ 1 (mod 4) e q ≡ 3 (mod 4) (ou vice-versa), então
p
q
= 1 se e somente se
= 1.
q
p
Parte 4
Corpos
CAPı́TULO 16
Extensões finitas
Sejam K ⊂ L dois corpos. Dizemos que L é uma extensão de K ou que L/K é
uma extensão de corpos. Notemos neste caso que a multiplicação de elementos de
K por elementos de L induz em L uma estrutura de K-espaço vetorial. Quando L
é um K-espaço vetorial de dimensão finita, dizemos que L/K é uma extensão finita
e denotamos dimK L = [L : K] chamado o grau da extensão.
Proposição 16.1. Sejam K ⊂ L ⊂ M corpos. Então M/K é uma extensão
finita se e somente se M/L e L/K são extensões finitas e neste caso
[M : K] = [M : L][L : K].
Demonstração. Suponha que M/K seja uma extensão finita. Qualquer conjunto de elementos de M que seja L-linearmente independente é em particular Klinearmente independente. Portanto, o número máximo de vetores L-linearmente
independentes em M é [M : K], em particular M/L é finita. Como L ⊂ M e M
é um K-espaço vetorial de dimensão finita, concluimos que o mesmo vale para L,
i.e., L/K é finita.
Suponha que M/L e L/K sejam finitas. Sejam {α1 , · · · , αn } uma base de M/L
e {β1 , · · · , βm } uma base de L/K. Afirmamos que o conjunto
{αi βj }1≤i≤n,1≤j≤m
é uma base de M/K. Disto segue imediatamente a proposição.
Seja x ∈ M , então
n
X
x=
ai αi ,
i=1
onde a1 , · · · , an ∈ L. Além disto para todo i = 1, · · · , n, temos que
ai =
m
X
bij βj ,
j=1
onde βj ∈ K. Logo,
x=
n X
m
X
bij αi βj ,
i=1 j=1
em particular o conjunto acima gera M como K-espaço vetorial.
Suponha que tenhamos uma K-combinação linear trivial
n X
m
X
cij αi βj = 0,
i=1 j=1
119
120
16. EXTENSÕES FINITAS
onde para todo i, j, cij ∈ K. Reescremos


n
m
X
X

cij βj  αi = 0.
i=1
j=1
Como para todo i temos
m
X
cij βj ∈ L e {α1 , · · · , αn }
j=1
é um conjunto L-linearmente independente, concluimos que para todo i temos
m
X
cij βj = 0.
j=1
Por outro lado, segue do fato de {β1 , · · · , βm } ser K-linearmente independente que
cij = 0 para todo i, j.
Corolário 16.2. Seja L/K uma extensão finita de grau primo. Então para
todo corpo F tal que K ⊂ F ⊂ L temos que F = K ou F = L.
Definição 16.3. Seja L/K uma extensão finita com base {α1 , · · · , αn } e u ∈ L.
Definimos o polinômio caracterı́stico de u em relação a L/K da seguinte forma. Para
todo i = 1, · · · , n temos
n
X
uαi =
aij αj .
j=1
O polinômio é definido por
Fu,L/K (x) := det(Ix − (aij )).
Denotamos A := (aij ).
Observação 16.4.
(1) Fu,L/K tem coeficiente lı́der 1 e grau n = [L : K].
(2) Fu,L/K não depende da escolha da base. De fato, seja {β1 , · · · , βn } uma
outra base de L/K e B a matriz de mudança de base de {β1 , · · · , βn } para
{α1 , · · · , αn }. Seja C := B −1 . Assim,
uβi = u
=
n
X
j=1
n
X
bij αj =
n
X
j=1
bij
n
X
ajl αl = (BA)il αl
l=1
(BA)il clh βh = (BAC)ih βh .
h=1
Assim,
det(Ix−(BAB −1 )) = det(B(Ix−A)B −1 ) = det(B) det(Ix−A) det(B −1 ) = Fu,L/K .
(3) Se u ∈ K, então Fu,L/K = (x − u)n .
Proposição 16.5. Sejam K ⊂ L ⊂ M tais que M/L e L/K sejam extensões
finitas. Seja u ∈ L. Então
[M :L]
Fu,M/K = Fu,L/K .
16. EXTENSÕES FINITAS
121
Demonstração. Sejam {α1 , · · · , αn } uma base de M/L e {β1 , · · · , βm } uma
base de L/K. Então {αi βj }1≤i≤n,1≤j≤m é uma base de M/K. Note que
uαi βj = αi
m
X
ajl βl =
l=1
m
X
ajl αi βl .
l=1
Assim, em cada bloco {α1 β1 , · · · , α1 , βm }, ... , {αn β1 , · · · , αn βm } a matriz do
operador linear definido pela multiplicação por u é igual a A. Portanto,
Fu,M/K

Ix − A
0
 0
Ix
−A

= det  .
..
.
 .
.
0
0
···
···
···
···
0
0
..
.



n
.
 = Fu,L/K

Ix − A
Definição 16.6. Escrevendo explicitamente,
Fu,L/K = xn + f1 xn−1 + . . . + fn−1 x + fn .
O traço TL/K (u) de u em relação a L/K é definido por
TL/K (u) := −f1 .
A norma NL/K (u) de u em relação a L/K é definida por
NL/K (u) := (−1)n fn .
Observe que expandindo o determinante que define Fu,L/K obtemos
f1 =
n
X
aii = Tr(A), o traço da matriz A, e fn = det(A).
i=1
Definição 16.7. Sejam L/K uma extensão de corpos f ∈ K[x]\{K}. Dizemos
que um elemento α ∈ L é raiz de f se f (α) = 0.
Suponhamos conhecidas u1 , · · · , un as raı́zes de Fu,L/K . Note que uma destas
raı́zes, digamos u1 , é exatamente u. Observe também que usando o algoritmo da
divisão, se α é raiz de f então
f (x) = (x − α)g(x),
para algum g ∈ K[x]. Neste caso temos a fatoração
Fu,L/K (x) =
n
Y
i=1
(x − ui ).
122
16. EXTENSÕES FINITAS
Desenvolvendo este produto obtemos
n
X
f1 = −
ui
i=1
X
f2 =
ui uj
1≤i<j≤n
f3 = −
X
ui uj uk
1≤i<j<k≤n
.. ..
. .
fn = (−1)n
n
Y
ui .
i=1
Assim,
TL/K (u) =
NL/K (u) =
n
X
i=1
n
Y
ui
ui .
i=1
Definição 16.8. Sejam x1 , · · · , xn variáveis independentes (ver definição no
capı́tulo de extensões trancendentes) sobre um corpo K. Para todo 1 ≤ i ≤ n
definimos a i-ésima função simétrica elementar nas variáveis x1 , · · · , xn por
X
si (x1 , · · · , xn ) :=
uj1 . . . uji .
1≤j1 <·<ji ≤n
Observe que para todo 1 ≤ i ≤ n temos
fi = (−1)i si (u1 , · · · , un ).
Segue imediatamente da lineraridade de traço de matriz e da multiplicatividade
de determinante de matriz o seguinte lema.
Lema 16.9.
(1) Se u ∈ K, então NL/K (u) = un e TL/K (u) = nu.
(2) A função NL/K é multiplicativa, i.e.,
NL/K (uv) = NL/K (u)NL/K (v).
(3) A função TL/K é K-linear, i.e.,
TL/K (u + v) = TL/K (u) + TL/K (v) e TL/K (au) = aTL/K (u), para a ∈ K.
(4) Se K ⊂ L ⊂ M são extensões finitas e u ∈ L, então
NM/K (u) = u[M :L] e TM/K (u) = [M : L]TL/K (u).
CAPı́TULO 17
Extensões algébricas
17.1. Elementos algébricos e transcendentes
Seja L/K uma extensão de corpos e α ∈ L. Dizemos que α é algébrico sobre
L, se existe f ∈ K[x] − {0} tal que f (α)√
= 0. Caso não exista tal f dizemos que α
é transcendente sobre K. Por exemplo, 2 ∈ R é algébrico sobre Q, pois é raiz de
x2 −2 e i ∈ C é algébrico sobre Q, pois é raiz de x2 +1. Por outro lado, são teoremas
não triviais devidos a Lindeman e Hilbert (resp.) que e, π ∈ R são transcendentes
sobre Q (ver capı́tulo de extensões transcendentes).
Na situação acima definimos a função
ϕα : K[x] → L por ϕα (g) := g(α).
Fica como exercı́cio mostrar que ϕα é um homomorfismo de anéis. Seja K[α] a
imagem de ϕα . Este é um subanel de L. Seja N (ϕα ) o núcleo de ϕα , i.e., este é o
conjunto dos elementos g ∈ K[x] tais que g(α) = 0, ou seja, este é o conjunto dos
polinômios dos quais α é raiz. Este conjunto é um ideal de K[x].
Teorema 17.1. Seja L/K uma extensão de corpos e α ∈ L.
(1) O elemento α é transcendente sobre K se e somente se ϕα é injetiva o
que equivale a N (ϕα ) = (0). Neste caso, K[α] é isomorfo ao anel de
polinômios K[x].
(2) O elemento α é algébrico sobre K se e somente se K[α] é um corpo. Neste
caso, [K[α] : K] = grau(Pα|K ).
Demonstração. Note que (1) é imediato das definições.
(2) Inicialmente, α é algébrico se e somente se N (ϕα ) 6= (0). Suponha que isto
ocorra. Seja Pα|K o gerador mônico do ideal N (ϕα ). Este polinômio é chamado o
polinômio mı́nimo de α sobre K. Por definição este é o polinômio mônico de menor
grau do qual α é raiz, sendo em particular irredutı́vel. Mas, isto equivale a dizer
que o ideal N (ϕα ) = (Pα|K ) é um ideal maximal de K[x]. Esta última afirmativa
equivale a dizer o anel quociente K[x]/(Pα|K ) é um corpo. Note que pelo teorema
dos homomorfismos K[α] é isomorfo como anel a K[x]/(Pα|K ). Portanto K[α] é
um corpo.
Reciprocamente, se K[α] for um corpo, então por (1), temos que α é algébrico
sobre K, pois K[x] não é corpo, uma vez que 1/x ∈
/ K[x].
Provemos a última afirmativa. Seja n := grau(Pα|K ). Afirmamos que
{1, α, · · · , αn−1 }
é uma base de K[α]/K. De fato, este conjunto é K-linearmente independente, do
contrário existiriam a0 , · · · , an−1 ∈ K não todos nulos tais que
a0 + . . . + an−1 αn−1 = 0.
123
124
17. EXTENSÕES ALGÉBRICAS
Ou seja α é raiz do polinômio
f (x) =
n−1
X
ai xi 6= 0.
i=0
Mas isto contradiz a minimalidade do grau de Pα|K . Para ver que este conjunto
gera K[α], seja g ∈ K[x] \ {0}. Dividindo g por Pα|K obtemos
g = Pα|K q + r,
para q, r ∈ K[x] tais que r = 0 ou grau(r) < n. Substituindo x por α concluimos que
g(α) = r(α). A fortiori, g(α) é uma K-combinação linear de {1, α, · · · , αn−1 }. Lema 17.2. Sejam L/K uma extensão de corpos e α ∈ L algébrico sobre K.
Então
(1) Fα,K[α]/K = Pα|K .
(2) Em particular, se L/K for finita, então
[L:K[α]]
Fα,L/K = Pα|K
.
Demonstração. (1) Por definição, Fα,L/K é um polinômio mônico de grau n
tendo α como raiz. Logo Fα,K[α]/K ∈ N (ϕα ), i.e.,
Pα|K | Fα,K[α]/K .
Mas pela igualdade do grau e por ambos serem mônicos concluimos que Pα|K =
Fα,K[α]/K .
(2) Vimos no capı́tulo anterior que
[L:K[α]]
[L:K[α]]
Fα,L/K = Fα,K[α]/K , i.e., Fα,L/K = Pα|K
.
Este é um caso particular do teorema de Cayley-Hamilton da álgebra linear.
17.2. Extensões algébricas
Definição 17.3. Uma extensão L/K é dita algébrica se todo α ∈ L é algébrico
sobre K. Caso exista algum α ∈ L transcendente sobre K dizemos que L/K é
transcendente.
Proposição 17.4. Toda extensão finita é algébrica.
Demonstração. Sejam L/K uma extensão finita e α ∈ L. Então existe n ≥ 1
inteiro mı́nimo tal que {1, α, · · · , αn−1 } é um conjunto K-linearmente independente.
Ou seja, existem a0 , · · · , an ∈ K não todos nulos tais que
n
X
ai αi = 0.
i=0
A fortiori, α é raiz do polinômio não nulo
f :=
n
X
ai xi .
i=0
17.2. EXTENSÕES ALGÉBRICAS
125
Definição 17.5. Seja L/K uma extensão algébrica. Suponhamos que existam
α1 , · · · , αr ∈ L tais que
K ⊂ K1 = K[α1 ] ⊂ K2 = K1 [α2 ] ⊂ · · · ⊂ Kr = Kr−1 [αr ] = K[α1 , · · · , αr ] = L.
Dizemos que L/K é uma extensão finitamente gerada e que L é gerada sobre K
por α1 , · · · , αr .
Proposição 17.6. Seja L/K uma extensão algébrica. Então L/K é finita se
e somente se L/K é finitamente gerada.
Demonstração. Suponha que L/K seja finita. Se L = K acabou. Senão
existe α1 ∈ L \ K. Seja K1 := K[α1 ]. Se L = K1 acabou. Senão existe α2 ∈ L \ K1 .
Seja K2 := K1 [α2 ]. Prosseguindo o argumento temos uma seqüência de corpos
estrita, i.e.,
K ( K1 ( K2 ( · · · .
Como L/K é finita esta seqüência não pode ser infinita. Logo existe r tal que
L = Kr e L/K é finitamente gerada.
Reciprocamente, se L/K é finitamente gerada então cada extensão Ki /Ki−1
é finita e pela transitividade de extensões finitas, concluimos que L/K também é
finita.
Teorema 17.7. Sejam M/L e L/K extensões de corpos.
algébrica se e somente se M/L e L/K também são algébricas.
Então M/K é
Demonstração. Segue da definição que se M/K é algébrica então M/L e
L/K também são algébricas.
Suponhamos que estas duas extensões sejam algébricas. Seja α ∈ M e
Pα|L :=
n−1
X
ai xi + xn .
i=0
Seja L a extensão de K gerada por a0 , · · · , an−1 . Então L ⊂ L e Pα|L ∈ L[x]. Pela
proposição anterior L/K é finita. Além disto, como α é algébrico sobre L, então
L[α]/L é finita. Pela transitividade de extensões finitas concluimos que L[α]/K é
finita. Por outro lado, K ⊂ K[α] ⊂ L[α], logo K[α]/K é finita. Em particular, α é
algébrico sobre K.
Exemplo 17.8. Seja L/K extensão com [L : K] = p número primo. Então
para todo K ⊂ K 0 ⊂ L temos que K 0 = K ou K 0 = L. Em particular, dado
α ∈ L \ K, então L = K[α].
√
Exemplo 17.9. Seja L/Q tal que [L : Q] = 2. Mostraremos que L = Q[ d]
para d ∈ Q que não é um quadrado. Pelo exemplo anterior, dado α ∈ L \ Q temos
que L = Q[α]. Seja
a
a2
Pα|Q := x2 + ax + b = x +
+ b−
.
2
4
A mudança de variável x 7→ x+a/2 transforma Pα|Q em X 2 −β, onde β = (a2 /4)−b.
Além disto esta mudança de variável é um automorfismo de K[x], portanto x2 − β
é irredutı́vel, assim tomamos d = β.
126
17. EXTENSÕES ALGÉBRICAS
17.3. Adjunção de raı́zes
Lema 17.10 (lema da duplicação). Sejam κ : K → K 0 um isomorfismo de
corpos e L0 ⊃ K 0 um corpo contendo K 0 . Então existe uma extensão L/K e um
isomorfismo de corpos λ : L → L0 estendendo κ, i.e., λ|K = κ.
Demonstração. Suponha que L0 ∩ K = ∅. Definimos L da seguinte forma :
L := K q (L0 \ K 0 ), onde q denota união disjuta. Definimos λ por λ : L → L0 , se
x ∈ K, então λ(x) := κ(x); se x ∈ L0 \ K 0 , então λ(x) := x. Dessa forma λ é uma
bijeção. Utilizamos esta bijeção para colocar uma estrutura de corpo em L por :
dados x, y ∈ L definimos
x + y := λ−1 (λ(x + y)) e xy := λ−1 (λ(x)λ(y)).
Com esta estrutura, λ é o isomorfismo de corpos procurado.
Se L0 ∩ K 6= ∅, basta aplicar o lema 1.1 para obter um conjunto L00 e uma
bijeção λ0 : L0 → L00 tal que L00 ∩ K = ∅. Novamente, definimos uma estrutura de
0
0
corpo em L00 por x0 +y 0 := λ −1 (λ0 (x)+λ0 (y)) et x0 y 0 := λ −1 (λ(x)λ(y)). Aplicamos
agora a parte anterior substituindo K 0 por K 00 := λ0 (K 0 ) e κ por κ0 := λ0 ◦ κ. Definição 17.11. Seja κ : K → K 0 um homomorfismo não nulo de corpos
(logo necessariamente injetivo). Este homomorfismo induz um homomorfismo de
anéis de polinômios da seguinte forma
κ∗ : K[x] → K 0 [x]
n
X
i=0
ai xi 7→
n
X
κ(ai )xi .
i=0
Teorema 17.12. Dado f ∈ K[x] \ K irredutı́vel existe uma extensão finita
L/K e α ∈ L tal que f (α) = 0.
Demonstração. Como f é irredutı́vel o ideal (f ) é maximal, logo o anel
quociente L := K[x]/(f ) é um corpo. Consideremos o homomorfimso sobrejetivo
ϕ : K[x] →
K[x]
definido por g 7→ g
(f )
(mod (f )).
Este homomorfismo não é o homomorfismo nulo, logo é injetivo quando restrito
a K, i.e., ϕ|K : K → K := ϕ(K) é um isomorfismo de corpos. Este induz um
isomorfismo de anéis de polinômios ϕ∗|K : K[x] → K[x] como na definição anterior.
Em particular, se x := ϕ(x), então
ϕ∗|K (f )(x) =
n
X
ϕ(ai )xi = ϕ(f (x)) ≡ 0
(mod (f )).
i=0
Assim x ∈ L é uma raiz de ϕ∗|K (f ).
Pelo lema da duplicação, existe uma extensão L/K e um isomorfismo λ : L → L
tal que λ|K = ϕ|K . A fortiori, definindo α := λ−1 (x), este elemento é uma raiz de
f em L.
Corolário 17.13. Seja f ∈ K[x] \ K, então existe uma extensão finita L/K
e α ∈ L tal que f (α) = 0.
17.4. FECHOS ALGÉBRICOS
127
Demonstração. Basta fatorar f em fatores irredutı́veis e usar o teorema para
determinar uma extensão finita de K no qual um dos fatores tenha raiz. Esta raiz
será também raiz de f .
Corolário 17.14. Seja f ∈ K[x] \ K. Existe uma extensão finita L/K tal que
f fatora-se linearmente em L[x].
Demonstração. Aplicando o teorema sucessivamente a cada fator irredutı́vel
de f obtemos em cada etapa uma extensão finita do corpo anterior e mais uma raiz
do fator. Como o número de fatores é finito e o número de raı́zes em cada fator
também o é, pela transitividade de extensões finitas, concluimos que existe L/K
finita como no corolário.
17.4. Fechos algébricos
Definição 17.15. Seja L/K uma extensão de corpos. Definimos AL (K) como
o conjunto dos elementos α ∈ L que são algébricos sobre K. Este conjunto é
chamado o fecho algébrico de K em L.
Observação 17.16. O conjunto AL (K) é um corpo. De fato, basta mostrar
que dados α, β ∈ AL (K) \ {0}, então α + β, αβ, α−1 ∈ AL (K). Provemos o caso de
α + β, os demais são similares. Por hipótese K[α] e K[β] são corpos e K[α]/K e
K[β]/K são finitas. Seja K[α, β] a extensão gerada sobre K por α e β. Considere
o seguinte diagrama de corpos.
K[α, β]
/
|
\
K[α] K[α + β] K[β]
\
|
/
K
A extensão K[α, β] é gerada por β sobre K[α]. Como β é algébrico sobre K e
K ⊂ K[α], concluimos que β é algébrico sobre K[α]. Logo a extensão K[α, β]/K[α]
é finita. Pela transitividade de extensões finitas, concluimos que K[α, β]/K é finita.
Mas, K ⊂ K[α + β] ⊂ K[α, β]. Logo K[α + β]/K é finita, portanto α + β ∈ AL (K).
Exemplo 17.17. Seja K um corpo, L/K extensão e τ ∈ L transcendente sobre
K. Afirmamos que K é algebricamente fechado em K(τ ) = {f (τ )/g(τ ) | f, g ∈
K[x], g 6= 0}. De fato, se existisse α ∈ K(τ ) \ K algébrico sobre K, digamos α =
f (τ )/g(τ ), então K[α]/K seria finita. Observe que h := f (x) − αg(x) ∈ (K[α])[x] e
h(τ ) = 0, ou seja, τ é algébrico sobre K[α]. Portanto, K(τ ) = (K[α])[τ ] é algébrico
sobre K, mas isto é impossı́vel, pois τ é transcendente sobre K.
Definição 17.18. Dizemos que um corpo K é algebricamente fechado, se todo
f ∈ K[x] \ K possui uma raiz α ∈ K.
A seguinte proposição é uma conseqüência direta desta definição, da fatoração
de polinômios e da definição sobre elementos algébricos.
Proposição 17.19. As seguintes condições são equivalentes.
(1) K é algebricamente fechado.
128
17. EXTENSÕES ALGÉBRICAS
(2) Todo f ∈ K[x] \ K fatora-se como produto de polinômios lineares.
(3) Todo f ∈ K[x] irredutı́vel tem grau 1.
(4) Não existe extensão L ) K algébrica.
O primeiro exemplo de corpo algebricamente fechado é C.
Teorema 17.20 (teorema fundamental da Álgebra). [Lins, p.199, corolário 4]
O corpo C é algebricamente fechado.
Exemplo 17.21. Seja f ∈ R[x]. Mostremos que grau(f ) = 1 ou 2. Seja β ∈ C
uma raiz de f . Então f = Pβ|R e como R ⊂ R[β] ⊂ C, e [C : R] = 2, então
grau(f ) = 1 ou 2.
Definição 17.22. Sejam K ⊂ Ω corpos com Ω algebricamente fechado. Dizemos que AΩ (K) é um fecho algébrico de K.
Definição 17.23. Sejam K um corpo e I um conjunto qualquer de ı́ndices.
O anel de polinômios K[xI ] em variáveis xi parametrizadas por elementos i ∈ I
é definido como sendo o conjunto de polinômios f com coeficientes em K em um
número finito de variáveis xi1 , · · · , xin , para i1 , · · · , in ∈ I.
Teorema 17.24. Para todo corpo K existe um corpo Ω ⊃ K algebricamente
fechado.
Demonstração. Seja P o conjunto dos polinômios irredutı́veis mônicos em
K[x]. Seja R o anel R := K[xP ]. Considere o ideal p de R gerado pelo conjunto
{P (xP ) | P ∈ P}. Este ideal é próprio, caso contrário existiriam P1 , · · · , Pr ∈ P e
G1 , · · · , Gr ∈ K[xP1 , · · · , xPr ] ⊂ R tais que
r
X
P (xPi )Gi (xP1 , · · · , x(Pr )) = 1.
i=1
Mas pelo corolário 17.14 existe uma extensão finita L/K tal que P1 . . . Pr fatora-se
linearmente em L. Para cada 1 ≤ i ≤ r seja αi ∈ L uma raiz de Pi . Logo
r
X
1=
P (αi )Gi (α1 , · · · , αr ) = 0,
i=1
o que é uma contradição.
Pelo lema de Krull, existe m ( R ideal maximal contendo p. Considere o homomorfismo quociente ϑ : R → R/m. A restrição κ de ϑ a K induz um isomorfimso de
corpos κ : K → K := ϑ(K). Pelo lema da duplicação existe uma extensão L1 /K e
um isomorfismo de corpos λ : L1 → R/m estendendo κ. Como na demonstração do
teorema 17.12 αP := ϑ(xP ) é uma raiz de ϑ∗ (P ), e a fortiori λ−1 (αP ) ∈ L1 é uma
raiz de P . Dessa forma construimos uma extensão L1 /K na qual todo elemento de
P possui uma raiz.
Prosseguindo indutivamente, contruimos uma seqüência de corpos
L0 := K ⊂ L1 ⊂ L2 ⊂ · · · ⊂ Ln ⊂ · · ·
tais que todo
S polinômio irredutı́vel mônico em Lj [x] possui uma raiz em Lj+1 .
Seja Ω := j≥1 Lj . Este conjunto é um corpo contendo K e afirmamos que é
algebricamente fechado. De fato, dado f ∈ Ω[x] \ Ω, este fatora-se linearmente em
algum Lj [x] para j suficientemente grande. Portanto, por construção, f possui raiz
em Lj+1 ⊂ Ω.
17.4. FECHOS ALGÉBRICOS
129
Corolário 17.25 (existência de fecho algébrico). Todo corpo K possui um
fecho algébrico.
Demonstração. Pelo teorema anterior existe extensão Ω/K tal que Ω é algebricamente fechado, portanto AΩ (K) é um fecho algébrico de K.
Teorema 17.26. Sejam K, K 0 corpos, κ : K → K 0 um isomorfismo de corpos,
L/K, L0 /K 0 extensões de corpos, α ∈ L (resp. α0 ∈ L0 ) algébrico sobre K (resp.
algébrico sobre K 0 ). As seguintes condições são equivalentes.
(1) O isomorfismo κ estende-se a um isormorfismo de corpos κα : K[α] →
K 0 [α0 ] tal que κα (α) = α0 .
(2) κ∗ (Pα|K ) = Pα0 |K 0 .
Demonstração. Suponha (1). Então κ∗ (Pα|K )(α0 ) = κα (Pα|K (α)) = 0, em
particular κ∗ (Pα|K ) | Pα0 |K 0 . Mas estes dois polinômios são irredutı́veis mônicos.
Portanto vale a igualdade.
Suponha (2). Sabemos que K[α] ∼
= K[x]/(Pα|K ) e K 0 [α0 ] ∼
= K 0 [x]/(Pα0 |K 0 ).
Assim, compondo os isomorfismos abaixo encontramos κα :
∼
K[x] κ
K 0 [x] ∼
=
=
K[α] −→
−→
−→ K 0 [α0 ].
(Pα|K )
(Pα0 |K 0 )
Definição 17.27. Sejam L e L0 extensões de K e λ : L → L0 um isomorfismo
de corpos. Dizemos que λ é um K-isomorfismo, se λ|K for a identidade.
Em particular, tomando K = K 0 , κ a identidade e L = L0 obtemos o corolário.
Corolário 17.28. Sejam L/K uma extensão de corpos e α, α0 ∈ L algébricos
sobre K. As seguintes condições são equivalentes.
(1) Existe um K-isomorfismo K[α] → K[α0 ] tal que α 7→ α0 .
(2) Pα|K = Pα0 |K 0 .
Definição 17.29. Sejam L/K uma extensão e α, β ∈ L algébricos sobre K.
Dizemos que α é K-conjugado a β (denotamos por α ∼K β), se Pα|K = Pβ|K . Esta
noção independe da escolha da extensão L/K. O conjunto Cα dos K-conjugados
de α é finito, pois #Cα ≤ grau(Pα|K ).
Proposição 17.30. Seja L/K uma extensão algébrica. Todo K-endomorfismo
de L é também um K-isomorfismo de L.
Demonstração. Seja σ um K-endomorfismo de L. Observe que para todo
α ∈ L temos σ(Cα ) ⊂ Cα , pois Pα|K (σ(β)) = β(Pα|K (β)) = 0. Mas Cα é finito e
σ é injetivo (pois é não nulo). Logo σCα é uma bijeção de um conjunto finito nele
mesmo. A fortiori, σ é sobrejetiva e σ é um K-automorfismo de L.
Teorema 17.31 (extensão de homomorfismos). Sejam L/K uma extensão
algébrica e κ : K → Ω um homomorfismo de corpos com Ω algebricamente fechado.
Então existe λ : L → Ω um homomorfismo de corpos estendendo κ.
Demonstração. Suponha inicialmente que L = k[α] para algum α ∈ L. Seja
α0 ∈ Ω uma raiz de κ∗ (Pα|K ). Assim, κ∗ (Pα|K ) = Pα0 |K 0 , onde K 0 := κ(K). Pelo
teorema 17.26, existe um homomorfismo de corpos λ : L → Ω estendendo κ tal que
λ(α) = α0 .
130
17. EXTENSÕES ALGÉBRICAS
No caso geral, consideramos o conjunto M de pares ordenados (L0 , λ0 ) formados por extensões L0 /K contidas em L e homomorfismos de corpos λ0 : L0 → Ω
estendendo κ. Definimos uma ordem parcial em M por
(L0 , λ0 ) ≤ (L00 , λ00 ) se e somente se L0 ⊂ L00 e λ0 = λ00|L0 .
O conjunto M é indutivo. De fato, se L := {(Lj , λj ) | j ∈ J} ⊂ M for um subconjunto totalmente ordenado, então o corpo
[
LJ :=
Lj
j∈J
é um subcorpo de L e definindo λJ em cada Lj por λJ := λj obtemos (por
construção) um homomorfismo de corpos λJ : LJ → Ω. Além disto, temos que
(Lj , λj ) ≤ (LJ , λJ ) para todo j ∈ J. Assim, (LJ , λJ ) é um limite superior para M.
Pelo lema de Zorn, o conjunto M admite elemento maximal (L̃, λ̃).
Afirmamos que L̃ = L. De fato, caso contrário, se α ∈ L̃ \ L, utlizando a
primeira parte da prova, poderı́amos estender λ̃ a um homomorfismo de corpos
L̃(α) → Ω, o que é uma contradição.
Teorema 17.32 (unicidade a menos de isomorfismo). Seja K um corpo. Suponha que Ω e Ω1 sejam corpos algebricamente fechados contendo K. Então AΩ (K)
e AΩ1 (K) são K-isomorfos.
Demonstração. Pelo teorema anterior, existe um K-homomorfismo λ :
AΩ (K) → Ω1 . É claro que a imagem de λ está contida em AΩ1 (K). Por outro
lado para todo α1 ∈ AΩ1 (K) e toda raiz α ∈ Ω de Pα1 |K temos que Pα|K = Pα1 |K .
Logo, pelo teorema 17.26, concluimos que existe um K-isomorfismo K[α] → K[α1 ]
tal que α 7→ α1 . Em particular, λ(AΩ (K)) = AΩ1 (K).
Exemplo 17.33. A motivação para o teorema anterior vem da seguinte situação. Uma maneira de construir R a partir de Q é adicionar a Q os limites de
seqüências de Cauchy de elementos de Q (ver [Li]). Por isto dizemos que R é o
completamento de Q.
Note-se entretanto que está implı́cito na discussão anterior que estamos utilizando para a noção de limite o valor absoluto usual dos números racionais. Tal
valor absoluto é arquimediano, ou seja satisfaz a desigualdade triangular |x + y| ≤
|x| + |y|. Por isto vamos dizer que R é o completamento arquimediano de Q. Na
linguagem da geometria aritmética moderna, o valor absoluto arquimediano nada
mais é que o primo no infinito que compatifica o conjunto (esquema) Spec(Z) dos
ideais primos de Z.
Porque dizemos isto? Para cada número primo p, pela unicidade da fatoração de
números inteiros em produto de números primos, para todo x ∈ Q existe um único
ordp (x) ∈ Z tal que x = pordp (x) x0 , onde nem o numerador nem o denominador de
x0 ∈ Q são divisı́veis por p. Isto permite definir o seguinte valor absoluto (chamado
de p-ádico)
|x|p := p−ordp (x) .
Este valor absoluto é não arquimediano, ou seja, vale uma propriedade mais forte
que a propriedade triangular, |x + y|p ≤ max(|x|p , |y|p ).
Repetimos o procedimento de construção de R a partir de Q e acrescentamos a
Q os limites de seqüências de Cauchy (com respeito ao valor absoluto p-ádico). O
17.4. FECHOS ALGÉBRICOS
131
conjunto obtido é o corpo Qp dos números p-ádicos. Uma outra forma de representar
um elemento de Qp é através de uma “série de Laurent”
X
ai pi ,
x=
i≥n
onde n ∈ Z e 0 ≤ ai < p é inteiro para todo i. Assim, Qp é o completamento de Q
com respeito ao valor absoluto p-ádico.
Pelo teorema 17.24 existe um corpo algebricamente fechado contendo R, por
exemplo C, e um corpo algebricamente fechado (até completo, mas isto não segue
do teorema, ver [Kob]) Cp contendo Qp . Assim, terı́amos por um lado o fecho
algébrico AC (Q) de Q en C (chamado o corpo de todos os números algébricos e
denotado por Q) e o fecho algébrico ACp (Q) de Q em Cp . O que o teorema nos
diz é que apesar destes dois fechos algébricos serem subcorpos de corpos distintos
(os valores absolutos são diferentes), eles são Q-isomorfos. Isto nos permite usar a
notação Q sem ambuiguidade.
Nos tópicos adicionais comentaremos sobre um grupo ligado a Q e um dos
objetos mais importantes da aritmética (bastante misterioso, ainda) o grupo de
Galois absoluto de Q.
CAPı́TULO 18
Extensões separáveis
Definição 18.1. Seja f ∈ K[x], L/K uma extensão de corpos e α ∈ L uma raiz
de f . A multiplicidade m = m(f, α) de α como raiz de f é definido como o maior
inteiro m ≥ 1 tal que existe g ∈ L[x] com g(α) 6= 0 satisfazendo a f = (x − α)m g.
Se m = 1 dizemos que α é uma raiz simples, caso contrário que é uma raiz múltipla.
No capı́tulo 15, seção 15.3 mostramos que dados f, g ∈ K[x]\K eles possuem um
fator comum não constante (logo uma raiz comum, utilizando o capı́tulo anterior)
se e somente sua resultante Res(f, g) for nula. Além disto, mostramos também
que f possui fator múltiplo (logo raiz múltipla) se e somente se seu discriminante
disc(f ) for nulo. Lembre que disc(f ) = Res(f, D(f )), onde D(f ) denota a derivada
de f .
Definição 18.2. Seja D um domı́nio de integridade. Consideremos o homomorfismo ϑ : Z → D tal que ϑ(1) = 1D , onde 1D denota o elemento neutro
multiplicativo de D. Seja I = N (ϑ) o núcleo de ϑ. Se N (ϑ) = (0) (i.e., ϑ for
injetivo) dizemos que a caracterı́stica car(D) como 0. Caso isto não ocorra I é um
ideal não nulo de Z, logo I = nZ para algum n ≥ 1. Além disto pelo teorema dos
isomorfismos Z/nZ é isomorfo a um subdomı́nio de D. Mas Z/nZ é um domı́nio se
e somente se n = p é um número primo. Neste caso dizemos que car(D) = p. Note
que neste caso p.1D = 0 e para todo a ∈ D temos também que pa = 0. Observe
também que
p X
p i p−i
(a + b)p =
ab
= ap + bp ,
i
i=0
pois para todo i = 1, · · · , p − 1 temos
p
≡0
i
(mod p).
Teorema 18.3. Seja L/K uma extensão de corpos e α ∈ L algébrico sobre K.
Então Pα|K não possui raı́zes múltiplas ou existe h ∈ K[x] tal que Pα|K (x) = h(xp )
e neste caso p = car(K).
Demonstração. Suponha que D(Pα|K ) 6= 0. Neste caso, como grau(D(Pα|K
)) < grau(Pα|K ), então mdc(Pα|K , D(Pα|K )) = 1, i.e., Pα|K não admite raı́zes
múltiplas.
Seja
Pα|K = xn +
n−1
X
i=0
133
ai xi .
134
18. EXTENSÕES SEPARÁVEIS
Então D(Pα|K ) = 0 se e somente se para todo i tal que ai 6= 0 temos que i = 0 em
K (i.e., i ≡ 0 (mod p) em Z). Assim,
0
0
Pα|K = xn p + a(n0 −1)p x(n −1)p + . . . + ap xp + a0
e basta tomar
0
0
h = xn + a(n0 −1)p xn −1 + . . . + ap x + a0 .
Definição 18.4. Dado f ∈ K[x] \ K, dizemos que f é separável, se f não
admite raı́zes múltiplas. Seja L/K uma extensão de corpos e α ∈ L algébrico sobre
K, então α é dito separável sobre K, se Pα|K for separável. Uma extensão algébrica
L/K é dita separável, se todo α ∈ L for separável sobre K. Um corpo K é dito
perfeito, se car(K) = 0 ou car(K) = p e K = K p = {ap | a ∈ K} (i.e., todo elemento
de K é p-potência). Note que a inclusão K p ⊂ K é sempre satisfeita. A questão é
a inclusão oposta.
Proposição 18.5. Um corpo K é perfeito se e somente se para todo f ∈ K[x]
irredutı́vel for separável.
Demonstração. Suponha que K seja perfeito e seja f ∈ K[x] irredutı́vel.
Seja L/K finita e α ∈ L tal que f (α) = 0. Logo f = aPα|K para a ∈ K ∗ . Se
car(K) = 0 ou D(Pα|K ) 6= 0, então Pα|K é separável (logo o mesmo vale para f ).
Caso isto não ocorra, então Pα|K (x) = h(xp ) para algum h ∈ K[x] e p = car(K).
Como K é perfeito K = K p . Escrevendo
Pα|K =
n
X
aip xip
i=0
temos que para todo i existe bi ∈ K tal que aip = bpip . Logo
Pα|K = (
n
X
bip xi )p
i=0
é redutı́vel, o que é uma contradição.
Reciprocamente, suponha que todo f ∈ K[x] irredutı́vel seja separável. Se
car(K) = 0 nada há a fazer. Suponhamos que car(K) = p. Seja a ∈ K e f = xp −a.
Existe uma extensão finita L/K e α ∈ L tal que f (α) = 0, em particular
Pα|K | f = (x − α)p , i.e., Pα|K = (x − α)` ,
para algum 1 ≤ ` ≤ p. Mas pela separabilidade de Pα|K , temos que ` = 1 e
α ∈ K.
Proposição 18.6. Um corpo K é perfeito se e somente se toda extensão
algébrica L/K for separável.
Demonstração. Suponha que K seja perfeito e seja L/K uma extensão
algébrica. Pela proposição anterior para todo α ∈ L temos que Pα|K é separável.
Reciprocamente, suponhamos que toda extensão algébrica L/K seja separável.
Novamente, se car(K) = 0 nada há a fazer. Suponhamos que car(K) = p. Seja
a ∈ K e f = xp − a. Seja L/K finita e α ∈ L tal que f (α) = 0. Logo Pα|K | f e
pelo mesmo argumento anterior α ∈ K.
18. EXTENSÕES SEPARÁVEIS
135
Definição 18.7. Seja L/K uma extensão algébrica. Dizemos que α ∈ L é
inseparável sobre K, se não for separável, i.e., se Pα|K admitir raı́zes múltiplas.
Para provar uma proposição sobre transitividade de extensões separáveis, precisamos antes do seguinte resultado sobre extensões de homomorfismos.
Proposição 18.8. Seja L/K uma extensão finita, digamos L = K[α1 , · · · , αr ].
Seja Ω um corpo algebricamente fechado e κ : K → Ω um homomorfismo não trivial
(logo necessariamente injetivo) de corpos, onde Ω é algebricamente fechado. Seja
m o número de extensões λ : L → Ω de κ a L (ver capı́tulo anterior). Então
1 ≤ m ≤ [L : K].
Além disto as seguintes condições são equivalentes:
(i) m = [L : K].
(ii) α1 , · · · , αr são separáveis sobre K.
(iii) L/K é separável.
Demonstração. Provaremos inicialmente a proposição para r = 1. Sejam
{α1 = β1 , · · · , βn } as raı́zes de Pα1 |K . Se λ é uma extensão de κ a L, então λ(α1 )
é necessariamente uma raiz de Pα1 |K , uma vez que este polinômio é invariante por
κ. Assim, o número de extensões λ é igual ao número de raı́zes distintas de Pα1 |K .
Este número é no máximo igual a grau(Pα1 |K ) = [L : K]. Além disto, m ≥ 1,
pois provamos no capı́tulo anterior a existência de extensões λ de κ, se L/K for
algébrica.
Observe que m = [L : K] se e somente se o número de raı́zes distintas de Pα1 |K
for igual a [L : K] = grau(Pα1 |K ). Isto equivale a Pα1 |K ser separável. Assim, as
condições (i) e (ii) são equivalentes. É claro que (iii) implica (ii). Suponha que L/K
seja inseparável, digamos que γ ∈ L seja inseparável sobre K. Pela equivalência
entre (i) e (ii) concluimos que o número de extensões κγ de κ a K[γ] é estritamente
inferior a [K[γ] : K]. Por outro lado, pela primeira parte, cada κγ possui no máximo
[L : K[γ]] extensões a L. Dessa forma, o número de extensões de κ a L é menor
que [L : K], ou seja, (i) implica (iii).
Para provar o caso geral, para qualquer r, lembremos que existe uma seqüência
finita de extensões
K = K0 ⊂ K1 = K0 [α1 ] ⊂ K2 = K1 [α2 ] ⊂ · · ·
⊂ Kr = Kr−1 [αr ] = K[α1 , · · · , αr ] = L.
Pela primeira parte, o número de extensões κ1 de κ a K1 é no máximo [K1 : K], o
número de extensões de κ1 a K2 é no máximo [K2 : K1 ], etc. Portanto, o número
de extensões de κ a L é no máximo igual a
[K1 : K][K2 : K1 ] . . . [Kr : Kr−1 ] = [L : K].
Como anteriormente (iii) implica (ii). Suponha (ii). Então cada αi é separável
também sobre Ki−1 . A fortiori, pela primeira parte, o número de extensões de κi−1
a Ki é igual a [Ki : Ki−1 ]. Aplicando a multiplicativade dos graus concluimos que
m = [L : K]. Finalmente, a prova que (i) implica (iii) é idêntica à da primeira
parte.
Corolário 18.9. Sejam L/K uma extensão algébrica e M um subconjunto de
L. Se todo α ∈ M for separável sobre K, então K[M]/K é separável.
136
18. EXTENSÕES SEPARÁVEIS
Demonstração. Basta observar que
[
K[M] =
K[F],
F∈C
onde F percorre o conjunto C de subconjuntos finitos de M, e aplicar a proposição
anterior.
Teorema 18.10. Sejam L/K e M/L extensões algébricas. Então M/K é
separável se e somente se M/L e L/K o forem.
Demonstração. É claro que se M/K for separável, então M/L e L/K também o são. Provemos a recı́proca. Seja α ∈ M e
Pα|L = xn + an−1 xn−1 + . . . + a0 .
Seja L := K[a0 , · · · , an−1 ]. Então Pα|L ∈ L[x] e α é separável sobre L. Como cada
ai ∈ L e L/K e separável, pela proposição 18.8 L/K também é separável. Além
disto, pelo observado acima e pela proposição 18.8 obtemos que L[α]/L também é
separável.
Seja κ : K → Ω um homorfismo não trivial de corpos, com Ω algebricamente
fechado. O número de extensões κL de κ a L é igual a [L : K]. Além disto, para
cada κL o número de extensões deste homomorfismo a L[α] é igual a [L[α] : L].
Portanto, o número de extensões de κ a L[α] é igual a
[L : K][L[α] : L] = [L[α] : K].
Novamente, aplicando a proposição 18.8 concluimos que L[α]/K é separável, assim
α é separável sobre K.
Definição 18.11. Seja L/K uma extensão algébrica e Ω um corpo algebricamente fechado. Denotamos por HomK (L, Ω) o conjunto dos homomorfismos de
corpos λ : L → Ω tais que λ|K = id. São chamados K-homomorfismos de L em Ω.
O seguinte resultado é uma conseqüência imediata da proposição 18.8.
Teorema 18.12. Seja L/K uma extensão finita. Então
# HomK (L, Ω) ≤ [L : K].
Além disto, vale a igualdade se e somente se L/K for separável.
Definição 18.13. Seja L/K uma extensão algébrica. Definimos o fecho separável SL (K) de K em L por
SL (K) := {α ∈ L | α é separável sobre K.
É claro que K ⊂ SL (K). Fica como exercı́cio provar que SL (K) é um subcorpo de
K (utilize a transitividade de extensões separáveis provada acima).
Definição 18.14. Seja L/K uma extensão de corpos. Dizemos que α é um
elemento primitivo de L/K se L = K[α]. Neste caso, dizemos que L/K é uma
extensão simples.
Teorema 18.15 (teorema do elemento primitivo). Suponha que K seja um
corpo infinito. Seja L/K uma extensão finita e separável. Então L/K é simples,
i.e., existe α ∈ L elemento primitivo de L/K.
18.1. CORPOS FINITOS
137
Demonstração. Observemos inicialmente que basta supor que L seja gerado
por 2 elementos α, β, digamos L = K[α, β]. De fato, sendo L/K finita, sabemos
que L é da forma L = K[α1 , · · · , αr ]. Suponha o resultado provado para extensões
geradas por 2 elementos. Assim, existe β1 ∈ K2 = K1 [α1 ] = K[α1 , α2 ] tal que K2 =
K[β1 ]. Pelo mesmo argumento, existe β2 ∈ K3 tal que K3 = K[β1 , α3 ] = K[β2 ].
Repetindo sucessivamente o argumento, concluimos que L = Kr = K[βr−1 ].
Sejam
f := Pα|K = (x − α) . . . (x − αn ) e g := Pβ|K = (x − β) . . . (x − βm ).
Seja c ∈ K e γ := α + cβ. Consideremos os corpos K ⊂ F = K[γ] ⊂ L =
K[α, β]. Provaremos que L = F para uma escolha genérica de c ∈ K. Seja
h(x) := f (γ − cx) ∈ F [x]. Observe que h(β) = 0. Portanto, x − β divide h em L[x].
Seja M/L uma extensão finita contendo todas as raı́zes de f e g. Mostraremos que
mdcM [x] (h, g) = x − β.
Observemos inicialmente que algum βj é raiz de f (com j > 1) se e somente se
γ − cβj = α + c(β − βj ) = αi ,
para algum i. Ou equivalentemente, se e somente se
αi − α
.
(18.1)
c=
β − βj
Note que o conjunto destas frações com j percorrendo 2, · · · , m e i percorrendo
1, · · · , n é finito. Como o corpo K é infinito, podemos sempre escolher c ∈ K
diferente de todas estas frações. Em outras palavras a única raiz comum de h e g
é β, daı́ segue o resultado sobre o mdc.
Mas o mdc não depende do corpo no qual estamos considerando, pela unicidade
do resto no algoritmo de divisão de polinômios. Dessa forma, como g, h ∈ F [x]
concluimos que β ∈ F . Portanto, por construção α ∈ F e L = F .
Observação 18.16. No próximo capı́tulo daremos uma prova intrı́nseca do
teorema do elemento primitivo para corpos finitos. Observe também que na prova
do teorema do elemento primitivo, se nos restringirmos a corpos L da forma K[α, β],
não precisamos supor que L/K seja separável. Basta que β seja separável sobre K,
uma vez que isto garante que os denominadores de (18.1) sejam todos não nulos.
18.1. Corpos Finitos
Dado um inteiro n ≥ 1 sabemos que o anel quociente Z/nZ é um corpo se e
somente se n = p for um número primo. Este é o primeiro exemplo de um corpo
finito que será denotado por Fp . Uma maneira natural de definir corpos finitos
é tomar f ∈ Fp [x] irredutı́vel e lembrar que o anel quociente Fp [x]/(f ) é neste
caso um corpo. Este corpo também pode ser escrito como Fp [α] para raiz α de f
em alguma extensão finita l de Fp . Além disto, [Fp [α] : Fp ] = grau(f ) digamos
n. Assim, como Fp espaço vetorial Fp [α] é isomorfo a Fnp portanto é um corpo de
q = pn elementos. Estes corpos são caracterizados pelo seguinte teorema.
Teorema 18.17.
(a) Para todo n ≥ 1 inteiro existe um corpo finito Fq de
q = pn elementos dado pelo conjunto das raı́zes Rxq −x de xq −x em algum
corpo algebricamente fechado Ω contendo Fp . Além disto este polinômio
é separável.
(b) O corpo Fq é único a menos de isomorfismo.
138
18. EXTENSÕES SEPARÁVEIS
(c) O grupo multiplicativo F∗q = Fq \ {0} é um grupo cı́clico.
(d) Os fatores irredutı́veis mônicos de xq − x são exatamente os polinômios
irredutı́veis mônicos f ∈ Fp [x] tais que grau(f ) | n.
(e) Se q 0 = pm , então Fq0 ⊂ Fq se e somente se q 0 | q.
Demonstração. (a) Sabemos que existe uma extensão finita L de Fp tal que
f fatora-se linearmente em L[x]. Seja Fq := Rxq −x ⊂ L. Afirmamos que Fq é
um subcorpo de L. De fato, se a, b ∈ Fq , então (a + b)q = aq + bq = a + b,
logo a + b ∈ Fq . Além disto (ab)q = aq bq = ab, logo ab ∈ Fq . E se a ∈ F∗q ,
então (a−1 )q = (aq )−1 = a−1 , logo a−1 ∈ Fq . Além disto, como D(xq − x) = −1,
concluimos que xq −x é separável. O ı́tem (b) segue da unicidade de fecho algébrico
a menos de isomorfismo.
O item (c) segue imediatamente do seguinte lema.
Lema 18.18. Seja K um corpo e G ⊂ K ∗ um subgrupo finito. Então G é
cı́clico.
Demonstração. Como G é finito, então seu expoente exp(G) também o é
(veja definição 9.33). Digamos que n = exp(G). Isto significa que para todo a ∈ G,
temos an = 1, ou seja, G ⊂ Wn (K) := {α ∈ K | αn = 1}. Mas este é o conjunto das
raı́zes de xn − 1 que tem cardinalidade no máximo n. Portanto, #G ≤ n, como a
desigualdade contrária vale em geral, temos que |G| = exp(G) = n. Pela proposição
9.36, concluimos que G é cı́clico.
Para provar os ı́tens (d) e (e) precisamos de um lema adicional.
0
Lema 18.19. Seja q 0 := pm tal que n = mk. Então xq − x divide xq − x.
Demonstração. Recordemos a fatoração
y d − 1 = (y − 1)(y d−1 + . . . + y + 1).
0
Tomemos y = q 0 e d = k, assim q 0 − 1 divide (q 0 )k − 1 = q − 1. Tomando y = xq −1 e
0
0
0
d = (q − 1)/(q 0 − 1) obtemos que xq −1 − 1 divide (xq −1 )(q−1)/(q −1) − 1 = xq−1 − 1,
0
multiplicando por x concluimos que xq − x divide xq − x.
Suite da prova do teorema. (d) Seja f um fator irredutı́vel mônico de xq −
x. Então existe α ∈ Fq tal que f = Pα|Fp . Neste caso, Fq ⊃ Fp [α] ⊃ Fp e como
[Fp [α] : Fp ] = grau(Pα|Fp ) concluimos que grau(f ) | n.
Reciprocamente, se f ∈ Fp [x] é irredutı́vel mônico de grau m | n, então existe
uma extensão finita L de Fp e α ∈ L tal que f = Pα|Fp . Neste caso, Fp [α] = Fq0 ,
0
onde q 0 = pm . Como m | n, (xq − x) | (xq − x), em particular Rxq0 − x = Fq0 ⊂
Rxq −x = Fq . Logo α é raiz de xq − x, assim f = Pα|Fp | (xq − x).
0
(e) Suponhamos que m | n. Pelo lema anterior, (xq − x) | (xq − x), logo
Rxq0 − x = Fq0 ⊂ Rxq −x = Fq . Reciprocamente, se Fq0 ⊂ Fq , então [Fq : Fp ] = n =
[Fq : Fq0 ][Fq0 : Fp ] = [Fq : Fq0 ]m, assim m | n.
CAPı́TULO 19
Extensões puramente inseparáveis
Ao longo de todo este capı́tulo K será um corpo de caracterı́stica prima p.
Sabemos que se L/K for uma extensão e α ∈ AL (K), então Pα|K é separável ou
existe h1 ∈ K[x] tal que Pα|K (x) = h1 (xp ). Note que h1 (x) é mônico e irredutı́vel,
na verdade coincide com Pαp |K . Assim, podemos repetir o argumento para h1 .
Pela finitude do grau de Pα|K , concluimos que existe um e ≥ 0 inteiro máximo e
P̃α|K ∈ K[x] tal que
e
Pα|K (x) = P̃α|K (xp ).
Este inteiro e é dito o expoente de Pα|K .
O anel K[x] é fatorial, logo similarmente, podemos definir para todo f ∈ K[x] \
K o maior inteiro e ≥ 0 tal que
e
f (x) = f˜(xp ),
para um único f˜ ∈ K[x]. Novamente e é dito o expoente de f . Observamos que f
é separável se e somente se e = 0.
Definição 19.1. Um polinômio f ∈ K[x] \ K é dito puramente inseparável se
e
f (x) = xp − a para algum e ≥ 0 e a ∈ K. Note que neste caso f˜ = x − a. Observe
também que se α for uma raiz de f em uma extensão finita L/K então
e
f (x) = (x − α)p .
Ou seja, um polinômio puramente inseparável possui uma única raiz em um fecho
algébrico de K. Neste sentido um polinômio puramente inseparável é o extremo
oposto de um polinômio separável.
Definição 19.2. Seja L/K uma extensão de corpos e α ∈ L algébrico sobre
K. Dizemos que α é puramente inseparável sobre K se for raiz de algum f ∈ K[x] \
K puramente inseparável. Observe que todo elemento de K é simultaneamente
separável e puramente inseparável sobre K. Dizemos que uma extensão algébrica
L/K é puramente inseparável se todo α ∈ L for puramente inseparável sobre K.
Lema 19.3. Seja L/K extensão e α ∈ AL (K). Então α é puramente inseparável sobre K se e somente se Pα|K for puramente inseparável.
Demonstração. Se Pα|K for puramente inseparável nada há a fazer. Suponhamos que α seja puramente inseparável sobre K. Ou seja, existe e ≥ 0 tal que
e
α é raiz de xp − a para algum a ∈ K. Suponha e mı́nimo para esta propriedade.
e
Neste caso, xp − a é irredutı́vel, coincidindo portanto com Pα|K .
Teorema 19.4. Seja L/K algébrica, digamos L = K[M]. Sejam Ω um corpo
algebricamente fechado e κ : K → Ω um homomorfismo não trivial de corpos. As
seguintes condições são equivalentes:
139
140
19. EXTENSÕES PURAMENTE INSEPARÁVEIS
(i) Existe uma única extensão λ : L → Ω de κ a L.
(ii) Todo elemento de M é puramente inseparável sobre K.
(iii) L/K é puramente inseparável.
Demonstração. Suponha (ii). Sabemos que existe um homomorfismo λ :
L → Ω estendendo κ. Além disto para todo α ∈ M temos que β := λ(α) é uma raiz
de κ∗ (Pα|K ). Como Pα|K é puramente inseparável, o mesmo vale para κ∗ (Pα|K ).
Logo β fica univocamente detereminado, portanto λ é único.
Suponha que L/K não seja puramente inseparável, i.e., existe α ∈ L tal
que Pα|K é puramente inseparável. Logo κ∗ (Pα|K ) também não é puramente inseparável. Portanto possui pelo menos duas raı́zes distintas digamos α1 6= β1 .
Assim, existem pelo menos duas opções para λ, ou λ(alpha) = α1 ou λ(α) = β1 .
Isto mostra que (i) implica (iii). É imediato que (iii) implica (ii).
Proposição 19.5. Sejam L/K e M/L extensões algébricas. Então M/K é
puramente inseparável se e somente se M/L e L/K forem puramente inseparáveis.
Demonstração. Suponha que M/K seja puramente inseparável. Então automaticamente L/K é puramente inseparável. Além disto, como K ⊂ L, se
e
αp ∈ K ⊂ L, então M/L é puramente inseparável.
Reciprocamente, suponha que M/L e L/K sejam puramente inseparáveis. Dae
do α ∈ M temos que existe e ≥ 0 tal que αp ∈ L. Por outro lado, existe f ≥ 0 tal
e
f
e+f
que (αp )p ∈ K, i.e., αp
∈ K e α é puramente inseparável sobre K.
Definição 19.6. Seja L/K uma extensão algébrica. Definimos o fecho puramente inseparável de K em L por
PL (K) := {α ∈ L | α é puramente inseparável sobre K}.
Deixamos a cargo do leitor verificar que isto é um subcorpo de L contendo K.
Observação 19.7. Lembre que o fecho separável SL (K) de K em L é definido
similarmente como o conjunto dos elementos de L separáveis sobre K. Assim,
PL (K) ∩ SL (K) = K.
Proposição 19.8. Seja L/K uma extensão algébrica. Então L/SL (K) é puramente inseparável.
Demonstração. Seja α ∈ L. Seja e o expoente de Pα|K . Assim Pα|K (x) =
e
e
h1 (xp ) com h1 ∈ K[x] separável. Em particular, αp como raiz de h1 pertence a
SL (K).
Observação 19.9. Note que a proposição diz que qualquer extensão algébrica
L/K pode ser decomposta em dois pedaços, L/SL (K), puramente inseparável, e
SL (K)/K separável.
Definição 19.10. Seja L/K uma extensão algébrica. Se SL (K) = K dizemos
que K é separavelmente fechado em L.
Definição 19.11. Seja L/K uma extensão finita. O grau de separabilidade
[L : K]s de L/K é definido por [SL (K) : K], e o grau de inseparabilidade [L : K]i
de L/k é definido por [L : SL (K)].
19. EXTENSÕES PURAMENTE INSEPARÁVEIS
141
Proposição 19.12. Seja L/K finita puramente inseparável, então [L : K] é
potência de p.
Demonstração. Sejam α1 , · · · , αr geradores de L sobre K e para todo i seja
Ki := Ki−1 [αi ]. Como cada αi é puramente inseparável sobre K, ele também o é
sobre Ki−1 . Assim, [Ki : Ki−1 ] é potência de p, pois é igual ao grau de Pαi |Ki−1
que é puramente inseparável. A fortiori, [L : K] é potência de p.
CAPı́TULO 20
Corpos de decomposição e extensões normais
Definição 20.1. Seja K um corpo e f ∈ K[x] \ K. Seja Ω um corpo algebricamente fechado com Ω ⊃ K. Seja Rf := {α ∈ Ω | f (α) = 0} = {α1 , · · · , αn }. O
corpo de decomposição K[Rf ] de f com relação a K é a extensão finita K[α1 , · · · ,
αn ] gerada sobre K por {α1 , · · · , αn }. Observemos que este é o menor subcorpo
de Ω contendo K e Rf . De fato, qualquer outro subcorpo contendo K e Rf necessariamente contém K(Rf ), pois os elemento deste são polinômios nos αi ’s com
coeficientes em K. Uma extensão algébrica L/K é dita normal, se para todo α ∈ L,
RPα|K ⊂ L.
Observação 20.2. Note que a noção de corpo de decomposição a priori dependeria do corpo Ω. Novamente, com o mesmo argumento que utilizado para provar
a unicidade de fecho algébrico a menos de isomorfismo, observamos que se R0f for o
conjunto de raı́zes de f em um outro corpo algebricamente fechado Ω0 ⊃ K, então
K[R0f ] e K[Rf ] são K-isomorfos.
Observação 20.3. Se F ⊂ K[x] \ K for uma famı́lia de polinômios, definimos
da mesma forma o conjunto
[
RF :=
Rf
f ∈F
e denotamos por K[RF ] o corpo de decomposição da famı́lia em Ω. Este nada mais
é que o compositum dos corpos K[Rf ] para f ∈ F.
Proposição 20.4. Uma extensão algébrica L/K é normal se e somente se para
todo f ∈ K[x] irredutı́vel temos Rf ⊂ L ou Rf ∩ L = ∅.
Demonstração. Suponha que L/K seja normal. Seja f ∈ K[x] irredutı́vel
tal que Rf ∩ L 6= ∅. Seja α ∈ L ∩ Rf . Então existe a ∈ K ∗ tal que f = aPα|K . Por
hipótese, RPα|K ⊂ L, mas Rf = RPα|K .
Reciprocamente, suponha que para todo f ∈ K[x] irredutı́vel Rf ⊂ L ou
Rf ∩ L = ∅. Seja α ∈ L. Então RPα|K ∩ L 6= ∅, portanto RPα|K ⊂ L.
Exemplo
20.5. Considere f = x3 − 2 ∈ Q[x]. Seja
z = e2πi/3 . Então
Rx3√
−2 =
√
√
√
√
√
3
3
3
3
3
3
2
3 −2 ) ⊂ Q[
Q(R
2,
z].
Mas
z
=
(
2z)/
2∈
{ 2, 2z, 2z } ⊂ C. Desta forma,
x
√
3
3
3
4
Q(R
).
Logo
Q(R
)
=
Q[
2,
z].
Pelo
mesmo
argumento,
Q(R
)
x −5 =
x −2
√ x −2
Q[ 4 5, i].
Proposição 20.6. Seja L/K uma extensão tal que [L : K] = 2. Então L/K é
normal.
Demonstração. Seja α ∈ L. Se α ∈ K, então Pα|K = x − α e RPα|K =
{α} ⊂ K ⊂ L. Caso contrário, em L[x] temos Pα|K = (x − α)g(x) para g ∈ L[x]
mônico de grau 1, assim g(x) = x − β, logo RPα|K = {α, β} ⊂ L.
143
144
20. CORPOS DE DECOMPOSIÇÃO E EXTENSÕES NORMAIS
Observação 20.7. Note que em uma extensão normal L/K para todo α ∈ L,
Pα|K fatora-se linearmente em L[x].
Definição 20.8. Seja L/K uma extensão de corpos, Ω um corpo algebricamente fechado contendo K e HomK (L, Ω) o conjunto dos K-homomorfismos
ϕ : L → Ω. Denotamos por Aut(L/K) ao conjunto dos K-automorfismos de L, i.e.,
o conjunto dos automorfismos σ : L → L de L tais que σ|K = idK .
Observação 20.9. Ao contrário das extensões finitas, algébricas e separáveis,
√
não vale transitividade para extensões normais. De fato, se L =
Q[ 3 2, z] =
√
Q(Rx3 −2 ), então L/Q é normal (pelo
teorema). A extensão L/Q[ 3 2] é normal,
√
3
pois seu grauÎ 2. Mas
a extensão Q[ 2]/Q não é normal, pois x3 − 2 tem também
√
3
3
como raı́zes
2z e 2z 2 e este números são números complexos conjugados, en√
3
quanto Q[ 2] ⊂ R.
√
Consideremos agora a extensão Q[ 4 5]/Q. Ela tem grau 4, pois x4 − 5 é
irredutı́vel
√
√sobre Q√(critério de Eisenstein para p = 5). Assim, as extensões
4
Q[ √
5]/Q[ 5] e Q[ 5]/Q têm grau 2, portanto são normais.
Mas a extensão
√
4
Q[ 4 5]/Q não o é, pois x4 − 5 tem também
como
raı́zes
±
5i
e
estes
são números
√
complexos conjugados, enquanto Q[ 4 5] ⊂ R.
O lema a seguir permite-nos definir o fecho normal de uma extensão L/K.
Lema 20.10. Sejam K ⊂ Ω corpos com Ω algebricamente fechado. Seja N o
conjunto dos subcorpos de Ω normais sobre K. Então a extensão
!
\
N /K
N ∈N
é normal.
T
Demonstração. Seja α ∈ N ∈N N . Como α ∈ N e N/K é normal, concluimos que RPα|K ⊂ N , para todo N ∈ N.
Definição 20.11. Sejam K ⊂ L ⊂ Ω corpos com Ω algebricamente fechado.
Seja NL o conjunto de subcorpos N de Ω contendo L tais que N/K seja normal.
O corpo
\
NΩ (L/K) :=
N
N ∈NL
é chamado o fecho normal da extensão L/K em Ω. Segue da definição que NΩ (L/K)
é o menor subcorpo de Ω contendo L que é normal sobre K.
Caracterizaremos agora extensões normais como sendo corpos de decomposição
de uma famı́lia de polinômios. Disto seguirá que no caso particular de extensões
normais finitas, estas podem ser caracterizadas como corpos de decomposição de
apenas um polinômio.
Teorema 20.12. Sejam K ⊂ Ω corpos com Ω algebricamente fechado. Seja
L/K uma extensão algébrica contida em Ω. As seguintes condições são equivalentes:
(i) L/K é normal.
(ii) Existe uma famı́lia F ⊂ K[x] \ K tal que L = K[RF ].
(iii) HomK (L, Ω) = Aut(L/K).
A famı́lia F é descrita como {Pα|K | α ∈ M}, onde M ⊂ L é tal que L = K[M].
20. CORPOS DE DECOMPOSIÇÃO E EXTENSÕES NORMAIS
145
Demonstração. Suponha (i) e seja F como acima. Para todo α ∈ M, uma
vez que L/K é normal, RPα|K ⊂ L. A fortiori, K[RF ] ⊂ L. Por outro lado,
L = K[M] ⊂ K[RF ] ⊂ L, logo vale (ii).
Suponha (ii). Observe que temos sempre a inclusão Aut(L/K) ⊂ HomK (L, Ω).
Seja σ ∈ HomK (L, Ω). Para todo f ∈ F temos que σ(Rf ) ⊂ Rf , em particular
σ(L) ⊂ L. A igualdade segue da proposição 17.30.
Suponha (iii). Sejam α ∈ L e β ∈ RPα|K . Logo Pβ|K = Pα|K . Pelo corolário
17.28 existe um K-isomorfismo θ : K[α] → K[β] ⊂ Ω tal que θ(α) = β. Como
β ∈ L e L/K é algébrica, existe um K-homomorfismo λ : L → Ω tal que λK[α] = θ.
Por (iii) temos então β = λ(α) ∈ L. Assim, RPα|K ⊂ L e L/K é normal.
Corolário 20.13. Sejam L/K uma extensão algébrica, M e F como no teorema. Então K[RF ] é o fecho normal de L/K em Ω.
Demonstração. É claro que K ⊂ L ⊂ K[RF ], e pelo teorema K[RF ]/K é
normal. Por outro lado para todo subcorpo N de Ω contendo L e normal sobre K
e para todo α ∈ M temos RPα|K ⊂ N , portanto K[RF ] ⊂ N .
Corolário 20.14. Seja L/K uma extensão finita, digamos L = K[α1 , · · · , αr ].
Seja
P := Pα1 |K . . . Pαr |K .
Então K[RP ] é o fecho normal de L/K em Ω.
Corolário 20.15. Seja L/K uma extensão finita. As seguintes condições são
equivalentes.
(1) L/K é normal.
(2) Existe f ∈ K[x] \ K tal que L = K[Rf ].
(3) HomK (L, Ω) = Aut(L/K).
Reunindo as informações deste capı́tulo e do anterior obtemos o seguinte teorema.
Teorema 20.16. Seja L/K uma extensão finita e Ω um corpo algebricamente
fechado contendo K.
(1) # HomK (L, Ω) ≤ [L : K] e vale a igualdade se e somente se L/K é
separável.
(2) # Aut(L/K) ≤ # HomK (L, Ω) e vale a igualdade se e somente se L/K é
normal.
(3) # Aut(L/K) ≤ [L : K] e vale a igualdade se e somente se L/K é separável
e normal.
No próximo capı́tulo definiremos extensões finitas separáveis e normais como
extensões galoisianas.
146
20. CORPOS DE DECOMPOSIÇÃO E EXTENSÕES NORMAIS
20.1. Exemplos
Exemplo 20.17. Seja f = x3 − 2 ∈ Q[x]. Considere o diagrama de corpos
√
Q[ 3 2, z] = Q[Rf ]
\
/
√
3
Q[ 2]
Q[z]
\
/
Q
√
A extensão Q[ 3 2]/Q tem grau 2 pois x3 − 2 é irredutı́vel em Q[x] pelo critério
de Eisenstein com p = 2. A extensão Q[z]/Q tem grau 2, pois o polinômio mı́nimo
de z sobre Q é x2 + x + 1. As raı́zes deste polinômio
são z e z 2 que são números
√
3
complexos,
um conjugado do outro. Como Q[ 2] ⊂ R, x2 + x + 1 é irredutı́vel
√
3
sobre Q[ 2], portanto
√
√
3
3
[Q[ 2, z] : Q[ 2]] = 2 e [Q(Rx3 −2 ) : Q] = 6.
Assim # Gal(Q(Rx3 −2 )/Q) = 6. Um grupo de ordem 6 gerado por dois elementos
σ e τ com σ de ordem 3 e τ de ordem 2 satisfazendo a
τ σ = σ2 τ
é isomorfo ao grupo S3 das permutações de 3 elementos que é dado explicitamente
por
{id, σ, σ 2 , τ, στ, σ 2 τ }.
Vamos mostrar que este é o grupo de Galois G = Gal(Q(Rx3 −2 )/Q).
√ √ 2
√
√
Como 1, 3 2, 3 2 , z, z 3 2, z 3 2 é uma base de Q(R
√x3 −2 ) como Q-espaço vetorial,
para obter um elemento de G basta calculá-lo em 3 2 e z. Observemos que dado
ϕ ∈ G, então
√
√
3
3
3
ϕ( 2)3 = ϕ( 2 ) = ϕ(2) = 2,
√
√
logo ϕ( 3 2) ∈ { 3 2z i | para i = 0, 1, 2}. Da mesma forma ϕ(z) ∈ {z, z 2 }.
Definimos σ por
√
√
3
3
σ( 2) := 2z e σ(z) := z e
√
√
3
3
τ por τ ( 2) := 2 e τ (z) := z.
√
√
Observemos
que σ e τ satisfazem
à √
condição acima.
De fato, σ 2 ( 3 2)√= σ( 3 2z)
√
√
√
√ =
3
2z 2 e σ 2 (z) = z; √
σ 3 ( 3 2) =√σ( 3 2z 2√
) = 3 2 e σ 3 (z) = z; τ 2 ( 3 2) =√ 3 2 e
τ (z)√= z 4 √= z; τ σ( 3 2) = τ ( 3 2z) = 3 2z 2 e τ σ(z) = τ (z) = z 2 ; σ 2 τ ( 3 2) =
σ 2 ( 3 2) = 3 2z 2 e σ 2τ (z) = σ 2 (z 2 ) = z 2 .
Finalmente, note que o subgrupo de Aut(Q[Rf ]/Q) gerado por σ e τ tem ordem
6, logo deve ser todo o grupo.
20.1. EXEMPLOS
147
√
Exemplo 20.18. Seja f = x4 − 5 ∈ Q[x] e K = Q(Rx4 −5 ) = Q[ 4 5, i]. Considere o diagrama de corpos
√
Q[ 4 5, i] = Q[Rf ]
\
/
√
4
Q[ 5]
Q[i]
\
√
4
/
Q
4
Note que [Q[ 5] : Q] = 4, pois x − 5 é irredutı́vem em Q[x] pelo critério de
Eisenstein para p = 5, [Q[i] : Q]√
= 2, pois x2 + 1 é irredutı́vel em Q[x], suas raı́zes
4
são ±i, assim,
uma vez que Q[ 5] ⊂ R, temos que x2 + 1 é também irredutı́vel
√
4
sobre Q[ 5][x], portanto [K : Q] = 8 = # Gal(K/Q). Um grupo de ordem 8 gerado
por 2 elementos σ de ordem 4 e τ de ordem 2 tal que
τ σ = σ3 τ
é isomorfo ao grupo diedral de ordem 4, D4 que é dado explicitamente por
{id, σ, σ 2 , σ 3 , τ, στ, σ 2 τ, σ 3 τ }.
Vamos mostrar que este é o grupo de Galois G = Gal(K/Q).
√ √ 2 √ 3 √ √ 2 √ 3
Como 1, 4 5, 4 5 , 4 5 , i, 4 5i, 4 5 i, 4 5 i formam uma base de √K como Qespaço vetorial, para obter um
elemento
de √
G basta cálculá-lo em 4 5 e i. Ob√
√
4
4
servemos que dado ϕ ∈ G, ϕ( 5) ∈ {± 5, ± 4 5i} e ϕ(i) ∈ {±i}.
Definimos σ por
√
√
4
4
σ( 5) := 5i e σ(i) := i e
√
√
4
4
τ por τ ( 5) := 5 e τ (i) := −i.
√
√
Observemos
que σ e √
τ satisfazem
à condição
acima. De fato,√σ 2 ( 4 5) =√σ( 4 5i)√=
√
√
√
− 4 5 e σ 2 (i) = i; √
σ 3 ( 4 5) √
= σ(− 4 5) = − 4 5i e σ 3 (i) = i;√σ 4 ( 4 5) =√σ(− 4 5i) √
= 45
4
4
4
4
2 4
2
e σ (i) = i; τ ( 5) = √ 5 e τ (i)
= τ (−i)
= i; τ σ( 5) = τ ( 5i) = − 4 5i e
√
√
4
4
4
τ σ(i) = τ (i) = −i; σ 3 τ ( 5) = σ 3 ( 5) = − 5i e σ 3 τ (i) = σ 3 (−i) = −i.
Finalmente, o subgrupo de Aut(Q[Rf ]/Q) gerado por σ e τ tem ordem 8, logo
é todo o grupo.
CAPı́TULO 21
Teoria de Galois
21.1. Correspondência de Galois
Definição 21.1. Seja N/K uma extensão finita, G = Aut(N/K), K o conjunto
dos subcorpos L de N contendo K e G o conjunto dos subgrupos H de G. Definimos
duas funções:
γ : K → G dada por γ(L) := Aut(N/L) e
κ : G → K dada por κ(H) := N H := {α ∈ N | τ (α) = α para todo τ ∈ H}.
Verifiquemos que N H é de fato um subcorpo de N , é claro que K ⊂ N H . De fato,
como τ é um homomorfismo temos que τ (α + β) = τ (α) + τ (β) = α + β. O mesmo
vale para o produto. Além disto, τ (α−1 ) = τ (α)−1 = α−1 . O par de funções {γ, κ}
é chamado uma conexão de Galois.
Este par satisfaz às seguintes propriedades.
Proposição 21.2.
(1) Se L1 ⊂ L2 , então γ(L1 ) ⊃ γ(L2 ).
(2) Se H1 ⊂ H2 , então κ(H1 ) ⊃ κ(H2 ).
(3) L ⊂ κ ◦ γ(L).
(4) H ⊂ γ ◦ κ(H).
Além disto, denotando por K∗ a imagem de κ e G ∗ a imagem de γ
temos também as seguintes propriedades.
(5) L ∈ K∗ se e somente se L = κ ◦ γ(L).
(6) H ∈ G ∗ se e somente se H = γ ◦ κ(H). Como conseqüência destes últimos
2 itens temos imediatamente que
(7) γ ◦ κ ◦ γ = γ.
(8) κ◦γ◦κ = κ. Em particular, {γ, κ} induzem uma bijeção entre os conjuntos
K∗ e γ ∗ .
Demonstração.
(1) Seja τ ∈ γ(L2 ), então para todo α ∈ L2 , τ α = α,
em particular o mesmo vale para todo α ∈ L1 , logo τ ∈ γ(L1 ).
(2) Seja α ∈ κ(H2 ), logo para todo τ ∈ H2 , τ α = α, em particular o mesmo
vale para todo τ ∈ H1 , logo α ∈ κ(H1 ).
(3) É claro que para todo α ∈ L e para todo τ ∈ Aut(N/L) temos τ α = α,
assim α ∈ κ ◦ γ(L).
(4) É claro que para todo τ ∈ H e α ∈ κ(H) temos que τ α = α, portanto,
τ ∈ γ ◦ κ(H).
(5) É claro que se L = κ ◦ γ(L), então L ∈ K∗ . Por outro lado, se L ∈ K∗ ,
digamos L = κ(H), então, como H ⊂ γ ◦ κ(H), temos que L = κ(H) ⊃
κ ◦ γ ◦ κ(H) = κ ◦ γ(L).
149
150
21. TEORIA DE GALOIS
(6) É claro que se H = γ ◦ κ(H), então H ∈ G ∗ . Por outro lado, se H ∈ G ∗ ,
digamos H = γ(L), então, como L ⊂ κ ◦ γ(L), temos que H = γ(L) ⊃
γ ◦ κ ◦ γ(L) = γ ◦ κ(H).
Definição 21.3. Dizemos que a restrição de uma conexão de Galois {γ, κ} aos
conjuntos K∗ e G ∗ é uma correspondência de Galois. Uma extensão finita L/K é
dita galoisiana se for separável e normal.
Teorema 21.4 (teorema de Artin). Dado H ∈ G temos que N/N H é galoisiana, [N : N H ] = #H e H = Aut(N/N H ) = γ ◦ κ(H).
Demonstração. Seja α ∈ N e Cα = {τ α | τ ∈ H} o conjunto dos elementos
H-conjugados a α. Note que #Cα ≤ |H|. Seja
Y
fα :=
(x − β).
β∈Cα
Observemos que para todo τ ∈ H, τ|Cα é uma permutação de Cα (uma vez que τ
é injetivo, Cα é finito e τ (Cα ) ⊂ Cα ). Portanto, fα ∈ N H [x]. Por construção fα é
separável, portanto α é separável sobre N H .
Assim, para provar que N/N H é normal, basta mostrar que
# Aut(N/N H ) = [N : N H ].
Inicialmente, como H ⊂ Aut(N/N H ) temos que
#H ≤ | Aut(N/N H )| ≤ [N : N H ].
Para provar a desigualdade oposta, observe que como N/N H é finita e separável,
pelo teorema do elemento primitivo, existe α ∈ N tal que N = N H (α). Mas neste
caso,
[N : N H ] = grau(Pα|N H ) ≤ grau(fα ) ≤ |H|.
Portanto,
[N : N H ] = |H| = | Aut(N/N H )| e H = γ ◦ κ(H),
pois o primeiro é subgrupo do segundo e ambos têm a mesma ordem.
Proposição 21.5. Seja L ∈ K. Então L ∈ K∗ se e somente se N/L for
galoisiana.
Demonstração. Se L ∈ K∗ , o teorema de Artin garante que N/L é galoisiana.
Reciprocamente, suponha que N/L seja galoisisana. Logo | Aut(N/L)| = [N : L].
Por outro lado, L ⊂ κ ◦ γ(L) ⊂ N e pelo teorema de Artin,
[N : κ ◦ γ(L)] = [N : N Aut(N/L) ] = | Aut(N/L)| = [N : L],
portanto L = κ ◦ γ(L) ∈ K∗ .
Teorema 21.6 (teorema fundamental da teoria de Galois). Seja N/K uma
extensão galoisiana finita. Então {γ, κ} define uma correspondência de Galois entre
K e G.
21.1. CORRESPONDÊNCIA DE GALOIS
151
Demonstração. Já provamos anteriormente que se N/K for galoisiana então
N/L também o será para todo L ∈ K (ver capı́tulos de extensões separáveis e
normais). Assim, pela proposição anterior, κ ◦ γ(L) = L. Por outro lado, pelo
teorema de Artin, γ ◦ κ(H) = H.
Calculemos alguns exemplos concretos da correspondência de Galois.
Exemplo√21.7. Seja K = Q, N = Q[Rx3 −2 ]. Já provamos anteriormente
que N = Q[ 3 2, ζ], onde ζ = e2πi/3 , [N : Q] = 6 e G = Aut(N/Q) =√S3 =
{id,
σ, σ 2 , τ, στ, σ 2 τ√} com√o(σ) = 3, o(τ ) = 2 e τ σ = σ 2 τ . Além disto, σ( 3 2) =
√
3
2ζ, σ(ζ) = ζ, τ ( 3 2) = 3 2 e τ (ζ) = ζ 2 .
Note que N ⊂ N {id} ⊂ N , logo N {id} = N . Também Q ⊂ N G ⊂ N e pela
teoria de Galois [N : N G ] = #G = 6, logo Q = N G .
Seja H1 = hαi = {id, σ, σ 2 }. Observe que Q[ζ] ⊂ N H1 ⊂ N e que [N : N H1 ] =
#H1 = 3. Como [Q[ζ] : Q] = 2, concluimos
que Q[ζ] = N H1 .
√
3
Seja H
Q[ 2] ⊂ N H2 ⊂ N , [N : N H2 ] = #H2 = 2.
2 = hτ i = {id, τ }. Então√
√
3
3
Como [Q[ 2] : Q] = 3, segue que Q[ 2]√= N H2√
.
√
3
3
Seja
H
=
hστ
i.
Observe
que
στ
(
2)
=
2ζ, στ (ζ)
= ζ 2 , logo στ (√3 2ζ) =
3
√
√
√
√
√
3
2ζζ 2 = 3 2. Portanto,
στ ( 3 2(1 + ζ)) = 3 2(1 + ζ) = − 3 2ζ 2 . Assim, Q[ 3 2ζ 2 ] ⊂
√
3
3
N H√
⊂ N . Como 2ζ 2 é raiz de x3 − 2 e este é irredutı́vel sobre√Q, segue que
3
2, concluimos que Q[ 3 2ζ 2 ] = √
[Q[ 2ζ 2 ] : Q] = 3. Como [N : N H3 ] = #H
N H3 .
3 =√
√
3
3
2
2
2
2
2
2
Seja H4 √
= hσ τ i. Observe √
que σ τ ( 2) =√ 2ζ e σ τ (ζ)√= ζ , logo σ τ √
( 3 2ζ 2 )
√
= 3 2ζ 2 ζ = 3 2, portanto σ 2 τ ( 3 2(1+ζ 2√
)) = 3 2(1+ζ 2 ) = − 3 2ζ. Assim,
Q[ 3 2ζ] ⊂
√
3
3
H4
H4
N ⊂ N , [N : N ] = #H4 = 2 e [Q[ 2ζ] : Q] = 3, portanto Q[ 2ζ] = N H4 .
Exemplo
21.8. Seja K = Q, N = Q[Rx4 −3 ]. Já provamos anteriormente que
√
N = Q( 4 3, i), [N : Q] = 8 e G = Aut(N/Q) = D4 = {id, σ,
σ2 , σ3 ,√
τ, στ, σ 2 τ, σ 3 τ }
√
4
3
com
o(σ)√= 4, o(τ ) = 2 e τ σ = σ τ . Além disto, σ( 3) = 4 3i, σ(i) = i,
√
4
τ ( 3) = 4 3 e τ (i) = −i.
N ⊂ N {id} ⊂ N , N = N {id} .
Q ⊂ N G ⊂ N , [N : N G ] = #G = 8, Q = N G .
H1
H1
N , [N : N H1 ] = #H
=√
2, Q[i] =
H1 = hσi, Q[i] ⊂
√N ⊂√
√ 1 = 4, [Q[i]
√ : Q]
√N .
4
2
2 4
2
2
2 4
2
H2 = hσ i, σ ( 3) = − 3, σ (i) =√i, σ ( 3i) = σ ( 3)√ i = 3i, Q[ 3i] ⊂
N H2 ⊂ N , [N : N H2 ] √
= #H2 = 2, [Q[ 3i] : Q] = 4 já que 3i é raiz de x4 + 3
irredutı́vel sobre Q,
Q[ 3i] = N H2 .
√
√
4
H3 = hτ i, Q[ 3] ⊂ N H3 ⊂ N , [N : N H3 ] = #H3 = 4, [Q[ 4 3] : Q] = 4,
√
Q[ 4 3] = N H3 .
√
√
√
√
√
H4 = hστ
i, στ ( 4 3) = 4 3i, στ (i) = −i, στ ( 4 3i) = 4 3, στ ( 4 3(1 + i)) =
√
√
4
3(1 + i), 4 3(1 + i) é raiz de x4 + 12, pelo
critério de Eisenstein
para p = 3, este
√
√
4
4
3(1
+
i)]
:
Q]
=
4,
Q[
3(1
+ i)] ⊂ N H4 ⊂
polinômio é irredutı́vel sobre Q,
logo
[Q[
√
4
H4
N4
N , [N : N ] = #H4 =√2, Q( 3(1
√ + i)) = N .
√
√
√
(i) = −i, σ 2 τ ( 4 3i) = 4 3i, Q[ 4 3i] ⊂
H5 = hσ 2 τ i, σ 2 τ ( 4 3) = − 4 3, σ 2 τ√
N H√5 ⊂ N , [N : N H5 ] = #H5 = 2, [Q[ 4 3i] : Q] = 4, já que é raiz de x4 − 3,
Q[ 4 3i] = N H5 .
√
√
√
√
√
H6 = hσ 3 τ√i, σ 3 τ ( 4 3) = − 4 3i, σ 3 τ (i) = √
−i, σ 3 τ ( 4 3i) = − 4 3, √
σ 3 τ ( 4 3(1 −
√
i)) 4 3(1 − i), 4 3(1 − i) é raiz de x4 + 12, [Q[ 4 3(1 − i)] : Q] = 4, Q[ 4 3(1 − i)] ⊂
N H6 ⊂ N , [N : N H6 ] = #H6 = 2.
152
21. TEORIA DE GALOIS
Finalmente, fica como exercı́cio calcular os corpos fixos dos seguintes subgrupos
de G : hσ 2 , τ i e hσ 2 , στ . Ambos têm ordem 4, e esgotam a correspondência de
Galois.
21.2. Extensões e subgrupos normais
Proposição 21.9. Seja N/K galoisiana finita, L ∈ K e H ∈ G. Então
σ Aut(N/L)σ −1 = Aut(N/σ(L)) e N σHσ
−1
= σ(N H ).
Demonstração. Como N/K é galoisiana L = N Aut(N/L) . Seja τ ∈ Aut(N/L)
e α ∈ N , então στ σ −1 (σα) = στ α = σα, i.e., στ σ −1 ∈ Aut(N/σ(L)). Reciprocamente, se τ ∈ Aut(N/σ(L)) e α ∈ N , então τ σα = σα, i.e., σ −1 τ σα = α, i.e.,
σ −1 τ σ ∈ Aut(N/L), i.e., τ ∈ σ Aut(N/L)σ −1 .
−1
Seja α ∈ N σHσ e τ ∈ H, então στ σ −1 α = α, i.e., τ σ −1 α = σ −1 α, i.e.,
−1
H
σ α ∈ N , i.e., α ∈ σ(N H ). Reciprocamente, se α ∈ N H e τ ∈ H, então
−1
στ σ −1 (σα) = στ α = σα, i.e., σα ∈ N σHσ .
Teorema 21.10. Seja N/K galoisiana finita e L ∈ K. Então L/K é normal
(logo galoisiana) se e somente se Aut(N/L) C Aut(N/K). Neste caso
Aut(N/K)/ Aut(N/L) ∼
= Aut(L/K).
Demonstração. Suponha que L/K seja normal. Dado σ ∈ Aut(N/L) e
Ω ⊃ N algebricamente fechado, então σ|L : L → N ⊂ Ω é um K-homomorfismo (já
que L ⊃ K), portanto σ(L) = L e σ|L ∈ Aut(L/K). Neste caso, pela proposição
anterior,
σ Aut(N/L)σ −1 = Aut(N/σ(L)) = Aut(N/L), i.e., Aut(N/L) C Aut(N/K).
Reciprocamente, se Aut(N/L) C Aut(N/K), então
Aut(N/σ(L)) = σ Aut(N/L)σ −1 = Aut(N/L).
Pela correspondência de Galois L = σ(L). Seja λ : L → Ω um K-homomorfismo.
Como N/L é finita (logo algébrica), existe ν : N → Ω um K-homomorfismo tal
que ν|L = λ. Como N/K é normal, ν ∈ Aut(N/K), pelo que foi feito acima,
ν(L) = λ(L) = L, i.e., λ ∈ Aut(L/K).
Suponhamos que L/K seja normal. A função ϕ : Aut(N/K) → Aut(L/K)
definida por σ 7→ σ|L é um homomorfismo de grupos. Este homomorfismo é sobrejetivo, pois dado τ ∈ Aut(L/K), o processo acima produz σ ∈ Aut(N/K) tal
que σ|L = τ . Além disto, σ ∈ N (ϕ) se e somente se σ|L = id, i.e., σ ∈ Aut(N/L).
Finalmente a última afirmativa segue do teorema dos homomorfismos.
Definição 21.11. Sejam K, L subcorpos de Ω. Definimos o compositum KL
de k e L em Ω como sendo o menor subcorpo de Ω contendo K e L.
Lema 21.12. Sejam K, L subcorpos de Ω e
f (α1 , · · · , αm )
| f eg
K[L] :=
g(β1 , · · · , βn )
têm coeficientes em K e α1 , · · · , αm , β1 , · · · , βn ∈ L} .
Então KL = K[L].
21.3. COEFICIENTES E RAÍZES
153
Demonstração. Observemos inicialmente que por construção K[l] é um subcorpo de Ω. Além disto contem K (tome denominador igual a 1 e numerador
igual a uma função constante) e L (tome denominador igual a 1 e numerador
igual a variável α1 ). Seja N ⊂ Ω um subcorpo contendo K e L. Então necessariamente conterá qualquer fração f (α1 , · · · , αm )/g(β1 , · · · , βn ) como acima. Portanto,
KL = K[L].
Proposição 21.13. Seja N/K galoisiana finita, K 0 /K finita e Ω ⊃ N, K 0 um
corpo algebricamente fechado. Então K 0 N/K 0 é galoisiana finita e
ϕ : Aut(K 0 N/K 0 ) → Aut(N/K 0 ∩ N )
dada por σ 7→ σ|N é um isomorfismo de grupos. Em particular, [K 0 N : K 0 ] = [N :
K 0 ∩ N ].
Demonstração. Como N/K é finita, então existem α1 , · · · , αr ∈ N tais que
N = K[α1 , · · · , αr ]. Logo K 0 N = K 0 [α1 , · · · , αr ] e como cada αi é algébrico sobre
K (logo sobre K 0 ) concluimos que K 0 N/K 0 é finita. Além disto cada αi é separável
sobre K, assim Pαi |K é separável. Mas Pαi |K 0 | Pαi |K , logo Pαi |K 0 também é
separável, em particular αi é separável sobre K 0 e K 0 N/K 0 é separável.
Seja σ : K 0 N → Ω um K 0 -homomorfismo, onde Ω ⊃ K 0 é algebricamente
fechado. Logo σ|N : N → Ω é um K-homorfismo. Como N/K é normal, então σ ∈
Aut(N/K) e σ(αi ) ∈ N para todo i. Como σ|K 0 = id, concluimos que σ(K 0 N ) ⊂
K 0 N . Por outro lado, para todo z ∈ K 0 N , z = f (α1 , · · · , αr ) com coeficientes em
K 0 , e como αi = σβi para algum βi ∈ N , concluimos que z = σ(f (β1 , · · · , βr )),
portanto σ(K 0 N ) = K 0 N , σ ∈ Aut(K 0 N/K 0 ) e K 0 N/K 0 é normal.
Observe que ϕ está bem definita e é injetiva. Seja σ ∈ Aut(N/K 0 ∩ N ). Como
K ⊂ K 0 ∩ N , então σ ∈ Aut(N/K). Seja H a imagem de ϕ. Basta mostrar que
κ(H) ⊂ K 0 ∩ N . De fato, neste caso, H = γ ◦ κ(H) ⊃ γ(K 0 ∩ N ) = Aut(N/K 0 ∩
N ) ⊃ H. Seja α ∈ κ(H) = N H e τ ∈ H. Basta mostrar que α ∈ K 0 , pois
automaticamente α ∈ N . Existe σ ∈ Aut(K 0 N/K 0 ) tal que σ|N = τ . Assim, para
0
0
todo σ ∈ Aut(K 0 N/K 0 ), σα = α, i.e., α ∈ N Aut(K N/K ) = K 0 , pois K 0 N/K 0 é
galoisiana.
Corolário 21.14. Seja N/K uma extensão galoisiana finita com K ⊂ R,
N ⊂ C e N 6⊂ R. Então [N : N ∩ R] = 2 e [N : K] é par.
Demonstração. Observe que RN = C e [N : (N ∩R)] = [C : R] = 2 e aplique
a proposição.
Corolário 21.15. Seja N/K uma extensão galoisiana finita. Seja N (x1 , · · · ,
xn ) o corpo de frações do anel de polinômio N [x1 , · · · , xn ] em n variáveis com
coeficientes em N . Então N (x1 , · · · , xn )/K(x1 , · · · , xn ) é galoisiana com grupo de
Galois isomorfo a Aut(N/K).
Demonstração. Basta observar que N K(x1 , · · · , xn ) = N (x1 , · · · , xn ) e aplicar a proposição anterior.
21.3. Coeficientes e raı́zes
Para todo n ≥ 1 inteiro seja Sn o grupo das permutações de n elementos. Para
todo conjunto finito S denotamos por Perm(S) o grupo das permutações de S.
154
21. TEORIA DE GALOIS
Proposição 21.16. Seja f ∈ K[x] irredutı́vel, mônico, separável de grau n e
N = K(Rf ). Então
(a) para todo σ ∈ Aut(N/K), σ|Rf ∈ Perm(Rf ) = Sn .
(b) A função ϕ : Aut(N/K) → Sn dada por σ 7→ σRf é um homomorfismo
injetivo de grupos.
Demonstração. Observemos que #Rf = n e que σ|Rf é injetiva. Assim (1)
segue. É claro que ϕ é um homomorfismo de grupos. Observemos que se ϕ|Rf = id,
então ϕ = id, pois N = K(Rf ).
O ı́tem (b) é um caso particular do seguinte teorema de Cayley (ver capı́tulo
sobre teoremas de Sylow).
Definição 21.17. A imagem de ϕ é chamado o grupo de Galois de f com
respeito a K e denotado por Gal(f, K).
Observação 21.18. Quando K = Q, o problema de Galois era caracterizar
em termos de propriedades de Gal(f, Q) quando as raı́zes de f seriam expressas da
forma radical. Isto equivale a Gal(f, Q) ser um grupo solúvel. Retornaremos a este
ponto no capı́tulo de solubilidade por radicais.
Existe uma situação em que o grupo de Galois Gal(f, K) é todo o grupo Sn .
Para isto utilizaremos o seguinte lema (ver [GaLe, p. 106]).
Lema 21.19. Seja p > 2 um número primo e H um subgrupo do grupo Sp de
permutações de p elementos. Suponha que H contenha uma transposição (elemento
de ordem 2) e um elemento de ordem p. Então H = Sp .
Teorema 21.20. Seja f ∈ Q[x] irredutı́vel mônico de grau primo p > 2.
Suponha que f possua exatamente p − 2 raı́zes reais. Então Gal(f, Q) = Sp .
Demonstração. A conjugação complexa τ restrita a N = Q[Rf ] nos dá um
Q-homomorfismo η : N → C. Mas como N/Q é normal, então η ∈ Aut(N/Q).
Por hipótese η fixa as p − 2 raı́zes reais e necessariamente permuta as duas raı́zes
complexas conjugadas restantes. Portanto η tem ordem 2. A fortiori, sua imagem,
também denotada por η em Gal(f, Q) também tem ordem 2.
Seja α ∈ Rf . Logo [Q[α] : Q] = grau(f ) | [N : Q] = # Gal(N/Q), uma vez
que N/Q é galoisiana. Pelo primeiro teorema de Sylow, existe θ ∈ Gal(N/Q) de
ordem p. A fortiori, sua imagem, também denotada por θ em Gal(f, Q) também
tem ordem p. Assim, o teorema segue do lema.
CAPı́TULO 22
Extensões ciclotômicas
Seja K um subcorpo de um corpo algebricamente fechado Ω. Para todo n ≥ 1,
consideremos o subgrupo
Wn := Wn (Ω) := {z ∈ Ω | z n = 1}
de Ω∗ , dito grupo das raı́zes n-ésimas da unidade. Observemos que este grupo é
finito de ordem no máximo n. Pelo lema 18.18 temos que Wn é um grupo cı́clico
cuja ordem coincide com o seu expoente. Além disto, #Wn = n se somente se
p = car(Ω) - n. De fato, #Wn = n se e somente se polinômio xn − 1 ∈ Ω[x] é
separável, o que ocorre se e somente se car(Ω) = 0 ou p com p - n. Note por
exemplo que Wp = {1}, se car(Ω) = p.
A partir de agora suporemos sempre que car(Ω) = 0 ou p com p - n. Seja
Wn (K) := Wn ∩ K.
Este conjunto é um subgrupo cı́clico de Wn e de K ∗ . Este subgrupo depende
diretamente de K e n. Por exemplo, se K = Q, Ω = C e n = 6, temos que
W6 = {1, ζ, · · · , ζ 5 }, onde ζ = e2πi/6 , mas W6 (Q) = {±1}. Se n = 5, então
Wn = {1, η, · · · , η 4 }, onde η = e2πi/5 , mas W5 (Q) = {1}. Assim, Wn (K) depende
de n e de K. Por outro lado, se n é par (resp. ı́mpar), então Wn (Q) = {±1} (resp.
Wn (Q) = {1}).
Seja ζ um gerador de Wn . Existe um isomorfismo canônico
Wn ∼
= Z/nZ dado por ζ i 7→ i.
Lembremos que os geradores de Z/nZ são exatamente as classes
a tais que mdc(a, n) = 1,
i.e., são os elementos de (Z/nZ)∗ . A pré-imagem destes geradores pelo isomorfismo
anterior é o conjunto Pn de geradores de Wn . Tal conjunto é chamado o conjunto
das raı́zes primitivas n-ésimas da unidade. Observe também que pelo teorema de
Lagrange para todo ϑ ∈ Wn temos o(ϑ) = d | n. Assim, podemos escrever
[
(22.1)
Wn =
Pd .
d|n
Como anteriormente definimos
Pn (K) := Pn ∩ K.
Assim, Wn (K) é cı́clico de ordem n se e somente se Pn (K) 6= ∅.
Definição 22.1. Dizemos que Ln := K[Rxn −1 ] é a n-ésima extensão ciclotômica de K contida em Ω. Quando K = Q, Ln é dito o n-ésimo corpo ciclotômico.
155
156
22. EXTENSÕES CICLOTÔMICAS
Teorema 22.2. A extensão Ln /K é galoisiana finita, Aut(Ln /K) é um grupo
abeliano isomorfo a um subgrupo de (Z/nZ)∗ . Em particular, [Ln : K] | φ(n). Além
disto, Ln = K(ζ) para algum gerador ζ de Wn (Ln ).
Demonstração. Esta extensão é finita, pois é finitamente gerada por elementos algébricos sobre K, as raı́zes de xn − 1. É claro que Ln /K é normal, pois
Ln é o corpo de decomposição de xn − 1 sobre K. Também é claro que Ln /K é
separável, pois xn − 1 é separável (lembre que p - n, se p > 0). Seja ζ um gerador de
Wn (Ln ) = Wn . Então σ ∈ Aut(Ln /K) se e somente se σ(ζ) for também um gerador
de Wn , o que ocorre se e somente se σ(ζ) = ζ aσ para algum aσ ∈ {0, · · · , n − 1} tal
que mdc(aσ , n) = 1. Isto induz a seguinte função
ϕ : Aut(Ln /K) → (Z/nZ)∗
definida por σ 7→ aσ . Esta função é um homomorfismo injetivo de grupos. De fato,
por um lado ϕ(στ ) = aστ . Por outro lado, στ (ζ) = σ(ζ aτ ) = σ(ζ)aτ = ζ aσ aτ ,
portanto aστ = aσ aτ , a fortiori, ϕ(στ ) = ϕ(σ)ϕ(τ ) e ϕ é um homomorfismo de
grupos. Além disto, σ ∈ N (ϕ) se e somente se aσ = 1, o que ocorre se e somente
se σ = id.
Corolário 22.3. [Ln : K] = φ(n) se e somente se Aut(Ln /K) ∼
= (Z/nZ)∗ .
Verificaremos que a condição do corolário é satisfeita se K = Q. Para isto
precisamos do seguinte lema elementar cuja demonstração deixamos a cargo do
leitor.
Lema 22.4. Sejam f, g ∈ Q[x] tais que f g ∈ Z[x], então f, g ∈ Z[x].
Teorema 22.5. Seja ζ um gerador de Wn ⊂ C∗ . Então [Q(ζ) : Q] = φ(n).
Demonstração. Seja p um número primo tal que p - n. Afirmamos que
Pζ|Q = Pζ p |Q . Suponha que Pζ|Q 6= Pζ p |Q . Seja
κ p : Z → Fp ,
a 7→ a
o homomorfismo quociente. Este induz um homomorfismo sobrejetivo κ∗p : Z[x] →
Fp [x] dado por
X
X
ai xi 7→
ai xi .
i
Observe que ζ p ∈ Rxn −1 , logo Pζ|Q e Pζ p |Q dividem xn −1. Ou seja, existe h ∈ Q[x]
tal que
xn − 1 = hPζ|Q Pζ p |Q .
Pelo lema anterior concluimos que h, Pζ|Q , Pζ p |Q ∈ Z[x]. Em particular,
xn − 1 = κ∗p (h)κ∗p (Pζ|Q )κ∗p (Pζ p |Q ).
Observe que ζ é raiz de Pζ p |Q (xp ), logo
Pζ p |Q (xp ) = h1 (x)Pζ|Q (x),
para algum h1 ∈ Z[x], onde novamente utilizamos pelo lema anterior. Portanto,
κ∗p (Pζ p |Q (xp )) = κ∗p (Pζ p |Q )(x)p = κ∗p (h1 )(x)κ∗p (Pζ|Q )(x).
Mas κ∗p (Pζ|Q ) e κ∗p (Pζ p |Q ) são irredutı́veis mônicos. Logo κ∗p (Pζ|Q ) = κ∗p (Pζ p |Q ). Em
particular, xn − 1 possui fator múltiplo. Mas este polinômio é separável, pois p - n.
Concluimos assim que
(22.2)
Pζ|Q = Pζp |Q .
22. EXTENSÕES CICLOTÔMICAS
157
Seja η ∈ Pn , então η = ζ a , onde a = p1 · · · pr , onde pi é primo e pi - n.
Aplicando sucessivamente (22.2) concluimos que
Pη|Q = Pζ|Q .
Logo
#RPζ|Q ≥ #Pn = φ(n).
Por outro lado,
#RPζ|Q = grau(Pζ|Q ) = [Q(ζ) : Q] ≤ φ(n),
onde a última desigualdade segue do teorema anterior.
Definição 22.6. Denotamos por
Φn := Pζ|Q
o n-ésimo polinômio ciclotômico.
Segue de (22.1) e da prova do teorema anterior que
Y
xn − 1 =
Φd .
d|n
Esta última igualdade permite recuperar indutivamente os polinômios ciclotômicos,
por exemplo, a partir de Φp para p um número primo.
O grupo de Galois de extensões ciclotômicas, mesmo sobre os racionais, é sempre abeliano, mas raramente é cı́clico. Lembre por exemplo que (Z/nZ)∗ é cı́clico
se n for 2, 4, p número primo ou 2p. Entretanto, quando substituimos Q pelo corpo
finito Fp de p elementos, para um número primo p, o que obtemos é sempre um
grupo cı́clico como explicaremos a seguir.
Observação 22.7. Note também que todo corpo finito Fq de q = pn elementos
dá origem a uma extensão ciclotômica Fq /Fp de corpos finitos é necessariamente
uma extensão ciclotômica, pois Fpn \ {0} é exatamente Wpn −1 .
Extensões finitas de Q são ditas corpos de números. Podemos naturalmente
constuir uma torre de extensões ciclotômicas
Q ⊂ Q[ζp ] ⊂ Q[ζp2 ] ⊂ · · · ⊂ Qp∞
chamada uma torre p-ádica. O estudo deste tipo de torre foi feito por K. Iwasawa
e este associa a cada torre uma série p-ádica intimamente ligada à função analı́tica
p-ádica de Kubota e Leopoldt a qual interpola L-funções de Dirichlet nos inteiros
negativos.
Por outro lado é possı́vel construir torres semelhantes quando substituimos Q
pelo corpo de funções racionais Fp (x). Neste caso entretanto dois tipos de ciclotomia aparecem, emergindo um fenômeno distinto do caso de corpos de números.
De um lado as extensões do tipo Fq (x)/Fp (x) por constantes, que como observamos anteriormente e utilizando a teoria de Galois são extensões ciclotômicas. Por
outro lado, o papel das raı́zes da unidade também tem como contrapartida o que
chamamos de pontos de torção de um determinado módulo devido a Carlitz. Para
mais sobre isto ver [Goss].
Finalmente, a teoria de extensões ciclotômicas tanto em um caso quanto em
outro são incarnações unidimensionais de um fenômeno mais amplo (multiplicação
complexa) que ocorre por exemplo no contexto de variedades abelianas e módulos
de Drinfeld.
158
22. EXTENSÕES CICLOTÔMICAS
Definição 22.8. Seja Ωp um corpo algebricamente fechado contendo Fp . Definimos em Ωp o automorfismo de Frobenius Frobp (a) = ap .
Teorema 22.9. A extensão Fq /Fp é galoisiana finita e seu grupo de Galois
Aut(Fq /Fp ) é cı́clico de ordem n gerado pela restrição (Frobp )|Fq do automorfismo
de Frobenius Frobp a Fq .
Demonstração. A primeira parte do teorema já está feita. Note que
(Frobp )nFq = id. Seja ζ um gerador de F∗q . Então o(ζ) = pn − 1. Se existisse j < n
j
tal que (Frobp )j|Fq = id, então ζ = Frobp (ζ)j = ζ p , i.e., (pn − 1) | (pj − 1), o que é
impossı́vel. Assim, o((Frobp )|Fq ) = n. Mas # Aut(Fq /Fp ) = [Fq : Fp ] = n.
Teorema 22.10. Seja η um gerador de Wn (Ωp ). Então [Fp (η) : Fp ] = o(p) em
(Z/nZ)∗ .
Demonstração. Seja m := [Fp (η) : Fp ] e f := o(p) em (Z/nZ)∗ . Neste caso
Fp (η) ∼
= Fq , onde q = pm . Além disto, o(η) = n | |F∗q | = q −1, i.e., pm ≡ 1 (mod n),
em particular pm = 1. Pelo lema chave, o(p) = f | m, a fortiori f ≤ m.
f
f
Reciprocamente, como pf ≡ 1 (mod n), então η p −1 = 1, i.e., η p = η. Por
outro lado, para todo α ∈ Fp (η) temos que
α=
m−1
X
ai η i ,
i=0
onde ai ∈ Fp para todo i. Pelo pequeno teorema de Fermat, api = ai para todo i,
portanto,
m−1
X pf f m−1
X
f
αp =
ai η p =
ai η i = α.
i=0
i=0
f
Em particular, tomando α um gerador de Fp (η)∗ concluimos que αp
pelo lema chave, o(α) = (pm − 1) | (pf − 1), em particular m ≤ f .
Definição 22.11. Analogamente, definimos Ψn := Pη|Fp .
Observação 22.12. A decomposição de
[
Wn (Ωp ) =
Pd (Ωp )
d|n
e o teorema anterior implicam que
xn − 1 =
Y
d|n
Além disto é fácil ver que Ψd = κ∗p (Φd ).
Ψd .
−1
= 1, logo
CAPı́TULO 23
Extensões cı́clicas
Seja K um subcorpo de um corpo algebricamente fechado Ω. Uma extensão
galoisiana finita L/K é cı́clica (resp. abeliana) se Aut(L/K) for cı́clico (resp.
abeliano).
Teorema 23.1 (teorema de Abel). Seja K um corpo, car(K) = p primo e
a ∈ K ∗ . As seguintes condições são equivalentes:
(1) xp − a é irredutı́vel em K[x].
(2) xp − a não possui raiz em K.
(3) a ∈
/ K p := {bp | b ∈ K}.
Demonstração. É claro que (1) implica (2) que implica (3). Suponha que
xp − a seja redutı́vel em K[x] e seja α ∈ Ω tal que αp = a. Então Pα|K | (xp − a).
Como xp − a = (x − α)p em Ω[x] concluimos que Pα|K (x) = (x − α)l , onde 1 ≤
l ≤ p − 1. Mas se l > 1, entâo Pα|K não é separável, consequentemente existe
h ∈ K[x] tal que Pα|K (x) = h(xp ). Mas devido ao grau de Pα|K isto não é possı́vel.
Portanto, Pα|K (x) = x − α é separável e α ∈ K, em particular a ∈ K p .
Trataremos agora o caso em que car(K) = 0 ou car(K) = p e p - n. Neste caso
Pn 6= ∅, digamos ζ ∈ Pn e
Rxn −a = {ζ i α | 0 ≤ i ≤ n − 1, α ∈ Ω, αn = a}.
Analisaremos primeiro o caso em que Pn (K) 6= ∅.
Teorema 23.2. Suponhamos que Pn (K) 6= ∅ e seja L = K[Rxn −a ]. Então
L/K é galoisiana e Aut(L/K) é isomorfo a um subgrupo de Z/nZ, sendo portanto
cı́clico. Em particular, [L : K] | n e L = K[α] para qualquer α ∈ Rxn −a .
Demonstração. Como L é um corpo de decomposição, então L/K é normal.
Além disto como p - n e D(xn − a) = nxn−1 concluimos que xn − a é separável,
portanto L/K é separável. Além disto para todo σ ∈ Aut(L/K), σ(α) ∈ Rxn −a ,
portanto existe 0 ≤ iσ < n tal que σ(α) = ζ iσ . Consideremos a função
ϕ : Aut(L/K) → Z/nZ dada por ϕ(σ) = iσ .
Esta função é um homomorfismo injetivo de grupos (neste caso, como Z/nZ é cı́clico,
concluimos que Aut(L/K) como subgrupo também o é). De fato, dados σ, τ ∈
Aut(L/K), então τ σ(α) = τ (ζ iσ α) = ζ iτ iσ , portanto ϕ(τ σ) = iτ iσ = ϕ(τ )ϕ(σ).
Além disto σ ∈ N (ϕ) se e somente se iσ = 0, i.e., iσ = 0, mas neste caso σ = id. Definição 23.3. A extensão cı́clica L = K[Rxn −a ] é dita uma extensão de
Kummer.
159
160
23. EXTENSÕES CÍCLICAS
Observação 23.4. É possı́vel desenvolver uma teoria de extensões de Kummer
mesmo que Pn (K) = ∅. Para isto é necessário cohomologia galoisiana. Para mais
detalhes ver [La, chapter VI].
Nesta última situação construimos a seguinte seqüência de extensões
K[Rxn −a ] = K[ζ, α] ⊃ K[ζ] ⊂ K.
A primeira extensão é cı́clica de grau dividindo n enquanto a segunda é abeliana de
grau diviindo φ(n). Mais tarde veremos que isto pode ser traduzido em termos do
grupo Aut(L/K). Ele tem a propriedade de ser um grupo solúvel. Em particular
obteremos que o polinômio xn − a = 0 é solúvel por radicais (o que é exatamente
a pergunta original de Galois para este polinômio particular.
Para provar a recı́proca do teorema anterior precisamos do teorema 90 de
Hilbert. Seja G um grupo e Hom(G, K) denota o conjunto dos homomorfismos
multiplicativos, i.e., dado σ ∈ hom(G, K), σ(xy) = σ(x)σ(y). Por abuso de notação
denotaremos ainda por Hom(G, K) o K-espaço vetorial gerado por este conjunto.
Teorema 23.5 (teorema de Artin). Dados ϕ1 , · · · , ϕn ∈ Hom(G, K) distintos
então estes elementos são K-linearmente independentes.
Demonstração. Suponhamos que existam a1 , · · · , an ∈ K não todos nulos
tais que
a1 ϕ1 + . . . + an ϕn = 0,
i.e., para todo y ∈ G temos que
(23.1)
a1 ϕ1 (y) + . . . + an ϕn (y) = 0.
Após reenumeração suponhmaos que a1 , · · · , ak sejam não nulos que a n-upla
(a1 , · · · , ak , 0, · · · , 0) tenha o maior número de entradas nulas possı́veis. Seja x ∈ G
tal que ϕ1 (x) 6= ϕk (x). Então para todo y ∈ G temos que
(23.2)
a1 ϕ1 (xy) + . . . + ak ϕk (xy) = a1 ϕ1 (x)ϕ1 (y) + . . . + ak ϕk (x)ϕk (y) = 0.
Multiplicando a (23.1) por ϕk (x) e subtraindo de (23.2) obtemos
b1 ϕ1 (y) + . . . + bk−1 ϕk−1 (y) = 0,
onde bi = ai (ϕi (y) − ϕi (x)) e b1 6= 0. Em particular
b1 ϕ1 + . . . + bk−1 ϕk−1 = 0
e esta combinação é não trivial possuindo um número de zeros maior que a combinação que possui o maior número de zeros. Isto é uma contradição.
Corolário 23.6 (teorema de Dedekind). Sejam σ1 , · · · , σn ∈ Aut(K), então
este conjunto é K-linearmente independente.
Teorema 23.7 (teorema 90 de Hilbert). Seja L/K uma extensão cı́clica de
grau n e σ um gerador de Aut(L/K). Dado β ∈ L temos que
α
(1) NL/K (β) = 1 se e somente se existe α ∈ L tal que β = σ(α)
.
(2) TL/K (α) = 0 se e somente se existe α ∈ L tal que β = α − σ(α).
23. EXTENSÕES CÍCLICAS
161
Demonstração. Lembremos que como Aut(L/K) = hσi, então
NL/K (β) =
n−1
Y
i
σ (β) e TL/K (β) =
i=0
n−1
X
σ i (β).
i=0
Em particular, NL/K (σ(β)) = NL/K (β) e TL/K (σ(β)) = TL/K (β). Se existe α ∈ L
α
(resp. β = α − σ(α)) então NL/K (β) = 1 (resp. TL/K (β) = 0).
tal que β = σ(α)
Provemos as recı́procas separadamente. Suponhamos primeiro que NL/K (β) =
1. Pelo teorema de Dedekind, id, σ, · · · , σ n−1 são K-lienarmente independentes.
Consideremos a K-combinação linear não trivial
id + βσ + (βσ(β))σ 2 + . . . + (βσ(β) . . . σ n−2 (β))σ n−1 6= 0,
pois o primeiro coeficiente é não nulo. Logo existe γ ∈ L tal que
α := γ + βσ(γ) + (βσ(β))σ 2 (γ) + . . . + (βσ(β) . . . σ n−2 (β))σ n−1 (γ) 6= 0.
Qn−1
Aplicando σ dos dois lados desta igualdade de notando que i=1 σ i (β) = β −1 e
que σ n (γ) = γ concluimos que
σ(α) = σ(γ) + σ(β)σ 2 (γ) + (σ(β)σ 2 (β))σ 3 (γ) + . . . + β −1 γ
= β −1 (γ + βσ(γ) + (βσ(β))σ 2 (γ) + . . . + (βσ(β) . . . σ n−2 (β))σ n−1 (β))
= β −1 α.
Suponhamos agora que TL/K (β) = 0. Como L/K é separável existe γ ∈ L tal
que TL/K (γ) 6= 0 (ver exercı́cio no captı́tulo de extensões separáveis). Seja
α :=
1
(βσ(γ) + (β + σ(β))σ 2 (γ) + . . . + (β + σ(β) + . . . + σ n−2 (β))σ n−1 (γ).
TL/K (γ)
Observe que
σ(α) =
1
(σ(β)σ 2 (γ)) + (σ(β) + σ 2 (β))σ 3 (γ) + . . .
TL/K (γ)
+ (σ(β) + . . . + σ n−1 (β))σ n (γ)).
Pn−1
Como σ n (γ) = γ e i=1 σ i (β) = −β concluimos que
1
(βγ + βσ(γ) + . . . + βσ n−1 (γ))
TL/K (γ)
1
=
βTL/K (γ) = β.
TL/K (γ)
α − σ(α) =
Teorema 23.8. Suponhamos que Pn (K) 6= ∅. Seja L/K uma extensão cı́clica
de grau n. Então existe a ∈ K ∗ tal que L = K[Rxn −a ] e L = K[α] para qualquer
α ∈ Rxn −a .
Demonstração. Seja ζ ∈ Pn (K), então NL/K (ζ) = ζ n = 1. Pelo teorema 90
α
de Hilbert existe α ∈ L tal que ζ = σ(α)
, onde hσi = Aut(L/K). Em particular,
σ(α) = ζ −1 α e σ(αn ) = σ(α)n = (ζ −1 )n αn = α, i.e., a = αn ∈ K. É claro que
Rxn −a = {ζ i α | 0 ≤ i ≤ n − 1} ⊂ L, logo K[Rxn −a ] ⊂ L. Além disto Rxn −a ⊂
RPα|K , portanto xn −a = Pα|K , assim K[α] = K[Rxn −a ] e [K[α] : K] = n, portanto
L = K[α].
162
23. EXTENSÕES CÍCLICAS
Proposição 23.9. Seja K um corpo de caracterı́stica p e a ∈ K. Então
xp − x − a é irredutı́vel em K se e somente se não existe b ∈ K tal que bp − b = a.
Demonstração. Se existe b ∈ K tal que bp −b = a, então xp −x−a possui uma
raiz em K sendo portanto redutı́vel. Reciprocamente, suponha que f = xp − x − a
seja redutı́vel em K[x]. Seja α ∈ Ω uma raiz de f , então Pα|K | (xp − x − a). Note
que
Y
Rxp −x−a = {α + i | 0 ≤ i < p} e Pα|K =
(x − α − i)
i∈I
para algum subconjunto I ⊂ {0, 1, · · · , p − 1}. Portanto o coeficiente de grau d − 1,
onde 1 ≤ d = #I, é igual a dα + c com c ∈ {0, 1, · · · , p − 1}. Em particular, como
dα + c ∈ K, concluimos que dα ∈ K e como d é inversı́vel, pois p - d, concluimos
que α ∈ K, i.e., αp − α = a.
Teorema 23.10. Seja a ∈ K ∗ tal que não existe α ∈ K com αp −α = a. Então
a extensão K(Rxp −x−a )/K é cı́clica de grau p. Além disto K[Rxp −x−a ] = K[α]
para todo α ∈ Rxp −x−a .
Demonstração. Como L = K[Rxp −x−a ] é um corpo de decomposição, a
extensão L/K é nornmal. Além disto D(xp − x − a) = −1, logo L/K é separável.
As raı́zes de xp −x−a são da forma α+i para i = 0, · · · , p−1. Portanto, L = K[α].
Pela proposição anterior xp − x − a = Pα|K para algum α ∈ Rxp −x−a , portanto
[L : K] = p.
Definição 23.11. Uma extensão cı́clica da forma da forma K[Rxp −x−a ]/K em
caracterı́stica p é dita uma extensão de Artin-Schreier.
Observação 23.12. É possı́vel de forma semelhante ao que foi feito acima caracterizar extensões cı́clicas em caracterı́stica p de grau pn . Neste caso é necessário
substituir α por um vetor, chamado um vetor de Witt, por isto estas extensões são
ditas de Artin-Schreier-Witt. Vetores de Witt formam um anel que como espaço
vetorial é isomorfo a K n , mas com outra soma e produto de tal forma que seja
um anel em caracterı́stica 0. Tomando seu limite projetivo (veja capı́tulo de teoria
de Galois infinita) obtemos o anel W(K) de vetores de Witt. É um anel com um
único ideal maximal pW(K) cujo quociete é isomorfo a K. Assim pensamos que ele
levanta K. Isto é similar ao fato dos anel inteiros p-ádicos Zp levantar Fp o corpo
de p elementos.
Vetores de Witt aparecem em várias partes na matemática. Para citar apenas
duas. Serre introduziu a cohomologia com coeficientes nos feixes de vetores de
Witt que pode ser vista como uma precursora da cohomologia étale. De outro lado,
curvas sobre um corpo K de caracterı́stica p podem ser “deformadas” em curvas
sobre o anel W(K).
Teorema 23.13. Seja K um corpo de caracterı́stica p e L/K uma extensão
cı́clica de grau p. Então existe a ∈ K tal que a 6= bp − b para todo b ∈ K e
L = K[Rxp −x−a ].
Demonstração. Note que TL/K (1) = p = 0. Seja σ um gerador de Aut(L/K
). Pelo teorema 90 de Hilbert existe α ∈ L tal que 1 = α − σ(α), i.e., σ(α) = α − 1.
Logo para todo 0 ≤ j < p, σ j (α) = α − j, em particular para todo i = 0, · · · , p − 1,
α+i é raiz de Pα|K e além disto σ(αp −α) = αp +j −(α+j) = αp −α (pelo pequeno
23. EXTENSÕES CÍCLICAS
163
teorema de Fermat). Além disto, Rxp −x−a ⊂ RPα|K , logo Pα|K | xp − x − a, para
a = αp − α ∈ K e Pα|K = xp − x − a. Em particular, L = K(Rxp −x−a ).
CAPı́TULO 24
Solubilidade por radicais
Este capı́tulo responde à questão original de Galois : quando uma equação
polinomial com coeficientes racionais tem solução na forma radical. Observe que
precisamos não só da gestalt da teoria de Galois mas também de extensões ciclotômicas e cı́clicas bem como da noção de grupos solúveis.
Definição 24.1. Uma extensão galoisiana finita E/k é dita solúvel se e somente
se Aut(E/k) é um grupo solúvel. Isto equivale a dizer que existe uma seqüência de
corpos
E = E0 ⊃ E1 ⊃ E 2 ⊃ · · · En = k
tal que cada extensão Ei /Ei+1 é abeliana, ou equivalentemente cı́clica de grau
primo.
Extensões solúveis satisfazem às seguintes propriedades.
Proposição 24.2.
(1) Sejam k ⊂ F ⊂ E corpos tais que E/k e F/k
sejam extensões galoisianas finitas. Então E/k é solúvel se e somente se
E/F e F/k são solúveis.
(2) Suponha que E/k seja solúvel e que K/k seja uma extensão finita qualquer
com E, K ⊂ Ω e Ω corpo, então EK/K é solúvel.
(3) Se E/k e K/k são solúveis, então EK/k é solúvel.
Demonstração. (1) Basta utilizar a proposição 12.15 e notar que basta mostrar o resultado para os respectivos grupos de automorfismos, i.e., Aut(E/k) é
solúvel se e somente se Aut(E/F ) e Aut(F/k) ∼
= Aut(E/k)/ Aut(E/F ) são solúveis
(lembre que F/k é galoisiana se e somente se Aut(E/F ) C Aut(E/k).
(2) Segue da proposição 21.13 que EK/K é galoisiana finita. Além disto
Aut(EK/K) ∼
= Aut(E/E ∩ K) ⊂ Aut(E/k). Como Aut(E/k) é solúvel, pela
proposição 12.15 concluimos que Aut(EK/K) também é solúvel.
(3) Novamente, pela proposição 21.13, EK/k é galoisiana finita. Além disto,
pela proposição 12.15, utilizando que Aut(EK/K) e Aut(K/k) ∼
= Aut(EK/k)/
Aut(EK/K) são solúveis, concluimos que Aut(EK/k) também o é. Portanto,
EK/k é solúvel.
Definição 24.3. Uma extensão finita separável F/k é dita solúvel por radicais
se existe E/k finita tal que F ⊂ E e existe uma seqüência de corpos
E = E0 ⊃ E 1 ⊃ · · · ⊃ En = k
tal que cada extensão Ei /Ei+1 é de um dos 3 tipos seguintes:
(1) Ei = Ei−1 [ζ], onde ζ ∈ Rxn −1 , para algum n ≥ 1.
(2) Ei = Ei−1 [α], onde α ∈ Rxn −a , para algum n ≥ 1, se p - n, onde p =
car(k) (esta condição é vazia se car(k) = 0) e a ∈ Ei−1 .
165
166
24. SOLUBILIDADE POR RADICAIS
(3) Ei = Ei−1 [α], onde α ∈ Rxp −x−a , se car(K) = p > 0 e para algum
a ∈ Ei−1 .
Extensões solúveis por radicais satisfazem as seguintes propriedades. Em todas
as propriedades abaixo suporemos que os corpos estejam todos contidos em um
corpo Ω suficientemente grande, de tal forma a podermos tomar composita de
corpos.
Proposição 24.4.
(1) Sejam k ⊂ F ⊂ E corpos com E/k separável
finita. Então E/k é solúvel por radicais se e somente se E/F e F/k
o são.
(2) Suponha que E/k seja solúvel por radicais e seja K/k uma extensão finita.
Então EK/K é solúvel por radicais.
(3) Suponha que E/k e K/k sejam solúveis por radicais. Então EK/k é
solúvel por radicais.
Demonstração. (1) Suponha que F/k e E/F sejam solúveis por radicais.
Logo existem F 0 /k finita tal que F 0 ⊃ F e seqüência de corpos
F 0 = F0 ⊃ F1 ⊃ · · · ⊃ k,
na qual cada extensão Fi /Fi−1 é de um dos 3 tipos anterioes. Similarmente, existem
E 0 /F finita tal que E 0 ⊃ E e seqüência de corpos
E 0 = E0 ⊃ E1 ⊃ · · · ⊃ F,
onde cada extensão Ei /Ei−1 é de um dos 3 tipos acima. Tomando o compositum da
segunda seqüência com F 0 e continuando pela segunda até obtemos uma seqüência
de corpos
E 0 F 0 = E0 F 0 ⊃ E1 F 0 ⊃ · · · ⊃ F 0 ⊃ F1 ⊃ · · · ⊃ k.
Finalmente, observe que Ei F 0 = Ei−1 F 0 [ζ] ou Ei−1 F 0 [α], em qualquer caso recuperamos um dos 3 tipos anteriores.
Suponha agora que E/k seja solúvel por radicais, ou seja existe E 0 /k finita com
0
E ⊃E e
E 0 = E0 ⊃ E1 ⊃ · · · ⊃ k,
com Ei = Ei−1 [α] ou Ei−1 [ζ]. Primeiro, como F ⊂ E ⊂ E 0 , segue imediatamente
que F/k é solúvel por radicais. De outro lado, como acima, tomando o compositum
da seqüência anterior com F concluimos também que E ⊂ E 0 ⊂ E 0 F e E/F é
solúvel por radicais.
(2) Mesmo argumento do último parágrafo, tomando agora o compositum da
seqüência com K.
(3) Segue dos 2 anteriores.
Teorema 24.5. Seja E/k uma extensão galoisiana finita. Então E/k é solúvel
por radicais se e somente se E/k é solúvel.
Demonstração. Suponha que E/k seja solúvel. Neste caso existe uma seqüência de corpos
E = E 0 ⊃ E1 ⊃ E2 ⊃ · · · ⊃ E n = k
Q
tal que cada extensão Ei /Ei+1 é cı́clica de grau primo `i . Seja m = i `i onde
fazemos o produto apenas nos números primos `i tais que `i 6= p = car(k). Seja
24. SOLUBILIDADE POR RADICAIS
167
Ω um corpo algebricamente fechado contendo k e ζ ∈ Pm (Ω). Seja K := k[ζ].
Consideremos o compositum da seqüência de corpos acima com K,
EK = L0 ⊃ E1 K = L1 ⊃ E2 K = L2 ⊃ · · · ⊃ En K = K.
Cada extensão Li /Li+1 é galoisiana e temos que
Aut(Li /Li+1 ) = Aut(Ei K/Ei+1 K)
é isomorfo a um subgrupo de ordem > 1 de Aut(Ei /Ei+1 ). Portanto este subgrupo
é igual ao próprio Aut(Ei /Ei+1 ), o qual é cı́clico de ordem `i . Mas neste caso, por
construção existe ζ m/`i ∈ Ei−1 raiz `i -ésima da unidade, para `i 6= p. Portanto, a
extensão Li /Li+1 é uma extensão de Kummer, se `i 6= p. Caso `i = p a extensão
é automaticamente de Artin-Schreier. Portanto, cada extensão Li /Li+1 é de um
dos 3 tipos acima, i.e., EK/K é solúvel por radicais. Trivialmente, K/k é solúvel
por radicais. Do item (1) das propriedades anteriores concluimos que EK/k é
solúvel por radicais, a fortiori E/k é solúvel por radicais (novamente o item (1) das
propriedades acima, uma vez que E ⊂ EK).
Reciprocamente, suponha que E/k seja solúvel por radicais. Então existe E 0 /k
finita contendo E e uma seqüência de corpos
E 0 = E 0 ⊃ E 1 ⊃ E 2 ⊃ · · · ⊃ En = k
tal que cada Ei /Ei+1 é de um dos três tipos acima. Note que a priori a extensão
Ei /Ei−1 não é galoisiana, isto falha no caso (2) acima. Seja m o produto de todos
os números primos dividindo [E 0 : k] distintos de p = car(k) (caso p > 0). Seja
ζ ∈ Wm (Ω) uma raiz primitiva m-ésima da unidade em um corpo algebricamente
fechado Ω (como sempre supomos Ω suficientemente grande para conter todos os
corpos considerados). Seja F := k[ζ] a m-ésima extensão ciclotômica de k. Considere agora o compositum da seqüência anterior com F dado por
E 0 F ⊃ E1 F ⊃ · · · ⊃ F.
Para cada i, seja Li := Ei F . Note que agora cada Li /Li−1 é galoisiano, pois
corrigimos o caso Kummer acrescentando um elemento ζmi , uma raiz mi -ésima
primitiva da unidade a Ei−1 , onde mi = [Ei : Ei−1 ], caso p - mi . Caso contrário
nada há a fazer. Além disto neste caso Li = Li−1 [αi ] = Li−1 [Rxmi −ai ], onde
αimi = ai . Finalmente, observe que E 0 F é o corpo de decomposição sobre k do
polinômio
Y
Y
f :=
(xmi − ai ) ×
(xp − x − ai ).
i,p-mi
i,mi =p
Portanto, E 0 F/k é galoisiana (já que E 0 F/F é separável, pois cada Li /Li−1 o é, e
F/k também é separável). A fortiori, E 0 F/F é solúvel. Trivialmente F/k é solúvel.
Assim, pelas propriedades de extensões solúveis, E 0 F/k é solúvel. A fortiori, pela
mesma razão, E/k é solúvel.
Definição 24.6. Dado f ∈ Q[x] irredutı́vel. Este polinômio é dito solúvel por
radicais se Q[Rf ]/Q é solúvel por radicais.
Corolário 24.7 (teorema de Galois, post-mortem). Seja f ∈ Q[x] irredutı́vel.
Então f é solúvel por radicais se e somente se Gal(f, K) for solúvel.
Observação 24.8. Num capı́tulo posterior abordaremos o problema inverso
de Galois, que permaence em aberto desde o século XIX. Este diz o seguinte. Dado
um grupo finito G será que existe uma extensão galoisiana finita K/Q tal que
168
24. SOLUBILIDADE POR RADICAIS
Gal(K/Q) seja G? Veremos que a geometria, via o teorema de irredutibilidade
de Hilbert poderá nos dar informações relevantes para este problema. Um caso
particular é aquele no qual o grupo G é um grupo solúvel. Nesta situação sabe-se
que existe K. Isto é devido a S̆afarevic̆ e Iwasawa. Para mais sobre isto veja [Ser]
Observação 24.9. Não é difı́cil provar que S4 e S3 são grupos solúveis. Além
disto, para todo polinômio irredutı́vel f ∈ Q[x] de grau n temos que Aut(k(Rf )/k)
é isomorfo a um subgrupo de Sn . Portanto, polinômios de graus 3 e 4 são sempre
solúveis. Isto mostra que os algebristas árabes e italianos só podiam mesmo achar
explicitamente as raı́zes na forma radical, o que não quer dizer que encontrar as
fórmulas por eles obtidas fosse missão fácil.
Contrariamente, equações de grau 5 não são necessariamente solúveis por radicais, uma vez que S5 não o é (veja [GaLe]. O teorema 21.20 nos diz que polinômios
de grau primo p > 2 com exatamente 2 raı́zes reais têm grupo de Galois Sp . Assim,
basta considerar um polinômio de grau 5 com 3 raı́zes reais.
Parte 5
Tópicos adicionais
CAPı́TULO 25
O problema inverso de Galois
Problema 25.1. Seja G um grupo finito. Será que existe uma extensão galoisiana finita K/Q tal que Gal(K/Q) = G?
Este problema permanece em aberto desde o século XIX. Entretanto reformulações geométricas não só geraram análogos desta questão em outras circunstâncias, bem como trouxeram de volta resultados para o problema original. Nossa
primeira seção será justamente dedicada a mostrar que o grupo Sn de permutações
de n elementos sempre é grupo de Galois de uma extensão do corpo de funções
racionais K(x1 , · · · , xn ) para um corpo K qualquer. Em particular, tomando
K = Q e utilizando o teorema de irredutibilidade de Hilbert, obteremos que Sn é
grupo de Galois sobre Q, i.e., existe K/Q galoisiana finita tal que Sn = Gal(K/Q).
Em seguida discutiremos desenvolvimentos na direção do problema inverso para
outros grupos.
25.1. Grupo Sn
Sejam Sn o grupo das permutações de n elementos, R um anel comutativo com
unidade e A = R[x1 , · · · , xn ] o anel de polinômios em n variáveis com coeficientes
em R. Para todo σ ∈ Sn e f (x1 , · · · , xn ) ∈ A definimos
σ ∗ (f (x1 , · · · , xn )) = f (xσ(1) , · · · , xσ(n) ).
Esta função é na verdade um automorfismo de A (verifique!). Dizemos que f é
simétrico se e somente se σ ∗ (f ) = f para todo σ ∈ Sn . Por exemplo, as funções
simétricas elementares s1 , · · · , sn nas variáveis x1 , · · · , xn são polinômios simétricos
(veja capı́tulo de extensões finitas). É claro que nem todo polinômio simétrico é
uma função simétrica elementar, por exemplo,
(25.1)
x21 + . . . + x2n .
Entretanto, mostraremos que todo polinômio simétrico se escreve de forma única
como polinômio nas funções simétricas elementares. Além disto não existem relações
entre estas, ou seja, são algebricamente independentes (veja capı́tulo de teoria de
transcendência).
Teorema 25.2. Seja f ∈ A simétrico. Então existe um único g ∈ R[s1 , · · · , sn ]
tal que f (x1 , · · · , xn ) = g(s1 , · · · , sn ).
Do teorema segue imediatamente o seguinte corolário.
Corolário 25.3. Não existe g ∈ R[s1 , · · · , sn ] \ {0} tal que g(s1 , · · · , sn ) = 0.
Exemplo 25.4. Observe que o polinômio em (25.1) pode ser reescrito como
x21 + . . . + x2n = s21 − 2s2 .
171
172
25. O PROBLEMA INVERSO DE GALOIS
Considere o polinômio
f (t) = (t − x1 ) . . . (t − xn ) = xn − s1 xn−1 + . . . + (−1)n sn ∈ A[t].
Definimos o discriminante de f (t) por
Y
D :=
(xi − xj )2 = (−1)n(n−1)/2
1≤i<j≤n
Y
(xi − xj ).
1≤i6=j≤n
É imediato da definição que o D é um polinômio simétrico com coeficientes inteiros.
É um dos mais importantes invariantes de um polinômio. Assim, segue do teorema,
que podemos escrevê-lo de forma única como D(x1 , · · · , xn ) = ∆(s1 , · · · , sn ) ∈
Z[s1 , · · · , sn ]. Na prática é bastante laborioso de obter a expressão. Entretanto, se
n = 2 temos
(x1 − x2 )2 = s21 − 4s2 ;
e para n = 3 temos
(x1 − x2 )2 (x1 − x3 )2 (x2 − x3 )2 =
s21 s22 − 4s32 − 4s31 s3 − 27s23 + 18s1 s2 s3 .
É importante notar que estas igualdades são identidades no anel Z[x1 , · · · , xn ].
Assim, permanecem verdadeiras se substituimos as variáveis x1 , · · · , xn por constantes. Por exemplo, se R for um corpo K e α1 , · · · , αn forem elementos algébricos
sobre K contidos em alguma extensão L de K, então
(x − α1 ) . . . (x − αn ) = xn − a1 xn−1 + . . . + an ,
onde ai = si (α1 , · · · , αn ). Neste caso o discriminante do polinômio é dado por
Y
∆(a1 , · · · , an ) =
(αi − αj )2 .
1≤i<j≤n
Em particular, f é separável se e somente se ∆(a1 , · · · , an ) 6= 0. Fica como exercı́cio verificar que esta definição de discriminante coincide com a definição anterior
(capı́tulo de anéis e domı́nios). No caso do polinômio cúbico x3 − ax + b obtemos
como discriminante −(4a3 + 27b2 ).
Para a prova do teorema precisamos da noção de grau de um polinômio em
várias variáveis. Se f ∈ A, então ele pode ser escrito como
X
f (x1 , · · · , xn ) =
ai1 ···in xi11 . . . xinn ,
i1 ,··· ,in
onde cada ai1 ···in pertence a R. O monômio xi11 . . . xinn tem grau i1 + . . . + in . O
grau de f é definido como sendo o maior grau dos monômios com coeficiente não
nulo. Por exemplo, o discriminante em 3 variáveis é um polinômio de grau 6.
Demonstração do teorema. Demonstraremos o teorema por indução no
número de variáveis n e no grau d de f . Comecemos com a existência. Se n = 1,
nada há a fazer, pois x1 = s1 . Suponha que o teorema seja verdade para polinômios
em n − 1 variáveis. Definimos a seguinte função
ϕ : A = R[x1 , · · · , xn ] → R[x1 , · · · , xn−1 ]
h 7→ h(x1 , · · · , xn−1 , 0).
25.1. GRUPO Sn
173
Observe que como f é simétrico com respeito a Sn , então ϕ(f ) é simétrico em
relação a Sn−1 . Por hipótese de indução existe g 0 ∈ R[s01 , · · · , s0n−1 ] tal que
ϕ(f (x1 , · · · , xn )) = g 0 (s01 , · · · , s0n−1 ),
onde para 1 ≤ i ≤ n − 1, a função s0i denota a i-ésima função simétrica elementar
nas variáveis x1 , · · · , xn−1 . Observe que para todo 1 ≤ i ≤ n − 1 temos
ϕ(si (x1 , · · · , xn )) = s0i (x1 , · · · , xn−1 ).
Seja
p(x1 , · · · , xn ) := f (x1 , · · · , xn ) − g 0 (s01 , · · · , s0n−1 ).
Como p é diferença de polinômios simétricos (um polinômio simétrico em n − 1
variáveis é simétrico em n variáveis), concluimos que p também é simétrico. Além
disto, p(x1 , · · · , xn−1 , 0) = 0. Mas isto significa que p(x1 , · · · , xn ) é divisı́vel por
xn . Similarmente, definindo a função ϕ anulando qualquer outra das variáveis,
concluimos que para todo 1 ≤ i ≤ n o polinômio p(x1 , · · · , xn ) é divisı́vel por cada
xi , a fortiori por x1 . . . xn = sn (x1 , · · · , xn ), digamos
f (x1 , · · · , xn ) = g 0 (s01 , · · · , s0n−1 ) + sn h(x1 , · · · , xn ),
onde h ∈ A. Por construção o grau de h é inferior ao grau de f . Além disto, como
p(x1 , · · · , xn ) e sn são simétricos, concluimos que h também o é. Por indução no
grau, temos que existe q ∈ R[s1 , · · · , sn ] tal que
h(x1 , · · · , xn ) = q(s1 , · · · , sn ),
assim
f (x1 , · · · , xn ) = g 0 (s01 , · · · , s0n−1 ) + sn q(s1 , · · · , sn )
é uma expressão de f em termos de funções simétricas elementares.
A unicidade também é provada com indução em n e no grau. Considere a
função
ψ : A = R[x1 , · · · , xn ] → R[s1 , · · · , sn ]
f (x1 , · · · , xn ) 7→ f (s1 , · · · , sn ).
Esta função é um homomorfismo de anéis (verifique!). A unicidade então é equivalente a injetividade de ψ. Suponha que f (x1 , · · · , xn ) ∈ ker(ψ), i.e., f (s1 , · · · , sn ) =
0. Aplicando ϕ a f (s1 , · · · , sn ) concluimos que f (s01 , · · · , s0n−1 ) = 0. Por indução
no número de variáveis, concluimos que ϕ(f (x1 , · · · , xn ) = f (x1 , · · · , xn−1 , 0) = 0.
Logo xn divide f (x1 , · · · , xn ). Similarmente, redefinindo ϕ de forma a anular
qualquer outra das variáveis, temos que cada xi divide f (x1 , · · · , xn ), a fortiori
x1 . . . xn = sn (x1 , · · · , xn ) divide f (x1 , · · · , xn ), digamos
f (x1 , · · · , xn ) = sn (x1 , · · · , xn )h(x1 , · · · , xn ),
para algum h ∈ A. Neste caso, por construção, o grau de h é menor que o grau de
f . Além disto,
0 = f (s1 , · · · , sn ) = s1 . . . sn h(s1 , · · · , sn )
em R[s1 , · · · , sn ]. Concluimos portanto que h(s1 , · · · , sn ) = 0. Logo, por indução
no grau, h(x1 , · · · , xn ) = 0, em particular, f (x1 , · · · , xn ) = 0.
174
25. O PROBLEMA INVERSO DE GALOIS
Suponhamos agora que R seja um corpo F . Seja F (x1 , · · · , xn ) o corpo de
frações do anel de polinômios F [x1 , · · · , xn ]. Este é dito o corpo de funções racionais
em n variáveis com coeficientes em F . Analogamente, para todo σ ∈ Sn definimos
σ ∗ (f (x1 , · · · , xn )) := f (xσ(1) , · · · , xσ(n) ) e dizemos que f é simétrica se e somente
se σ ∗ (f ) = f para todo σ ∈ Sn .
Teorema 25.5. Toda função simétrica f ∈ F (x1 , · · · , xn ) pode ser escrita de
forma única como f (x1 , · · · , xn ) = g(s1 , · · · , sn ) ∈ F (s1 , · · · , sn ).
Demonstração. Suponha que
f (x1 , · · · , xn ) =
f1 (x1 , · · · , xn )
,
f2 (x1 , · · · , xn )
onde f1 , f2 ∈ A, seja simétrica. Seja
G(x1 , · · · , xn ) :=
Y
σ ∗ (f2 ).
σ∈Sn
Observe que G e Gf são polinômios simétricos em A. Ou seja existem únicos
h1 , h2 ∈ R[s1 , · · · , sn ] tais que G = h1 e Gf = h2 . Logo f = h2 /h1 ∈ F (s1 , · · · , sn )
e esta expressão é única pela unicidade de h1 e h2 .
Teorema 25.6. A extensão de corpos F (x1 , · · · , xn )/F (s1 , · · · , sn ) é galoisiana
com grupo de Galois isomorfo a Sn .
Demonstração. Seja L := F (s1 , · · · , sn ) e
f (t) := (t − x1 ) . . . (t − xn ) = tn − s1 tn−1 + . . . + (−1)n sn ∈ L[t].
Então F (x1 , · · · , xn ) = L[Rf (t) ] é o corpo de decomposição de f (t) sobre L. Assim,
a extensão acima é normal. É também separável, pois as variáveis x1 , · · · , xn são
distintas, logo f (t) é separável. Portanto, a extensão é galoisiana. Como f (t) tem
grau n, sabemos que Gal(F (x1 , · · · , xn )/L) é isomorfo a um subgrupo de Sn (ver
capı́tulo de teoria de Galois). Por outro lado,
F (x1 , · · · , xn )Sn ⊃ L.
Isto significa que Sn ⊂ Gal(F (x1 , · · · , xn )/L). Logo Gal(F (x1 , · · · , xn )/L) ∼
= Sn .
Para passarmos do teorema acima para um resultado sobre Q precisamos do
teorema de irredutibilidade de Hilbert (veja [LaDio, chapter 9].
Teorema 25.7 (teorema de irredutiblidade de Hilbert). Seja L := Q(x1 , · · ·
, xn ) ⊃ R := Q[x1 , · · · , xn ] e f (t) ∈ L[t] irredutı́vel. Então existem infinitos homomorfismos λ : R → Q tais que λ∗ (f )(t) seja irredutı́vel em Q[t].
Teorema 25.8. Existe uma extensão galoisiana finita K de Q tal que Gal(K/
Q) ∼
= Sn .
Demonstração. Pelo teorema 25.6 a extensão Q(x1 , · · · , xn )/Q(s1 , · · · , sn )
é galoisiana com grupo de Galois isomorfo a Sn . Seja α um elemento primitivo
desta extensão e Pα|M o seu polinômio mı́nimo sobre M := Q(s1 , · · · , sn ). Pelo
teorema de irredutibilidade de Hilbert existem infinitos homomorfismos λ : R → Q
tais que λ∗ (Pα|M ) =: f seja irredutı́vel sobre Q[t]. Note que a extensão Q[Rf ]/Q é
galoisiana de grau n!. É possı́vel mostrar com argumentos geométricos que podemos
25.3. MÉTODO GERAL
175
escolher λ de tal forma que Gal(Q[Rf ]/Q) seja ainda Sn (ver [SerMW, proposition
2, seção 9.2]).
25.2. Grupo An
Para obter o grupo An como grupo
de Galois sobre Q começamos novamente
Q
com a situação genérica. Seja D = 1≤i<j≤n (xi −xj )2 o discriminante do polinômio
Q
f (t) = (t − x1 ) . . . (t − xn ) = xn − s1 xn−1 + . . . + (−1)n sn . Seja δ := 1≤i<j≤n (xi −
xj ). Observe que para todo σ ∈ Sn temos σ ∗ (δ) = ±δ. Se o sinal for positivo,
dizemos que a permutação é par, senão dizemos que é ı́mpar. É claro que δ 2 = D
eδ∈
/ M := F (s1 , · · · , sn ). Assim, [M [δ] : M ] = 2. Além disto, denotando por An
o subgrupo normal de ı́ndice 2 de Sn formado pelas permutações pares, temos que
F (x1 , · · · , xn )An ⊃ M [δ]. Obtemos dessa forma o seguinte resultado.
Teorema 25.9. A extensão F (x1 , · · · , xn )/M [δ] é galoisiana com grupo de
Galois An .
Teorema 25.10. Existe extensão galoisiana K/Q tal que Gal(K/Q) ∼
= An .
Demonstração. A prova é como no caso Sn utilizando o fato adicional que
podemos escolher λ de tal forma que λ(δ) ∈
/ Q (ver [SerMW, seção 10.3]).
25.3. Método geral
O que está ocorrendo em ambos os casos está longe de ser uma situação particular. Em primeiro lugar, o corpo de funções racionais F (x1 , · · · , xn ) é o corpo de
funções racionais do espaço afim An (F ) = F n como variedade algébrica. O objetivo
é primeiramente realizar um grupo finito G como grupo de Galois sobre este corpo.
Isto nem sempre pode ser obtido, é quase tão difı́cil quanto o problema original.
Entretanto, temos o seguinte resultado.
Teorema 25.11. [SerMW, seção 10.1] Seja G um grupo finito. Suponha que
exista uma extensão galoisiana finita L/Q(x1 , · · · , xn ) com grupo de Galois G.
Então existe uma extensão galoisiana K/Q com grupo de Galois G. Além disto,
se L é Q-regular, i.e., Q é algebricamente fechado em L, então existem uma infinidade de extensões linearmente disjuntas (para definição ver capı́tulo de teoria
de transcendência).
Observação 25.12. Utilizando a teoria de curvas elı́ticas é possı́vel provar
que existe uma extensão Q-regular de Q(x) com grupo de Galois PSL2 (Fp ) =
SL2 (Fp )/F∗p . Isto é devido a Shih (ver [SerMW, seção 10.4]). Na verdade estas extensões representam do ponto de vista geométrico recobrimentos galoisianos
finitos de curvas definidas sobre Q com um número finito de pontos de ramificação.
Isto remete a seguinte pergunta: quando um grupo finito pode ser grupo de Galois
de um tal recobrimento com um conjunto prescrito de pontos de ramificação? Nesta
generalidade a pergunta permanece em aberto, mas se considerarmos a pergunta
sobre C, ela é respondida em termos topológicos através do chamado grupo fundamental algébrico, que neste caso é o completamento profinito do grupo topológico
(para mais sobre grupos profinitos ver capı́tulo de teoria de Galois infinita). A
reformulação desta pergunta para corpos algebricamente fechados de caracterı́stica
positiva, só foi respondida na década de 90 por Raynaud e depois Harbater correspondendo a uma conjectura de Abhyankar. A resposta é que para que um grupo
176
25. O PROBLEMA INVERSO DE GALOIS
G ocorra como grupo de Galois seu maior quociente primo com p deve se realizar
sobre uma curva sobre C com mesmo número de pontos de ramificação (suposto
pelo menos 1). Seu maior quociente primo com p nada mais é que o quociente de
G pelo seu quase-p-subgrupo, i.e., o subgrupo gerado pelos seus p-subgrupos de
Sylow.
Observação 25.13. Um objeto extremamente importante em aritmética e
relacionado com o problema inverso de Galois é o grupo de Galois absoluto GQ :=
Gal(Q/Q), onde Q = AC (Q). O fato de um grupo finito G ser grupo de Galois
sobre Q equivale ao fato de G ser um quociente de GQ . Este tema está intimamente relacionado a resolver problemas de mergulhos para o grupo profinito GQ
(para mais ver [Ser]).
CAPı́TULO 26
Teoria de Galois infinita
26.1. Limite inverso
Consideremos uma seqüência de grupos {Gn }n∈N e suponhamos que para cada
n tenhamos
um homomorfismo sobrejetivo de grupos fn : Gn Gn1 . Consideremos
Q
em n∈N Gn (onde a operação é componente a componente) o subconjunto de uplas
da forma x = (x0 , x1 , x2 , · · · ) tais que fn (xn ) = xn−1 para todo n ∈ N. Como
cada fn é um homomorfismo sobrejetivo, partindo de x1 ∈ G1 , tomando uma pré
imagem sua x2 em G2 e assim sucessivamente, formamos pelo menos uma upla
neste subconjunto que denotaremos por limn (Gn , fn ). Este conjunto é chamado o
←−
limite inverso ou limite projetivo da famı́lia {Gn , fn } que é chamada de um sistema
projetivo.
Exemplo 26.1. Seja A um grupo abeliano, p um número primo e pA : A → A a
multiplicação por p em A. Dizemos que A é p-divisı́vel , se pA for sobrejetivo. Neste
caso tomaremos o limite projetivo considerando a seqüência constante An = A para
todo n e fn = pA para todo n. O limite projetivo de (A, pA ) será denotado por
Vp (A). Consideremos o subconjunto Tp (A) de Vp (A) formado pelas uplas tais que
x1 = 0. Seja A[pn ] := ker(pnA ). Então Tp (A) = limn A[pn ]. Este é chamado
←−
o subgrupo de Tate associado ao grupo p-divisı́vel A. O exemplo mais comum
deste tipo de grupo é no contexto de variedades abelianas sobre corpos globais.
Entretanto, o exemplo mais simples, é tomar µpn o grupo das raı́zes pn -ésimas da
unidade em um corpo S
algebricamente fechado Ω de caracterı́stica distinta de p,
tomar A como µp∞ := n µpn e considerar Tp (µ) := limn µpn .
←−
Exemplo 26.2. Dado um grupo G considere uma seqüência de subgrupos Hn
de G tais que Hn ⊃ Hn−1 . Considere o homomorfismo sobrejetivo fn : G/Hn G/Hn−1 (projeção). Isto nos permite tomar o limite projetivo limn (G/Hn , fn )
←−
e observar que os homomorfismos anteriores implicam um homomorfismo natural
g : G → limn Gn dado por x 7→ (· · · , xn , · · · ), onde xn := x + Hn .
←−
Exemplo 26.3. Para todo n ≥ 0 considere Gn := Z/pn Z e o homomorfismo
sobrejetivo de projeção fn : Z/pn+1 Z → Z/pn Z. O limite projetivo limn Z/pn Z é
←−
chamado o anel Zp dos inteiros p-ádicos (para mais detalhes ver [Ne, chapter II].
Definiremos agora a noção de produto inverso de forma um pouco mais geral.
Seja I um conjunto de ı́ndices dotado de uma ordem parcial i ≤ j. Diremos
que I é direcionado se para quaisquer i, j ∈ I, existe k ∈ I tal que i ≤ k e
j ≤ k. Suponhamos que I seja direcionado. Uma famı́lia inversa direcionada de
grupos é uma famı́lia de grupos {Gi }i∈I e para cada par i ≤ j um homomorfismo
Q
fji : Gj → Gi tal que se k ≤ i ≤ j, então fjk = fji ◦ fik e fii = id. Seja G := i Gi
com a operação compenente a componente. Seja Γ o subconjunto de G formado
177
178
26. TEORIA DE GALOIS INFINITA
pelos elementos (xi ) tais que xi ∈ Gi satisfazendo a para todo j ≥ i, fji (xj ) = xi .
Então Γ contém o elemento neutro e é um subgrupo de G dito o limite inverso da
famı́lia e denotado por Γ = limi Gi .
←−
Exemplo 26.4. Seja G um grupo e F o conjunto de subgrupos normais em
G de ı́ndice finito. Se H, K ∈ F, então H ∩ K ∈ F, assim F é uma famı́lia
direcionada (com respeito à inclusão). Consideramos o limite inverso limH∈F G/H.
←−
Este subgrupo de G é o que se chama um grupo profinito (no sentido de ser limite
de grupos finitos). Uma variante desta construção consiste em nos restringirmos à
famı́lia Fp de subgrupos normais H de G cujo ı́ndice é uma potência de p. Podemos
similarmente tomar o limite inverso limH∈F G/H, este grupo é chamado um grupo
←−
p
pro-p profinito.
Exemplo 26.5. Logo em seguida consideraremos o contexto natural onde grupos profinitos aparecem, na teoria de Galois infinita. Seja k um corpo e A uma
extensão infinita de k. Por exemplo, k = Q e A = Q. Seja G := Aut(A/k) o grupo
de k-automorfismos de A. O limite inverso limH∈F G/H coincide na verdade com
←−
G (vamos mostrar isto em seção posterior). Além disto os grupos quocientes G/H
são na verdade grupos de automorfismos de extensões finitas K/k contidas em A.
Analogamente, se X for uma superfı́cie compacta de Riemann de gênero g ≥ 2
e p : X 0 → X for a aplicação de recobrimento universal, F := C(X), F 0 := C(X 0 )
seus corpos de funções. Exites uma injeção natural π1 (X)top ,→ Aut(F 0 /F ) do
grupo fundamental topológico de X (que é um grupo em 2g geradores com uma
relação) e Gal(F 0 /F ) é o grupo profinito definido como limite projetivo com relação
a subgrupos de ı́ndice finito de AutX (X 0 ). Chamamos a Aut(F 0 /F ) de grupo fundamental algébrico de X, que coincide com o completamento profinito de π1top (X)
(ver seção seguinte). Grothendieck definiu isto de maneira geral para curvas sobre
um corpo qualquer. Isto permitiu transpor a noção tradicional de grupo fundamental na topologia algébrica para a geometria algébrica. Permanece um grande
mistério a estrutura dos grupos fundamentais algébricos de curvas, embora por exemplo conheça-se bem todos os quocientes finitos deste grupo, no caso de curvas
afins (isto nada mais é que uma conjectura de Abhyankar, provada por M. Raynaud e D. Harbater nos anos 90, que diz que para que um grupo seja quociente é
necessário e suficiente que seu maior quociente primo com p o seja).
26.2. Completamento de um grupo
Seja G um grupo e suponhamos que {Hr } seja uma famı́lia de subgrupos normais de ı́ndice finito tais que Hr ⊂ Hr+1 para todo n. Uma seqüência de elementos
{xn } em G é dita uma seqüência de Cauchy, se dado Hr existe N ≥ 1 tal que
para quaiquer n, m ≥ N tenhamos xn x−1
m ∈ Hr . Dizemos que a seqüência {xn }
é a seqüência nula se para todo Hr existir um N ≥ 1 tal que para todo n ≥ N
tenhamos xn ∈ Hr . Fica como exercı́cio provar que o conjunto C de seqüências
de Cauchy com operação termo a termo é um grupo e que as seqüências nulas N
formam um sugrupo normal. O grupo quociente C/N é chamado o completamento
de G com respeito às seqüências nulas e denotado por Ĝ.
Observe que existe um homomorfismo natural T
G → Ĝ dado por x 7→ (x, x, x, · · · )
mod N . O núcleo deste homomorfismo é igual a r Hr . Quando este núcleo é trivial temos uma injeção.
26.3. TEORIA DE GALOIS INFINITA
179
G/Hr .
Teorema 26.6. Existe um isomorfismo de grupos Ĝ ∼
= lim
←−r
Demonstração. Seja x = {xn } uma seqüência de Cauchy em G. Para todo
n suficientemente grande a classe de xn mod Hr independe de n, denotamos esta
classe por x(r). Assim, (x(1), x(2), · · · ) ∈ limr G/Hr .
←−
Reciprocamente, todo elemento (x1 , x2 , · · · ) ∈ limn G/Hn , com xn ∈ G/Hn e
←−
xn um representante de xn em G. A seqüência {xn } é uma seqüência de Cauchy,
que fica como exercı́cio provar que está bem definida, a menos de seqüências nulas.
Também fica como exercı́cio mostrar que a correspondência acima nos dá a bijeção
requerida (que por construção é um homomorfismo).
Podemos fazer a construção acima mais geralmente da seguinte forma. Seja
F uma famı́lia, uma seqüência de Cauchy é uma famı́lia {xj }j∈J indexada por
um conjunto arbitrário J tal que para cada H ∈ F existe j ∈ J tal que para
k, k 0 ≥ j temos xk x−1
k0 ∈ H. Na prática trabalhamos realmente com seqüências,
pois os grupos profinitos considerados na maior parte dos casos que trataremos têm
uma base enumerável de abertos. Por exemplo, isto ocorre quando G é finitamente
gerado.
Mais geralmente, uma famı́lia {Hi } de subgrupos normais contida em F é dita
cofinal em F se dado H ∈ F existir i tal que Hi ⊂ H. Suponhamos que exista uma
famı́lia {Hi } cujos ı́ndices percorram um conjunto enumerável. Fica como exercı́cio
G/H.
mostrar que limi G/Hi ∼
= lim
←−H∈F
←−
26.3. Teoria de Galois infinita
Estenderemos agora a teoria de Galois para extensões infinitas. Uma extensão
algébrica infinita K/k é dita galoisiana, se for normal e separável (lembre que para
definir normalidade e separabilidade precisamos apenas que a extensão K/k seja
algébrica). Para toda subextensão finita F/k de K/k tal que F/k seja galoisiana,
temos que # Gal(F/k) = [F : k]. Pela teoria geral K/F é galosiana (a separabilidade é clara, a normalidade, segue do fato que para qualquer α ∈ K temos
Pα|K | Pα|k ). Seja H := Gal(K/F ) := Aut(K/F ). Então H tem ı́ndice finito em
G := Gal(K/k). De fato, consideremos o homomorfismo sobrejetivo (pela normalidade) de restrição G → Gal(F/k) dado por σ 7→ σ|F . O núcleo deste homomorfismo é exatamente H, logo, pelo teorema dos homomorfismos, G/H ∼
= Gal(F/k),
a fortiori, H tem ı́ndice finito em G. Pelas propriedades anteriores de limite projetivo, isto permite definir um homomorfismo de grupos G → limH∈F G/H, onde
←−
F := {Gal(F/k) | F é uma extensão galoisiana finita de k}.
Teorema 26.7. O homomorfismo G → limH∈F G/H é um isomorfismo de
←−
grupos.
Demonstração. Observemos inicialmente que o núcleo é trivial. De fato se
σ pertence ao núcleo, então para toda extensão galoisina finita F/k contida em K
temos que σ|F = 1. Mas como todo α ∈ K pertence a alguma extensão galoisiana
finita F/k concluimos que σ = 1.
Para ver a sobrejetividade, observe que um elemento (σH ) de limH G/H satisfaz
←−
a compatibilidade σH 7→ σH 0 para H 0 ⊃ H. Isto nos permite definir σ ∈ G
globalmente da seguinte forma. Seja α ∈ K, como observado, existe F/k galoisiana
finita contida em K tal que α ∈ F . Seja H := Gal(K/F ) e σ(α) := σH (α).
Observe que a condição de compatibilidade acima afirma justamente que σ(α) não
180
26. TEORIA DE GALOIS INFINITA
depende da escolha de F . Portanto, isto define um elemento σ ∈ G. Além disto,
por construção σ 7→ (σH ).
Exemplo 26.8. Seja p um número primo e para todo inteiro n ≥ 1 consideremos Kn := Q(µpn ) o pn -ésimo corpo ciclotômico. Seja K := Q(µp∞ ). A extensão
K/Q é abeliana infinita. Como para todo n ≥ 1 temos que Gal(Kn /Q) ∼
= (Z/pn Z)∗
concluimos que temos um isomorfismo de grupos Z∗p → Gal(K/Q). Este tipo de extensão cicltômica foi estudada por K. Iwasawa e está associada a funções L analı́ticas
na topologia p-ádica.
Exemplo 26.9. Similarmente, dada uma curva elı́tica E sobre Q consideramos
a extensão ciclotômica Q(E[pn ]) gerada pelas coordenadas dos pontos de pn -torção
de E, lembre que E[pn ] ∼
= (Z/pn Z)2 . Observe também que o grupo de Galois absoluto GQ := Gal(Q/Q) de Q age em E[pn ], para todo n, assim temos uma representação de GQ dada por ρn : GQ → GL(E[pn ]) ∼
= GL2 (Z/pn Z) e pelas construções
anteoriores podemos tomar o limite projetivo destas representações, obtendo assim
a representação p-ádica GQ → GL2 (Zp ). Na verdade o estudo destas representações
remonta a trabalhos de Serre, Shimura e Lang-Trotter eQ
um teorema profundo de
Serre afirma que a representação galoisiana ρ : GQ → p GL2 (Zp ) tem imagem
aberta, se E não tem multiplicação complexa, i.e., a imagem de GQ é um subgrupo
de ı́ndice finito em GL2 (Zp ) para todo p sendo igual a GL2 (Zp ) para quase todo p.
O mesmo tipo de problemática pode ser encontrado no caso de variedades abelianas,
mas a extensão do teorema de Serre depende de um conjectura sobre o grupo de
Mumford-Tate da variedade abeliana.
Pode-se considerar também extensões ciclotômicas de extensões ciclotômicas.
Isto é o conteúdo da seguinte conjectura devida a S̆afarevic̆.
Conjectura 26.10. Seja k0 := Q(µ∞ ) o compositum de todas as extensões
ciclotômicas de Q em Q. Seja k/k0 uma extensão finita e Gk := Gal(Q/k). Então
Gk é isomorfo ao completamento de um grupo profinito livro em um número enumerável de geradores.
É possı́vel formular um análogo desta conjectura para curvas elı́ticas substituindo Q(µ) por Q(E(Q)tor ).
CAPı́TULO 27
Teoria de transcendência
27.1. Bases de trasncendência
27.2. Transcendência de e
27.3. Transcendência de π
27.4. Elementos de teoria de transcencência
181
Bibliografia - Livros
[Ap]
[Ar]
[Co]
[En]
[GaLe]
[Go]
[Goss]
[Ha]
[IrRo]
T. M. Apostol, Introduction to Analytic Number Theroy.
M. Artin, Algebra.
S. Collier Coutinho, Números Inteiros e Criptografia, SBM.
O. Endler, Teoria de Corpos, IMPA.
A. Garcia, Y. Lequain, Elementos de Álgebra, Projeto Euclides, IMPA.
D. Gorenstein, Finite Groups
D. Goss, The Basic Structures of the Arithmetic of Functions Fields
J. Harris, Algebraic Geometry, Springer-Verlag.
K. Ireland, M. Rosen, A Modern Introduction to Classical Number Theory, SpringerVerlag.
[Kob] N. Koblitz, p-adic analysis.
[La]
S. Lang, Algebra, Springer-Verlag.
[LaDio] S. Lang, Fundamentals of Diophantine Geometry
[Li]
E. L. Lima, Curso de Análise, vol. 1, Projeto Euclides, IMPA.
[Lins] A. Lins Neto, Funções de uma variável complexa, projeto Euclides.
[Lo]
D. Lorenzini, An Invitation to Arithmetic Geometry, Graduate Studies in Mathematics,
AMS, vol 9, 1996.
[Mi]
J. S. Milne, Étale Cohomology
[Ne]
J. Neukirch, Algebraic Number Theory
[Ser]
J.-P. Serre, Topics in Galois Theory
[SerMW] J.-P. Serre, Lectures on the Mordell-Weil theorem
[Sh]
D. Shanks, Solved and Unsolved Problems in the Theory of Numbers
[Si]
W. Sierpinski, A Selection of Problems in the Theory of Numbers
[Sil]
J. Silverman, The Arithmetic of Elliptic Curves, GTM, Springer.
[Sp]
M. Spivak, Calculus.
[vWa] van der Waerden, Algebra.
183
Bibliografia - Artigos
[Le1]
[Le2]
[Ma]
[We1]
[We2]
H. Lenstra
H. Lenstra
B. Mazur, Modular curves and the Eisenstein ideal, Pub. IHES, 1969.
P. Deligne, Conjectures de Weil I, Pub. Math. IHES 43 (1974), 273-307.
P. Deligne, Conjectures de Weil II, Pub. Math. IHES 52 (1981), 313-428.
185
Índice Remissivo
K-automorfismos, 144
K-conjugados, 129
K-homomorfismos, 136
K-isomorfismo, 129
Z/nZ, 3
π(x), 27
ordp (n), 1
ϕα , 123
n-ésima
extensão ciclotômica, 155
n-ésimo
corpo ciclotômico, 155
polinômio ciclotômico, 157
p-divisı́vel, 177
p-grupo, 76
p-subgrupo
de Sylow, 75
de corpos, 152
comprimento
de série, 79
conúcleo
de homomorfismo, 87
conexão
de Galois, 149
congruência
linear, 39
módulo ideais, 111
conjunto
de relações, 87
de geradores, 87
dos p-subgrupos de Sylow, 76
dos conjugados, 74
indutivo, 3
conteúdo
de polinômio, 107
corpo
algebricamente fechado, 127
de decomposição, 143
de frações de um domı́nio, 106
de números, 157
finito, 137
perfeito, 134
correspondência
de Galois, 150
critério
de Eisenstein, 100
critérios
de divisibilidade, 37
curva
elı́tica, 90
algarismos, 37
algoritmo
de Euclides, 7
anel, 9
comutativo com unidade, 10
de inteiros, 32
noetheriano, 88
quociente, 32
automorfismo
de anéis, 112
de grupo, 64
interno, 64
axioma
da boa ordenação, 1
cancelamento, 7
caracterı́stica
p, 133
0, 133
centro
de um grupo, 60
classe
de equivalência, 2
lateral a direita, 54
lateral a esquerda, 54
compositum
discriminante
de polinômio, 172
divisı́vel, 7
domı́nio
de integridade, 10
euclideano, 101
fatorial, 106
principal, 10
elemento
187
188
algébrico, 123
inseparável, 135
inversı́vel, 36
maximal, 3
neutro, 49
primitivo, 136
puramente inseparável, 139
separável, 134
transcendente, 123
elementos
inversı́veis, 104
endomorfismo
de anéis, 112
de grupo, 64
equação
das classes de conjugação, 74
diofantina, 39
expoente
de grupo abeliano, 56
de polinômio, 139
extensão
abeliana, 159
algébrica, 124
cı́clica, 159
de Artin-Schreier, 162
de corpos, 119
de Kummer, 159
finita, 119
finitamente gerada, 125
galoisiana, 145, 150
normal, 143
separável, 134
simples, 136
solúvel, 165
solúvel por radicais, 166
transcendente, 124
fecho
algébrico de K em Ω, 128
algébrico de K em L, 127
normal, 144
puramente inseparável, 140
separável, 136
funções
aritméticas elementares, 15
função
φ de Euler, 16
sobrejetiva, 1
de Mœbius, 15
injetiva, 1
zeta de Riemann, 30
funções
simétricas elementares, 122
grau
da extensão, 119
de inseparabilidade, 140
de monômio, 172
de polinômio, 93
ÍNDICE REMISSIVO
de separabilidade, 140
grupo, 49
abeliano, 49
abeliano de torção, 85
cı́clico, 56
das raı́zes n-ésimas da unidade, 53
das raı́zes n-ésimas da unidade, 155
de Galois, 154
finito, 49
infinito, 49
linear, 49
metacı́clico, 68
profinito, 178
quociente, 60
simples, 79
solúvel, 81
hipótese
de Riemann, 31
homomorfimso
de grupos, 61
homomorfismo
de anéis, 106, 112
de módulos, 86
ideais
coprimos, 110
ideal, 9
maximal, 97, 111
primo, 112
principal, 10
soma, 110
imagem
de homomorfismo, 112
indı́ce
de um subgrupo, 54
indução finita, 19
inteiro
em uma dada base, 37
livre de f -potência, 14
livre de quadrados, 13
inteiros
gaussianos, 101
inverso, 49
isomorfismo
de anéis, 112
de grupos, 62
lema
chave, 55
da duplicação, 126
de Gauss, 99
de Krull, 3
de Zorn, 3
limite
inverso, 177
superior, 3
máximo
ÍNDICE REMISSIVO
divisor comum, 8
máximo divisor comum
de polinômios, 95
módulo
finitamente gerado, 85
livre, 85
quociente, 85
sobre anel, 85
matriz
de presentação, 87
matrizes, 49
monóide, 64
monômio, 172
multiplicação
de Dirichlet, 15
multiplicidade
de raiz, 133
núcleo
de homomorfismo, 61, 112
número
binomial, 1
composto, 11
de Fermat, 27
de Carmichael, 44
de divisores, 15
de Fermat, 23
de Mersenne, 27
primo, 11
números
p-ádicos, 130
norma
de elemento, 121
normalizador
de um subgrupo, 75
ordem
p-ádica, 1
de elemento, 55
de grupo, 49
parcial, 3
total, 3
parte
inteira, 1
pequeno
teorema de Fermat, 20
permutação
de conjunto, 73
polinômio, 93
caracterı́stico, 120
inversı́vel, 94
irredutı́vel, 97
mı́nimo, 123
mônico, 95
primitivo, 107
puramente inseparável, 139
separável, 134
simétrico, 171
posto
da curva elı́tica, 90
de um módulo, 85
primos
em progressões aritméticas, 24
princı́pio
da indução finita, 19
produto
de ideais, 113
direto de grupos, 64
notável, 1
semi-direto de grupos, 66
pseudoprimo
em uma dada base, 44
raı́zes
n-ésimas da unidade, 53
primitivas n-ésimas da unidade, 55
raı́zes
primitivas n-ésimas da unidade, 155
raiz
de polinômio, 121
múltipla, 133
simples, 133
refinamento
de série subnormal, 79
próprio, 79
relação
binária, 2
de equivalência, 2
representação
de grupo, 73
por conjugação, 73
por translação, 73
resto
quadrático, 116
resultante
de polinômios, 109
série
de composição, 79
subnormal, 79
séries
equivalentes, 79
sı́mbolo
de Legendre, 116
separavelmente
fechado, 140
sistema
de congruências, 40
soma
de divisores, 15
progressão geométrica, 1
subgrupo, 52
caracterı́stico, 64
dos comutadores, 60
gerado por subconjunto, 56
normal, 59
submódulo, 85
189
190
ÍNDICE REMISSIVO
teorema
90 de Hilbert, 160
chinês dos restos, 41, 114
de inversão de Mœbius, 16
de Abel, 159
de Artin, 150
de Artin para homomorfismos, 160
de Cayley, 73
de Dedekind, 160
de Euclides, 20
de Korselt, 45
de Lagrange, 55
de Mazur, 90
de Mordell, 90
do isomorfismo de grupos, 62
fundamental da Álgebra, 128
fundamental da teoria de Galois, 150
teoremas
de Sylow, 75
traço
de elemento, 121
transitividade, 7
valor
absoluto, 1
Download

´Algebra Am´ılcar Pacheco