UNIVERSIDADE ESTADUAL DE FEIRA DE SANTANA
Departamento de Ciências Exatas e da Terra
Colegiado de Matemática
Curso de Licenciatura em Matemática
Trabalho de Conclusão de Curso
UM ESTUDO APROFUNDADO SOBRE
SOLUBILIDADE DE EQUAÇÕES POLINOMIAIS
Geraldo de Assis Júnior
Feira de Santana
Setembro de 2008
Banca Examinadora
Orientadora:Profa . Msc. Fabı́ola de Oliveira Pedreira Lima
Prof. Dra . Taı́se Santiago C. Oliveira
Prof. Msc. Marcos Grilo Rosa
UNIVERSIDADE ESTADUAL DE FEIRA DE SANTANA
Departamento de Ciências Exatas e da Terra
Colegiado de Matemática
Curso de Licenciatura em Matemática
Trabalho de Conclusão de Curso
UM ESTUDO APROFUNDADO SOBRE
SOLUBILIDADE DE EQUAÇÕES POLINOMIAIS
Geraldo de Assis Júnior
Trabalho apresentado ao Departamento de
Ciências Exatas e da Terra como requisito parcial para a obtenção do tı́tulo de Licenciado em
Matemática na Universidade Estadual de Feira
de Santana.
Orientadora: Fabı́ola O. P. Lima
Feira de Santana
Setembro de 2008
Agradecimentos
Agradeço à Universidade Estadual de Feira de Santana por ter me oportunizado a dar
esta contribuição, ainda que modesta, para o desenvolvimento cientı́fico. E em especial à
professora Fabı́ola pela paciência, compreensão e incentivo na realização deste trabalho.
i
Resumo
Neste trabalho é feito um estudo sobre solubilidade de equações polinomiais sobre um
corpo arbitrário. O capı́tulo 1 é uma revisão de grupos e anéis. No capı́tulo 2 deduzimos as
fórmulas para equações polinomiais de grau menor que 5, já no capı́tulo 3 demonstramos
por meio da Teoria de Galois que não existem fórmulas para resolver equações polinomiais
de grau maior que 4. Por fim abordamos no capı́tulo 4, métodos numéricos para se obter
raı́zes de equações ainda que não existam fórmulas explı́citas para isto. Alguns resultados
são enunciados sem demonstração. Isto foi feito para dar mais objetividade ao texto.
Optamos por fazer uma revisão detalhada de álgebra uma vez que é pré-requisito para a
Teoria de Galois que tem papel crucial em todo este trabalho.
Palavras Chave: Teoria de Galois, equações polinomiais, extensão de corpos.
iii
Sumário
Introdução
1
1 Grupos e Anéis
3
1.1
1.2
Grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
1.1.1
Subgrupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
1.1.2
Classes laterais e Teorema de Lagrange . . . . . . . . . . . . . . . .
6
1.1.3
Subgrupos normais e grupos quocientes . . . . . . . . . . . . . . . .
8
1.1.4
Homomorfismo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Anéis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.2.1
Ideais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.2.2
Anéis de polinômios
1.2.3
Funções simétricas . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
. . . . . . . . . . . . . . . . . . . . . . . . . . 19
2 Solução de equações polinomiais de grau ≤ 4
25
2.1
Equação quadrática . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.2
Equação cúbica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.3
Equação quártica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3 Teoria de Galois
31
3.1
Extensão de corpos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2
O Teorema Fundamental da Teoria de Galois . . . . . . . . . . . . . . . . . 39
3.3
A equação geral de grau n . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4 Métodos numéricos para se obter raı́zes de equações
4.1
51
Raı́zes reais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.1.1
Isolamento de raı́zes . . . . . . . . . . . . . . . . . . . . . . . . . . 52
v
vi
SUMÁRIO
4.2
4.1.2
Método da bissecção . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.1.3
Método da iteração linear . . . . . . . . . . . . . . . . . . . . . . . 53
4.1.4
Método de Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
Raı́zes complexas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.2.1
Método de Newton-Bairstow . . . . . . . . . . . . . . . . . . . . . . 55
Considerações Finais
61
Introdução
As equações algébricas têm um grande destaque na história da matemática, posto que
propiciou o desenvolvimento de diversas teorias. Durante um longo tempo matemáticos
de diversas culturas e regiões se empenharam em deduzir fórmulas que resolvessem certas equações polinomiais. Ao final do século XVI já se tinha deduzido as fórmulas para
equações polinomiais de até quarto grau [9]. A partir daı́ muitos matemáticos se empenharam em resolver as equações de grau maior que quatro. Contudo, não tiveram
êxito. Foi então que um jovem matemático norueguês Niels Abel provou que as fórmulas
simplesmente não existiamm.
Em contrapartida, do ponto de vista da matemática aplicada, geralmente os métodos
iterativos, que consistem em fazer aproximações sucessivas da solução do problema, são
computacionalmente mais baratos que os métodos diretos. O termo computacionalmente
mais barato utilizado aqui está ligado à idéia de custo de um algoritmo que depende do
número de operações necessárias para resolver um dado problema. Por exemplo, o número
de operações(adição e multiplicação) necessárias para determinar o valor numérico de um
polinômio usando a definição é geralmente maior que o número de operações necessárias
para fazer o mesmo cálculo usando o dispositivo de Briot-Ruffini.
Nesta perspectiva, discorreremos neste trabalho sobre as teorias que tratam da solução
de uma equação algébrica por método direto e sobre os métodos iterativos de se solucionar
o mesmo problema. No capı́tulo um é feita uma revisão de álgebra para dar subsı́dio ao
capı́tulo três que trata dos fundamentos da Teoria de Galois. Neste capı́tulo provamos
que o polinômio geral de grau maior que quatro não é resolúvel por radicais. O capı́tulo
dois deste trabalho trata das equações polinomiais de até quarto grau, demonstrando as
fórmulas que determinam as suas raı́zes. E finalmente no capı́tulo quatro abordamos
alguns métodos iterativos para se obter as raı́zes da equação.
1
Capı́tulo 1
Grupos e Anéis
1.1
Grupos
Um grupo consiste de um conjunto não vazio G e uma aplicação σ : G × G −→ G
que a cada par (x, y) em G × G associa um único elemento σ(x, y) em G. Além disso, tal
aplicação deve satisfazer a três condições. São elas:
1. Associatividade
Dados x, y, z ∈ G temos que σ(σ(x, y), z) = σ(x, σ(y, z)).
2. Existência do elemento neutro
Existe um elemento e de G tal que σ(x, e) = σ(e, x) = x; ∀x ∈ G.
3. Simetrização
Para todo elemento x de G existe um y em G tal que σ(x, y) = σ(y, x) = e. O
elemento y é dito inverso ou simétrico de x.
Se além das três condições acima ocorre que σ(x, y) = σ(y, x), ∀x, y ∈ G, dizemos que
o grupo é comutativo ou abeliano.
O elemento neutro é único, pois se existissem dois e e e0 , terı́amos que e = σ(e, e0 ) = e0 .
O simétrico também é único. De fato, suponhamos que um elemento x de G tenha dois
simétricos y e z. Daı́ σ(x, y) = e e σ(x, z) = e. Ora, se σ(x, y) = e, então os pares
ordenados (z, σ(x, y)) e (z, e) são iguais. Logo suas imagens também são iguais, isto é,
σ(z, σ(x, y)) = σ(z, e). Daı́ σ(σ(z, x), y) = σ(z, e). Logo σ(e, y) = σ(z, e). Portanto
y = z.
3
Comumente representamos a imagem do par (x, y) pela σ por x.y ou simplesmente
xy, neste caso temos um grupo multiplicativo o qual denotamos por (G, .). Outras vezes
representamos a imagem de (x, y) por x + y, neste caso temos um grupo aditivo que
denotamos por (G, +). Em geral usaremos a notação multiplicativa para representar uma
operação arbitrária de um grupo arbitrário. Vale ressaltar que definir uma função de
G × G em G nada mais é que definir uma operação no conjunto G.
Usamos a terminologia inverso para grupos multiplicativos e simétrico para grupos
aditivos. Quando o grupo é multiplicativo representamos o inverso do elemento x por x−1
e quando o grupo é aditivo representamos o simétrico de x por −x.
Exemplos de grupos
1. (Z, +) é um grupo, isto é, Z é um grupo aditivo com a operação usual de soma.
2. (Q∗ , .) é um grupo multiplicativo e (Q, +) é um grupo aditivo.
3. O conjunto das matrizes inversı́veis de ordem n é um grupo multiplicativo não
abeliano denominado de grupo linear.
4. O conjunto Zn dos inteiros módulo n é um grupo em relação à adição e Zn − {0} é
grupo em relação à multiplicação.
5. Dado um conjunto arbitrário S tomamos A(S) como o conjunto de todas as bijeções
de S em si mesmo. Seja S um conjunto de n elementos. Sem perda de generalidade
tomemos S = {1, · · · , n}. Se usarmos a composição de funções entre os elementos
de A(S) teremos uma estrutura de grupo. Usamos a notação Sn para representar
este grupo que é denominado grupo das permutações.
Podemos representar cada f ∈ Sn como


f =
1
2
···
f (1) f (2) · · ·
n

f (n)
Dado k ≤ n, se acontece que f (i1 ) = i2 , f (i2 ) = i3 , · · · , f (ik ) = i1 e f (ij ) = ij
quando j 6∈ {1, · · · , k}, então representamos f como f = (i1 i2 · · · ik ) e dizemos que
f é um k-ciclo.
4
1.1.1
Subgrupos
Dado um grupo G, entendemos como subgrupo de G a todo subconjunto H ⊂ G que
é grupo com a mesma operação de G. Usamos a notação H < G para representar este
fato.
Segue desta definição que {e} e G são subgrupos de G para qualquer que seja G. São
os chamados subgrupos triviais.
Exemplos de subgrupos
1. O grupo aditivo nZ, que é o grupo dos múltiplos inteiros de n ∈ Z, é um subgrupo
de Z.
2. O grupo multiplicativo dos racionais (Q, .) é um subgrupo do grupo dos reais (R, .).
3. Seja G um grupo, dado a ∈ G e m um inteiro positivo definimos am = a.a.
· · · .a}.
| {z
m vezes
Assim, para cada a 6= e o grupo [a] = {e, a, a2 , · · · , am , · · · } que é o grupo gerado
por a é um subgrupo de G.
Em geral dado a ∈ G e m ∈ Z definimos



e, se m = 0


am =
a.am−1 , se m > 0



 (a−1 )−m , se m < 0
Se G for finito então o grupo H = {e, a, a2 , · · · , am−1 } é dito grupo cı́clico, isto porque
para cada i ≥ m existe j ∈ {1, · · · , m − 1} tal que ai = aj .
Em um grupo finito definimos ordem do grupo como o número de elementos deste
grupo. Além disso, sendo G um grupo e a elemento de G, definimos ordem de a como
sendo o menor inteiro positivo m tal que am = e.
Usamos a notação |G| para representar a ordem de G e |a| para a ordem de a. No
caso de um grupo cı́clico G = [a], temos que |G| = |a|.
Proposição 1.1.1 Todo subgrupo de um grupo cı́clico também é cı́clico.
Demonstração:
Seja G = [a] um grupo cı́clico de ordem m e H um subgrupo de G
tomemos n como o menor inteiro positivo tal que an ∈ H. Segue que [an ] ⊂ H. Por outro
lado, se x ∈ H então existe h ∈ Z tal que x = ah ∈ H. Pelo teorema da divisão euclidiana,
5
existem q, r ∈ Z tais que h = qn + r, com 0 ≤ r < n. Daı́ ar = ah−qn = ah a−qn ∈ H.
Logo ar ∈ H. Como n é o menor inteiro positivo tal que an ∈ H segue que r = 0 e daı́
h = qn. Logo x = ah = aqn ∈ [an ]. Daı́ H ⊂ [an ], e portanto H = [an ].
Teorema 1.1.1 Dado um grupo G e um subconjunto H ⊂ G, H é subgrupo de G se, e
somente se a.b−1 ∈ H, ∀ a, b ∈ H.
Demonstração:
De fato, se H é subgrupo de G então é claro que a.b−1 ∈ H, ∀ a, b ∈ H.
Reciprocamente, se a.b−1 ∈ H ∀ a, b ∈ H, então tomemos b = a, daı́ e = a.a−1 = a.b−1 ∈
H. Agora, como e ∈ H, para todo a ∈ H temos que a−1 = e.a−1 ∈ H. Além disso, dados
a, b ∈ H sabemos que b−1 ∈ H e daı́ a.b = a.(b−1 )−1 ∈ H, isto é, a operação é fechada em
H, e portanto vale a associativa em H já que esta é válida em G. Logo H é subgrupo de
G.
Este resultado é muito importante na teoria dos grupos. Sem ele para se provar que
um dado subconjunto é subgrupo várias condições deveriam ser verificadas. Agora apenas
uma condição deve ser satisfeita.
1.1.2
Classes laterais e Teorema de Lagrange
Seja G um grupo e H um subgrupo de G, dado um x ∈ G o conjunto de todos os
elementos da forma xh, com h ∈ H, será denotado por xH e designado classe lateral
à esquerda módulo H, da mesma forma o conjunto dos hx será denotado por Hx e
designado classe lateral à direita módulo H. A cardinalidade do conjunto de todas as
classes laterais à esquerda ou à direita é denominado ı́ndice de H em G e denotado por
(G : H). Frequentemente usaremos apenas a expressão classe lateral para designar classe
lateral à esquerda.
Exemplo 1.1.1 Considere o grupo aditivo Z6 = {0, 1, 2, 3, 4, 5} e o subgrupo H =<
6
2 >= {0, 2, 4}, vamos determinar as classes laterais de G = Z6 módulo H.
0 + H = {0 + 0, 0 + 2, 0 + 4} = {0, 2, 4}
1 + H = {1 + 0, 1 + 2, 1 + 4} = {1, 3, 5}
2 + H = {2 + 0, 2 + 2, 2 + 4} = {2, 4, 0}
3 + H = {3 + 0, 3 + 2, 3 + 4} = {3, 5, 1}
4 + H = {4 + 0, 4 + 2, 4 + 4} = {4, 0, 2}
5 + H = {5 + 0, 5 + 2, 5 + 4} = {5, 1, 3}
Logo, as únicas classes laterais à esquerda de G = Z6 módulo H, são {0, 2, 4} e
{1, 3, 5}, portanto (G : H) = 2. Note que |G| = 6 e |H| = 3 e daı́ |G| = |H|.(G : H).
Veremos mais adiante que não se trata de mera coincidência.
Proposição 1.1.2 Duas classes laterais distintas são sempre disjuntas.
Demonstração:
Sejam aH e bH classes distintas. Suponhamos que aH ∩ bH 6= ∅.
Segue que existe x tal que x ∈ aH ∩ bH. Daı́ x ∈ aH e x ∈ bH. Logo existem h1 , h2 ∈ H
tais que x = ah1 e x = bh2 . Segue que ah1 = bh2 , e portanto b−1 a = h2 h−1
1 ∈ H.
Agora, dado y ∈ aH, temos que existe h ∈ H tal que y = ah. Logo b−1 y = b−1 ah.
Daı́ b−1 y ∈ H, e portanto existe h3 ∈ H tal que b−1 y = h3 . Logo y = bh3 ∈ bH. Segue
que aH ⊂ bH. De forma análoga concluı́mos que bH ⊂ aH e daı́ aH = bH, o que fere a
nossa hipótese inicial de que aH 6= bH. Temos portanto um absurdo que certamente veio
da hipótese de que aH ∩ bH 6= ∅.
Teorema 1.1.2 (Lagrange) Dado um grupo finito G e um subgrupo H ⊂ G temos que
|G| = |H|.(G : H), isto é, a ordem do subgrupo divide a ordem do grupo.
Demonstração:
Ora da proposição 1.1.2 temos que as classes laterais de G módulo
H são duas a duas disjuntas. Logo o grupo G é a reunião disjunta de todas as suas
classes laterais módulo H . Então, sejam a1 H, · · · , am H as classes laterais de G, onde
[
m = (G : H) segue que G =
ai H. Portanto |G| = ] (a1 H) + · · · + ] (am H) (onde
1≤i≤m
] (ai H) representa a cardinalidade de ai H. É usada esta notação em vez de |ai H| porque
7
ai H não é necessariamente um grupo). Segue daı́ que |G| = |H| + · · · + |H| = |H|.m =
|
{z
}
m vezes
|H|.(G : H).
O que foi provado aqui é que a ordem do subgrupo divide a ordem do grupo, isto é,
para cada subgrupo H de G existe um m = |H| tal que m divide |G|. Daı́ naturalmente
surge a pergunta: Dado um divisor m de |G| existe um subgrupo H de G tal que |H| = m?
A resposta é não. Existem grupos cujo número de subgrupos é menor que o número de
divisores de sua ordem. O resultado mais próximo da recı́proca do Teorema de Lagrange
é o Teorema de Sylow que garante o resultado quando a ordem do grupo é da forma pα
com p primo e α ∈ Z cuja demonstração pode ser vista em [6].
1.1.3
Subgrupos normais e grupos quocientes
Na seção anterior definimos classes laterais. Sobre certas condições podemos ter uma
estrutura de grupo no conjunto de todas as classes laterais a esquerda ou no conjunto de
todas as classes laterais a direita. Estas idéias serão trabalhadas agora nessa seção.
Definição 1.1.1 Dado um grupo G, chamamos de subgrupo normal a todo subgrupo N
de G tal que gng −1 ∈ N para todo n ∈ N e todo g ∈ G. Representamos este fato por
N ¢ G.
Teorema 1.1.3 Dado um grupo G, temos que N ¢ G se, e somente se N = gN g −1 para
todo g ∈ G.
Demonstração:
Se N é normal, então gng −1 ∈ N , ∀n ∈ N e ∀g ∈ G. Logo
gN g −1 ⊂ N ∀g ∈ G. Além disso, se x ∈ N , então g −1 xg = g −1 x(g −1 )−1 ∈ N . Mas
x = g(g −1 xg)g −1 ∈ gN g −1 . Logo N ⊂ gN g −1 e daı́ gN g −1 = N .
Reciprocamente, se gN g −1 = N , ∀g ∈ G, então gng −1 ∈ N ∀g ∈ G e ∀n ∈ N , logo N
é subgrupo normal de G.
Teorema 1.1.4 Seja G um grupo, um subgrupo N de G é normal se, e somente se
gN = N g, ∀g ∈ G.
Demonstração:
Suponha N ¢ G. Se x ∈ gN , então existe n ∈ N tal que x = gn.
Como n ∈ N e N = g −1 N g, já que N é normal, segue que n = g −1 n0 g, com n0 ∈ N . Daı́
8
x = g(g −1 n0 g) = n0 g. Logo x ∈ N g e por tanto gN ⊂ N g. De forma análoga concluı́mos
que N g ⊂ gN e daı́ gN = N g. A recı́proca é trivial.
Teorema 1.1.5 Seja G um grupo e N um subgrupo normal de G, o conjunto de todas
as classes laterais à esquerda(ou à direita), que denotamos por G/N , é um grupo com a
operação (aN )(bN ) = (ab)N .
Demonstração:
Primeiramente vamos verificar se a operação está bem definida.
Com efeito, devemos provar que o produto de duas classes laterais é uma classe lateral,
isto é, (aN )(bN ) = (ab)N .
Ora, se x ∈ (aN )(bN ), então x = (an1 )(bn2 ) onde os ni pertencem a N . Sabemos que
bn2 ∈ bN , mas pelo teorema 1.1.4 bN = N b e portanto existe n3 ∈ N tal que bn2 = n3 b.
Logo x = (an1 )(n3 b) = a((n1 n3 )b). Novamente, como bN = N b temos que existe n4 ∈ N
tal que (n1 n3 )b = bn4 e daı́ x = a(bn4 ) = (ab)n4 ∈ (ab)N .
Por outro lado, se x ∈ (ab)N , então existe n ∈ N , tal que x = (ab)n = (ae)(bn) ∈
(aN )(bN ). Logo (aN )(bN ) = (ab)N .
Agora falta provar que vale a associativa, que existe um elemento neutro e que todo
elemento possui um inverso.
1. Associativa.
[(aN )(bN )](cN ) = [(ab)N ](cN ) = ((ab)c)N = (a(bc))N = (aN )[(bc)N ] =
= (aN )[(bN )(cN )]
2. Existência do elemento neutro.
O elemento neutro de G/N é N , já que (aN )(N ) = (aN )(eN ) = (ae)N = aN e
(N )(aN ) = (eN )(aN ) = (ea)N = aN .
3. Simetrização.
O inverso de (aN ) é (a−1 N ), já que (aN )(a−1 N ) = (aa−1 )N = eN = N e (a−1 N )(aN )
= (a−1 a)N = eN = N .
Exemplo 1.1.2 O grupo aditivo Z admite mZ como subgrupo, onde m ∈ Z. Observe
que mZ é normal. Daı́ Z/mZ = {mZ, 1 + mZ, 2 + mZ, · · · , (m − 1) + mZ} é grupo.
9
Uma análise mais atenta de Z/mZ vai mostrar que ele tem a mesma estrutura do Zm ,
isto é, para cada classe lateral a + mZ, podemos associar uma única classe de resto a, e
somar duas classes laterais (a + mZ) + (b + mZ) = (a + b) + mZ é o mesmo que somar
duas classes de resto a + b = a + b. Então dizemos que Z/mZ é isomorfo a Zm . Esta
idéia será formalizada na próxima seção.
Lema 1.1.1 Seja N um subgrupo normal de um grupo G, temos que a ∈ N se, e somente
se aN = N .
∈ N
Demonstração:
z }| {
Com efeito, suponhamos que a ∈ N . Se x ∈ N , então x = a (a−1 x) ∈
aN e daı́ N ⊂ aN . Por outro lado, se x ∈ aN , então existe n ∈ N tal que x = an ∈ N e
daı́ aN ⊂ N . Logo aN = N .
Reciprocamente, se aN = N , então ∃n, n0 ∈ N tais que an = n0 e daı́ a = n0 n−1 ∈ N .
Teorema 1.1.6 Seja G um grupo e N um subgrupo normal de G, temos que ∀a, b ∈ N ,
ab−1 ∈ N se, e somente se aN = bN .
Demonstração:
Se ab−1 ∈ N , então, pela lema 1.1.1, ab−1 N = N e daı́ [(ab−1 )N ](bN ) =
(eN )(bN ). Logo ((ab−1 )b)N = (eb)N , daı́ (a(bb−1 ))N = bN e portanto (ae)N = bN , isto
é, aN = bN .
Reciprocamente, se aN = bN , então (aN )(b−1 N ) = (bN )(b−1 N ). Logo (ab−1 )N =
(bb−1 )N , daı́ (ab−1 )N = eN = N e pelo lema 1.1.1 segue que ab−1 ∈ N .
1.1.4
Homomorfismo
Definição 1.1.2 Dados os grupos (G, .) e (H, ∗), onde em G é definida a operação . e
em H é definida a operação ∗, chamamos de homomorfismo uma aplicação f : G → H
tal que f (g1 .g2 ) = f (g1 ) ∗ f (g2 ) ∀g1 , g2 ∈ G, isto é, f preserva as operações.
Teorema 1.1.7 Dados os grupos (G, .) e (H, ∗) e o homomorfismo f : G → H, temos
que:
1. f (eG ) = eH , onde eG é o elemento neutro de G e eH é o elemento neutro de H.
2. f (a−1 ) = f (a)−1 .
10
Demonstração:
1. Temos que f (eG ) = f (eG .eG ) = f (eG ) ∗ f (eG ). Daı́ f (eG ) = f (eG ) ∗ f (eG ). Logo
f (eG ) ∗ f (eG )−1 = [f (eG ) ∗ f (eG )] ∗ f (eG )−1 e portanto eH = f (eG ).
2. Temos que eH = f (eG ) = f (a.a−1 ) = f (a) ∗ f (a−1 ). Logo f (a) ∗ f (a−1 ) = eH . Daı́
f (a)−1 ∗ [f (a) ∗ f (a−1 )] = f (a)−1 ∗ eH . Segue que f (a−1 ) = f (a)−1 .
Teorema 1.1.8 Seja N um subgrupo normal do grupo G, a aplicação f : G → G/N dada
por a 7→ a + N é um homomorfismo sobrejetor denominado de homomorfismo canônico.
Frequentemente denotamos o elemento a + N de G/N por a.
Demonstração:
Com efeito, se a = b, então a − b = 0 e portanto a − b ∈ N . Pelo
teorema 1.1.6 segue que a + N = b + N . Logo f (a) = f (b) e portanto a aplicação esta
bem definida. Agora todo y ∈ G/N por definição é da forma y = a + N . Logo tomemos
x = a ∈ G e daı́ f (x) = a + N = y. Segue que f é sobrejetora. Finalmente temos que
f (a + b) = (a + b) = a + b = f (a) + f (b) ∀a, b ∈ G.
Definição 1.1.3 Definimos como monomorfismo a todo homomorfismo injetor, epimorfismo a todo homomorfismo sobrejetor e isomorfismo a todo homomorfismo bijetor.
Definição 1.1.4 Dados os grupos (G, .) e (H, ∗) e o homomorfismo f : G → H chamamos
de núcleo do homomorfismo f e denotamos por Kerf ou N (f ) ao conjunto Kerf = {x ∈
G | f (x) = eH }.
Teorema 1.1.9 Dado um grupo G, entendemos como automorfismo a todo isomorfismo
de G em si mesmo. O conjunto de todos os automorfismos de G, que representamos por
AutG é um grupo.
Demonstração:
A operação que vamos tomar em AutG é a composição de funções.
Então provemos primeiramente que a composição de homomorfismo é um homomorfismo.
Com efeito, (f ◦ g)(x + y) = f (g(x + y)) = f (g(x) + g(y)) = f (g(x)) + f (g(y)) =
(f ◦ g)(x) + (f ◦ g)(y) A composição de funções é associativa. Com efeito, ((f ◦ g) ◦ h)(x) =
(f ◦g)(h(x)) = f (g(h(x))) = f ((g◦h)(x)) = (f ◦(g◦h))(x) O elemento neutro é a aplicação
11
identidade I(x) = x. (f ◦ I)(x) = f (I(x)) = f (x) e (I ◦ f )(x) = I(f (x)) = f (x). Dada a
aplicação f tal que f (x) = y a aplicação inversa é uma aplicação f −1 tal que f −1 (y) = x.
Logo (f −1 ◦ f )(x) = f −1 (f (x)) = f −1 (y) = x = I(x) e (f ◦ f −1 )(y) = f (f −1 (y)) = f (x) =
y = I(y).
Teorema 1.1.10 Dados os grupos (G, .) e (H, ∗), o homomorfismo f : G → H é injetor,
isto é, um monomorfismos se, e somente se Kerf = {eG }.
Demonstração:
Suponhamos que f seja injetor. Se f (x) = eH então pelo item 1
do teorema 1.1.7 temos que f (x) = f (eG ), e como f é injetor segue que x = eG . Logo
Kerf = {eG }.
Reciprocamente, suponhamos que Kerf = {eG }. Se f (x) = f (y), então f (x) ∗
f (y)−1 = eH , daı́ f (x) ∗ f (y −1 ) = eH , logo f (x.y −1 ) = eH . Como kerf {eG } segue
que x.y −1 = eG , daı́ x = y e portanto f é injetor.
Teorema 1.1.11 Dados os grupos (G, .) e (H, ∗) e o homomorfismo f : G → H, o núcleo
do homomorfismo, Kerf , é um subgrupo normal de G.
Demonstração:
Seja N = Kerf , dados x, y ∈ N , temos que f (x) = eH e f (y) = eH ,
−1
daı́ f (x.y −1 ) = f (x) ∗ f (y −1 ) = f (x) ∗ f (y)−1 = eH ∗ e−1
∈ N e portanto
H = eH . logo x.y
N é subgrupo de G. Além disso, para todo x ∈ N e todo g ∈ G temos que f (gxg −1 ) =
f (g) ∗ f (x) ∗ f (g −1 ) = f (g) ∗ eH ∗ f (g −1 ) = f (g) ∗ f (g −1 ) = f (g.g −1 ) = f (eG ) = eH , daı́
gxg −1 ∈ N e portanto N é um subgrupo normal de G.
Definição 1.1.5 Dados os grupos (G, .) e (H, ∗), dizemos que G é isomorfo a H e denotamos por G ≈ H se existir um isomorfismo de G em H.
Exemplo 1.1.3 f : Zm → Z/mZ definido por a 7→ a + mZ é um isomorfismo, logo
Zm ≈ Z/mZ.
Com efeito, dados x, y ∈ Zm temos que f (x + y) = f (x + y) = (x + y) + mZ =
(x + mZ) + (y + mZ) = f (x) + f (y). Logo f é um homomorfismo. Agora vejamos que f
é bijetor, e portanto um isomorfismo.
Se f (x) = mZ, então x + mZ = mZ, daı́ xx ∈ mZ, isto é x = 0, logo Kerf = {0} e
portanto f é injetor. Além disso para todo y = a + mZ ∈ Z/mZ tomemos x = a em Zm
e daı́ f (x) = f (a) = a + mZ = y, logo f é sobrejetor.
12
Exemplo 1.1.4 f : R2 → C dado por (a, b) 7→ a + bi é um isomorfismo, e portanto
R2 ≈ C.
Primeiramente mostremos que f é um homomorfismo. f ((a, b)+(a0 , b0 )) = f (a+a0 , b+
b0 ) = (a + a0 ) + (b + b)i = (a + bi) + (a0 + b0 i) = f (a, b) + f (a0 , b0 ). Agora mostremos que
f é bijetor.
Se f (a, b) = 0, então a + bi = 0, logo a = b = 0, daı́ Kerf + {(0, 0)} e portanto f é
injetor. Além disso, para todo y = a + bi ∈ C tomemos x = (a, b) e desta forma temos
f (x) = f (a, b) = a + bi = y.
Exemplo 1.1.5 O número a + bi onde a, b ∈ Z é chamado de inteiro gaussiano. O
conjunto {a + bi|a, b ∈ Z} é isomorfo a Z × Z. A demonstração deste fato é análoga ao
exemplo anterior.
Teorema 1.1.12 (Teorema do homomorfismo) Dados os grupos (G, .) e (H, ∗). Seja
f : G → H um homomorfismo e N = Kerf , temos que G/N ≈ f (G). Em particular, se
f é um epimorfismo, isto é, um homomorfismo sobrejetor, então G/N ≈ H.
Demonstração:
Considere a aplicação σ : G/N → f (G) dada por aN 7→ f (a).
Devemos verificar se tal aplicação está bem definida.
Com efeito, se aN = bN , então, pelo teorema 1.1.6, ab−1 ∈ N . Logo f (ab−1 ) = eH ,
isto é, f (a) ∗ f (b)−1 = eH , ou seja, f (a) = f (b), portanto σ(aN ) = σ(bN ).
Para provar que σ é injetora basta seguir o caminho inverso do raciocı́nio anterior, ou
então pode perceber que, se σ(aN ) = eH , então f (a) = eH . Logo a ∈ N , e pela afirmação
1.1.1 aN = N . Segue que Kerσ = {N }, e portanto σ é injetora. Lembre-se que N é o
elemento neutro de G/N .
Agora, para todo y ∈ f (G), existe a ∈ G tal que f (a) = y, então tomemos x = aN
em G/N e assim temos que σ(x) = σ(aN ) = f (a) = y. Logo σ é sobrejetora.
Por fim, dados aN, bN ∈ G/N temos que σ((aN )(bN )) = σ((ab)N ) = f (ab) = f (a) ∗
f (b) = σ(aN ) ∗ σ(bN ), logo σ é homomorfismo. Segue G/N ≈ f (G).
1.2
Anéis
Na seção 1.1 definimos grupo como um conjunto não vazio munido de uma operação
que é uma aplicação G × G → G satisfazendo a três axiomas. Para definir um anel
13
precisamos de duas operações sendo que para uma delas o conjunto dado é grupo.
Definição 1.2.1 Chamamos de Anel ao conjunto não vazio A, munido de duas operações,
que para simplificar a notação vamos chamá-las de adição + e multiplicação ., satisfazendo
as seguintes condições.
1. A é grupo abeliano em relação a adição.
2. A multiplicação é associativa, isto é, a(bc) = (ab)c, ∀a, b, c ∈ A.
3. Vale a distributiva, isto é, a(b + c) = ab + ac e (a + b)c = ac + bc, ∀a, b, c ∈ A.
Se além das condições supracitadas for verdade que ab = ba, ∀a, b ∈ A, então A é um
anel comutativo e se existir 1 ∈ A tal que a.1 = 1.a = a ∀a ∈ A dizemos que A é um
anel com unidade. Se as duas condições forem satisfeita, então dizemos que A é um anel
comutativo com unidade. Neste texto sempre que nos referirmos a anel estaremos falando
de anel comutativo com unidade. Usamos a notação (A, +, .) para denotar que A é anel
com estas operações. Além disso, se para todo a ∈ A e a 6= 0 existir b ∈ A tal que ab = 1,
então dizemos que A é um corpo.
Exemplo 1.2.1 Z é um anel com as operações usuais.
Exemplo 1.2.2 Zn , o conjunto dos inteiros módulo n, é anel com as operações usuais.
Exemplo 1.2.3 Seja A um anel, o conjunto das matrizes quadradas de ordem n com
entradas em A é um anel não-comutativo com as operações usuais de matrizes.
Teorema 1.2.1 Em todo anel A temos que, ∀a, b ∈ A.
1. a0 = 0
2. (−1)a = −a
3. (−a)b = −(ab)
4. (−a)(−b) = ab
onde 0 é o elemento neutro da adição.
Demonstração:
14
1. Note que a0 = a(0 + 0) = a0 + a0, isto é, a0 = a0 + a0. Desta forma, a.0 − a.0 =
(a0 + a0) − a0, daı́ 0 = a0 + (a0 − a0), e portanto 0 = a0.
2. Note que a + (−1)a = 1a + (−1)a = (1 + (−1))a = 0a = 0, isto é, a + (−1)a = 0, e
daı́ −a +(a +(−1)a) = −a +0, logo (−a + a)+ (−1)a = −a, ou seja, 0 + (−1)a = −a
e portanto (−1)a = −a.
3. Note que (−a)b + ab = ((−a) + a)b = 0b = 0, isto é, (−a)b + ab = 0, daı́ ((−a)b +
ab) − (ab) = 0 − (ab), logo (−a)b + (ab − (ab)) = −(ab), isto é, (−a)b + 0 = −(ab),
e portanto (−a)b = −(ab).
4. Note que (−a)(−b) + (−(ab)) = (−a)(−b) + (−a)b = (−a)((−b) + b) = (−a)0 = 0,
isto é, (−a)(−b) + (−(ab)) = 0, daı́ [(−a)(−b) + (−(ab))] + ab = 0 + ab, logo
(−a)(−b)+[(−(ab))+ab] = ab, ou seja, (−a)(−b)+0 = ab, portanto (−a)(−b) = ab.
Definição 1.2.2 Seja A um anel, o subconjunto S de A é um subanel de A, se for anel
com as mesmas operações de A.
Definição 1.2.3 Dados os anéis (A, +, .) e (B, +, .) chamamos de homomorfismo de
anéis a toda aplicação f : A → B tal que f (a + b) = f (a) + f (b) e f (ab) = f (a)f (b),
∀a, b ∈ A. Assim como na definição 1.1.3 definimos monomorfismo, epimorfismo e isomorfismo de anéis a todo homomorfismo injetor, sobrejetor e bijetor, respectivamente.
Dois anéis serão ditos isomorfos se existir um isomorfismo entre eles.
Teorema 1.2.2 Seja f : A → B um homomorfismo de anéis é verdade que:
1. f (0A ) = 0B
2. f (−a) = −f (a)
Demonstração:
Segue da definição 1.2.1 item 1 e do teorema 1.1.7.
Vale ressaltar que nem sempre se tem que f (1A ) = f (1B ), onde 1A é a unidade do anel
A e 1B é a unidade do anel B.
15
Teorema 1.2.3 Seja A um corpo, se existe um homomorfismo sobrejetor de anéis de A
em B, então B também é corpo.
Demonstração:
Como f é sobrejetor segue que f (1A ) = 1B . Com efeito, como f é
sobrejetor, então existe x ∈ A tal que f (x) = 1B . Agora suponhamos que f (1A ) = y 6= 1B .
Daı́ f (1A )f (x) = y1B . Logo f (x) = y. Concluı́mos que f (x) = 1B e f (x) = y, o que é um
absurdo. O absurdo é proveniente da hipótese de que y 6= 1B . Logo f (1A ) = 1B .
Agora, dado um 0 6= b ∈ B temos pela sobrejetividade de f que existe 0 6= a ∈ A tal
que f (a) = b. Como A é um corpo segue que existe a−1 . Então tomemos b0 = f (a−1 ) ∈ B
e daı́ bb0 = f (a)f (a−1 ) = f (aa−1 ) = f (1A ) = 1B , isto é, b0 = b−1 . Portanto todo elemento
não nulo b ∈ B possui um inverso multiplicativo. Logo B é um corpo.
1.2.1
Ideais
Definição 1.2.4 Dado o anel A, chamamos de ideal de A, a todo subconjunto I que
satisfaz as seguintes condições:
1. se a, b ∈ I então a − b ∈ I. (I é grupo em relação à adição)
2. se a ∈ I e c ∈ A, então ac ∈ I.
Exemplo 1.2.4 O conjunto nZ é um ideal do anel Z.
Com efeito, se a, b ∈ nZ, então existem x, y ∈ Z tais que a = nx, b = ny e daı́,
a − b = nx − ny = n(x − y) ∈ nZ. Além disso, dados a ∈ nZ e c ∈ Z, temos que a = nx,
com x ∈ Z e daı́ ac = (nx)c = n(xc) ∈ nZ.
Exemplo 1.2.5 Dado um subconjunto X = {a1 , · · · , an } de um anel A. O conjunto
(X) = {a1 x1 + · · · + an xn |xi ∈ A} é um ideal de A.
Com efeito, sejam x = a1 x1 + · · · + an xn e y = a1 y1 + · · · + an yn ∈ (X), temos que
x − y = (a1 x1 + · · · + an xn ) − (a1 y1 + · · · + an yn ) = a1 (x1 − y1 ) + · · · + an (xn − yn ) ∈ (X), já
que xi −yi ∈ A. Além disso, ∀z ∈ A, zx = z(a1 x1 +· · ·+an xn ) = (za1 )x1 +· · ·+(zan )xn =
(a1 z)x1 + · · · + (an z)xn = a1 (zx1 ) + · · · + an (zxn ) ∈ (X), já que zxi ∈ A. Em particular,
quando X = {a}, escrevemos (a) no lugar de (X). O ideal (a) é denominado ideal
principal. Um anel em que todo ideal é principal é denominado de anel principal. Z é
um anel principal.
16
Teorema 1.2.4 Dados os ideais I e J de um anel A. O conjunto I + J de todas somas
i + j, com i ∈ I e j ∈ J, e o conjunto I ∩ J também são ideais de A.
Demonstração:
Se a, b ∈ I + J, então existem i1 , i2 ∈ I e j1 , j2 ∈ J tais que a = i1 + j1
e b = i2 + j2 . Segue que a − b = (i1 + j1 ) − (i2 + j2 ) = (i1 − i2 ) + (j1 − j2 ) ∈ I + J. Além
disso, se a ∈ I + J e c ∈ A, então ac = (i1 + j1 )c = i1 c + j1 c ∈ I + J, já que i1 c ∈ I e
j1 c ∈ J. Logo I + J é ideal de A.
Agora, se a, b ∈ I ∩ J e c ∈ A, então a, b ∈ I e a, b ∈ J. Daı́, como I e J são ideais,
a − b, ac ∈ I e a − b, ac ∈ J, logo a − b, ac ∈ I ∩ J, portanto I ∩ J é um ideal de A.
Definição 1.2.5 Seja I um ideal do anel A, definimos classe lateral ao conjunto a + I =
{a + i| a ∈ A, i ∈ I}
Como todo anel é um grupo abeliano aditivo não se faz necessária a distinção entre
classe lateral à esquerda ou à direita.
Teorema 1.2.5 Seja I um ideal do anel A, o conjunto A/I de todas as classes laterais
é um anel.
Demonstração:
Precisamos definir duas operações em A/I satisfazendo as condições
da definição 1.2.1. Então definimos as operações (a + I) + (b + I) = (a + b) + I e
(a + I)(b + I) = ab + I, onde o elemento neutro da adição é I e o da multiplicação é 1 + I.
Sabemos do teorema 1.1.5 que a primeira delas está bem definida e satisfaz o axioma 1 da
definição 1.2.1. A demonstração de que a segunda operação está bem definida e satisfaz
as demais condições da definição de anel fica como exercı́cio para o leitor.
Teorema 1.2.6 Dado o homomorfismo de anéis f : A → B, o núcleo de f é um ideal de
A.
Demonstração:
Inicialmente ressaltamos que a definição de núcleo aqui usada é
análoga a definição para grupos, isto é, o núcleo de f é o conjunto Kerf = {x ∈ A|f (x) =
0}. Então, tomemos a, b ∈ Kerf , segue que f (a − b) = f (a) − f (b) = 0 − 0 = 0, logo
a − b ∈ Kerf . Além disso, dado a ∈ Kerf e c ∈ A, temos que f (ac) = f (a)f (c) =
0.f (c) = 0, logo ac ∈ Kerf . Portanto Kerf é um ideal de A.
17
Teorema 1.2.7 Seja I um ideal do anel A a aplicação f : A → A/I definida por a 7→ a+I
é um homomorfismo denominado de homomorfismo canônico.
Demonstração:
Pelo teorema 1.1.8 f está bem definida é sobrejetiva e preserva
a soma. Então basta provar que f preserva a multiplicação. Com efeito, temos que
f (ab) = ab = ab = f (a)f (b), ∀a, b ∈ A.
Teorema 1.2.8 (Teorema do homomorfismo para anéis) Seja f : A → B um homomorfismo de anéis e Kerf o seu núcleo, temos que A/Kerf e f (A) são isomorfos.
Em particular, se f é sobrejetor então A/Kerf ≈ B.
Demonstração:
Ora, como A, B são grupos aditivos então pelo teorema 1.1.7 σ é
bijetor e σ(x + y) = σ(x) + σ(y) ∀x, y ∈ f (A). Agora basta provar que σ(x.y) = σ(x).σ(y)
∀x, y ∈ f (A). Com efeito, σ(x.y) = x.y + Kerf = (x + Kerf ).(y + Kerf ) = σ(x).σ(y).
Definição 1.2.6 Dado um anel A, dizemos que um ideal I 6= A é um ideal primo sempre
que a seguinte condição é satisfeita. Se ab ∈ I então a ∈ Iou b ∈ I.
Exemplo 1.2.6 Se p é primo, então pZ é um ideal primo de Z.
Com efeito, se ab ∈ pZ, então existe n ∈ Z tal que ab = pn, isto é, p divide ab, daı́ p|a
ou p|b, isto é, a ∈ pZ ou b ∈ pZ.
Definição 1.2.7 Um ideal I de um anel A é maximal se I 6= A e para todo ideal J tal
que I ⊂ J ⊂ A tem-se que I = J ou J = A.
Exemplo 1.2.7 2Z é um ideal maximal do anel Z.
Com efeito, tomemos um ideal J tal que 2Z ⊂ J ⊂ Z. Se J 6= 2Z, então existe x tal
que x ∈ J e x não pertence a 2Z. Segue que x = 2k + 1 com k ∈ Z. Mas 2k ∈ 2Z e
portanto 2k ∈ J, daı́ pela definição 1.2.4 1 = (2k + 1) − 2k ∈ J. Novamente pela definição
1.2.4, segue que ∀a ∈ Z a = a.1 ∈ J, daı́ J = Z.
Teorema 1.2.9 Todo ideal maximal é primo.
18
Demonstração:
Seja M um ideal maximal do anel A. Suponhamos que ab ∈ M , mas
a 6∈ M . Ora M ⊂ M + (a) ⊂ A. Daı́, como M é maximal, segue que M + (a) = M
ou M + (a) = A. Se M + (a) = M , então podemos encontrar m1 , m2 ∈ M tais que
m1 + a = m2 . Logo a = m2 − m1 ∈ M , mas por hipótese a 6∈ M . Segue que M + (a) 6= M .
Logo M + (a) = A. Daı́ 1 ∈ M + (a). Então podemos encontrar m ∈ M e n ∈ A tais
que 1 = m + na. Multiplicando esta última equação por b, obtemos b = mb + nab. Logo
b ∈ M , já que ab ∈ M e m ∈ M . Portanto M é primo, pois provamos que se ab ∈ M ,
então a ∈ M ou b ∈ M .
Teorema 1.2.10 Seja A um anel e I um ideal de A, temos que A/I é corpo sempre que
I é maximal.
Demonstração:
Suponhamos que A/I não seja um corpo. Logo existe um elemento
a + I não invertı́vel, isto é, não existe b + I ∈ A/I tal que (a + I)(b + I) = 1 + I. Mas se
(a + I)(b + I) = 1 + I, então ab + I = 1 + I e pelo teorema 1.1.6 segue que ab − 1 ∈ I.
Concluı́mos que se a + I não é invertı́vel então ab − 1 ∈
/ I ∀b ∈ A. Tomemos agora o ideal
M = I + (a) ⊃ I. 1 ∈
/ M , pois caso contrário existiria c ∈ I e b ∈ A tal que 1 = c + ab,
logo ab − 1 = −c ∈ I o que é um absurdo. Logo M ⊃ I e M 6= A, portanto I não é
maximal.
É fácil ver que a aplicação f : Z → Zn é um homomorfismo sobrejetor e o seu núcleo
é Kerf = nZ. Segue do teorema fundamental do homomorfismo para anéis que Z/nZ é
isomorfo a Zn , o que já tı́nhamos provado no exemplo 1.1.3. Mas p é primo se, e somente
se, pZ é maximal, e portanto, pelo teorema 1.2.10 Z/pZ é corpo. Logo Zp é corpo se, e
somente se p é primo.
1.2.2
Anéis de polinômios
Dado um corpo F , definimos um polinômio sobre F na indeterminada x à toda exk
X
k
k−1
ai xi , onde ai ∈ F e
pressão do tipo ak x + ak−1 x
+ · · · + a1 x + a0 , ou simplesmente
i=0
x é um elemento de F tomado arbitrariamente. Definimos como grau do polinômio não
k
X
ai xi como sendo o maior expoente da indeterminada x cujo coeficiente é
nulo p(x) =
i=0
não nulo, neste caso gr(p(x)) = k, desde que ak 6= 0.
19
Teorema 1.2.11 O conjunto F [x] de todos os polinômios sobre o corpo F na indeterminada x é um anel com as operações usuais.
Demonstração:
Para demonstrar este fato precisamos definir duas operações sobre
k1
k2
X
X
(1) i
(2)
ai x , p2 (x) =
ai xi ∈ F [x], tomemos, sem
F [x]. Com efeito, dados p1 (x) =
i=0
i=0
k2
X
perda de generalidade que k1 < k2 . Então tomemos p1 (x) =
(1)
ai xi
=
(1)
(1)
ai xi , onde ai
(1)
a i xi +
i=0
i=0
k2
X
k1
X
= 0 para todo i > k1 . Daı́ podemos definir a soma como p1 (x) +
i=k1 +1
k2
X
p2 (x) = (p1 + p2 )(x) =
(1)
(2)
(ai + ai )xi . É fácil ver que F [x] é um grupo abeliano com
i=0
esta operação. Com efeito,
1. Associatividade da adição
k1
X
Dados p1 (x) =
(1)
ai xi ,
k2
X
p2 (x) =
i=0
k1
X
X
(3)
(ai + ai )xi =
i=0
(3)
(1)
ai xi
+[
k2
X
(2)
ai xi
+
i=0
(1)
(2)
(1)
(3)
ai xi ∈ F [x] temos
(3)
a i xi ]
=
i=0
max{k1 ,k2 ,k3 }
(3)
i=0
X
k3
X
[ai + (ai + ai )]xi =
X
k1
X
(1)
a i xi +
i=0
(1)
(2)
[(ai + ai ) +
i=0
max{k1 ,k2 }
ai ]xi =
p3 (x) =
i=0
i=0
max{k1 ,k2 ,k3 }
max{k2 ,k3 }
(2)
k3
X
i=0
que p1 (x) + [p2 (x) + p3 (x)] =
X
(2)
ai xi ,
(2)
(ai + ai )xi ] +
i=0
k3
X
(3)
ai xi = [p1 (x) + p2 (x)] + p3 (x).
i=0
2. Existência do elemento neutro
k0
k1
X
X
(1)
i
O elemento neutro é p0 (x) =
0x , pois para todo p1 (x) =
ai xi temos que
i=0
i=0
max{k0 ,k1 }
p0 (x) + p1 (x) =
X
(1)
(0 + ai )xi =
i=0
k1
X
(1)
ai xi = p1 (x).
i=0
Em geral, quando não houver risco de confusão representaremos p0 (x) simplesmente
por 0.
3. Simetrização
O simétrico de p1 (x) =
k1
X
(1)
ai xi
é (−p1 )(x) =
i=0
i=0
k1
X
i=0
(1)
(1)
(ai + (−ai ))xi =
k1
X
k1
X
0xi = 0.
i=0
4. Comutatividade da adição
20
(1)
(−ai )xi , pois p1 (x)+(−p1 )(x) =
Dados p1 (x) =
k1
X
(1)
ai xi ,
p2 (x) =
k2
X
i=0
k1
X
(1)
ai xi +
i=0
k1
X
(2)
ai xi ∈ F [X], temos que p1 (x) + p2 (x) =
i=0
max{k1 ,k2 }
max{k1 ,k2 }
k2
X
(2)
ai xi
X
=
i=0
(1)
(2)
(ai +ai )xi
X
=
i=0
(2)
(1)
(ai +ai )xi =
i=0
k2
X
(2)
ai xi +
i=0
(1)
ai xi = p2 (x) + p1 (x).
i=0
Agora para provar que F [x] é um anel precisamos de uma segunda operação. Então
definimos a multiplicação de polinômios como
k1
X
onde
(3)
ai
=
(1)
ai xi
.
k2
X
=
kX
1 +k2
i=0
i=0
X
(2)
ai xi
(3)
ai xi
i=0
(2)
a(1)
s at .
s+t=i
1. Associatividade da multiplicação.
k1
X
Sejam p1 (x) =
(1)
a i xi ,
i=0
k1
X
que p1 (x)p2 (x) =
(1)
a i xi .
[p1 (x)p2 (x)]p3 (x) =
(
i=0
(1) (2) (3)
as at )av =
X
u+v=i s+t=u
X
a(1)
s (
s+u=i
X
(2)
a i xi ,
p3 (x) =
i=0
i=0
kX
1 +k2
X
p2 (x) =
k2
X
(2)
at a(3)
v ),
k2
X
(2)
a i xi =
(4)
ai xi .
(3)
ai xi ∈ F [x], temos
i=0
kX
1 +k2
i=0
k3
X
k3
X
(4)
(4)
ai xi , onde ai
i=0
k1 +k
2 +k3
X
(3)
ai xi =
i=0
(2) (3)
(a(1)
s at )av
s+t+v=i
X
i=0
=
X
=
(2)
a(1)
s at . Logo
s+t=i
(5)
X
(5)
ai xi , onde ai =
(3)
a(4)
u av =
u+v=i
X
(2) (3)
a(1)
s (at av )
=
s+t+v=i
mais estes são exatamente os coeficientes de p1 (x)[p2 (x)p3 (x)],
t+v=u
isto implica que [p1 (x)p2 (x)]p3 (x) = p1 (x)[p2 (x)p3 (x)].
2. Comutatividade da multiplicação.
p1 (x)p2 (x) =
k1
X
(1)
ai xi .
k2
X
i=0
(2)
a i xi
=
i=0
kX
1 +k2
(
i=0
X
(2) i
a(1)
s at )x
=
kX
2 +k1
i=0
s+t=i
X
(
(2)
i
at a(1)
s )x =
s+t=i
p2 (x)p1 (x).
3. Distributividade
Dados p1 (x) =
k1
X
(1)
a i xi ,
p2 (x) =
i=0
que p1 (x)[p2 (x) + p3 (x)] =
k1
X
(1)
k2
X
i=0
k2
X
ai xi .(
i=0
(3)
ai )xi =
kX
1 +k3
i=0
(
X
(2)
3
i
a(1)
s (at +at ))x =
s+t=i
(2)
ai xi ,
(2)
ai xi +
i=0
21
(3)
ai xi ∈ F [x], temos
i=0
i=0
kX
1 +k3
p1 (x)p2 (x) + p1 (x)p3 (x).
p3 (x) =
k3
X
k3
X
(3)
ai xi ) =
i=0
(
X
s+t=i
(2)
i
a(1)
s at )x +
k1
X
(1)
ai xi .
k3
X
(2)
(ai +
i=0
i=0
kX
1 +k3
X
i=0
s+t=i
(
(3)
i
a(1)
s at )x =
Note que não usamos o fato de F ser um corpo. Usamos apenas o fato de F ser um
anel. A necessidade de F ser corpo vai garantir que F [x] seja um domı́nio de integridade.
Um domı́nio de integridade é um anel que possui a propriedade de que o produto de dois
elementos não nulos resulta em um elemento ainda não nulo.
Afirmação 1.2.1 Seja A um anel e sejam p1 (x), p2 (x) ∈ A[x] tais que p1 (x), p2 (x) 6= 0.
Segue que se A[X] é um domı́nio de integridade, então gr(p1 (x)p2 (x)) = gr(p1 (x)) +
gr(p2 (x))
Demonstração:
Segue diretamente da definição de multiplicação em A[x]. A igual-
dade acima só não valeria se tivéssemos dois polinômios não nulos p1 (x) e p2 (x) tais que
p1 (x)p2 (x) = 0, o que jamais ocorre já que A[x] é um domı́nio de integridade.
Definição 1.2.8 Uma raiz de um polinômio p(x) sobre um anel A é um elemento a ∈ A
tal que p(a) = 0
1.2.3
Funções simétricas
Nós definimos o anel de polinômios A[x] na indeterminada x sobre o anel A. Podemos
definir também A[x, y] = (A[x])[y] como sendo o anel de polinômios nas indeterminadas
x e y sobre A. Assim definimos por recorrência (A[x1 , · · · , xn−1 ])[xn ] = A[x1 , · · · , xn ], o
anel de polinômios nas indeterminadas x1 , · · · , xn sobre A. Os elementos de A[x1 , · · · , xn ]
são da forma
p(x1 , · · · , xn ) =
X
ai1 ···in xi11 · · · xinn
0≤i1 ≤r1
···
0≤in ≤rn
O grau de p(x1 , · · · , xn ) é o máximo das somas i1 + · · · + in para ai1 ···in 6= 0, por
exemplo, o polinômio p(x1 , x2 ) = a00 + a01 x2 + a10 x1 + a11 x1 x2 é um polinômio de duas
indeterminadas e de grau dois.
Um polinômio em A[x1 , x2 ] é dito simétrico se p(x1 , x2 ) = p(x2 , x1 ), por exemplo, os
polinômios s1 (x1 , x2 ) = x1 + x2 e s2 (x1 , x2 ) = x1 x2 são os chamados polinômios simétricos
elementares.
Definimos na seção 1.1 do capı́tulo 1 o grupo das bijeções Sn agindo sobre A =
{1, · · · , n}. Podemos fazer Sn agir sobre A(x1 , · · · , xn ), onde A(x1 , · · · , xn ) é o corpo
22
de frações de A[x1 , · · · , xn ], isto é, A(x1 , · · · , xn ) =
½
¾
p(x1 , · · · , xn )
=
| p(x1 , · · · , xn ), q(x1 , · · · , xn ) ∈ A[x1 , · · · , xn ] e q(x1 , · · · , xn ) 6= 0 .
q(x1 , · · · , xn )
Procederemos da seguinte forma; Dado σ ∈ Sn e r(x1 , · · · , xn ) ∈ A(x1 , · · · , xn ) definimos uma aplicação de A(x1 , · · · , xn ) em si mesmo dada por
r(x1 , · · · , xn ) 7→ r(xσ(1) , · · · , xσ(n) ).
Chamaremos esta aplicação também de σ. Os elementos r(x1 , · · · , xn ) de A(x1 , · · · , xn )
tais que r(x1 , · · · , xn ) = r(xσ(1) , · · · , xσ(n) ) são chamados de funções racionais simétricas.
Não é difı́cil ver que r1 , · · · , rn ∈ A(x1 , · · · , xn ) tais que
r1 (x1 , · · · , xn ) =
n
X
xi = x1 + · · · + xn
1
r2 (x1 , · · · , xn ) =
X
xi xj = x1 x2 + x1 x3 + · · · + xn−1 xn
i<j
r3 (x1 , · · · , xn ) =
...
X
xi xj xk = x1 x2 x3 + x1 x2 x4 + · · · + xn−1 xn−2 xn−3
i<j<k
rn (x1 , · · · , xn ) = x1 · · · xn
são funções racionais simétricas. Estas são as chamadas funções simétricas elementares.
Para simplificar a notação escrevemos a1 = r1 (x1 , · · · , xn ), · · · , a2 = r2 (x1 , · · · , xn ).
Segue que para cada xi temos que xni − a1 xn−1
+ · · · + (−1)n an = 0. Então as funções
i
simétricas elementares nos fornecem relações entre os coeficientes e as raı́zes de um
polinômio.
23
Capı́tulo 2
Solução de equações polinomiais de
grau ≤ 4
Dado um polinômio p(x) sobre um corpo F , definimos equação polinomial como
equação p(x) = 0.
A busca de soluções para equações polinomiais tem grande importância na história da
matemática, uma vez que propulsou o desenvolvimento de novas teorias. Já no final do
século XVI a comunidade matemática já havia solucionado as equações polinomiais de
grau menor que cinco. A partir daı́ os matemáticos se empenharam para resolver a equação
quı́ntica, isto é, a equação polinomial do quinto grau. Contudo em 1824 o matemático
norueguês Niels Abel provou que é impossı́vel resolver equações polinomiais de grau maior
que 4. Isto quer dizer que a raiz da equação não pode ser escrita explicitamente em função
√
de seus coeficientes utilizando as operações +, ., n . Esta é exatamente a noção de solução
por radicais. Infelizmente Abel morreu sem ter seu devido reconhecimento.
O leitor pode se questionar sobre a impossibilidade de se solucionar equações polinomiais de grau maior que cinco, pois é fácil ver que a equação x5 −32 = 0 pode ser resolvida
por radicais. Na verdade o que se prova é a insolubilidade da equação geral. Nesta perspectiva, Everiste Galois se propõe a estudar sobre quais condições um dado polinômio é
resolúvel por radicais. Para isto ele estabelece uma relação entre o que chamamos de grupo
de Galois e o chamado corpo de raı́zes do polinômio. Com isto ele consegue provar que
equação geral de grau maior que cinco não é resolúvel por radicais. Mas estas idéias serão
trabalhadas no próximo capı́tulo. Neste capı́tulo trataremos das equações polinomiais de
grau menor que cinco tomando polinômios definidos sobre o corpo dos reais.
25
2.1
Equação quadrática
Começaremos com a equação quadrática, pois o caso linear é trivial. Seja a equação
a2 x2 + a1 x + a0 = 0, onde a2 6= 0.
Façamos a substituição x = y −
a2 (y −
a1
. Daı́ obtemos;
2a2
a1
a1 2
) + a1 (y −
) + a0 = 0
2a2
2a2
Logo,
a2 y 2 +
a21
a2
− 1 + a0 = 0
4a2 2a2
daı́,
p
y=±
Mas, como x = y −
a21 − 4a2 a0
2a2
a1
, segue que
2a2
a1
x=−
±
2a2
2.2
p
a21 − 4a2 a0
2a2
Equação cúbica
Dada a equação
a3 x3 + a2 x2 + a1 x + a0 = 0, com a3 6= 0
(2.1)
Sempre podemos reescrevê-la como
x3 + A2 x2 + A1 x + A0 = 0
Fazendo x = y −
A2
, obtemos
3
1
2
1
y 3 − (A1 − A22 )y + A32 − A1 A2 + A0 = 0
3
27
3
Então podemos reescrever a equação de uma forma ainda mais simples, como
y 3 + py + q = 0
Agora, seja y = u + v uma raiz da equação. Segue que
(u + v)3 + p(u + v) + q = 0
26
(2.2)
Daı́,
u3 + v 3 + (3uv + p)(u + v) + q = 0
Segue que y = u + v é uma solução da equação 2.2 se o sistema não linear

 u3 + v 3 = −q
(1)
 3uv = −p
tiver solução. Mas toda solução deste sistema também é solução do sistema

 u3 + v 3 = −q
(2)
 u3 v 3 = − p3
27
Segue da definição de funções simétricas elementares que u3 e v 3 são as raı́zes da
equação do segundo grau
t2 + qt −
p3
=0
27
Resolvendo a equação obtemos
−q
t=
±
2
r³ ´
q 2 ³ p ´3
+
2
3
Como y = u + v, segue que uma solução de 2.2 é
s
s
r³ ´
r³ ´
³
´
2
3
p
q
q 2 ³ p ´3
3 −q
3 −q
+
+
+
y=
+
−
2
2
3
2
2
3
(2.3)
Esta é a conhecida fórmula de Cardan.
Agora, seja y1 = u + v a raiz da equação 2.2 obtida pela fórmula 2.3 onde u e v são tais
como no sistema (1) e seja w 6= 1 uma raiz cúbica da unidade temos que y2 = wu + wv
e y3 = wu + wv, também são raı́zes de 2.2. Isto pode ser demonstrado substituindo
diretamente y2 ou y3 em 2.3, ou ainda construindo as funções simétricas elementares em
a2
.
y1 , y2 , y3 . Portanto as raı́zes de 2.1 são xi = yi −
3a3
2.3
Equação quártica
Dada a equação
a4 x4 + a3 x3 + a2 x2 + a1 x + a0 = 0
(2.4)
Como fizemos na seção anterior podemos reescrever 2.4 como
x4 + A3 x3 + A2 x2 + A1 x + A0 = 0
27
(2.5)
e por meio da substituição x = y −
a3
escrevemos 2.5 como
4
y 4 + py 2 + qy + r = 0
(2.6)
Agora seja x = u + v + z uma raiz de 2.6, temos que
x2 − (u2 + v 2 + z 2 ) = 2(uv + uz + vz)
Elevando ambos os membros ao quadrado, temos
x4 − 2(u2 + v 2 + z 2 )x2 + (u2 + v 2 + z 2 )2 = 4(uv + uz + vz)2
Mas 4(uv + uz + vz)2 = 4(u2 v 2 + u2 z 2 + v 2 z 2 ) + 8(u2 vz + uv 2 z + uvz 2 ) = 4(u2 v 2 +
u2 z 2 + v 2 z 2 ) + 8uvz(u + v + z) = 4(u2 v 2 + u2 z 2 + v 2 z 2 ) + 8(uvz)x. Daı́,
x4 − 2(u2 + v 2 + z 2 )x2 − 8(uvz)x + (u2 + v 2 + z 2 )2 − 4(u2 v 2 + u2 z 2 + v 2 z 2 ) = 0


u2 + v 2 + z 2 =



Segue de 2.6 que
uvz = − 8q



 u2 v 2 + v 2 z 2 + z 2 u2 =
− p2
p2
−r
4
4
=
p2 −4r
16
Mas toda solução deste sistema é solução do sistema





u2
+
v2
u2 v 2 z 2 =
q2
64



 u2 v 2
+
z2
=
+ v 2 z 2 + z 2 u2 =
− p2
p2 −4r
16
Novamente usando a idéia de funções simétricas elementares concluı́mos que u2 , v 2 e
z 2 são as raı́zes da equação
p2 − 4r
q2
p
t−
=0
t3 + t2 +
2
16
64
(2.7)
Então o problema resume-se a resolver a equação cúbica 2.7 que já sabemos como
resolver. Porém nem toda solução do segundo sistema é uma solução do primeiro. Isto
quer dizer que as raı́zes de 2.7 podem não fornecer os u,v e w que procuramos. Para
resolver este problema podemos escolher duas raı́zes de 2.7 u2 e v 2 e a partir da relação
√
√
√
uvz = − 8q determinar o valor de z. Agora sendo u = α, v = β e z = γ, as raı́zes de
28
2.6 são
x1 =
x2 =
√
√
α
+
α
−
√
α
√
α
x3 =
−
x4 =
−
√
√
β
+
β
−
√
β
√
β
+
−
√
γ
√
γ
−
+
√
√
γ
γ
A partir das raı́zes de 2.6 é fácil determinar as raı́zes de 2.4.
Pela discussão que fizemos aqui somos impelidos a intuir que se pode dar o mesmo
tratamento para a equação polinomial geral de grau maior que 4. Poderı́amos, por exemplo, escrever uma raiz de um polinômio do quinto grau como x = u + v + z + t e utilizando
uma álgebra básica e um pouco de engenhosidade encontrarmos relações em termos das
funções simétricas elementares que reduziria o problema ao caso de grau quatro. Mas isto
na realidade não acontece.
O nosso objetivo agora é provar a impossibilidade de se resolver estas equações por
método direto. Na próxima seção apresentaremos alguns resultados sobre polinômios
culminando na demonstração de que as equações supracitadas não são resolúveis por
radicais.
29
Capı́tulo 3
Teoria de Galois
Antes de nos lançarmos sobre a Teoria de Galois veremos alguns resultados da Teoria
de Corpos.
3.1
Extensão de corpos
Como já vimos na seção 1.2 do capı́tulo 1 em Álgebra abstrata definimos corpo como
sendo um anel comutativo com unidade onde todo elemento não nulo possui um inverso
multiplicativo. Se um corpo K contém o corpo F , então dizemos que K é uma extensão
de F . Chamamos de grau de K sobre F e denotamos por [K : F ] a dimensão de K quando
visto como espaço vetorial sobre F . Desta forma, a extensão K de F será considerada
uma extensão finita se e somente se K for um espaço vetorial de dimensão finita sobre F .
Agora já temos dados suficientes para enunciar nosso primeiro resultado, cuja demonstração segue as idéias presentes em [6].
Teorema 3.1.1 Se K é uma extensão finita de F e F é uma extensão finita de P , então
K é uma extensão finita de P e [K : P ] = [K : F ].[F : P ].
Demonstração:
Com efeito, Sendo K uma extensão finita de F e F uma extensão
finita de P , podemos considerar [K : F ] = m e [F : P ] = n, com m e n inteiros positivos.
Desta forma tomemos {u1 , ..., um } uma base para K e {v1 , ..., vn } uma base para F . Segue
que para todo u ∈ K existem α1 , ..., αm ∈ F tais que u = α1 u1 + ... + αm um . Por outro
n
X
lado para cada αi ∈ F existem βi1 , ..., βin ∈ P tais que αi = βi1 v1 + ... + βin vn =
βij vj .
j=1
31
Logo podemos inferir que u = u1
u=
X
n
X
β1j vj + ... + um
j=1
n
X
βmj vj . Disto podemos obter
j=1
βij ui vj .
1≤i≤m
1≤j≤n
A conclusão é que todo elemento u de K pode ser escrito como combinação linear dos
mn elementos ui vj de K com coeficientes em P . Então basta provar que que o conjunto
{ui vj } 1≤i≤m é linearmente independente.
1≤j≤n
n
n
X
X
X
Ora, se
βij ui vj = 0, então u1
β1j vj + ... + um
βmj vj = 0. Mas {u1 , ..., um }
j=1
1≤i≤m
1≤j≤n
é base, logo
n
X
j=1
βij vj = 0 para todo i ∈ {1, ..., m}. Mas {v1 , ..., vn } é base, logo βij = 0
j=1
para todo i e todo j.
Definição 3.1.1 Seja F um corpo, K uma extensão de F e a ∈ K, definimos F (a)
como a menor extensão de F que contém a. O corpo F (a) também pode ser visto como o
conjunto de todos os elementos que podem ser expressos como um quociente de polinômios
em a.
Definição 3.1.2 Uma raiz de um polinômio p(x) ∈ F [x] é um a ∈ K ⊃ F , tal que
p(a) = 0.
Definição 3.1.3 Seja F um corpo e K uma extensão de F . Um elemento a ∈ K é dito
algébrico sobre F quando é raiz de algum polinômio em F [x]. Um elemento a ∈ K é dito
algébrico de grau n se o polinômio de menor grau que ele é raiz tem grau n. Diremos que
tal polinômio(que é único) é minimal para a.
Definição 3.1.4 Uma extensão onde todo elemento é algébrico é chamada de extensão
algébrica.
Definição 3.1.5 Se não existir um polinômio p(x) ∈ F [x] tal que p(a) = 0, então o
elemento a ∈ K é dito transcendente. Uma extensão onde pelo menos um elemento é
transcendente é chamada de extensão transcendente.
Definição 3.1.6
Teorema 3.1.2 Seja F um corpo, K uma extensão de F e a ∈ K, temos que a é algébrico
de grau n sobre F se, e somente se, F (a) é uma extensão finita de F e [F (a) : F ] = n
32
Demonstração:
Se a é algébrico de grau n então existe um polinômio p(x) ∈ F [x]
de grau n e minimal para a. O polinômio p(x) é irredutı́vel em F [x]. Caso contrário
existiriam polinômios f (x), g(x) ∈ F [x] de graus menores que n tais que p(x) = f (x)g(x).
Segue que f (a)g(a) = p(a) = 0. Logo f (a) = 0 ou g(a) = 0. Mas isto contraria a hipótese
de que p(x) é minimal para a. Portanto temos um absurdo.
Além disso, todo polinômio f (x) que tem a como raiz é múltiplo de p(x).
De fato, pelo algoritmo da divisão temos que existem q, r ∈ F [x] tais que f (x) =
p(x)q(x) + r(x) onde 0 ≤ gr(r(x)) < gr(p(x)). Segue que r(a) = −p(a)q(a) + f (a) =
0.q(a) + 0 = 0. Como p(x) é minimal para a temos que r(x) = 0. Logo f (x) = p(x)q(x).
Segue das considerações acima que (p(x)) o ideal gerado por p(x) consiste de todos os
polinômios em F [X] que tem a como raiz.
Agora afirmamos que a aplicação φ : F [x] → F (a) dada por f (x) 7→ f (a) é um
homomorfismo sobrejetor e tem (p(x)) como núcleo.
max{k1 .k2 }
k1
k2
X
X
X
i
i
De fato, φ(
αi x +
βi x ) = φ(
(αi + βi )xi ) =
i=0
k1
X
k2
X
αi ai +
i=0
kX
1 +k2
=
i=0
fismo.
i=0
(
X
s+t=i
i=0
k1
X
βi ai = φ(
i=0
k2
X
αi xi )+φ(
i=0
k1
X
αs βt )ai =
i=0
k1
X
βi xi ) e φ(
i=0
αi ai .
k2
X
αi xi .
i=0
k2
X
max{k1 .k2 }
X
i=0
kX
1 +k2
βi xi ) = φ(
i=0
(αi + βi )ai =
i=0
(
X
αs βt )xi )
s+t=i
k1
k2
X
X
i
i
βi a = φ(
αi x ).φ(
βi xi ). Logo φ é homomor-
i=0
i=0
i=0
Agora tomemos o polinômio i(x) = x. A sua imagem pela φ é φ(i(x)) = i(a) = a.
Agora tomemos β ∈ F e tomemos o polinômio j(x) = β. A imagem de j(x) pela φ é
φ(j(x)) = j(a) = β. Segue que a imagem de φ é um subcorpo de F (a) que contém F e a.
Logo a imagem de φ, Imφ = F (a). Portanto φ é um homomorfismo sobrejetor.
Além disso, note que Kerφ = {f (x) ∈ F [x] | φ(f (x)) = 0} = {f (x) ∈ F [x] | f (a) =
0} = (p(x)).
Segue do teorema do homomorfismo que F [x]/(p(x)) é isomorfo a F (a). Pelo teorema
1.2.3, F [x]/(p(x)) é corpo.
O conjunto {1 + (p(x)), x + (p(x)), x2 + (p(x)), · · · , xn−1 + (p(x))} é uma base para
F [X]/(p(x)) quando visto como espaço vetorial sobre F .
De fato, mostremos primeiramente que o conjunto é linearmente independente. Então
dados α0 , ..., αn−1 ∈ F tais que α0 (1+(p(x)))+α1 (x+(p(x)))+· · ·+αn−1 (xn−1 +(p(x))) =
(p(x)). Segue que α0 + α1 x + · · · + αn−1 xn−1 + (p(x)) = (p(x)). Logo f (x) = α0 + α1 x +
33
· · · + αn−1 xn−1 ∈ (p(x)). Daı́ f (a) = 0, mas isto só acontece se α0 = α1 = · · · = αn−1 = 0,
já que p(x) é minimal para a e tem grau n.
Agora provemos que o conjunto é gerador. Com efeito, os elementos de F [x]/(p(x))
são da forma f (x) + (p(x)). Suponhamos que gr(f (x)) = k < n, então f (x) + (p(x)) =
α0 + α1 x + · · · + αk xk + 0xk+1 + · · · + 0xn−1 + (p(x)) = α0 (1 + (p(x))) + α1 (x + (p(x))) +
· · · + αk (xk + (p(x))) + 0(xk+1 + (p(x))) + · · · + 0(xn−1 + (p(x))).
Por outro lado, suponhamos que gr(f (x)) ≥ n. Pelo algoritmo da divisão segue que
f (x) = p(x)q(x) + r(x) onde 0 ≤ gr(r(x)) < gr(p(x)) e daı́ f (x) + (p(x)) = r(x) + (p(x)).
Logo o problema se reduz ao caso anterior. Portanto F [x]/(p(x)) é um espaço vetorial de
dimensão n sobre F , ou ainda uma extensão finita de grau n. Como F (a) é isomorfo a
F [x]/(p(x)) segue que F (a) é uma extensão finita de F e [F (a) : F ] = n.
Agora para provar a volta do teorema, suponhamos que [F (a) : F ] = n. Então F (a)
pode ser visto como um espaço vetorial sobre F de dimensão n. Sabemos da álgebra linear
que qualquer conjunto com mais de n vetores é linearmente dependente. Logo o conjunto
{1, a, a2 , a3 , · · · , an } é L.D., isto é, qualquer um de seus elementos pode ser escrito como
combinação linear dos demais. Então consideremos an = α0 1 + α1 a + · · · + αn−1 an−1 onde
αi ∈ F . Logo o polinômio f (x) = α0 + α1 x + · · · + αn−1 xn−1 − xn tem a como raiz. Logo a
é algébrico de grau n, pois se existisse um polinômio de grau diferente de n e que tivesse
a como raiz então F (a) seria uma extensão de F de grau diferente de n.
Teorema 3.1.3 Se a ∈ K é uma raiz de p(x) ∈ F [x], então existe q(x) ∈ K[x] tal que
p(x) = (x − a)q(x).
Demonstração:
Ora pelo algoritmo da divisão temos que p(x) = (x − a)q(x) + r(x)
e 0 ≤ gr(r(x)) < gr(x − a). Como gr(x − a) = 1, segue que r(x) é uma constante
ou o polinômio nulo. Mas r(a) = p(a) − (a − a)q(a) = 0. Portanto r(x) = 0, e daı́
p(x) = (x − a)q(x).
Definição 3.1.7 Dizemos que uma raiz a ∈ K do polinômio p(x) ∈ F [x], onde F é um
subcorpo de K, é de multiplicidade m se (x − a)m divide p(x) e (x − a)m+1 não divide.
Teorema 3.1.4 Se a1 , · · · , ak ∈ K são raı́zes de p(x) ∈ F [x] de multiplicidades n1 , · · · , nk
respectivamente, então existe q(x) ∈ K[x] tal que p(x) = (x − a1 )n1 . · · · .(x − ak )nk q(x).
34
Demonstração:
Ora, seja a1 uma raiz de p(x) de multiplicidade n1 . Segue que existe
q1 (x) ∈ K[x] tal que p(x) = (x − a1 )n1 q1 (x). Mas (a2 − a1 )n1 q1 (a2 ) = p(a2 ) = 0. Como
a2 6= a1 segue que q1 (a2 ) = 0, isto é, a2 é raiz de q1 (x). Logo existe q2 (x) ∈ K[x] tal que
q1 (x) = (x − a2 )n2 q2 (x), e daı́ p(x) = (x − a1 )n1 (x − a2 )n2 q2 (x). Repetindo sucessivamente
este processo para a3 , · · · , ak concluı́mos que p(x) = (x − a1 )n1 . · · · .(x − ak )nk qk (x).
Teorema 3.1.5 Seja f (x) um polinômio de grau n sobre o corpo F . O polinômio f (x)
pode ter no máximo n raı́zes em qualquer extensão de F .
Demonstração:
Vale ressaltar que uma raiz de multiplicidade ni está sendo contada
aqui ni vezes. Suponhamos que E seja uma extensão de F que contenha todas as raı́zes
de p(x). Sejam a1 , · · · , ak todas as raı́zes de p(x) de multiplicidades n1 , · · · , nk respectivamente. Pelo teorema 3.1.4 temos que p(x) = (x − a1 )n1 . · · · .(x − ak )nk q(x), onde
q(x) ∈ K[x]. Segue da afirmação 1.2.1 que o grau do polinômio (x − a1 )n1 . · · · .(x − ak )nk
é menor ou igual a n = gr(p(x)), o que demonstra o teorema.
Definição 3.1.8 Seja F um corpo e f (x) ∈ F [x] de grau n. Uma extensão K de F é um
corpo de raı́zes para f (x) se f (x) pode ser fatorado como um produto de fatores lineares
em K e não pode ser fatorado como um produto de fatores lineares em nenhuma extensão
de F de grau menor.
Teorema 3.1.6 Para todo polinômio f (x) de grau n sobre um corpo F existe uma extensão finita de F de grau no máximo n na qual f (x) tem uma raiz.
Demonstração:
Seja p(x) um fator irredutı́vel de f (x). Segue que as raı́zes de p(x)
são todas raı́zes de f (x). Então basta provar que existe uma extensão de F na qual p(x)
tem uma raiz.
O ideal (p(x)) de F [x] é maximal, já que p(x) é irredutı́vel. Logo pelo teorema 1.2.10
F [x]/(p(x)) é corpo. Segue do teorema 1.2.7 que a aplicação φ : F [x] → F [x]/(p(x))
dada por g(x) 7→ g(x) + (p(x)) é um homomorfismo sobrejetor. Logo a restrição φ\F :
F → F [x]/(p(x)) também é um homomorfismo sobrejetor. Além disso, dados α, β ∈ F ,
se α + (p(x)) = β + (p(x)), então α − β ∈ (p(x)). Segue que α − β = 0. Logo α = β e
35
portanto φ\F é injetiva. Concluı́mos que a imagem de F pela φ\F que denotaremos por
Im(F ) é isomorfa a F .
O que estamos a provar é que existe uma extensão de Im(F ) na qual p(x) = φ(p(x))
tem uma raiz. Notemos que φ(p(x)) = (p(x)), isto é, a imagem de p(x) pela φ é o zero
de F [x]/(p(x)). Por outro lado tomemos q(x) = β0 + β1 x + · · · + βk xk e denotemos
βi + (p(x)) por βi . Segue que φ(β0 + β1 x + · · · + βk xk ) = β0 + β1 x + · · · + βk xk . Logo
x = x + (p(x)) ∈ F [x]/(p(x)) é raiz do polinômio q(x) = β0 + β1 x + · · · + βk xk sobre
Im(F ).
Além disso, F [x]/(p(x)) é uma extensão de F de grau igual a gr(p(x)) ≤ n, uma
vez que, como já verificamos no decorrer da demonstração do teorema 3.1.2, o conjunto
{1 + (p(x)), x + (p(x)), · · · , xgr(p(x))−1 + (p(x))} é base para o espaço vetorial F [x]/(p(x)).
Teorema 3.1.7 Para todo polinômio f (x) de grau n sobre um corpo F existe uma extensão finita de F de grau no máximo n! na qual f (x) tem n raı́zes.
Demonstração:
Usaremos indução sobre n = gr(f (x)). Para n = 1, f (x) é da forma
αx + β, onde α, β ∈ F . Segue que − αβ ∈ F é raiz de f (x) e [F : F ] = 1.
Suponhamos que o resultado seja válido para todo inteiro positivo e menor que n.
Pelo teorema 3.1.6 existe uma extensão E0 de F na qual f (x) tem uma raiz. Seja a ∈ E0
uma raiz de f (x). Segue f (x) = (x − a)q(x), onde q(x) ∈ E0 e tem grau n − 1. Pela
hipótese de indução existe uma extensão E de E0 na qual q(x) tem n − 1 raı́zes. Como
toda raiz de q(x) é raiz de f (x), segue que f (x) tem n raı́zes em E. Além disso = [E :
F ] = [E : E0 ][E0 : F ] ≤ (n − 1)!n = n!.
Teorema 3.1.8 Seja σ um isomorfismo entre os corpos F e F 0 , então F [x] e F 0 [x] são
k
k
X
X
i
0
σ(ai )xi .
ai x 7−→
isomorfos por meio do isomorfismo σ1 : F [x] −→ F [x] dado por
i=0
i=0
Demonstração:
Com efeito, temos que
k
X
i
ai x =
k
X
i=0
σ(bi ) ⇔
k
X
i=0
σ(ai )xi =
k
X
i=0
bi xi ⇔ ai = bi ⇔ σ(ai ) =
i=0
k
k
X
X
i
i
bi xi ). Acabamos de provar que
ai x ) = σ1 (
σ(bi )x ⇔ σ1 (
i=0
i=0
σ1 está bem definida e é injetiva. Agora, da sobrejetiva de σ segue que ∀bi ∈ F 0 existe
k
k
X
X
i
0
ai ∈ F tal que σ(ai ) = bi . Logo para todo
bi x ∈ F [x] tomemos
ai xi ∈ F [x] e daı́
i=0
36
i=0
temos que σ1 (
k
X
i
ai x ) =
i=0
k
X
i
σ(ai )x =
i=0
k
X
bi xi . Logo σ1 é sobrejetiva. Para finalizar a
i=0
demonstração mostremos que σ1 preserva as operações.
Para simplificar a notação vamos omitir os ı́ndices dos somátorios que definem um
polinômio.
Então temos que,
X
X
X
X
X
σ1 (
ai xi +
bi xi ) = σ1 ( (ai + bi )xi ) =
σ(ai + bi )xi =
[σ(ai ) + σ(bi )]xi =
X
X
X
X
σ(ai )xi +
σ(bi )xi = σ1 (
ai xi ) + σ1 (
bi xi ).
Além disso,
X X
X
X
X X
X X
σ(as )σ(bt )xi
as bt )xi =
(
σ1 (
ai xi .
bi xi ) = σ1 ( (
as bt )xi ) =
σ(
X
X
= σ1 (
ai xi ).σ1 (
bi xi ).
s+t=i
s+t=i
s+t=i
Teorema 3.1.9 Seja σ um isomorfismo entre os corpos F e F 0 . Seja f (x) um polinômio
irredutı́vel sobre F e f 0 (x) o polinômio correspondente em F 0 , isto é, a imagem de f (x)
pela σ1 . Sejam F (α) e F 0 (β) extensões de F e F 0 respectivamente, tais que f (α) = 0 e
f 0 (β) = 0, então σ induz um isomorfismo entre F (α) e F (β)
Demonstração:
Primeiramente notemos que os corpos F [x]/(f (x)) e F 0 [x]/(f 0 (x))
também são isomorfos por meio do isomorfismo σ2 : F [x]/(f (x)) −→ F 0 [x]/(f 0 (x)) dado
por p(x) + (f (x)) 7−→ σ1 (p(x)) + (f 0 (x)).
Com efeito, notemos que p1 (x) + (f (x)) = p2 (x) + (f (x)) ⇔ p1 (x) − p2 (x) ∈ (f (x)) ⇔
∃ q(x) ∈ F [x] tal que p1 (x) − p2 (x) = f (x)q(x) ⇔ σ1 (p1 (x) − p2 (x)) = σ1 (f (x)q(x)) ⇔
σ1 (p1 (x)) − σ1 (p2 (x)) = f 0 (x)σ1 (q(x)) ⇔ σ1 (p1 (x)) − σ1 (p2 (x)) ∈ (f 0 (x)) ⇔ σ1 (p1 (x)) +
(f 0 (x)) = σ1 (p2 (x)) + (f 0 (x)) ⇔ σ2 (p1 (x) + (f (x))) = σ2 (p2 (x) + (f (x))). Portanto
a aplicação σ2 está bem definida e é injetiva. Agora, segue da sobrejetividade de σ1
que ∀q(x) ∈ F 0 [x] existe p(x) ∈ F [x] tal que σ1 (p(x)) = q(x). Então dado q(x) +
(f 0 (x)) ∈ F 0 [x]/(f 0 (x)) tomemos p(x) + (f (x)) ∈ F [x]/(f (x)) e daı́ σ2 (p(x) + (f (x))) =
σ1 (p(x)) + (f 0 (x)) = q(x) + (f 0 (x)). Logo σ2 é sobrejetiva. Para completar esta etapa da
demonstração mostremos que σ2 preserva as operações.
Para simplificar a notação vamos considerar p(x) + (f (x)) = p(x) e q(x) + (f 0 (x)) =
0
q(x) . Então temos que,
0
0
0
σ2 (p1 (x) + p2 (x)) = σ2 (p1 (x) + p2 (x)) = σ1 (p1 (x) + p2 (x)) = σ1 (p1 (x)) + σ1 (p2 (x)) =
0
σ2 (p1 (x)) + σ2 (p2 (x)). Além disso, σ2 (p1 (x).p2 (x)) = σ2 (p1 (x).p2 (x)) = σ1 (p1 (x).p2 (x)) =
37
0
0
σ1 (p1 (x)) .σ1 (p2 (x)) = σ2 (p1 (x)).σ2 (p2 (x)).
Agora, notemos que f (x) é minimal para α. Caso contrário existiria um polinômio
p(x) de grau menor que gr(f (x)) minimal para α. Como foi provado no decorrer da
demonstração do teorema 3.1.2, todo polinômio que tem α como raiz é um múltiplo de
p(x). Segue que f (x) seria um múltiplo de p(x), o que seria um absurdo, já que por
hipótese f (x) é irredutı́vel. Analogamente f 0 (x) é minimal para β.
Nestas circunstâncias segue que existe um isomorfismo φ1 de F [x]/(f (x)) em F (α)
e um isomorfismo φ2 de F 0 [x]/(f 0 (x)) em F (β). Concluı́mos que φ−1
1 ◦ σ2 ◦ φ2 é um
isomorfismo de F (α) em F (β).
Teorema 3.1.10 Seja σ um isomorfismo entre os corpos F e F 0 . Seja f (x) um polinômio
sobre F e f 0 (x) o polinômio correspondente em F 0 . Seja E um corpo de raı́zes para F e
E 0 um corpo de raı́zes para F 0 , então σ induz um isomorfismo de E em E 0 .
Demonstração:
Usaremos indução sobre [E : F ] = n. Se n = 1, então E = F e
todas as raı́zes de f (x) estão em F . Segue do isomorfismo entre F [x] e F 0 [x], definido na
demonstração do teorema 3.1.8, que F 0 contém todas as raı́zes de f 0 (x), logo E 0 = F 0 .
Portanto, os corpos E e E 0 são isomorfos pelo isomorfismo σ.
Suponhamos que o resultado seja válido para todo inteiro positivo menor que n. Seja
p(x) um fator irredutı́vel de f (x) de grau gr(p(x)) = r > 1. Se u é uma raiz de f (x),
então u também é raiz de p(x). Segue do teorema 3.1.2 que F (u) é uma extensão de F
de grau r. Logo,
[E : F (v)] =
n
[E : F ]
= <n
[F (v) : F ]
r
Afirmamos que E é um corpo de raı́zes para f (x) quando visto como um polinômio
sobre F (u), pois se existisse um subcorpo E0 de E contendo F (u) e todas as raı́zes de
f (x), então E0 seria uma extensão de F menor que E contendo todas as raı́zes de f (x),
o que contrária a hipótese de que E é um corpo de raı́zes para f (x) ∈ F [x].
Analogamente E 0 é um corpo de raı́zes para f 0 (x) quando visto como um polinômio
sobre F (v), onde v é uma raiz de f 0 (x) e [E : F (v)] < n.
Pela hipótese de indução segue que existe um isomorfismo de E em E 0 .
Corolário 3.1.1 Quaisquer dois corpos de raı́zes de um polinômio f (x) sobre o corpo F
são isomorfos.
38
Demonstração:
3.2
Segue diretamente do teorema 3.1.10.
O Teorema Fundamental da Teoria de Galois
Nesta seção apresentaremos mais alguns resultados sobre a teoria de corpos. Estes
resultados nos darão subsı́dios para demonstrar o clássico Teorema Fundamental da Teoria
de Galois. Este teorema, por sua vez, terá grande importância na demonstração de que
o polinômio geral de grau n ≥ 5 não é resolúvel por radicais, que é o objetivo principal
deste capı́tulo.
Teorema 3.2.1 Sejam K um corpo, a1 , ..., an ∈ K e σ1 , ..., σn ∈ AutK tais que σi 6= σj ,
temos que a1 σ1 (u)+· · ·+an σn (u) = 0 para todo u ∈ K se, e somente se a1 = · · · = an = 0.
Demonstração:
Usaremos indução sobre n. Se n = 1, então a1 σ(u) = 0 para todo
u ∈ K. Podemos escolher u0 ∈ K tal que σ(u0 ) 6= 0. Logo a1 = 0.
Suponhamos que a afirmação seja válida para todo natural não nulo menor que n e
suponhamos que
a1 σ1 (u) + · · · + an σn (u) = 0
(3.1)
Como a equação 3.1 vale para todo u ∈ K, vale também para bu onde 0 6= b ∈ K.
Logo,
a1 σ1 (bu) + · · · + an σn (bu) = 0
(3.2)
Como cada σi é um isomorfismo, segue que
a1 σ1 (b)σ1 (u) + · · · + an σn (b)σn (u) = 0
(3.3)
Multiplicando 3.1 por σ1 (b) e subtraindo por 3.3 concluı́mos que
a2 (σ1 (b) − σ2 (b))σ2 (u) + · · · + an (σ1 (b) − σn (b))σn (u) = 0
(3.4)
Como os isomorfismos são dois a dois distintos, podemos escolher d de forma que
σ1 (d) 6= σi (d) pelo menos para um número 1 ≤ r < n de ı́ndices. Suponhamos σ1 (d) 6=
σi (d) para todo i 6= 1. Como σ1 (d) − σi (d) ∈ K segue da equação 3.4 e da hipótese de
39
indução que a2 = · · · = an = 0. Substituindo tudo isso em 3.1 concluı́mos que a1 = 0 e o
teorema está demonstrado.
Agora, suponhamos que σ1 (d) 6= σi (d) apenas para um número 1 ≤ r < n de ı́ndices.
Sem perda de generalidade suponhamos que este fato seja verdade para os r primeiros
ı́ndices com exceção de i = 1. Segue que
a2 (σ1 (d) − σ2 (d))σ2 (u) + · · · + ar (σ1 (d) − σr (d))σr (u) = 0
(3.5)
Segue da hipótese de indução que a1 = · · · = ar = 0. Substituindo tudo isso em 3.1
obtemos
ar+1 σr+1 (u) + · · · + an σn (u) = 0
(3.6)
Segue novamente da hipótese de indução que ar+1 = · · · = an = 0.
A recı́proca é imediata.
Definição 3.2.1 Seja G um subgrupo de AutK, onde K é corpo, chamamos de corpo
fixo ao conjunto de todos os elementos de K que permanecem invariantes para todo automorfismo de G, isto é, o conjunto KG = {a ∈ K|σ(a) = a ∀σ ∈ AutG}
Teorema 3.2.2 KG é um subcorpo de K.
Demonstração: Dados a, b ∈ KG , temos que provar que a−b e ab−1 ainda são elementos
de KG . Com efeito, para todo automorfismo σ ∈ AutK temos que σ(a−b) = σ(a)−σ(b) =
a − b e σ(a.b−1 ) = σ(a)σ(b)−1 = ab−1 , isto é, todo automorfismo σ ∈ AutK deixa fixos os
elementos a − b e ab−1 . Logo KG é um subcorpo de K.
Definição 3.2.2 Seja K uma extensão do corpo F , chamamos de grupo dos automorfismos de K relativos a F ao conjunto de todos os automorfismos de K que deixam fixo todo
elemento de F , isto é, o conjunto G(K, F ) = {σ ∈ AutK|σ(u) = u ∀u ∈ F }
Teorema 3.2.3 G(K, F ) é um subgrupo de AutK.
Demonstração:
Dados σ1 , σ2 ∈ G(K, F ), temos que σ1 (u) = u e σ2 (u) = u, ∀u ∈ F .
Logo (σ1 ◦ σ2 )(u) = σ1 (σ2 (u)) = σ1 (u) = u, ∀u ∈ F . Portanto σ1 ◦ σ2 ∈ G(K, F ),
e se σ1 (u) = u, ∀ u, então σ1−1 (u) = u, ∀u ∈ F . Logo σ1−1 ∈ G(K, F ). Portanto
G(K, F ) < AutK.
40
Teorema 3.2.4 Se K é uma extensão finita de um corpo F , então G(K, F ) é um grupo
finito e |G(K, F )| ≤ [K : F ].
Demonstração:
Seja [K : F ] = n e seja {u1 , · · · , un } ⊂ K uma base para K.
Segue que para todo t ∈ K existem α1 , · · · , αn ∈ F tais que t = α1 u1 + · · · + αn un .
Como todo automorfismo σi ∈ G(K, F ) deixa fixo todo elemento de F , segue que σi (t) =
α1 σi (u1 ) + · · · + αn σi (un ).
Sabemos da álgebra linear que um sistema homogêneo de r incógnitas e n equações
tal que r > n possui uma solução não trivial. Logo o sistema
σ1 (u1 )x1 + · · · + σr (u1 )xr = 0
.
.
.
σ1 (un )x1 + · · · + σr (un )xr = 0
tem uma solução não trivial. Seja a1 , · · · , ar uma solução não trivial do sistema. Então,
σ1 (u1 )a1 + · · · + σr (u1 )ar = 0
.
.
.
σ1 (un )a1 + · · · + σr (un )ar = 0
multiplicando a primeira equação por α1 , a segunda por α2 e assim sucessivamente, e
somando tudo no final obtemos
a1 (α1 σ1 (u1 ) + · · · + αn σ1 (un )) + · · · + ar (α1 σr (u1 ) + · · · + αn σr (un )) = 0
Mas σi (t) = α1 σi (u1 ) + · · · + αn σi (un ), daı́ a1 σ1 (t) + · · · + ar σr (t) = 0, o que é um
absurdo pelo teorema 3.2.1. O absurdo veio do fato de termos considerado a existência de
r > n = [K : F ] automorfismos em G(K, F ). Segue que G(K, F ) é finito e |G(K, F )| ≤
[K : F ].
Teorema 3.2.5 Seja K uma extensão do corpo F , F (x1 , · · · , xn ) o corpo das funções
racionais em x1 , · · · , xn e S o corpo das funções simétricas elementares, temos que:
41
1. F (x1 , · · · , xn ) é o corpo de raı́zes do polinômio p(t) = tn − a1 tn−1 + · · · + (−1)n an
sobre F (a1 , · · · , an )
2. [F (x1 , · · · , xn ) : S] = n!
3. Se a1 , · · · , an são as funções simétricas elementares em x1 , · · · , xn , então S =
F (a1 , · · · , an )
4. G(F (x1 , · · · , xn ), S) = Sn
Demonstração:
1. Segue das considerações feitas na seção 1.2 do capı́tulo 1, que o polinômio p(t) =
tn − a1 tn−1 + · · · + (−1)n an tem todas as suas raı́zes em F (x1 , · · · , xn ). Além disso
nenhum subcorpo de F (x1 , · · · , xn ) que contém F (a1 , · · · , an ) contém todas as raı́zes
de p(t), pois F (x1 , · · · , xn ) pode ser visto como a menor extensão de F que contém
x1 , · · · , xn . Logo F (x1 , ..., xn ) é o corpo de raı́zes de p(t).
2. De 1 temos que F (x1 , · · · , xn ) é o corpo de raı́zes de p(t) = tn −a1 tn−1 +· · ·+(−1)n an
sobre F (a1 , · · · , an ). Logo, pelo teorema 3.1.7, [F (x1 , · · · , xn ) : F (a1 , · · · , an )] ≤ n!.
Por outro lado, segue do teorema 3.2.4 que |G(F (x1 , · · · , xn ), F (a1 · · · , an ))| ≤
[F (x1 , · · · , xn ) : F (a1 · · · , an )]. Além disso, todo automorfismo σ de F (x1 , · · · , xn )
deixa fixos os elementos de F (a1 , · · · , an ). Logo Sn ⊂ G(F (x1 , · · · , xn ), F (a1 · · · , an )).
Daı́ [F (x1 , · · · , xn ) : F (a1 · · · , an )] ≥| G(F (x1 , · · · , xn ), F (a1 · · · , an )) |≥ n!. Concluı́mos que [F (x1 , · · · , xn ) : F (a1 · · · , an )] = n!.
Além disso [F (x1 , · · · , xn ) : F (a1 , · · · , an )] = [F (x1 , · · · , xn ) : S][S : F (a1 , · · · , an )].
Logo [F (x1 , · · · , xn ) : S][S : F (a1 , · · · , an )] = n!. Mas, todo automorfismo σ ∈ Sn
de F (x1 , · · · , xn ) deixa fixos os elementos de S. Logo Sn ⊂ G(F (x1 , · · · , xn ), S) e
portanto | G(F (x1 , · · · , xn ), S) |≥ n!. Concluı́mos que [F (x1 , · · · , xn ) : S] = n!.
3. Provamos no decorrer da demonstração do item 2 que [F (x1 , · · · , xn ) : S] = n! e
[F (x1 , · · · , xn ) : S][S : F (a1 · · · , an )] = n!. Segue daı́ que [S : F (a1 , · · · , an )] = 1, e
portanto S = F (a1 , · · · , an ).
4. Provamos no decorrer da demonstração do item 2 que | G(F (x1 , · · · , xn ), S) |≥ n!.
Pelo teorema 3.2.4 e novamente pelo item 2 segue que | G(F (x1 , · · · , xn ), S) |≤
42
[F (x1 , · · · , xn ) : S] = n!. Logo | G(F (x1 , · · · , xn ), S) |= n!, isto é, Sn é um subgrupo
de G(F (x1 , · · · , xn ), S) que tem a mesma ordem. Logo Sn = G(F (x1 , · · · , xn ), S).
Definição 3.2.3 Uma extensão K do corpo F é dita extensão simples se existir um a ∈ K
tal que K = F (a).
Definição 3.2.4 Dizemos que um anel A é de caracterı́stica n se n for o menor inteiro
positivo tal que na = 0, onde na = |a + ·{z
· · + a}. Se não existir um inteiro positivo n tal
nvezes
que na = 0, então dizemos que A é um anel de caracterı́stica 0.
Teorema 3.2.6 Toda extensão de um corpo de caracterı́stica zero é uma extensão simples.
A demonstração deste fato pode ser vista em [1]. Mas uma observação que deve ser
feita é que em um corpo de caracterı́stica zero todo elemento da extensão K é raiz de um
polinômio separável. Um polinômio é dito separável quando não tem raı́zes múltiplas.
Definição 3.2.5 Seja K uma extensão do corpo F , dizemos que K é uma extensão normal de F sempre que K é uma extensão finita de F tal que F é o corpo fixo de G(K, F ).
Teorema 3.2.7 Seja K uma extensão normal de F , H um subgrupo de G(K, F ) e KH
o corpo fixo de H, temos que
1. H = G(K, KH )
2. [K : KH ] = |H|
em particular |G(K, F )| = [K : F ]
Demonstração:
De fato, se σ ∈ H, então para todo u ∈ KH , σ(u) = u, pois por
definição os elementos de KH são invariantes para todo automorfismo σ ∈ H. Segue que
σ ∈ G(K, KH ) e daı́ H ⊂ G(K, KH ). Por outro lado, se σ ∈ G(K, KH ), então σ deixa
fixo todo elemento de KH . Mas os automorfismos de σ ∈ AutK que deixam fixos os
elemento de KH são exatamente os automorfismos de H. Segue que σ ∈ H, e portanto
G(K, F ) ⊂ H. Logo H = G(K, KH ).
43
Para demostrar o item 2, observe que pelo teorema 3.2.2, K é uma extensão finita de
KH . Pelo teorema 3.2.4 |G(K, KH )| ≤ [K : KH ] e pelo item 1 | H |≤ [K : KH ].
Por outro lado podemos provar que | H |≥ [K : KH ]. Com efeito, pelo teorema 3.2.6,
como K é uma extensão de KH , existe a ∈ K tal que K = KH (a). Sejam σ1 , · · · , σh
todos os automorfismos de H com σ1 = I. Segue que a satisfaz o polinômio p(x) =
(x − σ1 (a)) · · · (x − σh (a)), pois σ1 (a) = a. Expandindo o polinômio p(x) obtemos p(x) =
xh − α1 xh−1 + · · · + (−1)h αh , onde α1 , · · · , αh são as funções simétricas elementares em
σ1 (a), · · · , σh (a), isto é,
α1 = σ1 (a) + · · · + σh (a)
α2 = σ1 (a)σ2 (a) + · · · + σh−1 (a)σh (a)
.
.
.
αh = σ1 (a) · · · σh (a)
Agora, observe que para cada σi ∈ H tem-se que σi (α1 ) = σi (σ1 (a))+· · ·+σi (σh (a)) =
σj1 (a) + · · · + σjh (a). Mas σ1 , · · · , σh são todos os automorfismos de H sem repetições.
Segue que σj1 , · · · , σjh são novamente todos os automorfismos de H sem repetições. Logo
a única ação dos σi sobre α1 é mudar a ordem dos σi (a). Daı́ σi (α1 ) = α1 para todo i.
Analogamente concluı́mos que σi (α2 ) = α2 , · · · , σi (αh ) = αh , para todo i.
Segue que α1 , · · · , αh ∈ KH , e portanto p(x) ∈ KH [x]. Como K = KH (a) é uma
extensão finita de KH de grau n = [K : KH ] segue do teorema 3.1.2 que a satisfaz um
polinômio de grau n sobre KH e não satisfaz outro polinômio de grau menor. Como a
satisfaz p(x) segue que gr(p(x)) = h ≥ [K : KH ], isto é, | H |≥ [K : KH ].
Das duas desigualdades | H |≤ [K : KH ] e | H |≥ [K : KH ] segue que | H |= [K : KH ].
Teorema 3.2.8 K é uma extensão normal de F se, e somente se K é o corpo de raı́zes
de algum polinômio sobre F .
Demonstração:
Seja K uma extensão normal de F . Pelo teorema 3.2.6, existe a ∈ K
Y
tal que K = F (a). O polinômio p(x) =
(x − σ(a)) tem todas as suas raı́zes em
σ∈G(K,F )
44
K. Expandindo p(x) obtemos p(x) = xn − α1 xn−1 + · · · + (−1)n αn , onde α1 , · · · , αn são
as funções simétricas elementares em I = σ1 (a), · · · , σn (a). Logo cada αi é invariante por
todo σ ∈ G(K, F ). Segue que αi ∈ F , já que F é o corpo fixo de G(K, F ).
Agora como a gera K, a não pode estar em nenhum subcorpo de K que contém F .
Como a é raiz de p(x), já que σ1 (a) = a, nenhum subcorpo de K que contém F tem todas
as raı́zes de p(x). Logo K é o corpo de raı́zes de p(x) sobre F .
Reciprocamente, suponhamos que K seja o corpo de raı́zes f (x) = xn − a1 xn−1 + · · · +
(−1)n an sobre F . Sejam α1 , · · · , αn as raı́zes de f (x), então valem as relações
a1 = α1 + · · · + αn
a2 = α1 α2 + · · · + αn−1 αn
.
.
.
an = α1 · · · αn
Então a1 , · · · , an são as funções simétricas elementares em α1 , · · · , αn . Segue do teorema 3.2.5 que F (α1 , · · · , αn ) é corpo de raı́zes de f (x) sobre F (a1 , · · · , an ). Como
a1 , · · · , an ∈ F segue que F (a1 , · · · , an ) = F . Segue do corolário 3.1.1 que K é isomorfo
a F (α1 , · · · , αn ), neste caso tomemos K = F (α1 , · · · , αn ).
Segue do teorema 3.2.5 que o corpo fixo de G(F (α1 , · · · , αn ), F (a1 , · · · , an )) é o corpo
F (a1 , · · · , an ). Logo o corpo fixo de G(K, F ) é F , isto é, K é uma extensão normal de F .
Definição 3.2.6 Seja K o corpo de raı́zes do polinômio f (x) ∈ F [x]. O grupo de Galois
de f (x) é o grupo G(K, F ).
Teorema 3.2.9 (Teorema Fundamental da Teoria de Galois) Seja K o corpo de
raı́zes do polinômio f (x) ∈ F [x], G(K, F ) grupo de galois de f (x) e T um subcorpo de K
que contém F , então
1. A aplicação ψ : {subgrupos de G(K, F )} → {subcorpos de K que contém F } definida
por H 7→ KH é uma bijeção.
2. [K : T ] = |G(K, T )| e [T : F ] = (G(K, F ) : G(K, T ))
45
3. T é uma extensão normal de F se, e somente se G(K, T ) ¢ G(K, F )
4. Se T é uma extensão normal de F então G(T, F ) é isomorfo a G(K, F )/G(K, T )
Demonstração:
1. Primeiramente observe que KH é realmente um subcorpo de K que contém F . Que
KH é um subcorpo de K já provamos no teorema 3.2.2. Que KH é uma extensão de
F segue do fato de que os elementos de F ficam invariantes para todo automorfismo
σ ∈ G(K, F ), e portanto para todo automorfismo σ ∈ H < G(K, F ).
Salta à vista que ψ é injetiva, pois se KH1 = KH2 , então H1 = H2 . Vamos agora
provar que ψ é sobrejetiva. Seja T um subcorpo de K que contém F . Por hipótese
K é o corpo de raı́zes de f (x) sobre F . Podemos tomar f (x) como um polinômio
sobre T . Daı́ K será também o corpo de raı́zes de f (x) sobre T . Pelo teorema 3.2.8
K é uma extensão normal de T . Logo por definição T é o corpo fixo de G(K, T ).
Temos ainda que G(K, T ) é um subgrupo de G(K, F ), já que os automorfismos de
G(K, T ) deixam fixos os elementos de T , e portanto de F . Logo os automorfismos
de G(K, T ) estão todos em G(K, F ). Isto garante a sobrejetividade de ψ.
2. Seja T um subcorpo de K que contém F , pela sobrejetividade de ψ, T é o corpo
fixo de algum subgrupo H de G(K, F ), isto é, T = KH . Pelo teorema 3.2.7 segue
que [K : T ] = |G(K, T )|.
Agora, como G(K, T ) é um subgrupo de G(K, F ), segue do teorema de lagrange
(teorema 1.1.2) que | G(K, F ) |=| G(K, T ) | (G(K, F ) : G(K, T )). Mas pelo teo[K : F ]
rema 3.2.7 G(K, F ) = [K : F ]. Logo (G(K, F ) : G(K, T )) =
. Por outro
[K : T ]
[K : F ]
, daı́
lado, pelo teorema 3.1.1, [K : F ] = [K : T ][T : F ]. Logo [T : F ] =
[K : T ]
[T : F ] = (G(K, F ) : G(K, T )).
3. Como T é uma extensão de F , segue do teorema 3.2.6 que existe a ∈ T tal que T =
F (a). Sendo T uma extensão normal de F , segue do teorema 3.2.8 que T é o corpo de
raı́zes do polinômio minimal p(x) para a sobre F . Seja p(x) = β0 + β1 x + · · · + βn xn ,
temos que β0 +β1 a+· · ·+βn an = 0. Daı́ σ(β0 +β1 a+· · ·+βn an ) = σ(0) ∀σ ∈ G(K, F ).
Logo β0 + β1 σ(a) + · · · + βn σ(a)n = 0 ∀σ ∈ G(K, F ). Portanto σ(a) também é uma
raiz de p(x). Como T contém todas as raı́zes de p(x) segue que T contém σ(a) para
todo σ ∈ G(K, F ).
46
Agora como T = F (a), segue que para todo x ∈ T existem β1 , · · · , βk tais que
x = β0 + β1 a + · · · + βk ak . Logo σ(x) = β0 + β1 σ(a) + · · · + βk σ(a)k . Como
βi ∈ F ⊂ T e σ(a) ∈ T segue que σ(x) ∈ T . Logo σ(T ) ⊂ T .
Podemos agora definir o homomorfismo φ : G(K, F ) → G(T, F ) dada por σ 7→ σ|T ,
onde σ|T é a restrição de σ a T . Que σ|T é um automorfismo de T segue do fato de
que σ(T ) ⊂ T . Além disso é fácil ver que (σ1 ◦σ2 )|T = σ1 |T ◦σ2 |T ∀σ1 , σ2 ∈ G(K, F ).
Isto garante que φ é homomorfismo.
O núcleo de φ consiste de todos os automorfismos de G(K, F ) que são levados a
aplicação identidade em G(K, T ) pela φ, isto é, Kerφ = G(T, F ). Segue do teorema
1.1.11 que G(T, F ) / G(K, F ).
Reciprocamente, se G(T, F ) / G(K, F ), então pela definição de subgrupo normal
temos que σ −1 ◦ τ ◦ σ ∈ G(K, T ), para todo σ ∈ G(K, F ) e todo τ ∈ G(K, T ).
Segue que para todo t ∈ T , temos τ (σ(u)) = σ(u) para todo σ ∈ G(K, F ) e todo
τ ∈ G(K, T ). Logo σ(T ) ⊂ T . Agora, sendo T uma extensão de F , pelo teorema
3.2.6, existe a ∈ T talque T = F (a). Como σ(T ) ⊂ T , segue que σ(a) ∈ T . Logo
como já provamos T é corpo de raı́zes do polinômio p(x) = (x−σ1 (a)) · · · (x−σn (a)),
onde σ1 = I, · · · , σn são todos os automorfismos de G(K, F ). Segue do teorema 3.2.8
que T é uma extensão normal de F .
4. Como acabamos de ver φ : G(K, F ) → G(T, F ) dada por σ 7→ σ|T é um homomorfismo cujo núcleo é G(T, F ). Segue do teorema do homomorfismo (teorema
1.1.12) que G(K, F )/G(K, T ) é isomorfo a φ(G(K, F )). Pelo item 2 temos que
|φ(G(K, F ))| = |G(K, F )/G(K, T )| = [G(K, F ) : G(K, T )] = [T : F ] = |G(T, F )|.
Logo φ(G(K, F )) = G(T, F ), e portanto G(K, F )/G(K, T ) é isomorfo a G(T, F ).
3.3
A equação geral de grau n
Agora faremos uma conexão entre os resultados sobre teoria de corpos e a solubilidade
de equações polinomiais. Para isto precisamos introduzir o conceito de grupo solúvel e
abordar alguns resultados sobre o mesmo.
47
Definição 3.3.1 Seja G um grupo, dizemos que G é solúvel se existir uma sequência de
subgrupos G = G0 ⊃ G1 ⊃ G2 ⊃ · · · ⊃ Gk = {e} onde Gi é um subgrupo normal de Gi−1
e Gi−1 /Gi é abeliano.
Teorema 3.3.1 Seja H um subgrupo de Sn (n > 4) que contém todo 3-ciclo, e seja N
um subgrupo normal de H tal que H/N é abeliano, então N contém todo 3-ciclo de Sn .
Demonstração:
Seja f : H → H/N dado por f (x) = x o homomorfismo canônico e
sejam x = (i1 i2 i3 ) e y = (i3 i4 i5 ) elementos de H. Podemos tomar x e y desta forma, pois
n > 4. Como H/N é abeliano, segue que f (x−1 y −1 xy) = x−1 y −1 xy = x−1 y −1 x y = e,
isto é, x−1 y −1 xy = e. Pelo teorema 1.1.6, x−1 y −1 xy ∈ N .
Por outro lado
x−1 y −1 xy = (i1 i2 i3 )−1 (i3 i4 i5 )−1 (i1 i2 i3 )(i3 i4 i5 ) =
[(i3 i2 i1 )(i5 i4 i3 )][(i1 i2 i3 )(i3 i4 i5 )] =
(i1 i3 i5 i4 i2 )(i1 i2 i3 i4 i5 ) = (i2 i5 i3 ).
Logo (i2 i5 i3 ) ∈ N para quaisquer i2 , i3 , i5 .
Teorema 3.3.2 Sn não é um grupo solúvel para n ≥ 5
Demonstração:
Como n ≥ 5, Sn contém todo 3-ciclo. Se existisse uma cadeia de
subgrupos G = G0 . G1 . · · · . Gk = {e} com Gi−1 /Gi abeliano, então pelo teorema 3.3.1
todo subgrupo Gi conteria todo 3-ciclo de Sn , e portanto a cadeia nunca chegaria no
grupo trivial.
Definição 3.3.2 Dizemos que o polinômio p(x) sobre o corpo F é resolúvel por radicais
se existe uma seqüência de corpos F1 = F (w1 ) ⊂ F2 = F1 (w2 ) ⊂ · · · ⊂ Fk = Fk−1 (wk ) tal
que w1r1 ∈ F, w2r2 ∈ F1 , · · · , wkrk ∈ Fk−1 e Fk contém todas as raı́zes de p(x).
Dizer que o polinômio p(x) é resolúvel por radicais significa dizer que podemos escrever
√
sua raı́zes em função de seus coeficientes envolvendo as operações (+, ., n ).
q
p
√
7
4
Por exemplo, digamos que α = 1 − 3 3 + 7 13 é a raiz de um polinômio sobre
o corpo dos racionais que esta sendo escrita em função dos
deste ¶
polinômio,
µqcoeficientes
7
³p
p
√ 2
√ ´4
√
√
7
4
4
∈ F2 =
temos que 13 ∈ F,
3 + 7 13 ∈ F1 = F ( 13),
1 − 3 3 + 7 13
p
√
4
F1 ( 3 + 7 13) e F ⊂ F1 ⊂ F2 .
Teorema 3.3.3 (Critério de Galois) Se o polinômio f (x) ∈ F [x] é resolúvel por radicais então o grupo de Galois de f (x) sobre F é um grupo solúvel.
48
Demonstração:
Seja K o corpo de raı́zes de p(x) sobre F , e seja G(K, F ) o grupo de Galois de p(x).
Usaremos o fato de que se K é o corpo de raı́zes do polinômio p(x) ∈ F [x] e F contém
todas as raı́zes n-ésimas da unidade, então K = F (u), onde u é uma raiz de p(x) e G(K, F )
é abeliano. A demonstração deste fato pode ser vista em [6].
Se p(x) é resolúvel por radicais, então existe uma cadeia de subcorpos
F ⊂ F1 = F (w1 ) ⊂ F2 = F1 (w2 ) ⊂ · · · ⊂ Fk = Fk−1 (wk )
onde w1r1 ∈ F, w2r2 ∈ F1 , · · · , wkrk ∈ Fk−1 .
Sempre podemos encontrar Fk de modo que Fk seja uma extensão normal de F . Logo
Fk é uma extensão normal de Fi , para todo i.
Segue que da observação feita no inı́cio que Fi é o corpo de raı́zes de algum polinômio
sobre Fi−1 e portanto pelo teorema 3.2.8 é uma extensão normal. Segue do teorema 3.2.9
que
G(Fk , F ) . G(Fk , F1 ) . · · · . G(Fk , Fk−1 ) . {e} e
G(Fk , Fi )
é abeliano
G(FK , Fi−1 )
Segue que G(Fk , F ) é solúvel. Como K é corpo de raı́zes de p(x) sobre F , podemos
considerar K como corpo de raı́zes de p(x) sobre Fk , logo pelo terema 3.2.8 K é uma
extensão normal de Fk . Segue do teorema 3.2.9 que G(Fk , K) / G(Fk , F ) e G(K, F ) é
isomorfo a G(Fk , F )/G(Fk , K).
Concluı́mos que G(K, F ) é uma imagem homomorfa de G(Fk , F ) que é solúvel.
Usando o fato de que a imagem homomorfa de um grupo solúvel é um grupo solúvel
concluı́mos que G(K, F ) é solúvel. A demonstração de que a imagem homomorfa de um
grupo solúvel é um grupo solúvel pode ser vista tanto em [1] quanto em [6] ou em [7].
Teorema 3.3.4 (Abel) O polinômio geral de grau n ≥ 5 não é resolúvel por radicais.
Demonstração: Ora, pelo teorema 3.2.5 Sn é o grupo de Galois do polinômio p(t) =
n
X
(−1)k ak xk sobre F (a1 , · · · , an ). Pelo teorema 3.3.2 Sn não é solúvel para n ≥ 5.
k = 1
n
X
Logo, pelo teorema 3.3.3 o polinômio p(t) =
para n ≥ 5
k = 1
49
(−1)k ak xk não é resolúvel por radicais
Capı́tulo 4
Métodos numéricos para se obter
raı́zes de equações
A Teoria de Galois originalmente fazia um estudo de polinômios sobre o corpo dos
números complexos, posteriormente foi abrangida para corpos arbitrário, como foi feito
neste trabalho. Faremos agora uma discussão acerca dos polinômios definidos no corpo
dos reais.
No capı́tulo anterior provamos que as raı́zes do polinômio geral de grau ≥ 5 não podem
ser escritas em função dos coeficientes deste polinômio. Isto quer dizer que o problema de
achar as raı́zes de um polinômio de grau ≥ 5 não pode ser resolvido por método direto.
Contudo, o método direto é apenas uma maneira de resolver um problema matemático.
Podemos muitas vezes usar métodos iterativos que consistem em determinar aproximações
sucessivas da solução procurada. Embora geralmente não se encontre a solução exata,
podemos encontrar soluções convenientemente próximas.
4.1
Raı́zes reais
Os métodos iterativos para se obter raı́zes de equações consistem em fazer aproximações de raı́zes localizadas num intervalo real [a, b]. Então antes de começar a procurar as
raı́zes precisamos determinar a existência de raı́zes no intervalo [a, b].
Estes métodos não são válidos apenas para funções polinomiais, podemos aplicá-los
também à funções transcendentes (não polinomiais). Porém nosso interesse está nas
funções polinomiais.
51
4.1.1
Isolamento de raı́zes
Teorema 4.1.1 Seja f uma função contı́nua em [a, b], se f (a)f (b) < 0, então f tem no
mı́nimo uma raiz em [a, b].
Demonstração:
Este resultado segue diretamente do teorema do valor intermediário.
O teorema do valor intermediário diz que se f é contı́nua no intervalo fechado [a, b] e se γ
for um real compreendido entre f (a) e f (b), então existirá no mı́nimo um c ∈ [a, b] tal que
f (c) = γ. A demonstração do teorema do valor intermediário pode ser vista em qualquer
bom livro de cálculo diferencial.
Então, como f (a)f (b) < 0, segue que f (a) e f (b) tem sinais contrários. Logo γ = 0
esta entre f (a) e f (b). Pelo teorema do valor intermediário existe c ∈ [a, b] tal que
f (c) = γ = 0. Logo c ∈ [a, b] é uma raiz de f (x).
No caso particular de funções polinomiais temos o seguinte teorema devido a Cauchy
que será enunciado sem demonstração.
Teorema 4.1.2 (Cauchy) Dado o polinômio p(x) = an xn +· · · a1 x+a0 as raı́zes de p(x)
estão no disco centrado na origem e raio R = 1 +
A
,
|an |
onde A = max{|a0 |, · · · .|an−1 |}.
Este resultado na verdade permite localizar tanto raı́zes reais quanto raı́zes complexas.
O leitor interessado na demonstração pode consultar [8]
4.1.2
Método da bissecção
Seja p(x) uma função polinomial tal que o polinômio p(x) tem uma raiz ζ no intervalo
[a, b]. Seja x0 =
a+b
2
o ponto médio de [a, b]. Se x0 é a raiz de p(x) em [a, b], então o pro-
cesso acaba aqui. Caso contrário a raiz esta ou em [a, x0 ] ou em [x0 , b]. Seguindo com este
processo encontraremos em algum momento a raiz ζ de p(x) ou uma seqüência infinita de
intervalos encaixados [a0 , b0 ] ⊃ [a1 , b1 ] ⊃ · · · ⊃ [an , bn ] ⊃ · · · todos contendo ζ. Segue que
a0 , a1 , · · · , an , · · · formam uma seqüência monótona não-decrescente e b0 , b1 , · · · , bn , · · ·
formam uma seqüência monótona não-crescente. Segue que as duas seqüências são convergentes. Por outro lado, da forma como os intervalos são obtidos segue que bn − an =
b−a
2n
e daı́ lim bn − lim an = 0, portanto lim an = lim bn . Mas an ≤ ζ ≤ bn ∀n. Segue que
lim an = limbn = limζ = ζ.
Um caso mais geral do teorema 4.1.1 é o teorema
52
Teorema 4.1.3 Seja f uma função contı́nua em [a, b], se f (a)f (b) < 0, então f tem um
número ı́mpar de raı́zes em [a, b] e se f (a)f (b) > 0, então f não tem raı́zes ou tem um
número par de raı́zes em [a, b].
Não demonstraremos este resultado, vamos apenas discutir novamente o método da
bissecção.
Se p(a)p(b) < 0 então teremos um número ı́mpar de raı́zes para p(x). Suponhamos
que nunca obtemos uma raiz de p(x) ao tomar o ponto médio xi do segmento [ai , bi ].
Então obtemos dois intervalos [ai , xi ] e [xi , bi ] um contendo um número ı́mpar de raı́zes e
outro não contendo raı́zes ou contendo um número par de raı́zes. Sempre descartaremos o
intervalo que não contém raı́zes ou contém um número par de raı́zes. Em algum momento
encontraremos uma sequência de intervalos encaixados [ak , bk ] ⊃ · · · ⊃ [an , bn ] ⊃ · · · ,
onde k < n, cada um contendo um número ı́mpar de raı́zes de f (x) e novamente teremos
lim an = limbn = limζ = ζ.
4.1.3
Método da iteração linear
Este método consiste em escrever a função contı́nua p(x), como p(x) = f (x) − x e daı́
construir a seqüência xn+1 = f (xn ). Se ∀x ∈ I = [a, b], |f 0 (x)| ≤ L < 1 e f (I) ⊆ I, então
xn+1 converge para um x0 tal que f (x0 ) = x0 . Este x0 é chamado de ponto fixo da função
f e será uma raiz de p(x).
Com efeito, primeiramente vamos provar a existência de pontos fixos no intervalo [a, b].
Como f (I) ⊆ I, segue que a ≤ f (a) ≤ b e a ≤ f (b) ≤ b. Logo 0 ≤ f (a) − a ≤ b − a
e a − b ≤ f (b) − b ≤ 0. Suponhamos que f (a) 6= a e f (b) 6= b. Logo f (a) − a > 0 e
f (b) − b < 0. Daı́ p(a) > 0 e p(b) < 0. Logo p(x) tem uma raiz x0 em [a, b] que é o ponto
fixo de f .
Agora suponhamos que f tenha dois pontos fixos x1 e x2 . Segue do teorema do valor
médio que existe um c entre x1 e x2 tal que
f (x1 ) − f (x2 )
= f 0 (c)
x1 − x2
Segue que
¯
¯
¯ f (x1 ) − f (x2 ) ¯ x1 − x2
¯
¯=
|f (c)| = ¯
=1
x1 − x2 ¯ x1 − x2
0
Mas c ∈ [a, b], logo f 0 (c) < 1. Temos portanto um absurdo que certamente veio da
hipótese de que existem dois pontos fixos.
53
Provemos agora que a seqüência xn+1 = f (xn ) converge para x0 .
Segue do teorema do valor médio que existe um cn entre xn e x0 tal que
f (xn )−f (x0 )
xn −x0
=
f 0 (cn ). Daı́ f (xn )−f (x0 ) = f 0 (cn )(xn −x0 ). Logo |f (xn )−f (x0 )| = |f 0 (cn )||xn −x0 | ≤ L|xn −
x0 |. Segue que |xn+1 − x0 | = |f (xn ) − f (x0 )| ≤ L|xn − x0 |. Analogamente existe um cn−1
entre xn−1 e x0 tal que |xn − x0 | ≤ L|xn−1 − x0 |. Daı́ temos que |xn+1 − x0 | ≤ L2 |xn−1 − x0 |.
Por recorrência, obtemos |xn+1 − x0 | ≤ Ln+1 |x0 − x0 |.
Como 0 < L < 1 segue que lim Ln+1 = 0 e portanto lim xn+1 = x0 .
4.1.4
Método de Newton
Seja x uma raiz do polinômio p(x) = a0 xn + a1 xn−1 + · · · + an−1 x + an num
intervalo I = [a, b] e seja x0 uma aproximação de x com erro relativo ε, isto é, |x − x0 | = ε.
Suponhamos que x > x0 . Daı́ x = x0 + ε. Logo
a0 (x0 + ε)n + a1 (x0 + ε)n−1 + an−1 (x0 + ε) · · · + an = 0
Desenvolvendo cada binômio, obtemos
n(n − 1) n−2 2
x0 ε + · · · + εn ) + a1 (x0n−1 + (n − 1)x0n−2 ε +
2
(n − 1)(n − 2) n−3 2
x0 ε + · · · + εn−1 ) + · · · + an−1 (x0 + ε) + an = 0
2
a0 (xn0 + nxn−1
ε+
0
Para um ε suficientemente pequeno podemos tomar ε2 , ε3 , · · · , εn todos iguais a zero.
Obtemos assim a equação
(a0 xn0 + a1 xn−1
+ · · · + an ) + (na0 xn−1
+ (n − 1)a1 x0n−2 + · · · + an−1 )ε = 0
0
0
Logo
p(x0 ) + p0 (x0 )ε = 0
Mas ε = x − x0 . Logo,
p(x0 ) + p0 (x0 )(x − x0 ) = 0
Daı́
x = x0 −
54
p(x0 )
p0 (x0 )
Na verdade obtemos uma aproximação melhor que a inicial para a raiz de p(x). Nestas
condições, obtemos a seqüência
xn+1 = xn −
p(xn )
p0 (xn )
que converge para a raiz de p(x) em [a, b]. O mesmo se obtém quando se toma x < x0 .
Para uma função contı́nua arbitrária f (x), com f ”(x)f (x) < 0 consideremos a função
g(x) = x −
f (x)
.
f 0 (x)
Temos que g 0 (x) = 1 −
f 0 (x)2 −f (x)f ”(x)
f 0 (x)2
=
g(I) = I, então pelo resultado anterior xn+1 = g(xn ) = xn −
f (x)f ”(x)
< 1.
f 0 (x)2
f (xn )
converge
f 0 (xn )
Se além disso
para uma raiz
de f (x).
4.2
Raı́zes complexas
Um método para se obter raı́zes complexas de um polinômio P (x) é o método de
Newton-Bairstow que consiste em determinar os coeficientes de um polinômio do segundo
grau x2 + px + q que divide P (x). Nestas condições as raı́zes de x2 + px + q que podem ser
facilmente determinadas são raı́zes de P (x). A idéia reside no fato de que todo polinômio
de coeficientes reais pode ser decomposto no corpo dos reais em fatores de grau no máximo
dois. Como as raı́zes complexas sempre aparece aos pares, segue que elas são raı́zes de
fatores quadráticos de P (x). O método também pode ser utilizado para se obter raı́zes
reais.
4.2.1
Método de Newton-Bairstow
Seja
P (x) = an xn + an−1 xn−1 + · · · + a0
(4.1)
um polinômio sobre o corpo dos reais. Dividindo P (x) por x2 + px + q = 0, obtemos
P (x) = Q(x)(x2 + px + q) + R(x)
(4.2)
onde Q(x) é de grau n − 2 e R(x) é de grau 1, o que nos permite reescrever
P (x) = Q(x)(x2 + px + q) + b1 (x + p) + b0
(4.3)
Q(x) = bn xn−2 + bn−1 xn−3 + · · · + b2
(4.4)
e
55
Substituindo 4.4 em 4.3 e comparando com 4.1, obtemos;
bn = an
bn−1 = an−1 − pbn
bn−2 = an−2 − pbn−1 − qbn
..
.
b1 = a1 − pb2 − qb3
b0 = ao − pb1 − qb2
Queremos que x2 + px + q seja um divisor exato de P (x), para isto é necessário que
R(x) = 0 e daı́ b1 = b0 = 0.
Ora, pelas relações acima podemos expressar b0 e b1 em função de p e q calculando sucessivamente bn , bn−1 , · · · , b0 . Então o problema se reduz a resolver o sistema de equações
não lineares.

 b (p, q) = 0
0
 b (p, q) = 0
1
Para resolver um sistema de equações não lineares polinomiais ou transcendentes utilizamos o método de Newton. Não faremos nenhuma discussão da validade deste método.
Apenas apresentaremos o método para sistemas de duas equações, o leitor interessado no
assunto pode consultar [3].
Então para o sistema

 f (x, y) = 0
 g(x, y) = 0
A solução pode ser encontrada a partir de uma aproximação inicial (x0 , y0 ), por
xk+1 = xk −
yk+1
∂g
f. ∂y
−
∂g
.g
∂y
D(x, y)
∂g
∂f
.f
g. ∂x − ∂x
= yk −
D(x, y)
(4.5)
(4.6)
∂f ∂g ∂f ∂g
−
é o determinante da matriz jacobiana e ambos os nume∂x ∂y
∂y ∂x
radores são aplicados em (xk , yk ).
onde D(x, y) =
56
Então o problema agora é determinar
∂b0 ∂b0 ∂b1
. ∂q , ∂p
∂p
e
∂b1
.
∂q
Para isto basta observar que bj = aj − pbj+1 − qbj+2 . Daı́
∂bj+1
∂bj+2
∂bj
= −bj+1 − p
−q
∂p
∂p
∂p
para j = 0, · · · , n − 2.
∂b0
∂p
Logo, para se calcular
e
∂b1
∂p
basta se calcular sucessivamente
∂bn
∂p
0
· · · ∂b
.
∂p
∂bn
∂q
0
· · · ∂b
.
∂q
Analogamente
∂bj
∂bj+2
∂bj+1
= −bj+2 − q
−p
.
∂q
∂q
∂q
∂b0
∂q
Logo, para se calcular
e
∂b1
∂q
basta se calcular sucessivamente
Exemplo 4.2.1 Vamos discutir as raı́zes do polinômio P (x) = x5 − 8x + 2
q
Ora, como P (x) = 5x − 8, temos que P (x) = 0 se, e somente se x = ± 4 85 . Portanto
0
4
0
P (x) tem pelo menos um par de raı́zes complexas conjugadas.
Para calcular estas raı́zes vamos utilizar o método de Newton-Bairstow. Para isto
temos que determinar p e q de forma que P (x) = (x2 + px + q)(b5 x3 + b4 x2 + b3 x + b2 ),
onde
b5 = a 5
b4 = a4 − pb5
b3 = a3 − pb4 − qb5
b2 = a2 − pb3 − qb4
b1 = a1 − pb2 − qb3
b0 = a0 − pb1 − qb2
Daı́, calculando sucessivamente b5 , b4 , b3 e b2 , obtemos
b1 = −8 + p4 − 3p2 q + q 2
b0 = 2 + 8p − p5 + 4p3 q − 3pq 2
Mas também vamos precisar das derivadas parciais de b0 e b1 .
Com efeito,
57
∂b0
∂p
∂b0
∂q
∂b1
∂p
∂b1
∂q
= 8 − 5p4 + 12qp2 − 3q 2
= 4p3 − 6pq
= 4p3 − pq
= −3p2 + 2q
Para começar a utilizar o método de Newton-Bairtow, precisamos de uma aproximação
inicial dos coeficientes p e q. Pelo Teorema 4.1.2 as raı́zes de P (x) estão em um disco
8
1
centrado na origem e de raio R = 1 +
= 9. Então podemos tomar p0 = −0, 5 e q0 = 3,
que determinam o polinômio x2 − 0, 5x + 3 cujas raı́zes são complexas e têm módulo
√
ρ = 3 < 9.
k
pk
qk
b0 (pk , qk )
b1 (pk , qk )
0
0,5
3
-6,03125
-1,1875
1
0,29880
2,69128
-1,81741
2
0,27599
2,78655
-1,98851
3
0,20845
2,80972
4
0,16597
5
∂b0
∂p
∂b0
∂q
∂b1
∂p
∂b1
∂q
(pk , qk )
D(pk , qk )
pk+1
qk+1
-10,3125
-8,5
-8,5
5,25
-126,39062
0,298801
2,69128
-1,46990
-10,88540
-4,71823
-4,71823
5,114711
-77,93735
0,27599
2,78655
-0,86610
-12,776512
-4,53035
-4,53035
5,34459
-88,80929
0,20845
2,80972
-1,16779
-0,46986
-14,22795
-3,47784
-3,47785
5,48908
-90,19381
0,16597
2,83881
2,83881
-0,63305
-0,17502
-15,24185
-2,80869
-2,80869
5,59497
-93,166441
0,13846
2,84835
0,13846
2,84835
-0,23225
-0,05034
-15,68588
-2,35578
-2,35578
5,63919
-94,00536
0,12755
2,8509
6
0,12755
2,85093
-0,06614
-0,01106
-15,82819
-2,17358
-2,17358
5,65306
-94,20215
0,12425
2,85127
7
0,12425
2,85127
-0,01448
-0,00209
-15,86216
-2,11792
-2,11792
5,65622
-94,20546
0,12350
2,85129
8
0,12350
2,85129
-0,00273
-0,00037
-15,86888
-2,10535
-2,10535
5,65683
-94,19999
0,12336
2,85129
9
0,12336
2,85129
-0,00048
-6,43219E-05
-15,87009
-2,10295
-2,10295
5,65693
-94,19846
0,12334
2,85129
10
0,12334
2,85129
-8,40883E-05
-1,11483E-05
-15,87031
-2,10252
-2,10252
5,65695
-94,19817
0,12333
2,85129
11
0,12333
2,85129
-1,4574E-05
-1,93096E-06
-15,87034
-2,10245
-2,10245
5,65695
-94,19812
0,12333
2,85129
(pk , qk )
(pk , qk )
(pk , qk )
Daı́ obtemos p11 = 0, 12333 e q11 = 2, 85129. Agora o problema se resume a calcular
as raı́zes da equação x2 + 0, 12333x + 2, 85129 que são z1 = −0, 061666008 + 1, 687451253i
e z2 = −0, 061666008 − 1, 687451253i.
Para calcular as demais raı́zes basta reduzir o grau do polinômio P (x), já que conhecemos duas de suas raı́zes. Assim obtemos o polinômio R(x) = x3 −0, 12333x2 −2, 836084x+
0, 701436. Pelo teorema 4.1.2 as raı́zes reais estão no intervalo [−3, 836084; 3, 836084].
Mais precisamente, pela tabela abaixo R(x) tem uma raiz no intervalo [-2,-1], uma raiz
no intervalo [0,1] e uma raiz em [1,2].
x
-2
-1
0
1
2
p(x) -14
9
2 -5
18
58
Para obter uma aproximação da raiz do intervalo [−2, −1] vamos utilizar o método de
Newton que consiste em obter o limite da sequência xk+1 = xk −
R(xk )
.
R0 (xk )
Com efeito,
k
xk
xk+1
R(xk+1 )
0
-2
-1,78050
-0,28444
1
-1,78050
-1,74052
-0,00868
2
-1,74052
-1,73922
-0,00002
3
-1,73922
-1,73922
-0,00002
Por tanto x0 = −1, 73922 é uma raiz de R(x) com margem de erro de ² = 10−4 .
Para obter uma aproximação da raiz do intervalo [0, 1] vamos utilizar o método da
bissecção.
Com efeito,
k
a
b
p(a)
p(b)
0
0
1
2
-5
-
1
1
0
0,5
2
-1,696
-
0,5
2
0
0,25
2
0,001
+
0,25
3
0,25
-0,992
-
0,125
0,375 0,001
p(a)p(b) |a − b|
Portanto x1 = 0, 25 é uma raiz de R(x) com margem de erro de ² = 10−3
Para calcular a última raiz vamos utilizar o método da iteração linear.
Com efeito, queremos encontrar a solução de x3 −0, 12333x2 −2, 836084x+0, 701436 =
0. Daı́ x = 0, 12333 +
2,836084
x
−
fixo da função f (x) = 0, 12333 +
0,701436
.
x2
2,836084
x
Logo o problema se resume a calcular o ponto
0,701436
.
x2
−
Como f 0 (2) = −0, 533662 < 1, então
f (x) tem um ponto fixo no intervalo [1,2]. Assim temos,
k
xk
xk+1 = f (xk )
0
2
1,366013
1
1,366013
1,823601
2
1,823601
1,467615
3
1,467615
1,730114
...
...
...
50 1,612429
59
1,612429
Assim obtemos x2 = 1, 612429, a última raiz de R(x), com margem de erro de ² = 10−6 ,
já que R(1, 612429) = 0, 000001.
O que fizemos até aqui foi encontrar aproximações convenientes das raı́zes de P (x).
Esta foi uma discussão do ponto de vista da matemática aplicada. Agora iremos discutir
a natureza da solução e investigar se P (x) é resolúvel por radicais.
Com efeito, as possı́veis raı́zes racionais de P (x) = x5 − 8x + 2 são -2, -1 , 0, 1 e 2.
Logo P (x) é irredutı́vel sobre Q. Como já vimos as raı́zes de P (x) são todas distintas. Se
θ1 , θ2 , θ3 , θ4 e θ5 são as raı́zes de P (x) então K = Q(θ1 , θ2 , θ3 , θ4 , θ5 ) é o corpo de raı́zes de
P (x). Como as raı́zes são todas distintas então G = G(K, Q), o grupo de Galois de P (x),
é um subgrupo de S5 . Como P (x) é irredutı́vel, segue do teorema 3.1.2 que ∀i = 1, ..., 5
[Q(θi : Q)] = 5. Pelo teorema da Torre [K : Q] = 5 (ver [7]). Logo, pelo teorema 3.2.7
|G| = 5. Daı́, como todo grupo de ordem prima é cı́clico segue que G possui um elemento
de ordem 5. A aplicação z 7→ z de C induz um automorfismo de K, que mantém fixa as
3 raı́zes reais e permuta as 2 complexas. Mas isto corresponde ao 2-ciclo. Logo G contém
uma transposição (2-ciclo) e um ciclo de ordem 5. Se pode provar que qualquer ciclo de
ordem 5 e um 2-ciclo geram o S5 . Logo G = S5 e portanto pelo teorema 3.3.3 P (x) não
é resolúvel por radicais.
60
Considerações Finais
As equações polinomiais foi e ainda é fonte de estudo de muitos. Durante muitos
séculos, matemáticos dos mais diversos lugares se empenharam em achar fórmulas que
solucionassem tais equações. Até que Niels Abel demonstrou que uma equação polinomial
de grau maior ou igual a cinco não resolúvel por radicais. Vale ressaltar que Abel não
provou que as fórmulas não existem. Ele apenas provou que as raı́zes não podem ser
escritas em função dos coeficientes do polinômio usando as quatro operações e a extração
de raiz. Nada impede que as raı́zes possam ser escritas em função dos coeficientes do
polinômio utilizando outras funções elementares, como as trigonométricas por exemplo.
Em contraponto, como já vou dito, em determinadas circunstância o método iterativo
pode ser mais oportuno que o método direto.
Nesta perspectiva, este trabalho teve como objetivo fazer uma discussão detalhada
das equações polinomiais abordando desde as soluções das equações polinomiais de grau
menor que quatro, demonstrando a insolubilidade por radicais das equações de grau ≥ 5
e discorrendo sobre alguns métodos iterativos para se obter raı́zes de equações.
61
Referências Bibliográficas
[1] Artin, E., Galois Theory, second edition, Notre Dame Mathematical Lectures, Number 2.
[2] Bastos, G., G., Resolução de Equações por Radicais. Segunda Bienal da SBM.
Disponı́vel em www.bienasbm.ufba.br
[3] Cláudio, D. M., & Marins, J. M. Cálculo numérico computacional: teoria e prática.
2. ed.-São Paulo: Atlas, 1994.
[4] Garcia, A. & Lequain, Y., Álgebra: um curso de introdução. Rio de Janeiro, Instituto
de Matemática Pura e Aplicada, 1988.(Projeto Euclides)
[5] Gonçalves, A., Introdução à álgebra. Rio de Janeiro, Instituto de Matemática Pura
e Aplicada, 1979.(Projeto Euclides)
[6] Herstein I., N., Tópicos de Álgebra. Tradução de Adalberto P. Bergamasco e L. H.
Jacy Monteiro. SP. Editora da Univ. e Polı́gono, 1970.
[7] Hungerford, W., T., Algebra. Springer, 1974.
[8] Santos, I., L., D., & Silva, G., N., Zeros de Polinômios. Disponı́vel em
www.mtm.ufsc.br/ bosing/07-2/files/
[9] Teixeira, M., V., & Martins, C., R., P., A Resolução das equações algébricas por
radicais: As origens da Teoria de Galois. Terceira Bienal da SBM. Dispinı́vel em
www.ime.ufg.br/bienal/2006/minicursos.php
63