UNIVERSIDADE ESTADUAL DE FEIRA DE SANTANA
Departamento de Ciências Exatas e da Terra
Colegiado de Matemática
Curso de Licenciatura em Matemática
Trabalho de Conclusão de Curso
UM ESTUDO APROFUNDADO SOBRE
SOLUBILIDADE DE EQUAÇÕES POLINOMIAIS
Geraldo de Assis Júnior
Feira de Santana
Setembro de 2008
Banca Examinadora
Orientadora:Profa . Msc. Fabı́ola de Oliveira Pedreira Lima
Prof. Dra . Taı́se Santiago C. Oliveira
Prof. Msc. Marcos Grilo Rosa
UNIVERSIDADE ESTADUAL DE FEIRA DE SANTANA
Departamento de Ciências Exatas e da Terra
Colegiado de Matemática
Curso de Licenciatura em Matemática
Trabalho de Conclusão de Curso
UM ESTUDO APROFUNDADO SOBRE
SOLUBILIDADE DE EQUAÇÕES POLINOMIAIS
Geraldo de Assis Júnior
Trabalho apresentado ao Departamento de
Ciências Exatas e da Terra como requisito parcial para a obtenção do tı́tulo de Licenciado em
Matemática na Universidade Estadual de Feira
de Santana.
Orientadora: Fabı́ola O. P. Lima
Feira de Santana
Setembro de 2008
Agradecimentos
Agradeço à Universidade Estadual de Feira de Santana por ter me oportunizado a dar
esta contribuição, ainda que modesta, para o desenvolvimento cientı́fico. E em especial à
professora Fabı́ola pela paciência, compreensão e incentivo na realização deste trabalho.
i
Resumo
Neste trabalho é feito um estudo sobre solubilidade de equações polinomiais sobre um
corpo arbitrário. O capı́tulo 1 é uma revisão de grupos e anéis. No capı́tulo 2 deduzimos as
fórmulas para equações polinomiais de grau menor que 5, já no capı́tulo 3 demonstramos
por meio da Teoria de Galois que não existem fórmulas para resolver equações polinomiais
de grau maior que 4. Por fim abordamos no capı́tulo 4, métodos numéricos para se obter
raı́zes de equações ainda que não existam fórmulas explı́citas para isto. Alguns resultados
são enunciados sem demonstração. Isto foi feito para dar mais objetividade ao texto.
Optamos por fazer uma revisão detalhada de álgebra uma vez que é pré-requisito para a
Teoria de Galois que tem papel crucial em todo este trabalho.
Palavras Chave: Teoria de Galois, equações polinomiais, extensão de corpos.
iii
Sumário
Introdução
1
1 Grupos e Anéis
3
1.1
1.2
Grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
1.1.1
Subgrupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
1.1.2
Classes laterais e Teorema de Lagrange . . . . . . . . . . . . . . . .
6
1.1.3
Subgrupos normais e grupos quocientes . . . . . . . . . . . . . . . .
8
1.1.4
Homomorfismo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Anéis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.2.1
Ideais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.2.2
Anéis de polinômios
1.2.3
Funções simétricas . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
. . . . . . . . . . . . . . . . . . . . . . . . . . 19
2 Solução de equações polinomiais de grau ≤ 4
25
2.1
Equação quadrática . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.2
Equação cúbica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.3
Equação quártica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3 Teoria de Galois
31
3.1
Extensão de corpos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2
O Teorema Fundamental da Teoria de Galois . . . . . . . . . . . . . . . . . 39
3.3
A equação geral de grau n . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4 Métodos numéricos para se obter raı́zes de equações
4.1
51
Raı́zes reais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.1.1
Isolamento de raı́zes . . . . . . . . . . . . . . . . . . . . . . . . . . 52
v
vi
SUMÁRIO
4.2
4.1.2
Método da bissecção . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.1.3
Método da iteração linear . . . . . . . . . . . . . . . . . . . . . . . 53
4.1.4
Método de Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
Raı́zes complexas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.2.1
Método de Newton-Bairstow . . . . . . . . . . . . . . . . . . . . . . 55
Considerações Finais
61
Introdução
As equações algébricas têm um grande destaque na história da matemática, posto que
propiciou o desenvolvimento de diversas teorias. Durante um longo tempo matemáticos
de diversas culturas e regiões se empenharam em deduzir fórmulas que resolvessem certas equações polinomiais. Ao final do século XVI já se tinha deduzido as fórmulas para
equações polinomiais de até quarto grau [9]. A partir daı́ muitos matemáticos se empenharam em resolver as equações de grau maior que quatro. Contudo, não tiveram
êxito. Foi então que um jovem matemático norueguês Niels Abel provou que as fórmulas
simplesmente não existiamm.
Em contrapartida, do ponto de vista da matemática aplicada, geralmente os métodos
iterativos, que consistem em fazer aproximações sucessivas da solução do problema, são
computacionalmente mais baratos que os métodos diretos. O termo computacionalmente
mais barato utilizado aqui está ligado à idéia de custo de um algoritmo que depende do
número de operações necessárias para resolver um dado problema. Por exemplo, o número
de operações(adição e multiplicação) necessárias para determinar o valor numérico de um
polinômio usando a definição é geralmente maior que o número de operações necessárias
para fazer o mesmo cálculo usando o dispositivo de Briot-Ruffini.
Nesta perspectiva, discorreremos neste trabalho sobre as teorias que tratam da solução
de uma equação algébrica por método direto e sobre os métodos iterativos de se solucionar
o mesmo problema. No capı́tulo um é feita uma revisão de álgebra para dar subsı́dio ao
capı́tulo três que trata dos fundamentos da Teoria de Galois. Neste capı́tulo provamos
que o polinômio geral de grau maior que quatro não é resolúvel por radicais. O capı́tulo
dois deste trabalho trata das equações polinomiais de até quarto grau, demonstrando as
fórmulas que determinam as suas raı́zes. E finalmente no capı́tulo quatro abordamos
alguns métodos iterativos para se obter as raı́zes da equação.
1
Capı́tulo 1
Grupos e Anéis
1.1
Grupos
Um grupo consiste de um conjunto não vazio G e uma aplicação σ : G × G −→ G
que a cada par (x, y) em G × G associa um único elemento σ(x, y) em G. Além disso, tal
aplicação deve satisfazer a três condições. São elas:
1. Associatividade
Dados x, y, z ∈ G temos que σ(σ(x, y), z) = σ(x, σ(y, z)).
2. Existência do elemento neutro
Existe um elemento e de G tal que σ(x, e) = σ(e, x) = x; ∀x ∈ G.
3. Simetrização
Para todo elemento x de G existe um y em G tal que σ(x, y) = σ(y, x) = e. O
elemento y é dito inverso ou simétrico de x.
Se além das três condições acima ocorre que σ(x, y) = σ(y, x), ∀x, y ∈ G, dizemos que
o grupo é comutativo ou abeliano.
O elemento neutro é único, pois se existissem dois e e e0 , terı́amos que e = σ(e, e0 ) = e0 .
O simétrico também é único. De fato, suponhamos que um elemento x de G tenha dois
simétricos y e z. Daı́ σ(x, y) = e e σ(x, z) = e. Ora, se σ(x, y) = e, então os pares
ordenados (z, σ(x, y)) e (z, e) são iguais. Logo suas imagens também são iguais, isto é,
σ(z, σ(x, y)) = σ(z, e). Daı́ σ(σ(z, x), y) = σ(z, e). Logo σ(e, y) = σ(z, e). Portanto
y = z.
3
Comumente representamos a imagem do par (x, y) pela σ por x.y ou simplesmente
xy, neste caso temos um grupo multiplicativo o qual denotamos por (G, .). Outras vezes
representamos a imagem de (x, y) por x + y, neste caso temos um grupo aditivo que
denotamos por (G, +). Em geral usaremos a notação multiplicativa para representar uma
operação arbitrária de um grupo arbitrário. Vale ressaltar que definir uma função de
G × G em G nada mais é que definir uma operação no conjunto G.
Usamos a terminologia inverso para grupos multiplicativos e simétrico para grupos
aditivos. Quando o grupo é multiplicativo representamos o inverso do elemento x por x−1
e quando o grupo é aditivo representamos o simétrico de x por −x.
Exemplos de grupos
1. (Z, +) é um grupo, isto é, Z é um grupo aditivo com a operação usual de soma.
2. (Q∗ , .) é um grupo multiplicativo e (Q, +) é um grupo aditivo.
3. O conjunto das matrizes inversı́veis de ordem n é um grupo multiplicativo não
abeliano denominado de grupo linear.
4. O conjunto Zn dos inteiros módulo n é um grupo em relação à adição e Zn − {0} é
grupo em relação à multiplicação.
5. Dado um conjunto arbitrário S tomamos A(S) como o conjunto de todas as bijeções
de S em si mesmo. Seja S um conjunto de n elementos. Sem perda de generalidade
tomemos S = {1, · · · , n}. Se usarmos a composição de funções entre os elementos
de A(S) teremos uma estrutura de grupo. Usamos a notação Sn para representar
este grupo que é denominado grupo das permutações.
Podemos representar cada f ∈ Sn como


f =
1
2
···
f (1) f (2) · · ·
n

f (n)
Dado k ≤ n, se acontece que f (i1 ) = i2 , f (i2 ) = i3 , · · · , f (ik ) = i1 e f (ij ) = ij
quando j 6∈ {1, · · · , k}, então representamos f como f = (i1 i2 · · · ik ) e dizemos que
f é um k-ciclo.
4
1.1.1
Subgrupos
Dado um grupo G, entendemos como subgrupo de G a todo subconjunto H ⊂ G que
é grupo com a mesma operação de G. Usamos a notação H < G para representar este
fato.
Segue desta definição que {e} e G são subgrupos de G para qualquer que seja G. São
os chamados subgrupos triviais.
Exemplos de subgrupos
1. O grupo aditivo nZ, que é o grupo dos múltiplos inteiros de n ∈ Z, é um subgrupo
de Z.
2. O grupo multiplicativo dos racionais (Q, .) é um subgrupo do grupo dos reais (R, .).
3. Seja G um grupo, dado a ∈ G e m um inteiro positivo definimos am = a.a.
· · · .a}.
| {z
m vezes
Assim, para cada a 6= e o grupo [a] = {e, a, a2 , · · · , am , · · · } que é o grupo gerado
por a é um subgrupo de G.
Em geral dado a ∈ G e m ∈ Z definimos



e, se m = 0


am =
a.am−1 , se m > 0



 (a−1 )−m , se m < 0
Se G for finito então o grupo H = {e, a, a2 , · · · , am−1 } é dito grupo cı́clico, isto porque
para cada i ≥ m existe j ∈ {1, · · · , m − 1} tal que ai = aj .
Em um grupo finito definimos ordem do grupo como o número de elementos deste
grupo. Além disso, sendo G um grupo e a elemento de G, definimos ordem de a como
sendo o menor inteiro positivo m tal que am = e.
Usamos a notação |G| para representar a ordem de G e |a| para a ordem de a. No
caso de um grupo cı́clico G = [a], temos que |G| = |a|.
Proposição 1.1.1 Todo subgrupo de um grupo cı́clico também é cı́clico.
Demonstração:
Seja G = [a] um grupo cı́clico de ordem m e H um subgrupo de G
tomemos n como o menor inteiro positivo tal que an ∈ H. Segue que [an ] ⊂ H. Por outro
lado, se x ∈ H então existe h ∈ Z tal que x = ah ∈ H. Pelo teorema da divisão euclidiana,
5
existem q, r ∈ Z tais que h = qn + r, com 0 ≤ r < n. Daı́ ar = ah−qn = ah a−qn ∈ H.
Logo ar ∈ H. Como n é o menor inteiro positivo tal que an ∈ H segue que r = 0 e daı́
h = qn. Logo x = ah = aqn ∈ [an ]. Daı́ H ⊂ [an ], e portanto H = [an ].
Teorema 1.1.1 Dado um grupo G e um subconjunto H ⊂ G, H é subgrupo de G se, e
somente se a.b−1 ∈ H, ∀ a, b ∈ H.
Demonstração:
De fato, se H é subgrupo de G então é claro que a.b−1 ∈ H, ∀ a, b ∈ H.
Reciprocamente, se a.b−1 ∈ H ∀ a, b ∈ H, então tomemos b = a, daı́ e = a.a−1 = a.b−1 ∈
H. Agora, como e ∈ H, para todo a ∈ H temos que a−1 = e.a−1 ∈ H. Além disso, dados
a, b ∈ H sabemos que b−1 ∈ H e daı́ a.b = a.(b−1 )−1 ∈ H, isto é, a operação é fechada em
H, e portanto vale a associativa em H já que esta é válida em G. Logo H é subgrupo de
G.
Este resultado é muito importante na teoria dos grupos. Sem ele para se provar que
um dado subconjunto é subgrupo várias condições deveriam ser verificadas. Agora apenas
uma condição deve ser satisfeita.
1.1.2
Classes laterais e Teorema de Lagrange
Seja G um grupo e H um subgrupo de G, dado um x ∈ G o conjunto de todos os
elementos da forma xh, com h ∈ H, será denotado por xH e designado classe lateral
à esquerda módulo H, da mesma forma o conjunto dos hx será denotado por Hx e
designado classe lateral à direita módulo H. A cardinalidade do conjunto de todas as
classes laterais à esquerda ou à direita é denominado ı́ndice de H em G e denotado por
(G : H). Frequentemente usaremos apenas a expressão classe lateral para designar classe
lateral à esquerda.
Exemplo 1.1.1 Considere o grupo aditivo Z6 = {0, 1, 2, 3, 4, 5} e o subgrupo H =<
6
2 >= {0, 2, 4}, vamos determinar as classes laterais de G = Z6 módulo H.
0 + H = {0 + 0, 0 + 2, 0 + 4} = {0, 2, 4}
1 + H = {1 + 0, 1 + 2, 1 + 4} = {1, 3, 5}
2 + H = {2 + 0, 2 + 2, 2 + 4} = {2, 4, 0}
3 + H = {3 + 0, 3 + 2, 3 + 4} = {3, 5, 1}
4 + H = {4 + 0, 4 + 2, 4 + 4} = {4, 0, 2}
5 + H = {5 + 0, 5 + 2, 5 + 4} = {5, 1, 3}
Logo, as únicas classes laterais à esquerda de G = Z6 módulo H, são {0, 2, 4} e
{1, 3, 5}, portanto (G : H) = 2. Note que |G| = 6 e |H| = 3 e daı́ |G| = |H|.(G : H).
Veremos mais adiante que não se trata de mera coincidência.
Proposição 1.1.2 Duas classes laterais distintas são sempre disjuntas.
Demonstração:
Sejam aH e bH classes distintas. Suponhamos que aH ∩ bH 6= ∅.
Segue que existe x tal que x ∈ aH ∩ bH. Daı́ x ∈ aH e x ∈ bH. Logo existem h1 , h2 ∈ H
tais que x = ah1 e x = bh2 . Segue que ah1 = bh2 , e portanto b−1 a = h2 h−1
1 ∈ H.
Agora, dado y ∈ aH, temos que existe h ∈ H tal que y = ah. Logo b−1 y = b−1 ah.
Daı́ b−1 y ∈ H, e portanto existe h3 ∈ H tal que b−1 y = h3 . Logo y = bh3 ∈ bH. Segue
que aH ⊂ bH. De forma análoga concluı́mos que bH ⊂ aH e daı́ aH = bH, o que fere a
nossa hipótese inicial de que aH 6= bH. Temos portanto um absurdo que certamente veio
da hipótese de que aH ∩ bH 6= ∅.
Teorema 1.1.2 (Lagrange) Dado um grupo finito G e um subgrupo H ⊂ G temos que
|G| = |H|.(G : H), isto é, a ordem do subgrupo divide a ordem do grupo.
Demonstração:
Ora da proposição 1.1.2 temos que as classes laterais de G módulo
H são duas a duas disjuntas. Logo o grupo G é a reunião disjunta de todas as suas
classes laterais módulo H . Então, sejam a1 H, · · · , am H as classes laterais de G, onde
[
m = (G : H) segue que G =
ai H. Portanto |G| = ] (a1 H) + · · · + ] (am H) (onde
1≤i≤m
] (ai H) representa a cardinalidade de ai H. É usada esta notação em vez de |ai H| porque
7
ai H não é necessariamente um grupo). Segue daı́ que |G| = |H| + · · · + |H| = |H|.m =
|
{z
}
m vezes
|H|.(G : H).
O que foi provado aqui é que a ordem do subgrupo divide a ordem do grupo, isto é,
para cada subgrupo H de G existe um m = |H| tal que m divide |G|. Daı́ naturalmente
surge a pergunta: Dado um divisor m de |G| existe um subgrupo H de G tal que |H| = m?
A resposta é não. Existem grupos cujo número de subgrupos é menor que o número de
divisores de sua ordem. O resultado mais próximo da recı́proca do Teorema de Lagrange
é o Teorema de Sylow que garante o resultado quando a ordem do grupo é da forma pα
com p primo e α ∈ Z cuja demonstração pode ser vista em [6].
1.1.3
Subgrupos normais e grupos quocientes
Na seção anterior definimos classes laterais. Sobre certas condições podemos ter uma
estrutura de grupo no conjunto de todas as classes laterais a esquerda ou no conjunto de
todas as classes laterais a direita. Estas idéias serão trabalhadas agora nessa seção.
Definição 1.1.1 Dado um grupo G, chamamos de subgrupo normal a todo subgrupo N
de G tal que gng −1 ∈ N para todo n ∈ N e todo g ∈ G. Representamos este fato por
N ¢ G.
Teorema 1.1.3 Dado um grupo G, temos que N ¢ G se, e somente se N = gN g −1 para
todo g ∈ G.
Demonstração:
Se N é normal, então gng −1 ∈ N , ∀n ∈ N e ∀g ∈ G. Logo
gN g −1 ⊂ N ∀g ∈ G. Além disso, se x ∈ N , então g −1 xg = g −1 x(g −1 )−1 ∈ N . Mas
x = g(g −1 xg)g −1 ∈ gN g −1 . Logo N ⊂ gN g −1 e daı́ gN g −1 = N .
Reciprocamente, se gN g −1 = N , ∀g ∈ G, então gng −1 ∈ N ∀g ∈ G e ∀n ∈ N , logo N
é subgrupo normal de G.
Teorema 1.1.4 Seja G um grupo, um subgrupo N de G é normal se, e somente se
gN = N g, ∀g ∈ G.
Demonstração:
Suponha N ¢ G. Se x ∈ gN , então existe n ∈ N tal que x = gn.
Como n ∈ N e N = g −1 N g, já que N é normal, segue que n = g −1 n0 g, com n0 ∈ N . Daı́
8
x = g(g −1 n0 g) = n0 g. Logo x ∈ N g e por tanto gN ⊂ N g. De forma análoga concluı́mos
que N g ⊂ gN e daı́ gN = N g. A recı́proca é trivial.
Teorema 1.1.5 Seja G um grupo e N um subgrupo normal de G, o conjunto de todas
as classes laterais à esquerda(ou à direita), que denotamos por G/N , é um grupo com a
operação (aN )(bN ) = (ab)N .
Demonstração:
Primeiramente vamos verificar se a operação está bem definida.
Com efeito, devemos provar que o produto de duas classes laterais é uma classe lateral,
isto é, (aN )(bN ) = (ab)N .
Ora, se x ∈ (aN )(bN ), então x = (an1 )(bn2 ) onde os ni pertencem a N . Sabemos que
bn2 ∈ bN , mas pelo teorema 1.1.4 bN = N b e portanto existe n3 ∈ N tal que bn2 = n3 b.
Logo x = (an1 )(n3 b) = a((n1 n3 )b). Novamente, como bN = N b temos que existe n4 ∈ N
tal que (n1 n3 )b = bn4 e daı́ x = a(bn4 ) = (ab)n4 ∈ (ab)N .
Por outro lado, se x ∈ (ab)N , então existe n ∈ N , tal que x = (ab)n = (ae)(bn) ∈
(aN )(bN ). Logo (aN )(bN ) = (ab)N .
Agora falta provar que vale a associativa, que existe um elemento neutro e que todo
elemento possui um inverso.
1. Associativa.
[(aN )(bN )](cN ) = [(ab)N ](cN ) = ((ab)c)N = (a(bc))N = (aN )[(bc)N ] =
= (aN )[(bN )(cN )]
2. Existência do elemento neutro.
O elemento neutro de G/N é N , já que (aN )(N ) = (aN )(eN ) = (ae)N = aN e
(N )(aN ) = (eN )(aN ) = (ea)N = aN .
3. Simetrização.
O inverso de (aN ) é (a−1 N ), já que (aN )(a−1 N ) = (aa−1 )N = eN = N e (a−1 N )(aN )
= (a−1 a)N = eN = N .
Exemplo 1.1.2 O grupo aditivo Z admite mZ como subgrupo, onde m ∈ Z. Observe
que mZ é normal. Daı́ Z/mZ = {mZ, 1 + mZ, 2 + mZ, · · · , (m − 1) + mZ} é grupo.
9
Uma análise mais atenta de Z/mZ vai mostrar que ele tem a mesma estrutura do Zm ,
isto é, para cada classe lateral a + mZ, podemos associar uma única classe de resto a, e
somar duas classes laterais (a + mZ) + (b + mZ) = (a + b) + mZ é o mesmo que somar
duas classes de resto a + b = a + b. Então dizemos que Z/mZ é isomorfo a Zm . Esta
idéia será formalizada na próxima seção.
Lema 1.1.1 Seja N um subgrupo normal de um grupo G, temos que a ∈ N se, e somente
se aN = N .
∈ N
Demonstração:
z }| {
Com efeito, suponhamos que a ∈ N . Se x ∈ N , então x = a (a−1 x) ∈
aN e daı́ N ⊂ aN . Por outro lado, se x ∈ aN , então existe n ∈ N tal que x = an ∈ N e
daı́ aN ⊂ N . Logo aN = N .
Reciprocamente, se aN = N , então ∃n, n0 ∈ N tais que an = n0 e daı́ a = n0 n−1 ∈ N .
Teorema 1.1.6 Seja G um grupo e N um subgrupo normal de G, temos que ∀a, b ∈ N ,
ab−1 ∈ N se, e somente se aN = bN .
Demonstração:
Se ab−1 ∈ N , então, pela lema 1.1.1, ab−1 N = N e daı́ [(ab−1 )N ](bN ) =
(eN )(bN ). Logo ((ab−1 )b)N = (eb)N , daı́ (a(bb−1 ))N = bN e portanto (ae)N = bN , isto
é, aN = bN .
Reciprocamente, se aN = bN , então (aN )(b−1 N ) = (bN )(b−1 N ). Logo (ab−1 )N =
(bb−1 )N , daı́ (ab−1 )N = eN = N e pelo lema 1.1.1 segue que ab−1 ∈ N .
1.1.4
Homomorfismo
Definição 1.1.2 Dados os grupos (G, .) e (H, ∗), onde em G é definida a operação . e
em H é definida a operação ∗, chamamos de homomorfismo uma aplicação f : G → H
tal que f (g1 .g2 ) = f (g1 ) ∗ f (g2 ) ∀g1 , g2 ∈ G, isto é, f preserva as operações.
Teorema 1.1.7 Dados os grupos (G, .) e (H, ∗) e o homomorfismo f : G → H, temos
que:
1. f (eG ) = eH , onde eG é o elemento neutro de G e eH é o elemento neutro de H.
2. f (a−1 ) = f (a)−1 .
10
Demonstração:
1. Temos que f (eG ) = f (eG .eG ) = f (eG ) ∗ f (eG ). Daı́ f (eG ) = f (eG ) ∗ f (eG ). Logo
f (eG ) ∗ f (eG )−1 = [f (eG ) ∗ f (eG )] ∗ f (eG )−1 e portanto eH = f (eG ).
2. Temos que eH = f (eG ) = f (a.a−1 ) = f (a) ∗ f (a−1 ). Logo f (a) ∗ f (a−1 ) = eH . Daı́
f (a)−1 ∗ [f (a) ∗ f (a−1 )] = f (a)−1 ∗ eH . Segue que f (a−1 ) = f (a)−1 .
Teorema 1.1.8 Seja N um subgrupo normal do grupo G, a aplicação f : G → G/N dada
por a 7→ a + N é um homomorfismo sobrejetor denominado de homomorfismo canônico.
Frequentemente denotamos o elemento a + N de G/N por a.
Demonstração:
Com efeito, se a = b, então a − b = 0 e portanto a − b ∈ N . Pelo
teorema 1.1.6 segue que a + N = b + N . Logo f (a) = f (b) e portanto a aplicação esta
bem definida. Agora todo y ∈ G/N por definição é da forma y = a + N . Logo tomemos
x = a ∈ G e daı́ f (x) = a + N = y. Segue que f é sobrejetora. Finalmente temos que
f (a + b) = (a + b) = a + b = f (a) + f (b) ∀a, b ∈ G.
Definição 1.1.3 Definimos como monomorfismo a todo homomorfismo injetor, epimorfismo a todo homomorfismo sobrejetor e isomorfismo a todo homomorfismo bijetor.
Definição 1.1.4 Dados os grupos (G, .) e (H, ∗) e o homomorfismo f : G → H chamamos
de núcleo do homomorfismo f e denotamos por Kerf ou N (f ) ao conjunto Kerf = {x ∈
G | f (x) = eH }.
Teorema 1.1.9 Dado um grupo G, entendemos como automorfismo a todo isomorfismo
de G em si mesmo. O conjunto de todos os automorfismos de G, que representamos por
AutG é um grupo.
Demonstração:
A operação que vamos tomar em AutG é a composição de funções.
Então provemos primeiramente que a composição de homomorfismo é um homomorfismo.
Com efeito, (f ◦ g)(x + y) = f (g(x + y)) = f (g(x) + g(y)) = f (g(x)) + f (g(y)) =
(f ◦ g)(x) + (f ◦ g)(y) A composição de funções é associativa. Com efeito, ((f ◦ g) ◦ h)(x) =
(f ◦g)(h(x)) = f (g(h(x))) = f ((g◦h)(x)) = (f ◦(g◦h))(x) O elemento neutro é a aplicação
11
identidade I(x) = x. (f ◦ I)(x) = f (I(x)) = f (x) e (I ◦ f )(x) = I(f (x)) = f (x). Dada a
aplicação f tal que f (x) = y a aplicação inversa é uma aplicação f −1 tal que f −1 (y) = x.
Logo (f −1 ◦ f )(x) = f −1 (f (x)) = f −1 (y) = x = I(x) e (f ◦ f −1 )(y) = f (f −1 (y)) = f (x) =
y = I(y).
Teorema 1.1.10 Dados os grupos (G, .) e (H, ∗), o homomorfismo f : G → H é injetor,
isto é, um monomorfismos se, e somente se Kerf = {eG }.
Demonstração:
Suponhamos que f seja injetor. Se f (x) = eH então pelo item 1
do teorema 1.1.7 temos que f (x) = f (eG ), e como f é injetor segue que x = eG . Logo
Kerf = {eG }.
Reciprocamente, suponhamos que Kerf = {eG }. Se f (x) = f (y), então f (x) ∗
f (y)−1 = eH , daı́ f (x) ∗ f (y −1 ) = eH , logo f (x.y −1 ) = eH . Como kerf {eG } segue
que x.y −1 = eG , daı́ x = y e portanto f é injetor.
Teorema 1.1.11 Dados os grupos (G, .) e (H, ∗) e o homomorfismo f : G → H, o núcleo
do homomorfismo, Kerf , é um subgrupo normal de G.
Demonstração:
Seja N = Kerf , dados x, y ∈ N , temos que f (x) = eH e f (y) = eH ,
−1
daı́ f (x.y −1 ) = f (x) ∗ f (y −1 ) = f (x) ∗ f (y)−1 = eH ∗ e−1
∈ N e portanto
H = eH . logo x.y
N é subgrupo de G. Além disso, para todo x ∈ N e todo g ∈ G temos que f (gxg −1 ) =
f (g) ∗ f (x) ∗ f (g −1 ) = f (g) ∗ eH ∗ f (g −1 ) = f (g) ∗ f (g −1 ) = f (g.g −1 ) = f (eG ) = eH , daı́
gxg −1 ∈ N e portanto N é um subgrupo normal de G.
Definição 1.1.5 Dados os grupos (G, .) e (H, ∗), dizemos que G é isomorfo a H e denotamos por G ≈ H se existir um isomorfismo de G em H.
Exemplo 1.1.3 f : Zm → Z/mZ definido por a 7→ a + mZ é um isomorfismo, logo
Zm ≈ Z/mZ.
Com efeito, dados x, y ∈ Zm temos que f (x + y) = f (x + y) = (x + y) + mZ =
(x + mZ) + (y + mZ) = f (x) + f (y). Logo f é um homomorfismo. Agora vejamos que f
é bijetor, e portanto um isomorfismo.
Se f (x) = mZ, então x + mZ = mZ, daı́ xx ∈ mZ, isto é x = 0, logo Kerf = {0} e
portanto f é injetor. Além disso para todo y = a + mZ ∈ Z/mZ tomemos x = a em Zm
e daı́ f (x) = f (a) = a + mZ = y, logo f é sobrejetor.
12
Exemplo 1.1.4 f : R2 → C dado por (a, b) 7→ a + bi é um isomorfismo, e portanto
R2 ≈ C.
Primeiramente mostremos que f é um homomorfismo. f ((a, b)+(a0 , b0 )) = f (a+a0 , b+
b0 ) = (a + a0 ) + (b + b)i = (a + bi) + (a0 + b0 i) = f (a, b) + f (a0 , b0 ). Agora mostremos que
f é bijetor.
Se f (a, b) = 0, então a + bi = 0, logo a = b = 0, daı́ Kerf + {(0, 0)} e portanto f é
injetor. Além disso, para todo y = a + bi ∈ C tomemos x = (a, b) e desta forma temos
f (x) = f (a, b) = a + bi = y.
Exemplo 1.1.5 O número a + bi onde a, b ∈ Z é chamado de inteiro gaussiano. O
conjunto {a + bi|a, b ∈ Z} é isomorfo a Z × Z. A demonstração deste fato é análoga ao
exemplo anterior.
Teorema 1.1.12 (Teorema do homomorfismo) Dados os grupos (G, .) e (H, ∗). Seja
f : G → H um homomorfismo e N = Kerf , temos que G/N ≈ f (G). Em particular, se
f é um epimorfismo, isto é, um homomorfismo sobrejetor, então G/N ≈ H.
Demonstração:
Considere a aplicação σ : G/N → f (G) dada por aN 7→ f (a).
Devemos verificar se tal aplicação está bem definida.
Com efeito, se aN = bN , então, pelo teorema 1.1.6, ab−1 ∈ N . Logo f (ab−1 ) = eH ,
isto é, f (a) ∗ f (b)−1 = eH , ou seja, f (a) = f (b), portanto σ(aN ) = σ(bN ).
Para provar que σ é injetora basta seguir o caminho inverso do raciocı́nio anterior, ou
então pode perceber que, se σ(aN ) = eH , então f (a) = eH . Logo a ∈ N , e pela afirmação
1.1.1 aN = N . Segue que Kerσ = {N }, e portanto σ é injetora. Lembre-se que N é o
elemento neutro de G/N .
Agora, para todo y ∈ f (G), existe a ∈ G tal que f (a) = y, então tomemos x = aN
em G/N e assim temos que σ(x) = σ(aN ) = f (a) = y. Logo σ é sobrejetora.
Por fim, dados aN, bN ∈ G/N temos que σ((aN )(bN )) = σ((ab)N ) = f (ab) = f (a) ∗
f (b) = σ(aN ) ∗ σ(bN ), logo σ é homomorfismo. Segue G/N ≈ f (G).
1.2
Anéis
Na seção 1.1 definimos grupo como um conjunto não vazio munido de uma operação
que é uma aplicação G × G → G satisfazendo a três axiomas. Para definir um anel
13
precisamos de duas operações sendo que para uma delas o conjunto dado é grupo.
Definição 1.2.1 Chamamos de Anel ao conjunto não vazio A, munido de duas operações,
que para simplificar a notação vamos chamá-las de adição + e multiplicação ., satisfazendo
as seguintes condições.
1. A é grupo abeliano em relação a adição.
2. A multiplicação é associativa, isto é, a(bc) = (ab)c, ∀a, b, c ∈ A.
3. Vale a distributiva, isto é, a(b + c) = ab + ac e (a + b)c = ac + bc, ∀a, b, c ∈ A.
Se além das condições supracitadas for verdade que ab = ba, ∀a, b ∈ A, então A é um
anel comutativo e se existir 1 ∈ A tal que a.1 = 1.a = a ∀a ∈ A dizemos que A é um
anel com unidade. Se as duas condições forem satisfeita, então dizemos que A é um anel
comutativo com unidade. Neste texto sempre que nos referirmos a anel estaremos falando
de anel comutativo com unidade. Usamos a notação (A, +, .) para denotar que A é anel
com estas operações. Além disso, se para todo a ∈ A e a 6= 0 existir b ∈ A tal que ab = 1,
então dizemos que A é um corpo.
Exemplo 1.2.1 Z é um anel com as operações usuais.
Exemplo 1.2.2 Zn , o conjunto dos inteiros módulo n, é anel com as operações usuais.
Exemplo 1.2.3 Seja A um anel, o conjunto das matrizes quadradas de ordem n com
entradas em A é um anel não-comutativo com as operações usuais de matrizes.
Teorema 1.2.1 Em todo anel A temos que, ∀a, b ∈ A.
1. a0 = 0
2. (−1)a = −a
3. (−a)b = −(ab)
4. (−a)(−b) = ab
onde 0 é o elemento neutro da adição.
Demonstração:
14
1. Note que a0 = a(0 + 0) = a0 + a0, isto é, a0 = a0 + a0. Desta forma, a.0 − a.0 =
(a0 + a0) − a0, daı́ 0 = a0 + (a0 − a0), e portanto 0 = a0.
2. Note que a + (−1)a = 1a + (−1)a = (1 + (−1))a = 0a = 0, isto é, a + (−1)a = 0, e
daı́ −a +(a +(−1)a) = −a +0, logo (−a + a)+ (−1)a = −a, ou seja, 0 + (−1)a = −a
e portanto (−1)a = −a.
3. Note que (−a)b + ab = ((−a) + a)b = 0b = 0, isto é, (−a)b + ab = 0, daı́ ((−a)b +
ab) − (ab) = 0 − (ab), logo (−a)b + (ab − (ab)) = −(ab), isto é, (−a)b + 0 = −(ab),
e portanto (−a)b = −(ab).
4. Note que (−a)(−b) + (−(ab)) = (−a)(−b) + (−a)b = (−a)((−b) + b) = (−a)0 = 0,
isto é, (−a)(−b) + (−(ab)) = 0, daı́ [(−a)(−b) + (−(ab))] + ab = 0 + ab, logo
(−a)(−b)+[(−(ab))+ab] = ab, ou seja, (−a)(−b)+0 = ab, portanto (−a)(−b) = ab.
Definição 1.2.2 Seja A um anel, o subconjunto S de A é um subanel de A, se for anel
com as mesmas operações de A.
Definição 1.2.3 Dados os anéis (A, +, .) e (B, +, .) chamamos de homomorfismo de
anéis a toda aplicação f : A → B tal que f (a + b) = f (a) + f (b) e f (ab) = f (a)f (b),
∀a, b ∈ A. Assim como na definição 1.1.3 definimos monomorfismo, epimorfismo e isomorfismo de anéis a todo homomorfismo injetor, sobrejetor e bijetor, respectivamente.
Dois anéis serão ditos isomorfos se existir um isomorfismo entre eles.
Teorema 1.2.2 Seja f : A → B um homomorfismo de anéis é verdade que:
1. f (0A ) = 0B
2. f (−a) = −f (a)
Demonstração:
Segue da definição 1.2.1 item 1 e do teorema 1.1.7.
Vale ressaltar que nem sempre se tem que f (1A ) = f (1B ), onde 1A é a unidade do anel
A e 1B é a unidade do anel B.
15
Teorema 1.2.3 Seja A um corpo, se existe um homomorfismo sobrejetor de anéis de A
em B, então B também é corpo.
Demonstração:
Como f é sobrejetor segue que f (1A ) = 1B . Com efeito, como f é
sobrejetor, então existe x ∈ A tal que f (x) = 1B . Agora suponhamos que f (1A ) = y 6= 1B .
Daı́ f (1A )f (x) = y1B . Logo f (x) = y. Concluı́mos que f (x) = 1B e f (x) = y, o que é um
absurdo. O absurdo é proveniente da hipótese de que y 6= 1B . Logo f (1A ) = 1B .
Agora, dado um 0 6= b ∈ B temos pela sobrejetividade de f que existe 0 6= a ∈ A tal
que f (a) = b. Como A é um corpo segue que existe a−1 . Então tomemos b0 = f (a−1 ) ∈ B
e daı́ bb0 = f (a)f (a−1 ) = f (aa−1 ) = f (1A ) = 1B , isto é, b0 = b−1 . Portanto todo elemento
não nulo b ∈ B possui um inverso multiplicativo. Logo B é um corpo.
1.2.1
Ideais
Definição 1.2.4 Dado o anel A, chamamos de ideal de A, a todo subconjunto I que
satisfaz as seguintes condições:
1. se a, b ∈ I então a − b ∈ I. (I é grupo em relação à adição)
2. se a ∈ I e c ∈ A, então ac ∈ I.
Exemplo 1.2.4 O conjunto nZ é um ideal do anel Z.
Com efeito, se a, b ∈ nZ, então existem x, y ∈ Z tais que a = nx, b = ny e daı́,
a − b = nx − ny = n(x − y) ∈ nZ. Além disso, dados a ∈ nZ e c ∈ Z, temos que a = nx,
com x ∈ Z e daı́ ac = (nx)c = n(xc) ∈ nZ.
Exemplo 1.2.5 Dado um subconjunto X = {a1 , · · · , an } de um anel A. O conjunto
(X) = {a1 x1 + · · · + an xn |xi ∈ A} é um ideal de A.
Com efeito, sejam x = a1 x1 + · · · + an xn e y = a1 y1 + · · · + an yn ∈ (X), temos que
x − y = (a1 x1 + · · · + an xn ) − (a1 y1 + · · · + an yn ) = a1 (x1 − y1 ) + · · · + an (xn − yn ) ∈ (X), já
que xi −yi ∈ A. Além disso, ∀z ∈ A, zx = z(a1 x1 +· · ·+an xn ) = (za1 )x1 +· · ·+(zan )xn =
(a1 z)x1 + · · · + (an z)xn = a1 (zx1 ) + · · · + an (zxn ) ∈ (X), já que zxi ∈ A. Em particular,
quando X = {a}, escrevemos (a) no lugar de (X). O ideal (a) é denominado ideal
principal. Um anel em que todo ideal é principal é denominado de anel principal. Z é
um anel principal.
16
Teorema 1.2.4 Dados os ideais I e J de um anel A. O conjunto I + J de todas somas
i + j, com i ∈ I e j ∈ J, e o conjunto I ∩ J também são ideais de A.
Demonstração:
Se a, b ∈ I + J, então existem i1 , i2 ∈ I e j1 , j2 ∈ J tais que a = i1 + j1
e b = i2 + j2 . Segue que a − b = (i1 + j1 ) − (i2 + j2 ) = (i1 − i2 ) + (j1 − j2 ) ∈ I + J. Além
disso, se a ∈ I + J e c ∈ A, então ac = (i1 + j1 )c = i1 c + j1 c ∈ I + J, já que i1 c ∈ I e
j1 c ∈ J. Logo I + J é ideal de A.
Agora, se a, b ∈ I ∩ J e c ∈ A, então a, b ∈ I e a, b ∈ J. Daı́, como I e J são ideais,
a − b, ac ∈ I e a − b, ac ∈ J, logo a − b, ac ∈ I ∩ J, portanto I ∩ J é um ideal de A.
Definição 1.2.5 Seja I um ideal do anel A, definimos classe lateral ao conjunto a + I =
{a + i| a ∈ A, i ∈ I}
Como todo anel é um grupo abeliano aditivo não se faz necessária a distinção entre
classe lateral à esquerda ou à direita.
Teorema 1.2.5 Seja I um ideal do anel A, o conjunto A/I de todas as classes laterais
é um anel.
Demonstração:
Precisamos definir duas operações em A/I satisfazendo as condições
da definição 1.2.1. Então definimos as operações (a + I) + (b + I) = (a + b) + I e
(a + I)(b + I) = ab + I, onde o elemento neutro da adição é I e o da multiplicação é 1 + I.
Sabemos do teorema 1.1.5 que a primeira delas está bem definida e satisfaz o axioma 1 da
definição 1.2.1. A demonstração de que a segunda operação está bem definida e satisfaz
as demais condições da definição de anel fica como exercı́cio para o leitor.
Teorema 1.2.6 Dado o homomorfismo de anéis f : A → B, o núcleo de f é um ideal de
A.
Demonstração:
Inicialmente ressaltamos que a definição de núcleo aqui usada é
análoga a definição para grupos, isto é, o núcleo de f é o conjunto Kerf = {x ∈ A|f (x) =
0}. Então, tomemos a, b ∈ Kerf , segue que f (a − b) = f (a) − f (b) = 0 − 0 = 0, logo
a − b ∈ Kerf . Além disso, dado a ∈ Kerf e c ∈ A, temos que f (ac) = f (a)f (c) =
0.f (c) = 0, logo ac ∈ Kerf . Portanto Kerf é um ideal de A.
17
Teorema 1.2.7 Seja I um ideal do anel A a aplicação f : A → A/I definida por a 7→ a+I
é um homomorfismo denominado de homomorfismo canônico.
Demonstração:
Pelo teorema 1.1.8 f está bem definida é sobrejetiva e preserva
a soma. Então basta provar que f preserva a multiplicação. Com efeito, temos que
f (ab) = ab = ab = f (a)f (b), ∀a, b ∈ A.
Teorema 1.2.8 (Teorema do homomorfismo para anéis) Seja f : A → B um homomorfismo de anéis e Kerf o seu núcleo, temos que A/Kerf e f (A) são isomorfos.
Em particular, se f é sobrejetor então A/Kerf ≈ B.
Demonstração:
Ora, como A, B são grupos aditivos então pelo teorema 1.1.7 σ é
bijetor e σ(x + y) = σ(x) + σ(y) ∀x, y ∈ f (A). Agora basta provar que σ(x.y) = σ(x).σ(y)
∀x, y ∈ f (A). Com efeito, σ(x.y) = x.y + Kerf = (x + Kerf ).(y + Kerf ) = σ(x).σ(y).
Definição 1.2.6 Dado um anel A, dizemos que um ideal I 6= A é um ideal primo sempre
que a seguinte condição é satisfeita. Se ab ∈ I então a ∈ Iou b ∈ I.
Exemplo 1.2.6 Se p é primo, então pZ é um ideal primo de Z.
Com efeito, se ab ∈ pZ, então existe n ∈ Z tal que ab = pn, isto é, p divide ab, daı́ p|a
ou p|b, isto é, a ∈ pZ ou b ∈ pZ.
Definição 1.2.7 Um ideal I de um anel A é maximal se I 6= A e para todo ideal J tal
que I ⊂ J ⊂ A tem-se que I = J ou J = A.
Exemplo 1.2.7 2Z é um ideal maximal do anel Z.
Com efeito, tomemos um ideal J tal que 2Z ⊂ J ⊂ Z. Se J 6= 2Z, então existe x tal
que x ∈ J e x não pertence a 2Z. Segue que x = 2k + 1 com k ∈ Z. Mas 2k ∈ 2Z e
portanto 2k ∈ J, daı́ pela definição 1.2.4 1 = (2k + 1) − 2k ∈ J. Novamente pela definição
1.2.4, segue que ∀a ∈ Z a = a.1 ∈ J, daı́ J = Z.
Teorema 1.2.9 Todo ideal maximal é primo.
18
Demonstração:
Seja M um ideal maximal do anel A. Suponhamos que ab ∈ M , mas
a 6∈ M . Ora M ⊂ M + (a) ⊂ A. Daı́, como M é maximal, segue que M + (a) = M
ou M + (a) = A. Se M + (a) = M , então podemos encontrar m1 , m2 ∈ M tais que
m1 + a = m2 . Logo a = m2 − m1 ∈ M , mas por hipótese a 6∈ M . Segue que M + (a) 6= M .
Logo M + (a) = A. Daı́ 1 ∈ M + (a). Então podemos encontrar m ∈ M e n ∈ A tais
que 1 = m + na. Multiplicando esta última equação por b, obtemos b = mb + nab. Logo
b ∈ M , já que ab ∈ M e m ∈ M . Portanto M é primo, pois provamos que se ab ∈ M ,
então a ∈ M ou b ∈ M .
Teorema 1.2.10 Seja A um anel e I um ideal de A, temos que A/I é corpo sempre que
I é maximal.
Demonstração:
Suponhamos que A/I não seja um corpo. Logo existe um elemento
a + I não invertı́vel, isto é, não existe b + I ∈ A/I tal que (a + I)(b + I) = 1 + I. Mas se
(a + I)(b + I) = 1 + I, então ab + I = 1 + I e pelo teorema 1.1.6 segue que ab − 1 ∈ I.
Concluı́mos que se a + I não é invertı́vel então ab − 1 ∈
/ I ∀b ∈ A. Tomemos agora o ideal
M = I + (a) ⊃ I. 1 ∈
/ M , pois caso contrário existiria c ∈ I e b ∈ A tal que 1 = c + ab,
logo ab − 1 = −c ∈ I o que é um absurdo. Logo M ⊃ I e M 6= A, portanto I não é
maximal.
É fácil ver que a aplicação f : Z → Zn é um homomorfismo sobrejetor e o seu núcleo
é Kerf = nZ. Segue do teorema fundamental do homomorfismo para anéis que Z/nZ é
isomorfo a Zn , o que já tı́nhamos provado no exemplo 1.1.3. Mas p é primo se, e somente
se, pZ é maximal, e portanto, pelo teorema 1.2.10 Z/pZ é corpo. Logo Zp é corpo se, e
somente se p é primo.
1.2.2
Anéis de polinômios
Dado um corpo F , definimos um polinômio sobre F na indeterminada x à toda exk
X
k
k−1
ai xi , onde ai ∈ F e
pressão do tipo ak x + ak−1 x
+ · · · + a1 x + a0 , ou simplesmente
i=0
x é um elemento de F tomado arbitrariamente. Definimos como grau do polinômio não
k
X
ai xi como sendo o maior expoente da indeterminada x cujo coeficiente é
nulo p(x) =
i=0
não nulo, neste caso gr(p(x)) = k, desde que ak 6= 0.
19
Teorema 1.2.11 O conjunto F [x] de todos os polinômios sobre o corpo F na indeterminada x é um anel com as operações usuais.
Demonstração:
Para demonstrar este fato precisamos definir duas operações sobre
k1
k2
X
X
(1) i
(2)
ai x , p2 (x) =
ai xi ∈ F [x], tomemos, sem
F [x]. Com efeito, dados p1 (x) =
i=0
i=0
k2
X
perda de generalidade que k1 < k2 . Então tomemos p1 (x) =
(1)
ai xi
=
(1)
(1)
ai xi , onde ai
(1)
a i xi +
i=0
i=0
k2
X
k1
X
= 0 para todo i > k1 . Daı́ podemos definir a soma como p1 (x) +
i=k1 +1
k2
X
p2 (x) = (p1 + p2 )(x) =
(1)
(2)
(ai + ai )xi . É fácil ver que F [x] é um grupo abeliano com
i=0
esta operação. Com efeito,
1. Associatividade da adição
k1
X
Dados p1 (x) =
(1)
ai xi ,
k2
X
p2 (x) =
i=0
k1
X
X
(3)
(ai + ai )xi =
i=0
(3)
(1)
ai xi
+[
k2
X
(2)
ai xi
+
i=0
(1)
(2)
(1)
(3)
ai xi ∈ F [x] temos
(3)
a i xi ]
=
i=0
max{k1 ,k2 ,k3 }
(3)
i=0
X
k3
X
[ai + (ai + ai )]xi =
X
k1
X
(1)
a i xi +
i=0
(1)
(2)
[(ai + ai ) +
i=0
max{k1 ,k2 }
ai ]xi =
p3 (x) =
i=0
i=0
max{k1 ,k2 ,k3 }
max{k2 ,k3 }
(2)
k3
X
i=0
que p1 (x) + [p2 (x) + p3 (x)] =
X
(2)
ai xi ,
(2)
(ai + ai )xi ] +
i=0
k3
X
(3)
ai xi = [p1 (x) + p2 (x)] + p3 (x).
i=0
2. Existência do elemento neutro
k0
k1
X
X
(1)
i
O elemento neutro é p0 (x) =
0x , pois para todo p1 (x) =
ai xi temos que
i=0
i=0
max{k0 ,k1 }
p0 (x) + p1 (x) =
X
(1)
(0 + ai )xi =
i=0
k1
X
(1)
ai xi = p1 (x).
i=0
Em geral, quando não houver risco de confusão representaremos p0 (x) simplesmente
por 0.
3. Simetrização
O simétrico de p1 (x) =
k1
X
(1)
ai xi
é (−p1 )(x) =
i=0
i=0
k1
X
i=0
(1)
(1)
(ai + (−ai ))xi =
k1
X
k1
X
0xi = 0.
i=0
4. Comutatividade da adição
20
(1)
(−ai )xi , pois p1 (x)+(−p1 )(x) =
Dados p1 (x) =
k1
X
(1)
ai xi ,
p2 (x) =
k2
X
i=0
k1
X
(1)
ai xi +
i=0
k1
X
(2)
ai xi ∈ F [X], temos que p1 (x) + p2 (x) =
i=0
max{k1 ,k2 }
max{k1 ,k2 }
k2
X
(2)
ai xi
X
=
i=0
(1)
(2)
(ai +ai )xi
X
=
i=0
(2)
(1)
(ai +ai )xi =
i=0
k2
X
(2)
ai xi +
i=0
(1)
ai xi = p2 (x) + p1 (x).
i=0
Agora para provar que F [x] é um anel precisamos de uma segunda operação. Então
definimos a multiplicação de polinômios como
k1
X
onde
(3)
ai
=
(1)
ai xi
.
k2
X
=
kX
1 +k2
i=0
i=0
X
(2)
ai xi
(3)
ai xi
i=0
(2)
a(1)
s at .
s+t=i
1. Associatividade da multiplicação.
k1
X
Sejam p1 (x) =
(1)
a i xi ,
i=0
k1
X
que p1 (x)p2 (x) =
(1)
a i xi .
[p1 (x)p2 (x)]p3 (x) =
(
i=0
(1) (2) (3)
as at )av =
X
u+v=i s+t=u
X
a(1)
s (
s+u=i
X
(2)
a i xi ,
p3 (x) =
i=0
i=0
kX
1 +k2
X
p2 (x) =
k2
X
(2)
at a(3)
v ),
k2
X
(2)
a i xi =
(4)
ai xi .
(3)
ai xi ∈ F [x], temos
i=0
kX
1 +k2
i=0
k3
X
k3
X
(4)
(4)
ai xi , onde ai
i=0
k1 +k
2 +k3
X
(3)
ai xi =
i=0
(2) (3)
(a(1)
s at )av
s+t+v=i
X
i=0
=
X
=
(2)
a(1)
s at . Logo
s+t=i
(5)
X
(5)
ai xi , onde ai =
(3)
a(4)
u av =
u+v=i
X
(2) (3)
a(1)
s (at av )
=
s+t+v=i
mais estes são exatamente os coeficientes de p1 (x)[p2 (x)p3 (x)],
t+v=u
isto implica que [p1 (x)p2 (x)]p3 (x) = p1 (x)[p2 (x)p3 (x)].
2. Comutatividade da multiplicação.
p1 (x)p2 (x) =
k1
X
(1)
ai xi .
k2
X
i=0
(2)
a i xi
=
i=0
kX
1 +k2
(
i=0
X
(2) i
a(1)
s at )x
=
kX
2 +k1
i=0
s+t=i
X
(
(2)
i
at a(1)
s )x =
s+t=i
p2 (x)p1 (x).
3. Distributividade
Dados p1 (x) =
k1
X
(1)
a i xi ,
p2 (x) =
i=0
que p1 (x)[p2 (x) + p3 (x)] =
k1
X
(1)
k2
X
i=0
k2
X
ai xi .(
i=0
(3)
ai )xi =
kX
1 +k3
i=0
(
X
(2)
3
i
a(1)
s (at +at ))x =
s+t=i
(2)
ai xi ,
(2)
ai xi +
i=0
21
(3)
ai xi ∈ F [x], temos
i=0
i=0
kX
1 +k3
p1 (x)p2 (x) + p1 (x)p3 (x).
p3 (x) =
k3
X
k3
X
(3)
ai xi ) =
i=0
(
X
s+t=i
(2)
i
a(1)
s at )x +
k1
X
(1)
ai xi .
k3
X
(2)
(ai +
i=0
i=0
kX
1 +k3
X
i=0
s+t=i
(
(3)
i
a(1)
s at )x =
Note que não usamos o fato de F ser um corpo. Usamos apenas o fato de F ser um
anel. A necessidade de F ser corpo vai garantir que F [x] seja um domı́nio de integridade.
Um domı́nio de integridade é um anel que possui a propriedade de que o produto de dois
elementos não nulos resulta em um elemento ainda não nulo.
Afirmação 1.2.1 Seja A um anel e sejam p1 (x), p2 (x) ∈ A[x] tais que p1 (x), p2 (x) 6= 0.
Segue que se A[X] é um domı́nio de integridade, então gr(p1 (x)p2 (x)) = gr(p1 (x)) +
gr(p2 (x))
Demonstração:
Segue diretamente da definição de multiplicação em A[x]. A igual-
dade acima só não valeria se tivéssemos dois polinômios não nulos p1 (x) e p2 (x) tais que
p1 (x)p2 (x) = 0, o que jamais ocorre já que A[x] é um domı́nio de integridade.
Definição 1.2.8 Uma raiz de um polinômio p(x) sobre um anel A é um elemento a ∈ A
tal que p(a) = 0
1.2.3
Funções simétricas
Nós definimos o anel de polinômios A[x] na indeterminada x sobre o anel A. Podemos
definir também A[x, y] = (A[x])[y] como sendo o anel de polinômios nas indeterminadas
x e y sobre A. Assim definimos por recorrência (A[x1 , · · · , xn−1 ])[xn ] = A[x1 , · · · , xn ], o
anel de polinômios nas indeterminadas x1 , · · · , xn sobre A. Os elementos de A[x1 , · · · , xn ]
são da forma
p(x1 , · · · , xn ) =
X
ai1 ···in xi11 · · · xinn
0≤i1 ≤r1
···
0≤in ≤rn
O grau de p(x1 , · · · , xn ) é o máximo das somas i1 + · · · + in para ai1 ···in 6= 0, por
exemplo, o polinômio p(x1 , x2 ) = a00 + a01 x2 + a10 x1 + a11 x1 x2 é um polinômio de duas
indeterminadas e de grau dois.
Um polinômio em A[x1 , x2 ] é dito simétrico se p(x1 , x2 ) = p(x2 , x1 ), por exemplo, os
polinômios s1 (x1 , x2 ) = x1 + x2 e s2 (x1 , x2 ) = x1 x2 são os chamados polinômios simétricos
elementares.
Definimos na seção 1.1 do capı́tulo 1 o grupo das bijeções Sn agindo sobre A =
{1, · · · , n}. Podemos fazer Sn agir sobre A(x1 , · · · , xn ), onde A(x1 , · · · , xn ) é o corpo
22
de frações de A[x1 , · · · , xn ], isto é, A(x1 , · · · , xn ) =
½
¾
p(x1 , · · · , xn )
=
| p(x1 , · · · , xn ), q(x1 , · · · , xn ) ∈ A[x1 , · · · , xn ] e q(x1 , · · · , xn ) 6= 0 .
q(x1 , · · · , xn )
Procederemos da seguinte forma; Dado σ ∈ Sn e r(x1 , · · · , xn ) ∈ A(x1 , · · · , xn ) definimos uma aplicação de A(x1 , · · · , xn ) em si mesmo dada por
r(x1 , · · · , xn ) 7→ r(xσ(1) , · · · , xσ(n) ).
Chamaremos esta aplicação também de σ. Os elementos r(x1 , · · · , xn ) de A(x1 , · · · , xn )
tais que r(x1 , · · · , xn ) = r(xσ(1) , · · · , xσ(n) ) são chamados de funções racionais simétricas.
Não é difı́cil ver que r1 , · · · , rn ∈ A(x1 , · · · , xn ) tais que
r1 (x1 , · · · , xn ) =
n
X
xi = x1 + · · · + xn
1
r2 (x1 , · · · , xn ) =
X
xi xj = x1 x2 + x1 x3 + · · · + xn−1 xn
i<j
r3 (x1 , · · · , xn ) =
...
X
xi xj xk = x1 x2 x3 + x1 x2 x4 + · · · + xn−1 xn−2 xn−3
i<j<k
rn (x1 , · · · , xn ) = x1 · · · xn
são funções racionais simétricas. Estas são as chamadas funções simétricas elementares.
Para simplificar a notação escrevemos a1 = r1 (x1 , · · · , xn ), · · · , a2 = r2 (x1 , · · · , xn ).
Segue que para cada xi temos que xni − a1 xn−1
+ · · · + (−1)n an = 0. Então as funções
i
simétricas elementares nos fornecem relações entre os coeficientes e as raı́zes de um
polinômio.
23
Capı́tulo 2
Solução de equações polinomiais de
grau ≤ 4
Dado um polinômio p(x) sobre um corpo F , definimos equação polinomial como
equação p(x) = 0.
A busca de soluções para equações polinomiais tem grande importância na história da
matemática, uma vez que propulsou o desenvolvimento de novas teorias. Já no final do
século XVI a comunidade matemática já havia solucionado as equações polinomiais de
grau menor que cinco. A partir daı́ os matemáticos se empenharam para resolver a equação
quı́ntica, isto é, a equação polinomial do quinto grau. Contudo em 1824 o matemático
norueguês Niels Abel provou que é impossı́vel resolver equações polinomiais de grau maior
que 4. Isto quer dizer que a raiz da equação não pode ser escrita explicitamente em função
√
de seus coeficientes utilizando as operações +, ., n . Esta é exatamente a noção de solução
por radicais. Infelizmente Abel morreu sem ter seu devido reconhecimento.
O leitor pode se questionar sobre a impossibilidade de se solucionar equações polinomiais de grau maior que cinco, pois é fácil ver que a equação x5 −32 = 0 pode ser resolvida
por radicais. Na verdade o que se prova é a insolubilidade da equação geral. Nesta perspectiva, Everiste Galois se propõe a estudar sobre quais condições um dado polinômio é
resolúvel por radicais. Para isto ele estabelece uma relação entre o que chamamos de grupo
de Galois e o chamado corpo de raı́zes do polinômio. Com isto ele consegue provar que
equação geral de grau maior que cinco não é resolúvel por radicais. Mas estas idéias serão
trabalhadas no próximo capı́tulo. Neste capı́tulo trataremos das equações polinomiais de
grau menor que cinco tomando polinômios definidos sobre o corpo dos reais.
25
2.1
Equação quadrática
Começaremos com a equação quadrática, pois o caso linear é trivial. Seja a equação
a2 x2 + a1 x + a0 = 0, onde a2 6= 0.
Façamos a substituição x = y −
a2 (y −
a1
. Daı́ obtemos;
2a2
a1
a1 2
) + a1 (y −
) + a0 = 0
2a2
2a2
Logo,
a2 y 2 +
a21
a2
− 1 + a0 = 0
4a2 2a2
daı́,
p
y=±
Mas, como x = y −
a21 − 4a2 a0
2a2
a1
, segue que
2a2
a1
x=−
±
2a2
2.2
p
a21 − 4a2 a0
2a2
Equação cúbica
Dada a equação
a3 x3 + a2 x2 + a1 x + a0 = 0, com a3 6= 0
(2.1)
Sempre podemos reescrevê-la como
x3 + A2 x2 + A1 x + A0 = 0
Fazendo x = y −
A2
, obtemos
3
1
2
1
y 3 − (A1 − A22 )y + A32 − A1 A2 + A0 = 0
3
27
3
Então podemos reescrever a equação de uma forma ainda mais simples, como
y 3 + py + q = 0
Agora, seja y = u + v uma raiz da equação. Segue que
(u + v)3 + p(u + v) + q = 0
26
(2.2)
Daı́,
u3 + v 3 + (3uv + p)(u + v) + q = 0
Segue que y = u + v é uma solução da equação 2.2 se o sistema não linear

 u3 + v 3 = −q
(1)
 3uv = −p
tiver solução. Mas toda solução deste sistema também é solução do sistema

 u3 + v 3 = −q
(2)
 u3 v 3 = − p3
27
Segue da definição de funções simétricas elementares que u3 e v 3 são as raı́zes da
equação do segundo grau
t2 + qt −
p3
=0
27
Resolvendo a equação obtemos
−q
t=
±
2
r³ ´
q 2 ³ p ´3
+
2
3
Como y = u + v, segue que uma solução de 2.2 é
s
s
r³ ´
r³ ´
³
´
2
3
p
q
q 2 ³ p ´3
3 −q
3 −q
+
+
+
y=
+
−
2
2
3
2
2
3
(2.3)
Esta é a conhecida fórmula de Cardan.
Agora, seja y1 = u + v a raiz da equação 2.2 obtida pela fórmula 2.3 onde u e v são tais
como no sistema (1) e seja w 6= 1 uma raiz cúbica da unidade temos que y2 = wu + wv
e y3 = wu + wv, também são raı́zes de 2.2. Isto pode ser demonstrado substituindo
diretamente y2 ou y3 em 2.3, ou ainda construindo as funções simétricas elementares em
a2
.
y1 , y2 , y3 . Portanto as raı́zes de 2.1 são xi = yi −
3a3
2.3
Equação quártica
Dada a equação
a4 x4 + a3 x3 + a2 x2 + a1 x + a0 = 0
(2.4)
Como fizemos na seção anterior podemos reescrever 2.4 como
x4 + A3 x3 + A2 x2 + A1 x + A0 = 0
27
(2.5)
e por meio da substituição x = y −
a3
escrevemos 2.5 como
4
y 4 + py 2 + qy + r = 0
(2.6)
Agora seja x = u + v + z uma raiz de 2.6, temos que
x2 − (u2 + v 2 + z 2 ) = 2(uv + uz + vz)
Elevando ambos os membros ao quadrado, temos
x4 − 2(u2 + v 2 + z 2 )x2 + (u2 + v 2 + z 2 )2 = 4(uv + uz + vz)2
Mas 4(uv + uz + vz)2 = 4(u2 v 2 + u2 z 2 + v 2 z 2 ) + 8(u2 vz + uv 2 z + uvz 2 ) = 4(u2 v 2 +
u2 z 2 + v 2 z 2 ) + 8uvz(u + v + z) = 4(u2 v 2 + u2 z 2 + v 2 z 2 ) + 8(uvz)x. Daı́,
x4 − 2(u2 + v 2 + z 2 )x2 − 8(uvz)x + (u2 + v 2 + z 2 )2 − 4(u2 v 2 + u2 z 2 + v 2 z 2 ) = 0


u2 + v 2 + z 2 =



Segue de 2.6 que
uvz = − 8q



 u2 v 2 + v 2 z 2 + z 2 u2 =
− p2
p2
−r
4
4
=
p2 −4r
16
Mas toda solução deste sistema é solução do sistema





u2
+
v2
u2 v 2 z 2 =
q2
64



 u2 v 2
+
z2
=
+ v 2 z 2 + z 2 u2 =
− p2
p2 −4r
16
Novamente usando a idéia de funções simétricas elementares concluı́mos que u2 , v 2 e
z 2 são as raı́zes da equação
p2 − 4r
q2
p
t−
=0
t3 + t2 +
2
16
64
(2.7)
Então o problema resume-se a resolver a equação cúbica 2.7 que já sabemos como
resolver. Porém nem toda solução do segundo sistema é uma solução do primeiro. Isto
quer dizer que as raı́zes de 2.7 podem não fornecer os u,v e w que procuramos. Para
resolver este problema podemos escolher duas raı́zes de 2.7 u2 e v 2 e a partir da relação
√
√
√
uvz = − 8q determinar o valor de z. Agora sendo u = α, v = β e z = γ, as raı́zes de
28
2.6 são
x1 =
x2 =
√
√
α
+
α
−
√
α
√
α
x3 =
−
x4 =
−
√
√
β
+
β
−
√
β
√
β
+
−
√
γ
√
γ
−
+
√
√
γ
γ
A partir das raı́zes de 2.6 é fácil determinar as raı́zes de 2.4.
Pela discussão que fizemos aqui somos impelidos a intuir que se pode dar o mesmo
tratamento para a equação polinomial geral de grau maior que 4. Poderı́amos, por exemplo, escrever uma raiz de um polinômio do quinto grau como x = u + v + z + t e utilizando
uma álgebra básica e um pouco de engenhosidade encontrarmos relações em termos das
funções simétricas elementares que reduziria o problema ao caso de grau quatro. Mas isto
na realidade não acontece.
O nosso objetivo agora é provar a impossibilidade de se resolver estas equações por
método direto. Na próxima seção apresentaremos alguns resultados sobre polinômios
culminando na demonstração de que as equações supracitadas não são resolúveis por
radicais.
29
Capı́tulo 3
Teoria de Galois
Antes de nos lançarmos sobre a Teoria de Galois veremos alguns resultados da Teoria
de Corpos.
3.1
Extensão de corpos
Como já vimos na seção 1.2 do capı́tulo 1 em Álgebra abstrata definimos corpo como
sendo um anel comutativo com unidade onde todo elemento não nulo possui um inverso
multiplicativo. Se um corpo K contém o corpo F , então dizemos que K é uma extensão
de F . Chamamos de grau de K sobre F e denotamos por [K : F ] a dimensão de K quando
visto como espaço vetorial sobre F . Desta forma, a extensão K de F será considerada
uma extensão finita se e somente se K for um espaço vetorial de dimensão finita sobre F .
Agora já temos dados suficientes para enunciar nosso primeiro resultado, cuja demonstração segue as idéias presentes em [6].
Teorema 3.1.1 Se K é uma extensão finita de F e F é uma extensão finita de P , então
K é uma extensão finita de P e [K : P ] = [K : F ].[F : P ].
Demonstração:
Com efeito, Sendo K uma extensão finita de F e F uma extensão
finita de P , podemos considerar [K : F ] = m e [F : P ] = n, com m e n inteiros positivos.
Desta forma tomemos {u1 , ..., um } uma base para K e {v1 , ..., vn } uma base para F . Segue
que para todo u ∈ K existem α1 , ..., αm ∈ F tais que u = α1 u1 + ... + αm um . Por outro
n
X
lado para cada αi ∈ F existem βi1 , ..., βin ∈ P tais que αi = βi1 v1 + ... + βin vn =
βij vj .
j=1
31
Logo podemos inferir que u = u1
u=
X
n
X
β1j vj + ... + um
j=1
n
X
βmj vj . Disto podemos obter
j=1
βij ui vj .
1≤i≤m
1≤j≤n
A conclusão é que todo elemento u de K pode ser escrito como combinação linear dos
mn elementos ui vj de K com coeficientes em P . Então basta provar que que o conjunto
{ui vj } 1≤i≤m é linearmente independente.
1≤j≤n
n
n
X
X
X
Ora, se
βij ui vj = 0, então u1
β1j vj + ... + um
βmj vj = 0. Mas {u1 , ..., um }
j=1
1≤i≤m
1≤j≤n
é base, logo
n
X
j=1
βij vj = 0 para todo i ∈ {1, ..., m}. Mas {v1 , ..., vn } é base, logo βij = 0
j=1
para todo i e todo j.
Definição 3.1.1 Seja F um corpo, K uma extensão de F e a ∈ K, definimos F (a)
como a menor extensão de F que contém a. O corpo F (a) também pode ser visto como o
conjunto de todos os elementos que podem ser expressos como um quociente de polinômios
em a.
Definição 3.1.2 Uma raiz de um polinômio p(x) ∈ F [x] é um a ∈ K ⊃ F , tal que
p(a) = 0.
Definição 3.1.3 Seja F um corpo e K uma extensão de F . Um elemento a ∈ K é dito
algébrico sobre F quando é raiz de algum polinômio em F [x]. Um elemento a ∈ K é dito
algébrico de grau n se o polinômio de menor grau que ele é raiz tem grau n. Diremos que
tal polinômio(que é único) é minimal para a.
Definição 3.1.4 Uma extensão onde todo elemento é algébrico é chamada de extensão
algébrica.
Definição 3.1.5 Se não existir um polinômio p(x) ∈ F [x] tal que p(a) = 0, então o
elemento a ∈ K é dito transcendente. Uma extensão onde pelo menos um elemento é
transcendente é chamada de extensão transcendente.
Definição 3.1.6
Teorema 3.1.2 Seja F um corpo, K uma extensão de F e a ∈ K, temos que a é algébrico
de grau n sobre F se, e somente se, F (a) é uma extensão finita de F e [F (a) : F ] = n
32
Demonstração:
Se a é algébrico de grau n então existe um polinômio p(x) ∈ F [x]
de grau n e minimal para a. O polinômio p(x) é irredutı́vel em F [x]. Caso contrário
existiriam polinômios f (x), g(x) ∈ F [x] de graus menores que n tais que p(x) = f (x)g(x).
Segue que f (a)g(a) = p(a) = 0. Logo f (a) = 0 ou g(a) = 0. Mas isto contraria a hipótese
de que p(x) é minimal para a. Portanto temos um absurdo.
Além disso, todo polinômio f (x) que tem a como raiz é múltiplo de p(x).
De fato, pelo algoritmo da divisão temos que existem q, r ∈ F [x] tais que f (x) =
p(x)q(x) + r(x) onde 0 ≤ gr(r(x)) < gr(p(x)). Segue que r(a) = −p(a)q(a) + f (a) =
0.q(a) + 0 = 0. Como p(x) é minimal para a temos que r(x) = 0. Logo f (x) = p(x)q(x).
Segue das considerações acima que (p(x)) o ideal gerado por p(x) consiste de todos os
polinômios em F [X] que tem a como raiz.
Agora afirmamos que a aplicação φ : F [x] → F (a) dada por f (x) 7→ f (a) é um
homomorfismo sobrejetor e tem (p(x)) como núcleo.
max{k1 .k2 }
k1
k2
X
X
X
i
i
De fato, φ(
αi x +
βi x ) = φ(
(αi + βi )xi ) =
i=0
k1
X
k2
X
αi ai +
i=0
kX
1 +k2
=
i=0
fismo.
i=0
(
X
s+t=i
i=0
k1
X
βi ai = φ(
i=0
k2
X
αi xi )+φ(
i=0
k1
X
αs βt )ai =
i=0
k1
X
βi xi ) e φ(
i=0
αi ai .
k2
X
αi xi .
i=0
k2
X
max{k1 .k2 }
X
i=0
kX
1 +k2
βi xi ) = φ(
i=0
(αi + βi )ai =
i=0
(
X
αs βt )xi )
s+t=i
k1
k2
X
X
i
i
βi a = φ(
αi x ).φ(
βi xi ). Logo φ é homomor-
i=0
i=0
i=0
Agora tomemos o polinômio i(x) = x. A sua imagem pela φ é φ(i(x)) = i(a) = a.
Agora tomemos β ∈ F e tomemos o polinômio j(x) = β. A imagem de j(x) pela φ é
φ(j(x)) = j(a) = β. Segue que a imagem de φ é um subcorpo de F (a) que contém F e a.
Logo a imagem de φ, Imφ = F (a). Portanto φ é um homomorfismo sobrejetor.
Além disso, note que Kerφ = {f (x) ∈ F [x] | φ(f (x)) = 0} = {f (x) ∈ F [x] | f (a) =
0} = (p(x)).
Segue do teorema do homomorfismo que F [x]/(p(x)) é isomorfo a F (a). Pelo teorema
1.2.3, F [x]/(p(x)) é corpo.
O conjunto {1 + (p(x)), x + (p(x)), x2 + (p(x)), · · · , xn−1 + (p(x))} é uma base para
F [X]/(p(x)) quando visto como espaço vetorial sobre F .
De fato, mostremos primeiramente que o conjunto é linearmente independente. Então
dados α0 , ..., αn−1 ∈ F tais que α0 (1+(p(x)))+α1 (x+(p(x)))+· · ·+αn−1 (xn−1 +(p(x))) =
(p(x)). Segue que α0 + α1 x + · · · + αn−1 xn−1 + (p(x)) = (p(x)). Logo f (x) = α0 + α1 x +
33
· · · + αn−1 xn−1 ∈ (p(x)). Daı́ f (a) = 0, mas isto só acontece se α0 = α1 = · · · = αn−1 = 0,
já que p(x) é minimal para a e tem grau n.
Agora provemos que o conjunto é gerador. Com efeito, os elementos de F [x]/(p(x))
são da forma f (x) + (p(x)). Suponhamos que gr(f (x)) = k < n, então f (x) + (p(x)) =
α0 + α1 x + · · · + αk xk + 0xk+1 + · · · + 0xn−1 + (p(x)) = α0 (1 + (p(x))) + α1 (x + (p(x))) +
· · · + αk (xk + (p(x))) + 0(xk+1 + (p(x))) + · · · + 0(xn−1 + (p(x))).
Por outro lado, suponhamos que gr(f (x)) ≥ n. Pelo algoritmo da divisão segue que
f (x) = p(x)q(x) + r(x) onde 0 ≤ gr(r(x)) < gr(p(x)) e daı́ f (x) + (p(x)) = r(x) + (p(x)).
Logo o problema se reduz ao caso anterior. Portanto F [x]/(p(x)) é um espaço vetorial de
dimensão n sobre F , ou ainda uma extensão finita de grau n. Como F (a) é isomorfo a
F [x]/(p(x)) segue que F (a) é uma extensão finita de F e [F (a) : F ] = n.
Agora para provar a volta do teorema, suponhamos que [F (a) : F ] = n. Então F (a)
pode ser visto como um espaço vetorial sobre F de dimensão n. Sabemos da álgebra linear
que qualquer conjunto com mais de n vetores é linearmente dependente. Logo o conjunto
{1, a, a2 , a3 , · · · , an } é L.D., isto é, qualquer um de seus elementos pode ser escrito como
combinação linear dos demais. Então consideremos an = α0 1 + α1 a + · · · + αn−1 an−1 onde
αi ∈ F . Logo o polinômio f (x) = α0 + α1 x + · · · + αn−1 xn−1 − xn tem a como raiz. Logo a
é algébrico de grau n, pois se existisse um polinômio de grau diferente de n e que tivesse
a como raiz então F (a) seria uma extensão de F de grau diferente de n.
Teorema 3.1.3 Se a ∈ K é uma raiz de p(x) ∈ F [x], então existe q(x) ∈ K[x] tal que
p(x) = (x − a)q(x).
Demonstração:
Ora pelo algoritmo da divisão temos que p(x) = (x − a)q(x) + r(x)
e 0 ≤ gr(r(x)) < gr(x − a). Como gr(x − a) = 1, segue que r(x) é uma constante
ou o polinômio nulo. Mas r(a) = p(a) − (a − a)q(a) = 0. Portanto r(x) = 0, e daı́
p(x) = (x − a)q(x).
Definição 3.1.7 Dizemos que uma raiz a ∈ K do polinômio p(x) ∈ F [x], onde F é um
subcorpo de K, é de multiplicidade m se (x − a)m divide p(x) e (x − a)m+1 não divide.
Teorema 3.1.4 Se a1 , · · · , ak ∈ K são raı́zes de p(x) ∈ F [x] de multiplicidades n1 , · · · , nk
respectivamente, então existe q(x) ∈ K[x] tal que p(x) = (x − a1 )n1 . · · · .(x − ak )nk q(x).
34
Demonstração:
Ora, seja a1 uma raiz de p(x) de multiplicidade n1 . Segue que existe
q1 (x) ∈ K[x] tal que p(x) = (x − a1 )n1 q1 (x). Mas (a2 − a1 )n1 q1 (a2 ) = p(a2 ) = 0. Como
a2 6= a1 segue que q1 (a2 ) = 0, isto é, a2 é raiz de q1 (x). Logo existe q2 (x) ∈ K[x] tal que
q1 (x) = (x − a2 )n2 q2 (x), e daı́ p(x) = (x − a1 )n1 (x − a2 )n2 q2 (x). Repetindo sucessivamente
este processo para a3 , · · · , ak concluı́mos que p(x) = (x − a1 )n1 . · · · .(x − ak )nk qk (x).
Teorema 3.1.5 Seja f (x) um polinômio de grau n sobre o corpo F . O polinômio f (x)
pode ter no máximo n raı́zes em qualquer extensão de F .
Demonstração:
Vale ressaltar que uma raiz de multiplicidade ni está sendo contada
aqui ni vezes. Suponhamos que E seja uma extensão de F que contenha todas as raı́zes
de p(x). Sejam a1 , · · · , ak todas as raı́zes de p(x) de multiplicidades n1 , · · · , nk respectivamente. Pelo teorema 3.1.4 temos que p(x) = (x − a1 )n1 . · · · .(x − ak )nk q(x), onde
q(x) ∈ K[x]. Segue da afirmação 1.2.1 que o grau do polinômio (x − a1 )n1 . · · · .(x − ak )nk
é menor ou igual a n = gr(p(x)), o que demonstra o teorema.
Definição 3.1.8 Seja F um corpo e f (x) ∈ F [x] de grau n. Uma extensão K de F é um
corpo de raı́zes para f (x) se f (x) pode ser fatorado como um produto de fatores lineares
em K e não pode ser fatorado como um produto de fatores lineares em nenhuma extensão
de F de grau menor.
Teorema 3.1.6 Para todo polinômio f (x) de grau n sobre um corpo F existe uma extensão finita de F de grau no máximo n na qual f (x) tem uma raiz.
Demonstração:
Seja p(x) um fator irredutı́vel de f (x). Segue que as raı́zes de p(x)
são todas raı́zes de f (x). Então basta provar que existe uma extensão de F na qual p(x)
tem uma raiz.
O ideal (p(x)) de F [x] é maximal, já que p(x) é irredutı́vel. Logo pelo teorema 1.2.10
F [x]/(p(x)) é corpo. Segue do teorema 1.2.7 que a aplicação φ : F [x] → F [x]/(p(x))
dada por g(x) 7→ g(x) + (p(x)) é um homomorfismo sobrejetor. Logo a restrição φ\F :
F → F [x]/(p(x)) também é um homomorfismo sobrejetor. Além disso, dados α, β ∈ F ,
se α + (p(x)) = β + (p(x)), então α − β ∈ (p(x)). Segue que α − β = 0. Logo α = β e
35
portanto φ\F é injetiva. Concluı́mos que a imagem de F pela φ\F que denotaremos por
Im(F ) é isomorfa a F .
O que estamos a provar é que existe uma extensão de Im(F ) na qual p(x) = φ(p(x))
tem uma raiz. Notemos que φ(p(x)) = (p(x)), isto é, a imagem de p(x) pela φ é o zero
de F [x]/(p(x)). Por outro lado tomemos q(x) = β0 + β1 x + · · · + βk xk e denotemos
βi + (p(x)) por βi . Segue que φ(β0 + β1 x + · · · + βk xk ) = β0 + β1 x + · · · + βk xk . Logo
x = x + (p(x)) ∈ F [x]/(p(x)) é raiz do polinômio q(x) = β0 + β1 x + · · · + βk xk sobre
Im(F ).
Além disso, F [x]/(p(x)) é uma extensão de F de grau igual a gr(p(x)) ≤ n, uma
vez que, como já verificamos no decorrer da demonstração do teorema 3.1.2, o conjunto
{1 + (p(x)), x + (p(x)), · · · , xgr(p(x))−1 + (p(x))} é base para o espaço vetorial F [x]/(p(x)).
Teorema 3.1.7 Para todo polinômio f (x) de grau n sobre um corpo F existe uma extensão finita de F de grau no máximo n! na qual f (x) tem n raı́zes.
Demonstração:
Usaremos indução sobre n = gr(f (x)). Para n = 1, f (x) é da forma
αx + β, onde α, β ∈ F . Segue que − αβ ∈ F é raiz de f (x) e [F : F ] = 1.
Suponhamos que o resultado seja válido para todo inteiro positivo e menor que n.
Pelo teorema 3.1.6 existe uma extensão E0 de F na qual f (x) tem uma raiz. Seja a ∈ E0
uma raiz de f (x). Segue f (x) = (x − a)q(x), onde q(x) ∈ E0 e tem grau n − 1. Pela
hipótese de indução existe uma extensão E de E0 na qual q(x) tem n − 1 raı́zes. Como
toda raiz de q(x) é raiz de f (x), segue que f (x) tem n raı́zes em E. Além disso = [E :
F ] = [E : E0 ][E0 : F ] ≤ (n − 1)!n = n!.
Teorema 3.1.8 Seja σ um isomorfismo entre os corpos F e F 0 , então F [x] e F 0 [x] são
k
k
X
X
i
0
σ(ai )xi .
ai x 7−→
isomorfos por meio do isomorfismo σ1 : F [x] −→ F [x] dado por
i=0
i=0
Demonstração:
Com efeito, temos que
k
X
i
ai x =
k
X
i=0
σ(bi ) ⇔
k
X
i=0
σ(ai )xi =
k
X
i=0
bi xi ⇔ ai = bi ⇔ σ(ai ) =
i=0
k
k
X
X
i
i
bi xi ). Acabamos de provar que
ai x ) = σ1 (
σ(bi )x ⇔ σ1 (
i=0
i=0
σ1 está bem definida e é injetiva. Agora, da sobrejetiva de σ segue que ∀bi ∈ F 0 existe
k
k
X
X
i
0
ai ∈ F tal que σ(ai ) = bi . Logo para todo
bi x ∈ F [x] tomemos
ai xi ∈ F [x] e daı́
i=0
36
i=0
temos que σ1 (
k
X
i
ai x ) =
i=0
k
X
i
σ(ai )x =
i=0
k
X
bi xi . Logo σ1 é sobrejetiva. Para finalizar a
i=0
demonstração mostremos que σ1 preserva as operações.
Para simplificar a notação vamos omitir os ı́ndices dos somátorios que definem um
polinômio.
Então temos que,
X
X
X
X
X
σ1 (
ai xi +
bi xi ) = σ1 ( (ai + bi )xi ) =
σ(ai + bi )xi =
[σ(ai ) + σ(bi )]xi =
X
X
X
X
σ(ai )xi +
σ(bi )xi = σ1 (
ai xi ) + σ1 (
bi xi ).
Além disso,
X X
X
X
X X
X X
σ(as )σ(bt )xi
as bt )xi =
(
σ1 (
ai xi .
bi xi ) = σ1 ( (
as bt )xi ) =
σ(
X
X
= σ1 (
ai xi ).σ1 (
bi xi ).
s+t=i
s+t=i
s+t=i
Teorema 3.1.9 Seja σ um isomorfismo entre os corpos F e F 0 . Seja f (x) um polinômio
irredutı́vel sobre F e f 0 (x) o polinômio correspondente em F 0 , isto é, a imagem de f (x)
pela σ1 . Sejam F (α) e F 0 (β) extensões de F e F 0 respectivamente, tais que f (α) = 0 e
f 0 (β) = 0, então σ induz um isomorfismo entre F (α) e F (β)
Demonstração:
Primeiramente notemos que os corpos F [x]/(f (x)) e F 0 [x]/(f 0 (x))
também são isomorfos por meio do isomorfismo σ2 : F [x]/(f (x)) −→ F 0 [x]/(f 0 (x)) dado
por p(x) + (f (x)) 7−→ σ1 (p(x)) + (f 0 (x)).
Com efeito, notemos que p1 (x) + (f (x)) = p2 (x) + (f (x)) ⇔ p1 (x) − p2 (x) ∈ (f (x)) ⇔
∃ q(x) ∈ F [x] tal que p1 (x) − p2 (x) = f (x)q(x) ⇔ σ1 (p1 (x) − p2 (x)) = σ1 (f (x)q(x)) ⇔
σ1 (p1 (x)) − σ1 (p2 (x)) = f 0 (x)σ1 (q(x)) ⇔ σ1 (p1 (x)) − σ1 (p2 (x)) ∈ (f 0 (x)) ⇔ σ1 (p1 (x)) +
(f 0 (x)) = σ1 (p2 (x)) + (f 0 (x)) ⇔ σ2 (p1 (x) + (f (x))) = σ2 (p2 (x) + (f (x))). Portanto
a aplicação σ2 está bem definida e é injetiva. Agora, segue da sobrejetividade de σ1
que ∀q(x) ∈ F 0 [x] existe p(x) ∈ F [x] tal que σ1 (p(x)) = q(x). Então dado q(x) +
(f 0 (x)) ∈ F 0 [x]/(f 0 (x)) tomemos p(x) + (f (x)) ∈ F [x]/(f (x)) e daı́ σ2 (p(x) + (f (x))) =
σ1 (p(x)) + (f 0 (x)) = q(x) + (f 0 (x)). Logo σ2 é sobrejetiva. Para completar esta etapa da
demonstração mostremos que σ2 preserva as operações.
Para simplificar a notação vamos considerar p(x) + (f (x)) = p(x) e q(x) + (f 0 (x)) =
0
q(x) . Então temos que,
0
0
0
σ2 (p1 (x) + p2 (x)) = σ2 (p1 (x) + p2 (x)) = σ1 (p1 (x) + p2 (x)) = σ1 (p1 (x)) + σ1 (p2 (x)) =
0
σ2 (p1 (x)) + σ2 (p2 (x)). Além disso, σ2 (p1 (x).p2 (x)) = σ2 (p1 (x).p2 (x)) = σ1 (p1 (x).p2 (x)) =
37
0
0
σ1 (p1 (x)) .σ1 (p2 (x)) = σ2 (p1 (x)).σ2 (p2 (x)).
Agora, notemos que f (x) é minimal para α. Caso contrário existiria um polinômio
p(x) de grau menor que gr(f (x)) minimal para α. Como foi provado no decorrer da
demonstração do teorema 3.1.2, todo polinômio que tem α como raiz é um múltiplo de
p(x). Segue que f (x) seria um múltiplo de p(x), o que seria um absurdo, já que por
hipótese f (x) é irredutı́vel. Analogamente f 0 (x) é minimal para β.
Nestas circunstâncias segue que existe um isomorfismo φ1 de F [x]/(f (x)) em F (α)
e um isomorfismo φ2 de F 0 [x]/(f 0 (x)) em F (β). Concluı́mos que φ−1
1 ◦ σ2 ◦ φ2 é um
isomorfismo de F (α) em F (β).
Teorema 3.1.10 Seja σ um isomorfismo entre os corpos F e F 0 . Seja f (x) um polinômio
sobre F e f 0 (x) o polinômio correspondente em F 0 . Seja E um corpo de raı́zes para F e
E 0 um corpo de raı́zes para F 0 , então σ induz um isomorfismo de E em E 0 .
Demonstração:
Usaremos indução sobre [E : F ] = n. Se n = 1, então E = F e
todas as raı́zes de f (x) estão em F . Segue do isomorfismo entre F [x] e F 0 [x], definido na
demonstração do teorema 3.1.8, que F 0 contém todas as raı́zes de f 0 (x), logo E 0 = F 0 .
Portanto, os corpos E e E 0 são isomorfos pelo isomorfismo σ.
Suponhamos que o resultado seja válido para todo inteiro positivo menor que n. Seja
p(x) um fator irredutı́vel de f (x) de grau gr(p(x)) = r > 1. Se u é uma raiz de f (x),
então u também é raiz de p(x). Segue do teorema 3.1.2 que F (u) é uma extensão de F
de grau r. Logo,
[E : F (v)] =
n
[E : F ]
= <n
[F (v) : F ]
r
Afirmamos que E é um corpo de raı́zes para f (x) quando visto como um polinômio
sobre F (u), pois se existisse um subcorpo E0 de E contendo F (u) e todas as raı́zes de
f (x), então E0 seria uma extensão de F menor que E contendo todas as raı́zes de f (x),
o que contrária a hipótese de que E é um corpo de raı́zes para f (x) ∈ F [x].
Analogamente E 0 é um corpo de raı́zes para f 0 (x) quando visto como um polinômio
sobre F (v), onde v é uma raiz de f 0 (x) e [E : F (v)] < n.
Pela hipótese de indução segue que existe um isomorfismo de E em E 0 .
Corolário 3.1.1 Quaisquer dois corpos de raı́zes de um polinômio f (x) sobre o corpo F
são isomorfos.
38
Demonstração:
3.2
Segue diretamente do teorema 3.1.10.
O Teorema Fundamental da Teoria de Galois
Nesta seção apresentaremos mais alguns resultados sobre a teoria de corpos. Estes
resultados nos darão subsı́dios para demonstrar o clássico Teorema Fundamental da Teoria
de Galois. Este teorema, por sua vez, terá grande importância na demonstração de que
o polinômio geral de grau n ≥ 5 não é resolúvel por radicais, que é o objetivo principal
deste capı́tulo.
Teorema 3.2.1 Sejam K um corpo, a1 , ..., an ∈ K e σ1 , ..., σn ∈ AutK tais que σi 6= σj ,
temos que a1 σ1 (u)+· · ·+an σn (u) = 0 para todo u ∈ K se, e somente se a1 = · · · = an = 0.
Demonstração:
Usaremos indução sobre n. Se n = 1, então a1 σ(u) = 0 para todo
u ∈ K. Podemos escolher u0 ∈ K tal que σ(u0 ) 6= 0. Logo a1 = 0.
Suponhamos que a afirmação seja válida para todo natural não nulo menor que n e
suponhamos que
a1 σ1 (u) + · · · + an σn (u) = 0
(3.1)
Como a equação 3.1 vale para todo u ∈ K, vale também para bu onde 0 6= b ∈ K.
Logo,
a1 σ1 (bu) + · · · + an σn (bu) = 0
(3.2)
Como cada σi é um isomorfismo, segue que
a1 σ1 (b)σ1 (u) + · · · + an σn (b)σn (u) = 0
(3.3)
Multiplicando 3.1 por σ1 (b) e subtraindo por 3.3 concluı́mos que
a2 (σ1 (b) − σ2 (b))σ2 (u) + · · · + an (σ1 (b) − σn (b))σn (u) = 0
(3.4)
Como os isomorfismos são dois a dois distintos, podemos escolher d de forma que
σ1 (d) 6= σi (d) pelo menos para um número 1 ≤ r < n de ı́ndices. Suponhamos σ1 (d) 6=
σi (d) para todo i 6= 1. Como σ1 (d) − σi (d) ∈ K segue da equação 3.4 e da hipótese de
39
indução que a2 = · · · = an = 0. Substituindo tudo isso em 3.1 concluı́mos que a1 = 0 e o
teorema está demonstrado.
Agora, suponhamos que σ1 (d) 6= σi (d) apenas para um número 1 ≤ r < n de ı́ndices.
Sem perda de generalidade suponhamos que este fato seja verdade para os r primeiros
ı́ndices com exceção de i = 1. Segue que
a2 (σ1 (d) − σ2 (d))σ2 (u) + · · · + ar (σ1 (d) − σr (d))σr (u) = 0
(3.5)
Segue da hipótese de indução que a1 = · · · = ar = 0. Substituindo tudo isso em 3.1
obtemos
ar+1 σr+1 (u) + · · · + an σn (u) = 0
(3.6)
Segue novamente da hipótese de indução que ar+1 = · · · = an = 0.
A recı́proca é imediata.
Definição 3.2.1 Seja G um subgrupo de AutK, onde K é corpo, chamamos de corpo
fixo ao conjunto de todos os elementos de K que permanecem invariantes para todo automorfismo de G, isto é, o conjunto KG = {a ∈ K|σ(a) = a ∀σ ∈ AutG}
Teorema 3.2.2 KG é um subcorpo de K.
Demonstração: Dados a, b ∈ KG , temos que provar que a−b e ab−1 ainda são elementos
de KG . Com efeito, para todo automorfismo σ ∈ AutK temos que σ(a−b) = σ(a)−σ(b) =
a − b e σ(a.b−1 ) = σ(a)σ(b)−1 = ab−1 , isto é, todo automorfismo σ ∈ AutK deixa fixos os
elementos a − b e ab−1 . Logo KG é um subcorpo de K.
Definição 3.2.2 Seja K uma extensão do corpo F , chamamos de grupo dos automorfismos de K relativos a F ao conjunto de todos os automorfismos de K que deixam fixo todo
elemento de F , isto é, o conjunto G(K, F ) = {σ ∈ AutK|σ(u) = u ∀u ∈ F }
Teorema 3.2.3 G(K, F ) é um subgrupo de AutK.
Demonstração:
Dados σ1 , σ2 ∈ G(K, F ), temos que σ1 (u) = u e σ2 (u) = u, ∀u ∈ F .
Logo (σ1 ◦ σ2 )(u) = σ1 (σ2 (u)) = σ1 (u) = u, ∀u ∈ F . Portanto σ1 ◦ σ2 ∈ G(K, F ),
e se σ1 (u) = u, ∀ u, então σ1−1 (u) = u, ∀u ∈ F . Logo σ1−1 ∈ G(K, F ). Portanto
G(K, F ) < AutK.
40
Teorema 3.2.4 Se K é uma extensão finita de um corpo F , então G(K, F ) é um grupo
finito e |G(K, F )| ≤ [K : F ].
Demonstração:
Seja [K : F ] = n e seja {u1 , · · · , un } ⊂ K uma base para K.
Segue que para todo t ∈ K existem α1 , · · · , αn ∈ F tais que t = α1 u1 + · · · + αn un .
Como todo automorfismo σi ∈ G(K, F ) deixa fixo todo elemento de F , segue que σi (t) =
α1 σi (u1 ) + · · · + αn σi (un ).
Sabemos da álgebra linear que um sistema homogêneo de r incógnitas e n equações
tal que r > n possui uma solução não trivial. Logo o sistema
σ1 (u1 )x1 + · · · + σr (u1 )xr = 0
.
.
.
σ1 (un )x1 + · · · + σr (un )xr = 0
tem uma solução não trivial. Seja a1 , · · · , ar uma solução não trivial do sistema. Então,
σ1 (u1 )a1 + · · · + σr (u1 )ar = 0
.
.
.
σ1 (un )a1 + · · · + σr (un )ar = 0
multiplicando a primeira equação por α1 , a segunda por α2 e assim sucessivamente, e
somando tudo no final obtemos
a1 (α1 σ1 (u1 ) + · · · + αn σ1 (un )) + · · · + ar (α1 σr (u1 ) + · · · + αn σr (un )) = 0
Mas σi (t) = α1 σi (u1 ) + · · · + αn σi (un ), daı́ a1 σ1 (t) + · · · + ar σr (t) = 0, o que é um
absurdo pelo teorema 3.2.1. O absurdo veio do fato de termos considerado a existência de
r > n = [K : F ] automorfismos em G(K, F ). Segue que G(K, F ) é finito e |G(K, F )| ≤
[K : F ].
Teorema 3.2.5 Seja K uma extensão do corpo F , F (x1 , · · · , xn ) o corpo das funções
racionais em x1 , · · · , xn e S o corpo das funções simétricas elementares, temos que:
41
1. F (x1 , · · · , xn ) é o corpo de raı́zes do polinômio p(t) = tn − a1 tn−1 + · · · + (−1)n an
sobre F (a1 , · · · , an )
2. [F (x1 , · · · , xn ) : S] = n!
3. Se a1 , · · · , an são as funções simétricas elementares em x1 , · · · , xn , então S =
F (a1 , · · · , an )
4. G(F (x1 , · · · , xn ), S) = Sn
Demonstração:
1. Segue das considerações feitas na seção 1.2 do capı́tulo 1, que o polinômio p(t) =
tn − a1 tn−1 + · · · + (−1)n an tem todas as suas raı́zes em F (x1 , · · · , xn ). Além disso
nenhum subcorpo de F (x1 , · · · , xn ) que contém F (a1 , · · · , an ) contém todas as raı́zes
de p(t), pois F (x1 , · · · , xn ) pode ser visto como a menor extensão de F que contém
x1 , · · · , xn . Logo F (x1 , ..., xn ) é o corpo de raı́zes de p(t).
2. De 1 temos que F (x1 , · · · , xn ) é o corpo de raı́zes de p(t) = tn −a1 tn−1 +· · ·+(−1)n an
sobre F (a1 , · · · , an ). Logo, pelo teorema 3.1.7, [F (x1 , · · · , xn ) : F (a1 , · · · , an )] ≤ n!.
Por outro lado, segue do teorema 3.2.4 que |G(F (x1 , · · · , xn ), F (a1 · · · , an ))| ≤
[F (x1 , · · · , xn ) : F (a1 · · · , an )]. Além disso, todo automorfismo σ de F (x1 , · · · , xn )
deixa fixos os elementos de F (a1 , · · · , an ). Logo Sn ⊂ G(F (x1 , · · · , xn ), F (a1 · · · , an )).
Daı́ [F (x1 , · · · , xn ) : F (a1 · · · , an )] ≥| G(F (x1 , · · · , xn ), F (a1 · · · , an )) |≥ n!. Concluı́mos que [F (x1 , · · · , xn ) : F (a1 · · · , an )] = n!.
Além disso [F (x1 , · · · , xn ) : F (a1 , · · · , an )] = [F (x1 , · · · , xn ) : S][S : F (a1 , · · · , an )].
Logo [F (x1 , · · · , xn ) : S][S : F (a1 , · · · , an )] = n!. Mas, todo automorfismo σ ∈ Sn
de F (x1 , · · · , xn ) deixa fixos os elementos de S. Logo Sn ⊂ G(F (x1 , · · · , xn ), S) e
portanto | G(F (x1 , · · · , xn ), S) |≥ n!. Concluı́mos que [F (x1 , · · · , xn ) : S] = n!.
3. Provamos no decorrer da demonstração do item 2 que [F (x1 , · · · , xn ) : S] = n! e
[F (x1 , · · · , xn ) : S][S : F (a1 · · · , an )] = n!. Segue daı́ que [S : F (a1 , · · · , an )] = 1, e
portanto S = F (a1 , · · · , an ).
4. Provamos no decorrer da demonstração do item 2 que | G(F (x1 , · · · , xn ), S) |≥ n!.
Pelo teorema 3.2.4 e novamente pelo item 2 segue que | G(F (x1 , · · · , xn ), S) |≤
42
[F (x1 , · · · , xn ) : S] = n!. Logo | G(F (x1 , · · · , xn ), S) |= n!, isto é, Sn é um subgrupo
de G(F (x1 , · · · , xn ), S) que tem a mesma ordem. Logo Sn = G(F (x1 , · · · , xn ), S).
Definição 3.2.3 Uma extensão K do corpo F é dita extensão simples se existir um a ∈ K
tal que K = F (a).
Definição 3.2.4 Dizemos que um anel A é de caracterı́stica n se n for o menor inteiro
positivo tal que na = 0, onde na = |a + ·{z
· · + a}. Se não existir um inteiro positivo n tal
nvezes
que na = 0, então dizemos que A é um anel de caracterı́stica 0.
Teorema 3.2.6 Toda extensão de um corpo de caracterı́stica zero é uma extensão simples.
A demonstração deste fato pode ser vista em [1]. Mas uma observação que deve ser
feita é que em um corpo de caracterı́stica zero todo elemento da extensão K é raiz de um
polinômio separável. Um polinômio é dito separável quando não tem raı́zes múltiplas.
Definição 3.2.5 Seja K uma extensão do corpo F , dizemos que K é uma extensão normal de F sempre que K é uma extensão finita de F tal que F é o corpo fixo de G(K, F ).
Teorema 3.2.7 Seja K uma extensão normal de F , H um subgrupo de G(K, F ) e KH
o corpo fixo de H, temos que
1. H = G(K, KH )
2. [K : KH ] = |H|
em particular |G(K, F )| = [K : F ]
Demonstração:
De fato, se σ ∈ H, então para todo u ∈ KH , σ(u) = u, pois por
definição os elementos de KH são invariantes para todo automorfismo σ ∈ H. Segue que
σ ∈ G(K, KH ) e daı́ H ⊂ G(K, KH ). Por outro lado, se σ ∈ G(K, KH ), então σ deixa
fixo todo elemento de KH . Mas os automorfismos de σ ∈ AutK que deixam fixos os
elemento de KH são exatamente os automorfismos de H. Segue que σ ∈ H, e portanto
G(K, F ) ⊂ H. Logo H = G(K, KH ).
43
Para demostrar o item 2, observe que pelo teorema 3.2.2, K é uma extensão finita de
KH . Pelo teorema 3.2.4 |G(K, KH )| ≤ [K : KH ] e pelo item 1 | H |≤ [K : KH ].
Por outro lado podemos provar que | H |≥ [K : KH ]. Com efeito, pelo teorema 3.2.6,
como K é uma extensão de KH , existe a ∈ K tal que K = KH (a). Sejam σ1 , · · · , σh
todos os automorfismos de H com σ1 = I. Segue que a satisfaz o polinômio p(x) =
(x − σ1 (a)) · · · (x − σh (a)), pois σ1 (a) = a. Expandindo o polinômio p(x) obtemos p(x) =
xh − α1 xh−1 + · · · + (−1)h αh , onde α1 , · · · , αh são as funções simétricas elementares em
σ1 (a), · · · , σh (a), isto é,
α1 = σ1 (a) + · · · + σh (a)
α2 = σ1 (a)σ2 (a) + · · · + σh−1 (a)σh (a)
.
.
.
αh = σ1 (a) · · · σh (a)
Agora, observe que para cada σi ∈ H tem-se que σi (α1 ) = σi (σ1 (a))+· · ·+σi (σh (a)) =
σj1 (a) + · · · + σjh (a). Mas σ1 , · · · , σh são todos os automorfismos de H sem repetições.
Segue que σj1 , · · · , σjh são novamente todos os automorfismos de H sem repetições. Logo
a única ação dos σi sobre α1 é mudar a ordem dos σi (a). Daı́ σi (α1 ) = α1 para todo i.
Analogamente concluı́mos que σi (α2 ) = α2 , · · · , σi (αh ) = αh , para todo i.
Segue que α1 , · · · , αh ∈ KH , e portanto p(x) ∈ KH [x]. Como K = KH (a) é uma
extensão finita de KH de grau n = [K : KH ] segue do teorema 3.1.2 que a satisfaz um
polinômio de grau n sobre KH e não satisfaz outro polinômio de grau menor. Como a
satisfaz p(x) segue que gr(p(x)) = h ≥ [K : KH ], isto é, | H |≥ [K : KH ].
Das duas desigualdades | H |≤ [K : KH ] e | H |≥ [K : KH ] segue que | H |= [K : KH ].
Teorema 3.2.8 K é uma extensão normal de F se, e somente se K é o corpo de raı́zes
de algum polinômio sobre F .
Demonstração:
Seja K uma extensão normal de F . Pelo teorema 3.2.6, existe a ∈ K
Y
tal que K = F (a). O polinômio p(x) =
(x − σ(a)) tem todas as suas raı́zes em
σ∈G(K,F )
44
K. Expandindo p(x) obtemos p(x) = xn − α1 xn−1 + · · · + (−1)n αn , onde α1 , · · · , αn são
as funções simétricas elementares em I = σ1 (a), · · · , σn (a). Logo cada αi é invariante por
todo σ ∈ G(K, F ). Segue que αi ∈ F , já que F é o corpo fixo de G(K, F ).
Agora como a gera K, a não pode estar em nenhum subcorpo de K que contém F .
Como a é raiz de p(x), já que σ1 (a) = a, nenhum subcorpo de K que contém F tem todas
as raı́zes de p(x). Logo K é o corpo de raı́zes de p(x) sobre F .
Reciprocamente, suponhamos que K seja o corpo de raı́zes f (x) = xn − a1 xn−1 + · · · +
(−1)n an sobre F . Sejam α1 , · · · , αn as raı́zes de f (x), então valem as relações
a1 = α1 + · · · + αn
a2 = α1 α2 + · · · + αn−1 αn
.
.
.
an = α1 · · · αn
Então a1 , · · · , an são as funções simétricas elementares em α1 , · · · , αn . Segue do teorema 3.2.5 que F (α1 , · · · , αn ) é corpo de raı́zes de f (x) sobre F (a1 , · · · , an ). Como
a1 , · · · , an ∈ F segue que F (a1 , · · · , an ) = F . Segue do corolário 3.1.1 que K é isomorfo
a F (α1 , · · · , αn ), neste caso tomemos K = F (α1 , · · · , αn ).
Segue do teorema 3.2.5 que o corpo fixo de G(F (α1 , · · · , αn ), F (a1 , · · · , an )) é o corpo
F (a1 , · · · , an ). Logo o corpo fixo de G(K, F ) é F , isto é, K é uma extensão normal de F .
Definição 3.2.6 Seja K o corpo de raı́zes do polinômio f (x) ∈ F [x]. O grupo de Galois
de f (x) é o grupo G(K, F ).
Teorema 3.2.9 (Teorema Fundamental da Teoria de Galois) Seja K o corpo de
raı́zes do polinômio f (x) ∈ F [x], G(K, F ) grupo de galois de f (x) e T um subcorpo de K
que contém F , então
1. A aplicação ψ : {subgrupos de G(K, F )} → {subcorpos de K que contém F } definida
por H 7→ KH é uma bijeção.
2. [K : T ] = |G(K, T )| e [T : F ] = (G(K, F ) : G(K, T ))
45
3. T é uma extensão normal de F se, e somente se G(K, T ) ¢ G(K, F )
4. Se T é uma extensão normal de F então G(T, F ) é isomorfo a G(K, F )/G(K, T )
Demonstração:
1. Primeiramente observe que KH é realmente um subcorpo de K que contém F . Que
KH é um subcorpo de K já provamos no teorema 3.2.2. Que KH é uma extensão de
F segue do fato de que os elementos de F ficam invariantes para todo automorfismo
σ ∈ G(K, F ), e portanto para todo automorfismo σ ∈ H < G(K, F ).
Salta à vista que ψ é injetiva, pois se KH1 = KH2 , então H1 = H2 . Vamos agora
provar que ψ é sobrejetiva. Seja T um subcorpo de K que contém F . Por hipótese
K é o corpo de raı́zes de f (x) sobre F . Podemos tomar f (x) como um polinômio
sobre T . Daı́ K será também o corpo de raı́zes de f (x) sobre T . Pelo teorema 3.2.8
K é uma extensão normal de T . Logo por definição T é o corpo fixo de G(K, T ).
Temos ainda que G(K, T ) é um subgrupo de G(K, F ), já que os automorfismos de
G(K, T ) deixam fixos os elementos de T , e portanto de F . Logo os automorfismos
de G(K, T ) estão todos em G(K, F ). Isto garante a sobrejetividade de ψ.
2. Seja T um subcorpo de K que contém F , pela sobrejetividade de ψ, T é o corpo
fixo de algum subgrupo H de G(K, F ), isto é, T = KH . Pelo teorema 3.2.7 segue
que [K : T ] = |G(K, T )|.
Agora, como G(K, T ) é um subgrupo de G(K, F ), segue do teorema de lagrange
(teorema 1.1.2) que | G(K, F ) |=| G(K, T ) | (G(K, F ) : G(K, T )). Mas pelo teo[K : F ]
rema 3.2.7 G(K, F ) = [K : F ]. Logo (G(K, F ) : G(K, T )) =
. Por outro
[K : T ]
[K : F ]
, daı́
lado, pelo teorema 3.1.1, [K : F ] = [K : T ][T : F ]. Logo [T : F ] =
[K : T ]
[T : F ] = (G(K, F ) : G(K, T )).
3. Como T é uma extensão de F , segue do teorema 3.2.6 que existe a ∈ T tal que T =
F (a). Sendo T uma extensão normal de F , segue do teorema 3.2.8 que T é o corpo de
raı́zes do polinômio minimal p(x) para a sobre F . Seja p(x) = β0 + β1 x + · · · + βn xn ,
temos que β0 +β1 a+· · ·+βn an = 0. Daı́ σ(β0 +β1 a+· · ·+βn an ) = σ(0) ∀σ ∈ G(K, F ).
Logo β0 + β1 σ(a) + · · · + βn σ(a)n = 0 ∀σ ∈ G(K, F ). Portanto σ(a) também é uma
raiz de p(x). Como T contém todas as raı́zes de p(x) segue que T contém σ(a) para
todo σ ∈ G(K, F ).
46
Agora como T = F (a), segue que para todo x ∈ T existem β1 , · · · , βk tais que
x = β0 + β1 a + · · · + βk ak . Logo σ(x) = β0 + β1 σ(a) + · · · + βk σ(a)k . Como
βi ∈ F ⊂ T e σ(a) ∈ T segue que σ(x) ∈ T . Logo σ(T ) ⊂ T .
Podemos agora definir o homomorfismo φ : G(K, F ) → G(T, F ) dada por σ 7→ σ|T ,
onde σ|T é a restrição de σ a T . Que σ|T é um automorfismo de T segue do fato de
que σ(T ) ⊂ T . Além disso é fácil ver que (σ1 ◦σ2 )|T = σ1 |T ◦σ2 |T ∀σ1 , σ2 ∈ G(K, F ).
Isto garante que φ é homomorfismo.
O núcleo de φ consiste de todos os automorfismos de G(K, F ) que são levados a
aplicação identidade em G(K, T ) pela φ, isto é, Kerφ = G(T, F ). Segue do teorema
1.1.11 que G(T, F ) / G(K, F ).
Reciprocamente, se G(T, F ) / G(K, F ), então pela definição de subgrupo normal
temos que σ −1 ◦ τ ◦ σ ∈ G(K, T ), para todo σ ∈ G(K, F ) e todo τ ∈ G(K, T ).
Segue que para todo t ∈ T , temos τ (σ(u)) = σ(u) para todo σ ∈ G(K, F ) e todo
τ ∈ G(K, T ). Logo σ(T ) ⊂ T . Agora, sendo T uma extensão de F , pelo teorema
3.2.6, existe a ∈ T talque T = F (a). Como σ(T ) ⊂ T , segue que σ(a) ∈ T . Logo
como já provamos T é corpo de raı́zes do polinômio p(x) = (x−σ1 (a)) · · · (x−σn (a)),
onde σ1 = I, · · · , σn são todos os automorfismos de G(K, F ). Segue do teorema 3.2.8
que T é uma extensão normal de F .
4. Como acabamos de ver φ : G(K, F ) → G(T, F ) dada por σ 7→ σ|T é um homomorfismo cujo núcleo é G(T, F ). Segue do teorema do homomorfismo (teorema
1.1.12) que G(K, F )/G(K, T ) é isomorfo a φ(G(K, F )). Pelo item 2 temos que
|φ(G(K, F ))| = |G(K, F )/G(K, T )| = [G(K, F ) : G(K, T )] = [T : F ] = |G(T, F )|.
Logo φ(G(K, F )) = G(T, F ), e portanto G(K, F )/G(K, T ) é isomorfo a G(T, F ).
3.3
A equação geral de grau n
Agora faremos uma conexão entre os resultados sobre teoria de corpos e a solubilidade
de equações polinomiais. Para isto precisamos introduzir o conceito de grupo solúvel e
abordar alguns resultados sobre o mesmo.
47
Definição 3.3.1 Seja G um grupo, dizemos que G é solúvel se existir uma sequência de
subgrupos G = G0 ⊃ G1 ⊃ G2 ⊃ · · · ⊃ Gk = {e} onde Gi é um subgrupo normal de Gi−1
e Gi−1 /Gi é abeliano.
Teorema 3.3.1 Seja H um subgrupo de Sn (n > 4) que contém todo 3-ciclo, e seja N
um subgrupo normal de H tal que H/N é abeliano, então N contém todo 3-ciclo de Sn .
Demonstração:
Seja f : H → H/N dado por f (x) = x o homomorfismo canônico e
sejam x = (i1 i2 i3 ) e y = (i3 i4 i5 ) elementos de H. Podemos tomar x e y desta forma, pois
n > 4. Como H/N é abeliano, segue que f (x−1 y −1 xy) = x−1 y −1 xy = x−1 y −1 x y = e,
isto é, x−1 y −1 xy = e. Pelo teorema 1.1.6, x−1 y −1 xy ∈ N .
Por outro lado
x−1 y −1 xy = (i1 i2 i3 )−1 (i3 i4 i5 )−1 (i1 i2 i3 )(i3 i4 i5 ) =
[(i3 i2 i1 )(i5 i4 i3 )][(i1 i2 i3 )(i3 i4 i5 )] =
(i1 i3 i5 i4 i2 )(i1 i2 i3 i4 i5 ) = (i2 i5 i3 ).
Logo (i2 i5 i3 ) ∈ N para quaisquer i2 , i3 , i5 .
Teorema 3.3.2 Sn não é um grupo solúvel para n ≥ 5
Demonstração:
Como n ≥ 5, Sn contém todo 3-ciclo. Se existisse uma cadeia de
subgrupos G = G0 . G1 . · · · . Gk = {e} com Gi−1 /Gi abeliano, então pelo teorema 3.3.1
todo subgrupo Gi conteria todo 3-ciclo de Sn , e portanto a cadeia nunca chegaria no
grupo trivial.
Definição 3.3.2 Dizemos que o polinômio p(x) sobre o corpo F é resolúvel por radicais
se existe uma seqüência de corpos F1 = F (w1 ) ⊂ F2 = F1 (w2 ) ⊂ · · · ⊂ Fk = Fk−1 (wk ) tal
que w1r1 ∈ F, w2r2 ∈ F1 , · · · , wkrk ∈ Fk−1 e Fk contém todas as raı́zes de p(x).
Dizer que o polinômio p(x) é resolúvel por radicais significa dizer que podemos escrever
√
sua raı́zes em função de seus coeficientes envolvendo as operações (+, ., n ).
q
p
√
7
4
Por exemplo, digamos que α = 1 − 3 3 + 7 13 é a raiz de um polinômio sobre
o corpo dos racionais que esta sendo escrita em função dos
deste ¶
polinômio,
µqcoeficientes
7
³p
p
√ 2
√ ´4
√
√
7
4
4
∈ F2 =
temos que 13 ∈ F,
3 + 7 13 ∈ F1 = F ( 13),
1 − 3 3 + 7 13
p
√
4
F1 ( 3 + 7 13) e F ⊂ F1 ⊂ F2 .
Teorema 3.3.3 (Critério de Galois) Se o polinômio f (x) ∈ F [x] é resolúvel por radicais então o grupo de Galois de f (x) sobre F é um grupo solúvel.
48
Demonstração:
Seja K o corpo de raı́zes de p(x) sobre F , e seja G(K, F ) o grupo de Galois de p(x).
Usaremos o fato de que se K é o corpo de raı́zes do polinômio p(x) ∈ F [x] e F contém
todas as raı́zes n-ésimas da unidade, então K = F (u), onde u é uma raiz de p(x) e G(K, F )
é abeliano. A demonstração deste fato pode ser vista em [6].
Se p(x) é resolúvel por radicais, então existe uma cadeia de subcorpos
F ⊂ F1 = F (w1 ) ⊂ F2 = F1 (w2 ) ⊂ · · · ⊂ Fk = Fk−1 (wk )
onde w1r1 ∈ F, w2r2 ∈ F1 , · · · , wkrk ∈ Fk−1 .
Sempre podemos encontrar Fk de modo que Fk seja uma extensão normal de F . Logo
Fk é uma extensão normal de Fi , para todo i.
Segue que da observação feita no inı́cio que Fi é o corpo de raı́zes de algum polinômio
sobre Fi−1 e portanto pelo teorema 3.2.8 é uma extensão normal. Segue do teorema 3.2.9
que
G(Fk , F ) . G(Fk , F1 ) . · · · . G(Fk , Fk−1 ) . {e} e
G(Fk , Fi )
é abeliano
G(FK , Fi−1 )
Segue que G(Fk , F ) é solúvel. Como K é corpo de raı́zes de p(x) sobre F , podemos
considerar K como corpo de raı́zes de p(x) sobre Fk , logo pelo terema 3.2.8 K é uma
extensão normal de Fk . Segue do teorema 3.2.9 que G(Fk , K) / G(Fk , F ) e G(K, F ) é
isomorfo a G(Fk , F )/G(Fk , K).
Concluı́mos que G(K, F ) é uma imagem homomorfa de G(Fk , F ) que é solúvel.
Usando o fato de que a imagem homomorfa de um grupo solúvel é um grupo solúvel
concluı́mos que G(K, F ) é solúvel. A demonstração de que a imagem homomorfa de um
grupo solúvel é um grupo solúvel pode ser vista tanto em [1] quanto em [6] ou em [7].
Teorema 3.3.4 (Abel) O polinômio geral de grau n ≥ 5 não é resolúvel por radicais.
Demonstração: Ora, pelo teorema 3.2.5 Sn é o grupo de Galois do polinômio p(t) =
n
X
(−1)k ak xk sobre F (a1 , · · · , an ). Pelo teorema 3.3.2 Sn não é solúvel para n ≥ 5.
k = 1
n
X
Logo, pelo teorema 3.3.3 o polinômio p(t) =
para n ≥ 5
k = 1
49
(−1)k ak xk não é resolúvel por radicais
Capı́tulo 4
Métodos numéricos para se obter
raı́zes de equações
A Teoria de Galois originalmente fazia um estudo de polinômios sobre o corpo dos
números complexos, posteriormente foi abrangida para corpos arbitrário, como foi feito
neste trabalho. Faremos agora uma discussão acerca dos polinômios definidos no corpo
dos reais.
No capı́tulo anterior provamos que as raı́zes do polinômio geral de grau ≥ 5 não podem
ser escritas em função dos coeficientes deste polinômio. Isto quer dizer que o problema de
achar as raı́zes de um polinômio de grau ≥ 5 não pode ser resolvido por método direto.
Contudo, o método direto é apenas uma maneira de resolver um problema matemático.
Podemos muitas vezes usar métodos iterativos que consistem em determinar aproximações
sucessivas da solução procurada. Embora geralmente não se encontre a solução exata,
podemos encontrar soluções convenientemente próximas.
4.1
Raı́zes reais
Os métodos iterativos para se obter raı́zes de equações consistem em fazer aproximações de raı́zes localizadas num intervalo real [a, b]. Então antes de começar a procurar as
raı́zes precisamos determinar a existência de raı́zes no intervalo [a, b].
Estes métodos não são válidos apenas para funções polinomiais, podemos aplicá-los
também à funções transcendentes (não polinomiais). Porém nosso interesse está nas
funções polinomiais.
51
4.1.1
Isolamento de raı́zes
Teorema 4.1.1 Seja f uma função contı́nua em [a, b], se f (a)f (b) < 0, então f tem no
mı́nimo uma raiz em [a, b].
Demonstração:
Este resultado segue diretamente do teorema do valor intermediário.
O teorema do valor intermediário diz que se f é contı́nua no intervalo fechado [a, b] e se γ
for um real compreendido entre f (a) e f (b), então existirá no mı́nimo um c ∈ [a, b] tal que
f (c) = γ. A demonstração do teorema do valor intermediário pode ser vista em qualquer
bom livro de cálculo diferencial.
Então, como f (a)f (b) < 0, segue que f (a) e f (b) tem sinais contrários. Logo γ = 0
esta entre f (a) e f (b). Pelo teorema do valor intermediário existe c ∈ [a, b] tal que
f (c) = γ = 0. Logo c ∈ [a, b] é uma raiz de f (x).
No caso particular de funções polinomiais temos o seguinte teorema devido a Cauchy
que será enunciado sem demonstração.
Teorema 4.1.2 (Cauchy) Dado o polinômio p(x) = an xn +· · · a1 x+a0 as raı́zes de p(x)
estão no disco centrado na origem e raio R = 1 +
A
,
|an |
onde A = max{|a0 |, · · · .|an−1 |}.
Este resultado na verdade permite localizar tanto raı́zes reais quanto raı́zes complexas.
O leitor interessado na demonstração pode consultar [8]
4.1.2
Método da bissecção
Seja p(x) uma função polinomial tal que o polinômio p(x) tem uma raiz ζ no intervalo
[a, b]. Seja x0 =
a+b
2
o ponto médio de [a, b]. Se x0 é a raiz de p(x) em [a, b], então o pro-
cesso acaba aqui. Caso contrário a raiz esta ou em [a, x0 ] ou em [x0 , b]. Seguindo com este
processo encontraremos em algum momento a raiz ζ de p(x) ou uma seqüência infinita de
intervalos encaixados [a0 , b0 ] ⊃ [a1 , b1 ] ⊃ · · · ⊃ [an , bn ] ⊃ · · · todos contendo ζ. Segue que
a0 , a1 , · · · , an , · · · formam uma seqüência monótona não-decrescente e b0 , b1 , · · · , bn , · · ·
formam uma seqüência monótona não-crescente. Segue que as duas seqüências são convergentes. Por outro lado, da forma como os intervalos são obtidos segue que bn − an =
b−a
2n
e daı́ lim bn − lim an = 0, portanto lim an = lim bn . Mas an ≤ ζ ≤ bn ∀n. Segue que
lim an = limbn = limζ = ζ.
Um caso mais geral do teorema 4.1.1 é o teorema
52
Teorema 4.1.3 Seja f uma função contı́nua em [a, b], se f (a)f (b) < 0, então f tem um
número ı́mpar de raı́zes em [a, b] e se f (a)f (b) > 0, então f não tem raı́zes ou tem um
número par de raı́zes em [a, b].
Não demonstraremos este resultado, vamos apenas discutir novamente o método da
bissecção.
Se p(a)p(b) < 0 então teremos um número ı́mpar de raı́zes para p(x). Suponhamos
que nunca obtemos uma raiz de p(x) ao tomar o ponto médio xi do segmento [ai , bi ].
Então obtemos dois intervalos [ai , xi ] e [xi , bi ] um contendo um número ı́mpar de raı́zes e
outro não contendo raı́zes ou contendo um número par de raı́zes. Sempre descartaremos o
intervalo que não contém raı́zes ou contém um número par de raı́zes. Em algum momento
encontraremos uma sequência de intervalos encaixados [ak , bk ] ⊃ · · · ⊃ [an , bn ] ⊃ · · · ,
onde k < n, cada um contendo um número ı́mpar de raı́zes de f (x) e novamente teremos
lim an = limbn = limζ = ζ.
4.1.3
Método da iteração linear
Este método consiste em escrever a função contı́nua p(x), como p(x) = f (x) − x e daı́
construir a seqüência xn+1 = f (xn ). Se ∀x ∈ I = [a, b], |f 0 (x)| ≤ L < 1 e f (I) ⊆ I, então
xn+1 converge para um x0 tal que f (x0 ) = x0 . Este x0 é chamado de ponto fixo da função
f e será uma raiz de p(x).
Com efeito, primeiramente vamos provar a existência de pontos fixos no intervalo [a, b].
Como f (I) ⊆ I, segue que a ≤ f (a) ≤ b e a ≤ f (b) ≤ b. Logo 0 ≤ f (a) − a ≤ b − a
e a − b ≤ f (b) − b ≤ 0. Suponhamos que f (a) 6= a e f (b) 6= b. Logo f (a) − a > 0 e
f (b) − b < 0. Daı́ p(a) > 0 e p(b) < 0. Logo p(x) tem uma raiz x0 em [a, b] que é o ponto
fixo de f .
Agora suponhamos que f tenha dois pontos fixos x1 e x2 . Segue do teorema do valor
médio que existe um c entre x1 e x2 tal que
f (x1 ) − f (x2 )
= f 0 (c)
x1 − x2
Segue que
¯
¯
¯ f (x1 ) − f (x2 ) ¯ x1 − x2
¯
¯=
|f (c)| = ¯
=1
x1 − x2 ¯ x1 − x2
0
Mas c ∈ [a, b], logo f 0 (c) < 1. Temos portanto um absurdo que certamente veio da
hipótese de que existem dois pontos fixos.
53
Provemos agora que a seqüência xn+1 = f (xn ) converge para x0 .
Segue do teorema do valor médio que existe um cn entre xn e x0 tal que
f (xn )−f (x0 )
xn −x0
=
f 0 (cn ). Daı́ f (xn )−f (x0 ) = f 0 (cn )(xn −x0 ). Logo |f (xn )−f (x0 )| = |f 0 (cn )||xn −x0 | ≤ L|xn −
x0 |. Segue que |xn+1 − x0 | = |f (xn ) − f (x0 )| ≤ L|xn − x0 |. Analogamente existe um cn−1
entre xn−1 e x0 tal que |xn − x0 | ≤ L|xn−1 − x0 |. Daı́ temos que |xn+1 − x0 | ≤ L2 |xn−1 − x0 |.
Por recorrência, obtemos |xn+1 − x0 | ≤ Ln+1 |x0 − x0 |.
Como 0 < L < 1 segue que lim Ln+1 = 0 e portanto lim xn+1 = x0 .
4.1.4
Método de Newton
Seja x uma raiz do polinômio p(x) = a0 xn + a1 xn−1 + · · · + an−1 x + an num
intervalo I = [a, b] e seja x0 uma aproximação de x com erro relativo ε, isto é, |x − x0 | = ε.
Suponhamos que x > x0 . Daı́ x = x0 + ε. Logo
a0 (x0 + ε)n + a1 (x0 + ε)n−1 + an−1 (x0 + ε) · · · + an = 0
Desenvolvendo cada binômio, obtemos
n(n − 1) n−2 2
x0 ε + · · · + εn ) + a1 (x0n−1 + (n − 1)x0n−2 ε +
2
(n − 1)(n − 2) n−3 2
x0 ε + · · · + εn−1 ) + · · · + an−1 (x0 + ε) + an = 0
2
a0 (xn0 + nxn−1
ε+
0
Para um ε suficientemente pequeno podemos tomar ε2 , ε3 , · · · , εn todos iguais a zero.
Obtemos assim a equação
(a0 xn0 + a1 xn−1
+ · · · + an ) + (na0 xn−1
+ (n − 1)a1 x0n−2 + · · · + an−1 )ε = 0
0
0
Logo
p(x0 ) + p0 (x0 )ε = 0
Mas ε = x − x0 . Logo,
p(x0 ) + p0 (x0 )(x − x0 ) = 0
Daı́
x = x0 −
54
p(x0 )
p0 (x0 )
Na verdade obtemos uma aproximação melhor que a inicial para a raiz de p(x). Nestas
condições, obtemos a seqüência
xn+1 = xn −
p(xn )
p0 (xn )
que converge para a raiz de p(x) em [a, b]. O mesmo se obtém quando se toma x < x0 .
Para uma função contı́nua arbitrária f (x), com f ”(x)f (x) < 0 consideremos a função
g(x) = x −
f (x)
.
f 0 (x)
Temos que g 0 (x) = 1 −
f 0 (x)2 −f (x)f ”(x)
f 0 (x)2
=
g(I) = I, então pelo resultado anterior xn+1 = g(xn ) = xn −
f (x)f ”(x)
< 1.
f 0 (x)2
f (xn )
converge
f 0 (xn )
Se além disso
para uma raiz
de f (x).
4.2
Raı́zes complexas
Um método para se obter raı́zes complexas de um polinômio P (x) é o método de
Newton-Bairstow que consiste em determinar os coeficientes de um polinômio do segundo
grau x2 + px + q que divide P (x). Nestas condições as raı́zes de x2 + px + q que podem ser
facilmente determinadas são raı́zes de P (x). A idéia reside no fato de que todo polinômio
de coeficientes reais pode ser decomposto no corpo dos reais em fatores de grau no máximo
dois. Como as raı́zes complexas sempre aparece aos pares, segue que elas são raı́zes de
fatores quadráticos de P (x). O método também pode ser utilizado para se obter raı́zes
reais.
4.2.1
Método de Newton-Bairstow
Seja
P (x) = an xn + an−1 xn−1 + · · · + a0
(4.1)
um polinômio sobre o corpo dos reais. Dividindo P (x) por x2 + px + q = 0, obtemos
P (x) = Q(x)(x2 + px + q) + R(x)
(4.2)
onde Q(x) é de grau n − 2 e R(x) é de grau 1, o que nos permite reescrever
P (x) = Q(x)(x2 + px + q) + b1 (x + p) + b0
(4.3)
Q(x) = bn xn−2 + bn−1 xn−3 + · · · + b2
(4.4)
e
55
Substituindo 4.4 em 4.3 e comparando com 4.1, obtemos;
bn = an
bn−1 = an−1 − pbn
bn−2 = an−2 − pbn−1 − qbn
..
.
b1 = a1 − pb2 − qb3
b0 = ao − pb1 − qb2
Queremos que x2 + px + q seja um divisor exato de P (x), para isto é necessário que
R(x) = 0 e daı́ b1 = b0 = 0.
Ora, pelas relações acima podemos expressar b0 e b1 em função de p e q calculando sucessivamente bn , bn−1 , · · · , b0 . Então o problema se reduz a resolver o sistema de equações
não lineares.

 b (p, q) = 0
0
 b (p, q) = 0
1
Para resolver um sistema de equações não lineares polinomiais ou transcendentes utilizamos o método de Newton. Não faremos nenhuma discussão da validade deste método.
Apenas apresentaremos o método para sistemas de duas equações, o leitor interessado no
assunto pode consultar [3].
Então para o sistema

 f (x, y) = 0
 g(x, y) = 0
A solução pode ser encontrada a partir de uma aproximação inicial (x0 , y0 ), por
xk+1 = xk −
yk+1
∂g
f. ∂y
−
∂g
.g
∂y
D(x, y)
∂g
∂f
.f
g. ∂x − ∂x
= yk −
D(x, y)
(4.5)
(4.6)
∂f ∂g ∂f ∂g
−
é o determinante da matriz jacobiana e ambos os nume∂x ∂y
∂y ∂x
radores são aplicados em (xk , yk ).
onde D(x, y) =
56
Então o problema agora é determinar
∂b0 ∂b0 ∂b1
. ∂q , ∂p
∂p
e
∂b1
.
∂q
Para isto basta observar que bj = aj − pbj+1 − qbj+2 . Daı́
∂bj+1
∂bj+2
∂bj
= −bj+1 − p
−q
∂p
∂p
∂p
para j = 0, · · · , n − 2.
∂b0
∂p
Logo, para se calcular
e
∂b1
∂p
basta se calcular sucessivamente
∂bn
∂p
0
· · · ∂b
.
∂p
∂bn
∂q
0
· · · ∂b
.
∂q
Analogamente
∂bj
∂bj+2
∂bj+1
= −bj+2 − q
−p
.
∂q
∂q
∂q
∂b0
∂q
Logo, para se calcular
e
∂b1
∂q
basta se calcular sucessivamente
Exemplo 4.2.1 Vamos discutir as raı́zes do polinômio P (x) = x5 − 8x + 2
q
Ora, como P (x) = 5x − 8, temos que P (x) = 0 se, e somente se x = ± 4 85 . Portanto
0
4
0
P (x) tem pelo menos um par de raı́zes complexas conjugadas.
Para calcular estas raı́zes vamos utilizar o método de Newton-Bairstow. Para isto
temos que determinar p e q de forma que P (x) = (x2 + px + q)(b5 x3 + b4 x2 + b3 x + b2 ),
onde
b5 = a 5
b4 = a4 − pb5
b3 = a3 − pb4 − qb5
b2 = a2 − pb3 − qb4
b1 = a1 − pb2 − qb3
b0 = a0 − pb1 − qb2
Daı́, calculando sucessivamente b5 , b4 , b3 e b2 , obtemos
b1 = −8 + p4 − 3p2 q + q 2
b0 = 2 + 8p − p5 + 4p3 q − 3pq 2
Mas também vamos precisar das derivadas parciais de b0 e b1 .
Com efeito,
57
∂b0
∂p
∂b0
∂q
∂b1
∂p
∂b1
∂q
= 8 − 5p4 + 12qp2 − 3q 2
= 4p3 − 6pq
= 4p3 − pq
= −3p2 + 2q
Para começar a utilizar o método de Newton-Bairtow, precisamos de uma aproximação
inicial dos coeficientes p e q. Pelo Teorema 4.1.2 as raı́zes de P (x) estão em um disco
8
1
centrado na origem e de raio R = 1 +
= 9. Então podemos tomar p0 = −0, 5 e q0 = 3,
que determinam o polinômio x2 − 0, 5x + 3 cujas raı́zes são complexas e têm módulo
√
ρ = 3 < 9.
k
pk
qk
b0 (pk , qk )
b1 (pk , qk )
0
0,5
3
-6,03125
-1,1875
1
0,29880
2,69128
-1,81741
2
0,27599
2,78655
-1,98851
3
0,20845
2,80972
4
0,16597
5
∂b0
∂p
∂b0
∂q
∂b1
∂p
∂b1
∂q
(pk , qk )
D(pk , qk )
pk+1
qk+1
-10,3125
-8,5
-8,5
5,25
-126,39062
0,298801
2,69128
-1,46990
-10,88540
-4,71823
-4,71823
5,114711
-77,93735
0,27599
2,78655
-0,86610
-12,776512
-4,53035
-4,53035
5,34459
-88,80929
0,20845
2,80972
-1,16779
-0,46986
-14,22795
-3,47784
-3,47785
5,48908
-90,19381
0,16597
2,83881
2,83881
-0,63305
-0,17502
-15,24185
-2,80869
-2,80869
5,59497
-93,166441
0,13846
2,84835
0,13846
2,84835
-0,23225
-0,05034
-15,68588
-2,35578
-2,35578
5,63919
-94,00536
0,12755
2,8509
6
0,12755
2,85093
-0,06614
-0,01106
-15,82819
-2,17358
-2,17358
5,65306
-94,20215
0,12425
2,85127
7
0,12425
2,85127
-0,01448
-0,00209
-15,86216
-2,11792
-2,11792
5,65622
-94,20546
0,12350
2,85129
8
0,12350
2,85129
-0,00273
-0,00037
-15,86888
-2,10535
-2,10535
5,65683
-94,19999
0,12336
2,85129
9
0,12336
2,85129
-0,00048
-6,43219E-05
-15,87009
-2,10295
-2,10295
5,65693
-94,19846
0,12334
2,85129
10
0,12334
2,85129
-8,40883E-05
-1,11483E-05
-15,87031
-2,10252
-2,10252
5,65695
-94,19817
0,12333
2,85129
11
0,12333
2,85129
-1,4574E-05
-1,93096E-06
-15,87034
-2,10245
-2,10245
5,65695
-94,19812
0,12333
2,85129
(pk , qk )
(pk , qk )
(pk , qk )
Daı́ obtemos p11 = 0, 12333 e q11 = 2, 85129. Agora o problema se resume a calcular
as raı́zes da equação x2 + 0, 12333x + 2, 85129 que são z1 = −0, 061666008 + 1, 687451253i
e z2 = −0, 061666008 − 1, 687451253i.
Para calcular as demais raı́zes basta reduzir o grau do polinômio P (x), já que conhecemos duas de suas raı́zes. Assim obtemos o polinômio R(x) = x3 −0, 12333x2 −2, 836084x+
0, 701436. Pelo teorema 4.1.2 as raı́zes reais estão no intervalo [−3, 836084; 3, 836084].
Mais precisamente, pela tabela abaixo R(x) tem uma raiz no intervalo [-2,-1], uma raiz
no intervalo [0,1] e uma raiz em [1,2].
x
-2
-1
0
1
2
p(x) -14
9
2 -5
18
58
Para obter uma aproximação da raiz do intervalo [−2, −1] vamos utilizar o método de
Newton que consiste em obter o limite da sequência xk+1 = xk −
R(xk )
.
R0 (xk )
Com efeito,
k
xk
xk+1
R(xk+1 )
0
-2
-1,78050
-0,28444
1
-1,78050
-1,74052
-0,00868
2
-1,74052
-1,73922
-0,00002
3
-1,73922
-1,73922
-0,00002
Por tanto x0 = −1, 73922 é uma raiz de R(x) com margem de erro de ² = 10−4 .
Para obter uma aproximação da raiz do intervalo [0, 1] vamos utilizar o método da
bissecção.
Com efeito,
k
a
b
p(a)
p(b)
0
0
1
2
-5
-
1
1
0
0,5
2
-1,696
-
0,5
2
0
0,25
2
0,001
+
0,25
3
0,25
-0,992
-
0,125
0,375 0,001
p(a)p(b) |a − b|
Portanto x1 = 0, 25 é uma raiz de R(x) com margem de erro de ² = 10−3
Para calcular a última raiz vamos utilizar o método da iteração linear.
Com efeito, queremos encontrar a solução de x3 −0, 12333x2 −2, 836084x+0, 701436 =
0. Daı́ x = 0, 12333 +
2,836084
x
−
fixo da função f (x) = 0, 12333 +
0,701436
.
x2
2,836084
x
Logo o problema se resume a calcular o ponto
0,701436
.
x2
−
Como f 0 (2) = −0, 533662 < 1, então
f (x) tem um ponto fixo no intervalo [1,2]. Assim temos,
k
xk
xk+1 = f (xk )
0
2
1,366013
1
1,366013
1,823601
2
1,823601
1,467615
3
1,467615
1,730114
...
...
...
50 1,612429
59
1,612429
Assim obtemos x2 = 1, 612429, a última raiz de R(x), com margem de erro de ² = 10−6 ,
já que R(1, 612429) = 0, 000001.
O que fizemos até aqui foi encontrar aproximações convenientes das raı́zes de P (x).
Esta foi uma discussão do ponto de vista da matemática aplicada. Agora iremos discutir
a natureza da solução e investigar se P (x) é resolúvel por radicais.
Com efeito, as possı́veis raı́zes racionais de P (x) = x5 − 8x + 2 são -2, -1 , 0, 1 e 2.
Logo P (x) é irredutı́vel sobre Q. Como já vimos as raı́zes de P (x) são todas distintas. Se
θ1 , θ2 , θ3 , θ4 e θ5 são as raı́zes de P (x) então K = Q(θ1 , θ2 , θ3 , θ4 , θ5 ) é o corpo de raı́zes de
P (x). Como as raı́zes são todas distintas então G = G(K, Q), o grupo de Galois de P (x),
é um subgrupo de S5 . Como P (x) é irredutı́vel, segue do teorema 3.1.2 que ∀i = 1, ..., 5
[Q(θi : Q)] = 5. Pelo teorema da Torre [K : Q] = 5 (ver [7]). Logo, pelo teorema 3.2.7
|G| = 5. Daı́, como todo grupo de ordem prima é cı́clico segue que G possui um elemento
de ordem 5. A aplicação z 7→ z de C induz um automorfismo de K, que mantém fixa as
3 raı́zes reais e permuta as 2 complexas. Mas isto corresponde ao 2-ciclo. Logo G contém
uma transposição (2-ciclo) e um ciclo de ordem 5. Se pode provar que qualquer ciclo de
ordem 5 e um 2-ciclo geram o S5 . Logo G = S5 e portanto pelo teorema 3.3.3 P (x) não
é resolúvel por radicais.
60
Considerações Finais
As equações polinomiais foi e ainda é fonte de estudo de muitos. Durante muitos
séculos, matemáticos dos mais diversos lugares se empenharam em achar fórmulas que
solucionassem tais equações. Até que Niels Abel demonstrou que uma equação polinomial
de grau maior ou igual a cinco não resolúvel por radicais. Vale ressaltar que Abel não
provou que as fórmulas não existem. Ele apenas provou que as raı́zes não podem ser
escritas em função dos coeficientes do polinômio usando as quatro operações e a extração
de raiz. Nada impede que as raı́zes possam ser escritas em função dos coeficientes do
polinômio utilizando outras funções elementares, como as trigonométricas por exemplo.
Em contraponto, como já vou dito, em determinadas circunstância o método iterativo
pode ser mais oportuno que o método direto.
Nesta perspectiva, este trabalho teve como objetivo fazer uma discussão detalhada
das equações polinomiais abordando desde as soluções das equações polinomiais de grau
menor que quatro, demonstrando a insolubilidade por radicais das equações de grau ≥ 5
e discorrendo sobre alguns métodos iterativos para se obter raı́zes de equações.
61
Referências Bibliográficas
[1] Artin, E., Galois Theory, second edition, Notre Dame Mathematical Lectures, Number 2.
[2] Bastos, G., G., Resolução de Equações por Radicais. Segunda Bienal da SBM.
Disponı́vel em www.bienasbm.ufba.br
[3] Cláudio, D. M., & Marins, J. M. Cálculo numérico computacional: teoria e prática.
2. ed.-São Paulo: Atlas, 1994.
[4] Garcia, A. & Lequain, Y., Álgebra: um curso de introdução. Rio de Janeiro, Instituto
de Matemática Pura e Aplicada, 1988.(Projeto Euclides)
[5] Gonçalves, A., Introdução à álgebra. Rio de Janeiro, Instituto de Matemática Pura
e Aplicada, 1979.(Projeto Euclides)
[6] Herstein I., N., Tópicos de Álgebra. Tradução de Adalberto P. Bergamasco e L. H.
Jacy Monteiro. SP. Editora da Univ. e Polı́gono, 1970.
[7] Hungerford, W., T., Algebra. Springer, 1974.
[8] Santos, I., L., D., & Silva, G., N., Zeros de Polinômios. Disponı́vel em
www.mtm.ufsc.br/ bosing/07-2/files/
[9] Teixeira, M., V., & Martins, C., R., P., A Resolução das equações algébricas por
radicais: As origens da Teoria de Galois. Terceira Bienal da SBM. Dispinı́vel em
www.ime.ufg.br/bienal/2006/minicursos.php
63
Download

Um Estudo Aprofundado Sobre Solubilidade de Equações polinomiais