UNIVERSIDADE ESTADUAL DE FEIRA DE SANTANA Departamento de Ciências Exatas e da Terra Colegiado de Matemática Curso de Licenciatura em Matemática Trabalho de Conclusão de Curso UM ESTUDO APROFUNDADO SOBRE SOLUBILIDADE DE EQUAÇÕES POLINOMIAIS Geraldo de Assis Júnior Feira de Santana Setembro de 2008 Banca Examinadora Orientadora:Profa . Msc. Fabı́ola de Oliveira Pedreira Lima Prof. Dra . Taı́se Santiago C. Oliveira Prof. Msc. Marcos Grilo Rosa UNIVERSIDADE ESTADUAL DE FEIRA DE SANTANA Departamento de Ciências Exatas e da Terra Colegiado de Matemática Curso de Licenciatura em Matemática Trabalho de Conclusão de Curso UM ESTUDO APROFUNDADO SOBRE SOLUBILIDADE DE EQUAÇÕES POLINOMIAIS Geraldo de Assis Júnior Trabalho apresentado ao Departamento de Ciências Exatas e da Terra como requisito parcial para a obtenção do tı́tulo de Licenciado em Matemática na Universidade Estadual de Feira de Santana. Orientadora: Fabı́ola O. P. Lima Feira de Santana Setembro de 2008 Agradecimentos Agradeço à Universidade Estadual de Feira de Santana por ter me oportunizado a dar esta contribuição, ainda que modesta, para o desenvolvimento cientı́fico. E em especial à professora Fabı́ola pela paciência, compreensão e incentivo na realização deste trabalho. i Resumo Neste trabalho é feito um estudo sobre solubilidade de equações polinomiais sobre um corpo arbitrário. O capı́tulo 1 é uma revisão de grupos e anéis. No capı́tulo 2 deduzimos as fórmulas para equações polinomiais de grau menor que 5, já no capı́tulo 3 demonstramos por meio da Teoria de Galois que não existem fórmulas para resolver equações polinomiais de grau maior que 4. Por fim abordamos no capı́tulo 4, métodos numéricos para se obter raı́zes de equações ainda que não existam fórmulas explı́citas para isto. Alguns resultados são enunciados sem demonstração. Isto foi feito para dar mais objetividade ao texto. Optamos por fazer uma revisão detalhada de álgebra uma vez que é pré-requisito para a Teoria de Galois que tem papel crucial em todo este trabalho. Palavras Chave: Teoria de Galois, equações polinomiais, extensão de corpos. iii Sumário Introdução 1 1 Grupos e Anéis 3 1.1 1.2 Grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.1.1 Subgrupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.1.2 Classes laterais e Teorema de Lagrange . . . . . . . . . . . . . . . . 6 1.1.3 Subgrupos normais e grupos quocientes . . . . . . . . . . . . . . . . 8 1.1.4 Homomorfismo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Anéis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 1.2.1 Ideais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1.2.2 Anéis de polinômios 1.2.3 Funções simétricas . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2 Solução de equações polinomiais de grau ≤ 4 25 2.1 Equação quadrática . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 2.2 Equação cúbica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 2.3 Equação quártica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 3 Teoria de Galois 31 3.1 Extensão de corpos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 3.2 O Teorema Fundamental da Teoria de Galois . . . . . . . . . . . . . . . . . 39 3.3 A equação geral de grau n . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 4 Métodos numéricos para se obter raı́zes de equações 4.1 51 Raı́zes reais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 4.1.1 Isolamento de raı́zes . . . . . . . . . . . . . . . . . . . . . . . . . . 52 v vi SUMÁRIO 4.2 4.1.2 Método da bissecção . . . . . . . . . . . . . . . . . . . . . . . . . . 52 4.1.3 Método da iteração linear . . . . . . . . . . . . . . . . . . . . . . . 53 4.1.4 Método de Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 Raı́zes complexas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 4.2.1 Método de Newton-Bairstow . . . . . . . . . . . . . . . . . . . . . . 55 Considerações Finais 61 Introdução As equações algébricas têm um grande destaque na história da matemática, posto que propiciou o desenvolvimento de diversas teorias. Durante um longo tempo matemáticos de diversas culturas e regiões se empenharam em deduzir fórmulas que resolvessem certas equações polinomiais. Ao final do século XVI já se tinha deduzido as fórmulas para equações polinomiais de até quarto grau [9]. A partir daı́ muitos matemáticos se empenharam em resolver as equações de grau maior que quatro. Contudo, não tiveram êxito. Foi então que um jovem matemático norueguês Niels Abel provou que as fórmulas simplesmente não existiamm. Em contrapartida, do ponto de vista da matemática aplicada, geralmente os métodos iterativos, que consistem em fazer aproximações sucessivas da solução do problema, são computacionalmente mais baratos que os métodos diretos. O termo computacionalmente mais barato utilizado aqui está ligado à idéia de custo de um algoritmo que depende do número de operações necessárias para resolver um dado problema. Por exemplo, o número de operações(adição e multiplicação) necessárias para determinar o valor numérico de um polinômio usando a definição é geralmente maior que o número de operações necessárias para fazer o mesmo cálculo usando o dispositivo de Briot-Ruffini. Nesta perspectiva, discorreremos neste trabalho sobre as teorias que tratam da solução de uma equação algébrica por método direto e sobre os métodos iterativos de se solucionar o mesmo problema. No capı́tulo um é feita uma revisão de álgebra para dar subsı́dio ao capı́tulo três que trata dos fundamentos da Teoria de Galois. Neste capı́tulo provamos que o polinômio geral de grau maior que quatro não é resolúvel por radicais. O capı́tulo dois deste trabalho trata das equações polinomiais de até quarto grau, demonstrando as fórmulas que determinam as suas raı́zes. E finalmente no capı́tulo quatro abordamos alguns métodos iterativos para se obter as raı́zes da equação. 1 Capı́tulo 1 Grupos e Anéis 1.1 Grupos Um grupo consiste de um conjunto não vazio G e uma aplicação σ : G × G −→ G que a cada par (x, y) em G × G associa um único elemento σ(x, y) em G. Além disso, tal aplicação deve satisfazer a três condições. São elas: 1. Associatividade Dados x, y, z ∈ G temos que σ(σ(x, y), z) = σ(x, σ(y, z)). 2. Existência do elemento neutro Existe um elemento e de G tal que σ(x, e) = σ(e, x) = x; ∀x ∈ G. 3. Simetrização Para todo elemento x de G existe um y em G tal que σ(x, y) = σ(y, x) = e. O elemento y é dito inverso ou simétrico de x. Se além das três condições acima ocorre que σ(x, y) = σ(y, x), ∀x, y ∈ G, dizemos que o grupo é comutativo ou abeliano. O elemento neutro é único, pois se existissem dois e e e0 , terı́amos que e = σ(e, e0 ) = e0 . O simétrico também é único. De fato, suponhamos que um elemento x de G tenha dois simétricos y e z. Daı́ σ(x, y) = e e σ(x, z) = e. Ora, se σ(x, y) = e, então os pares ordenados (z, σ(x, y)) e (z, e) são iguais. Logo suas imagens também são iguais, isto é, σ(z, σ(x, y)) = σ(z, e). Daı́ σ(σ(z, x), y) = σ(z, e). Logo σ(e, y) = σ(z, e). Portanto y = z. 3 Comumente representamos a imagem do par (x, y) pela σ por x.y ou simplesmente xy, neste caso temos um grupo multiplicativo o qual denotamos por (G, .). Outras vezes representamos a imagem de (x, y) por x + y, neste caso temos um grupo aditivo que denotamos por (G, +). Em geral usaremos a notação multiplicativa para representar uma operação arbitrária de um grupo arbitrário. Vale ressaltar que definir uma função de G × G em G nada mais é que definir uma operação no conjunto G. Usamos a terminologia inverso para grupos multiplicativos e simétrico para grupos aditivos. Quando o grupo é multiplicativo representamos o inverso do elemento x por x−1 e quando o grupo é aditivo representamos o simétrico de x por −x. Exemplos de grupos 1. (Z, +) é um grupo, isto é, Z é um grupo aditivo com a operação usual de soma. 2. (Q∗ , .) é um grupo multiplicativo e (Q, +) é um grupo aditivo. 3. O conjunto das matrizes inversı́veis de ordem n é um grupo multiplicativo não abeliano denominado de grupo linear. 4. O conjunto Zn dos inteiros módulo n é um grupo em relação à adição e Zn − {0} é grupo em relação à multiplicação. 5. Dado um conjunto arbitrário S tomamos A(S) como o conjunto de todas as bijeções de S em si mesmo. Seja S um conjunto de n elementos. Sem perda de generalidade tomemos S = {1, · · · , n}. Se usarmos a composição de funções entre os elementos de A(S) teremos uma estrutura de grupo. Usamos a notação Sn para representar este grupo que é denominado grupo das permutações. Podemos representar cada f ∈ Sn como f = 1 2 ··· f (1) f (2) · · · n f (n) Dado k ≤ n, se acontece que f (i1 ) = i2 , f (i2 ) = i3 , · · · , f (ik ) = i1 e f (ij ) = ij quando j 6∈ {1, · · · , k}, então representamos f como f = (i1 i2 · · · ik ) e dizemos que f é um k-ciclo. 4 1.1.1 Subgrupos Dado um grupo G, entendemos como subgrupo de G a todo subconjunto H ⊂ G que é grupo com a mesma operação de G. Usamos a notação H < G para representar este fato. Segue desta definição que {e} e G são subgrupos de G para qualquer que seja G. São os chamados subgrupos triviais. Exemplos de subgrupos 1. O grupo aditivo nZ, que é o grupo dos múltiplos inteiros de n ∈ Z, é um subgrupo de Z. 2. O grupo multiplicativo dos racionais (Q, .) é um subgrupo do grupo dos reais (R, .). 3. Seja G um grupo, dado a ∈ G e m um inteiro positivo definimos am = a.a. · · · .a}. | {z m vezes Assim, para cada a 6= e o grupo [a] = {e, a, a2 , · · · , am , · · · } que é o grupo gerado por a é um subgrupo de G. Em geral dado a ∈ G e m ∈ Z definimos e, se m = 0 am = a.am−1 , se m > 0 (a−1 )−m , se m < 0 Se G for finito então o grupo H = {e, a, a2 , · · · , am−1 } é dito grupo cı́clico, isto porque para cada i ≥ m existe j ∈ {1, · · · , m − 1} tal que ai = aj . Em um grupo finito definimos ordem do grupo como o número de elementos deste grupo. Além disso, sendo G um grupo e a elemento de G, definimos ordem de a como sendo o menor inteiro positivo m tal que am = e. Usamos a notação |G| para representar a ordem de G e |a| para a ordem de a. No caso de um grupo cı́clico G = [a], temos que |G| = |a|. Proposição 1.1.1 Todo subgrupo de um grupo cı́clico também é cı́clico. Demonstração: Seja G = [a] um grupo cı́clico de ordem m e H um subgrupo de G tomemos n como o menor inteiro positivo tal que an ∈ H. Segue que [an ] ⊂ H. Por outro lado, se x ∈ H então existe h ∈ Z tal que x = ah ∈ H. Pelo teorema da divisão euclidiana, 5 existem q, r ∈ Z tais que h = qn + r, com 0 ≤ r < n. Daı́ ar = ah−qn = ah a−qn ∈ H. Logo ar ∈ H. Como n é o menor inteiro positivo tal que an ∈ H segue que r = 0 e daı́ h = qn. Logo x = ah = aqn ∈ [an ]. Daı́ H ⊂ [an ], e portanto H = [an ]. Teorema 1.1.1 Dado um grupo G e um subconjunto H ⊂ G, H é subgrupo de G se, e somente se a.b−1 ∈ H, ∀ a, b ∈ H. Demonstração: De fato, se H é subgrupo de G então é claro que a.b−1 ∈ H, ∀ a, b ∈ H. Reciprocamente, se a.b−1 ∈ H ∀ a, b ∈ H, então tomemos b = a, daı́ e = a.a−1 = a.b−1 ∈ H. Agora, como e ∈ H, para todo a ∈ H temos que a−1 = e.a−1 ∈ H. Além disso, dados a, b ∈ H sabemos que b−1 ∈ H e daı́ a.b = a.(b−1 )−1 ∈ H, isto é, a operação é fechada em H, e portanto vale a associativa em H já que esta é válida em G. Logo H é subgrupo de G. Este resultado é muito importante na teoria dos grupos. Sem ele para se provar que um dado subconjunto é subgrupo várias condições deveriam ser verificadas. Agora apenas uma condição deve ser satisfeita. 1.1.2 Classes laterais e Teorema de Lagrange Seja G um grupo e H um subgrupo de G, dado um x ∈ G o conjunto de todos os elementos da forma xh, com h ∈ H, será denotado por xH e designado classe lateral à esquerda módulo H, da mesma forma o conjunto dos hx será denotado por Hx e designado classe lateral à direita módulo H. A cardinalidade do conjunto de todas as classes laterais à esquerda ou à direita é denominado ı́ndice de H em G e denotado por (G : H). Frequentemente usaremos apenas a expressão classe lateral para designar classe lateral à esquerda. Exemplo 1.1.1 Considere o grupo aditivo Z6 = {0, 1, 2, 3, 4, 5} e o subgrupo H =< 6 2 >= {0, 2, 4}, vamos determinar as classes laterais de G = Z6 módulo H. 0 + H = {0 + 0, 0 + 2, 0 + 4} = {0, 2, 4} 1 + H = {1 + 0, 1 + 2, 1 + 4} = {1, 3, 5} 2 + H = {2 + 0, 2 + 2, 2 + 4} = {2, 4, 0} 3 + H = {3 + 0, 3 + 2, 3 + 4} = {3, 5, 1} 4 + H = {4 + 0, 4 + 2, 4 + 4} = {4, 0, 2} 5 + H = {5 + 0, 5 + 2, 5 + 4} = {5, 1, 3} Logo, as únicas classes laterais à esquerda de G = Z6 módulo H, são {0, 2, 4} e {1, 3, 5}, portanto (G : H) = 2. Note que |G| = 6 e |H| = 3 e daı́ |G| = |H|.(G : H). Veremos mais adiante que não se trata de mera coincidência. Proposição 1.1.2 Duas classes laterais distintas são sempre disjuntas. Demonstração: Sejam aH e bH classes distintas. Suponhamos que aH ∩ bH 6= ∅. Segue que existe x tal que x ∈ aH ∩ bH. Daı́ x ∈ aH e x ∈ bH. Logo existem h1 , h2 ∈ H tais que x = ah1 e x = bh2 . Segue que ah1 = bh2 , e portanto b−1 a = h2 h−1 1 ∈ H. Agora, dado y ∈ aH, temos que existe h ∈ H tal que y = ah. Logo b−1 y = b−1 ah. Daı́ b−1 y ∈ H, e portanto existe h3 ∈ H tal que b−1 y = h3 . Logo y = bh3 ∈ bH. Segue que aH ⊂ bH. De forma análoga concluı́mos que bH ⊂ aH e daı́ aH = bH, o que fere a nossa hipótese inicial de que aH 6= bH. Temos portanto um absurdo que certamente veio da hipótese de que aH ∩ bH 6= ∅. Teorema 1.1.2 (Lagrange) Dado um grupo finito G e um subgrupo H ⊂ G temos que |G| = |H|.(G : H), isto é, a ordem do subgrupo divide a ordem do grupo. Demonstração: Ora da proposição 1.1.2 temos que as classes laterais de G módulo H são duas a duas disjuntas. Logo o grupo G é a reunião disjunta de todas as suas classes laterais módulo H . Então, sejam a1 H, · · · , am H as classes laterais de G, onde [ m = (G : H) segue que G = ai H. Portanto |G| = ] (a1 H) + · · · + ] (am H) (onde 1≤i≤m ] (ai H) representa a cardinalidade de ai H. É usada esta notação em vez de |ai H| porque 7 ai H não é necessariamente um grupo). Segue daı́ que |G| = |H| + · · · + |H| = |H|.m = | {z } m vezes |H|.(G : H). O que foi provado aqui é que a ordem do subgrupo divide a ordem do grupo, isto é, para cada subgrupo H de G existe um m = |H| tal que m divide |G|. Daı́ naturalmente surge a pergunta: Dado um divisor m de |G| existe um subgrupo H de G tal que |H| = m? A resposta é não. Existem grupos cujo número de subgrupos é menor que o número de divisores de sua ordem. O resultado mais próximo da recı́proca do Teorema de Lagrange é o Teorema de Sylow que garante o resultado quando a ordem do grupo é da forma pα com p primo e α ∈ Z cuja demonstração pode ser vista em [6]. 1.1.3 Subgrupos normais e grupos quocientes Na seção anterior definimos classes laterais. Sobre certas condições podemos ter uma estrutura de grupo no conjunto de todas as classes laterais a esquerda ou no conjunto de todas as classes laterais a direita. Estas idéias serão trabalhadas agora nessa seção. Definição 1.1.1 Dado um grupo G, chamamos de subgrupo normal a todo subgrupo N de G tal que gng −1 ∈ N para todo n ∈ N e todo g ∈ G. Representamos este fato por N ¢ G. Teorema 1.1.3 Dado um grupo G, temos que N ¢ G se, e somente se N = gN g −1 para todo g ∈ G. Demonstração: Se N é normal, então gng −1 ∈ N , ∀n ∈ N e ∀g ∈ G. Logo gN g −1 ⊂ N ∀g ∈ G. Além disso, se x ∈ N , então g −1 xg = g −1 x(g −1 )−1 ∈ N . Mas x = g(g −1 xg)g −1 ∈ gN g −1 . Logo N ⊂ gN g −1 e daı́ gN g −1 = N . Reciprocamente, se gN g −1 = N , ∀g ∈ G, então gng −1 ∈ N ∀g ∈ G e ∀n ∈ N , logo N é subgrupo normal de G. Teorema 1.1.4 Seja G um grupo, um subgrupo N de G é normal se, e somente se gN = N g, ∀g ∈ G. Demonstração: Suponha N ¢ G. Se x ∈ gN , então existe n ∈ N tal que x = gn. Como n ∈ N e N = g −1 N g, já que N é normal, segue que n = g −1 n0 g, com n0 ∈ N . Daı́ 8 x = g(g −1 n0 g) = n0 g. Logo x ∈ N g e por tanto gN ⊂ N g. De forma análoga concluı́mos que N g ⊂ gN e daı́ gN = N g. A recı́proca é trivial. Teorema 1.1.5 Seja G um grupo e N um subgrupo normal de G, o conjunto de todas as classes laterais à esquerda(ou à direita), que denotamos por G/N , é um grupo com a operação (aN )(bN ) = (ab)N . Demonstração: Primeiramente vamos verificar se a operação está bem definida. Com efeito, devemos provar que o produto de duas classes laterais é uma classe lateral, isto é, (aN )(bN ) = (ab)N . Ora, se x ∈ (aN )(bN ), então x = (an1 )(bn2 ) onde os ni pertencem a N . Sabemos que bn2 ∈ bN , mas pelo teorema 1.1.4 bN = N b e portanto existe n3 ∈ N tal que bn2 = n3 b. Logo x = (an1 )(n3 b) = a((n1 n3 )b). Novamente, como bN = N b temos que existe n4 ∈ N tal que (n1 n3 )b = bn4 e daı́ x = a(bn4 ) = (ab)n4 ∈ (ab)N . Por outro lado, se x ∈ (ab)N , então existe n ∈ N , tal que x = (ab)n = (ae)(bn) ∈ (aN )(bN ). Logo (aN )(bN ) = (ab)N . Agora falta provar que vale a associativa, que existe um elemento neutro e que todo elemento possui um inverso. 1. Associativa. [(aN )(bN )](cN ) = [(ab)N ](cN ) = ((ab)c)N = (a(bc))N = (aN )[(bc)N ] = = (aN )[(bN )(cN )] 2. Existência do elemento neutro. O elemento neutro de G/N é N , já que (aN )(N ) = (aN )(eN ) = (ae)N = aN e (N )(aN ) = (eN )(aN ) = (ea)N = aN . 3. Simetrização. O inverso de (aN ) é (a−1 N ), já que (aN )(a−1 N ) = (aa−1 )N = eN = N e (a−1 N )(aN ) = (a−1 a)N = eN = N . Exemplo 1.1.2 O grupo aditivo Z admite mZ como subgrupo, onde m ∈ Z. Observe que mZ é normal. Daı́ Z/mZ = {mZ, 1 + mZ, 2 + mZ, · · · , (m − 1) + mZ} é grupo. 9 Uma análise mais atenta de Z/mZ vai mostrar que ele tem a mesma estrutura do Zm , isto é, para cada classe lateral a + mZ, podemos associar uma única classe de resto a, e somar duas classes laterais (a + mZ) + (b + mZ) = (a + b) + mZ é o mesmo que somar duas classes de resto a + b = a + b. Então dizemos que Z/mZ é isomorfo a Zm . Esta idéia será formalizada na próxima seção. Lema 1.1.1 Seja N um subgrupo normal de um grupo G, temos que a ∈ N se, e somente se aN = N . ∈ N Demonstração: z }| { Com efeito, suponhamos que a ∈ N . Se x ∈ N , então x = a (a−1 x) ∈ aN e daı́ N ⊂ aN . Por outro lado, se x ∈ aN , então existe n ∈ N tal que x = an ∈ N e daı́ aN ⊂ N . Logo aN = N . Reciprocamente, se aN = N , então ∃n, n0 ∈ N tais que an = n0 e daı́ a = n0 n−1 ∈ N . Teorema 1.1.6 Seja G um grupo e N um subgrupo normal de G, temos que ∀a, b ∈ N , ab−1 ∈ N se, e somente se aN = bN . Demonstração: Se ab−1 ∈ N , então, pela lema 1.1.1, ab−1 N = N e daı́ [(ab−1 )N ](bN ) = (eN )(bN ). Logo ((ab−1 )b)N = (eb)N , daı́ (a(bb−1 ))N = bN e portanto (ae)N = bN , isto é, aN = bN . Reciprocamente, se aN = bN , então (aN )(b−1 N ) = (bN )(b−1 N ). Logo (ab−1 )N = (bb−1 )N , daı́ (ab−1 )N = eN = N e pelo lema 1.1.1 segue que ab−1 ∈ N . 1.1.4 Homomorfismo Definição 1.1.2 Dados os grupos (G, .) e (H, ∗), onde em G é definida a operação . e em H é definida a operação ∗, chamamos de homomorfismo uma aplicação f : G → H tal que f (g1 .g2 ) = f (g1 ) ∗ f (g2 ) ∀g1 , g2 ∈ G, isto é, f preserva as operações. Teorema 1.1.7 Dados os grupos (G, .) e (H, ∗) e o homomorfismo f : G → H, temos que: 1. f (eG ) = eH , onde eG é o elemento neutro de G e eH é o elemento neutro de H. 2. f (a−1 ) = f (a)−1 . 10 Demonstração: 1. Temos que f (eG ) = f (eG .eG ) = f (eG ) ∗ f (eG ). Daı́ f (eG ) = f (eG ) ∗ f (eG ). Logo f (eG ) ∗ f (eG )−1 = [f (eG ) ∗ f (eG )] ∗ f (eG )−1 e portanto eH = f (eG ). 2. Temos que eH = f (eG ) = f (a.a−1 ) = f (a) ∗ f (a−1 ). Logo f (a) ∗ f (a−1 ) = eH . Daı́ f (a)−1 ∗ [f (a) ∗ f (a−1 )] = f (a)−1 ∗ eH . Segue que f (a−1 ) = f (a)−1 . Teorema 1.1.8 Seja N um subgrupo normal do grupo G, a aplicação f : G → G/N dada por a 7→ a + N é um homomorfismo sobrejetor denominado de homomorfismo canônico. Frequentemente denotamos o elemento a + N de G/N por a. Demonstração: Com efeito, se a = b, então a − b = 0 e portanto a − b ∈ N . Pelo teorema 1.1.6 segue que a + N = b + N . Logo f (a) = f (b) e portanto a aplicação esta bem definida. Agora todo y ∈ G/N por definição é da forma y = a + N . Logo tomemos x = a ∈ G e daı́ f (x) = a + N = y. Segue que f é sobrejetora. Finalmente temos que f (a + b) = (a + b) = a + b = f (a) + f (b) ∀a, b ∈ G. Definição 1.1.3 Definimos como monomorfismo a todo homomorfismo injetor, epimorfismo a todo homomorfismo sobrejetor e isomorfismo a todo homomorfismo bijetor. Definição 1.1.4 Dados os grupos (G, .) e (H, ∗) e o homomorfismo f : G → H chamamos de núcleo do homomorfismo f e denotamos por Kerf ou N (f ) ao conjunto Kerf = {x ∈ G | f (x) = eH }. Teorema 1.1.9 Dado um grupo G, entendemos como automorfismo a todo isomorfismo de G em si mesmo. O conjunto de todos os automorfismos de G, que representamos por AutG é um grupo. Demonstração: A operação que vamos tomar em AutG é a composição de funções. Então provemos primeiramente que a composição de homomorfismo é um homomorfismo. Com efeito, (f ◦ g)(x + y) = f (g(x + y)) = f (g(x) + g(y)) = f (g(x)) + f (g(y)) = (f ◦ g)(x) + (f ◦ g)(y) A composição de funções é associativa. Com efeito, ((f ◦ g) ◦ h)(x) = (f ◦g)(h(x)) = f (g(h(x))) = f ((g◦h)(x)) = (f ◦(g◦h))(x) O elemento neutro é a aplicação 11 identidade I(x) = x. (f ◦ I)(x) = f (I(x)) = f (x) e (I ◦ f )(x) = I(f (x)) = f (x). Dada a aplicação f tal que f (x) = y a aplicação inversa é uma aplicação f −1 tal que f −1 (y) = x. Logo (f −1 ◦ f )(x) = f −1 (f (x)) = f −1 (y) = x = I(x) e (f ◦ f −1 )(y) = f (f −1 (y)) = f (x) = y = I(y). Teorema 1.1.10 Dados os grupos (G, .) e (H, ∗), o homomorfismo f : G → H é injetor, isto é, um monomorfismos se, e somente se Kerf = {eG }. Demonstração: Suponhamos que f seja injetor. Se f (x) = eH então pelo item 1 do teorema 1.1.7 temos que f (x) = f (eG ), e como f é injetor segue que x = eG . Logo Kerf = {eG }. Reciprocamente, suponhamos que Kerf = {eG }. Se f (x) = f (y), então f (x) ∗ f (y)−1 = eH , daı́ f (x) ∗ f (y −1 ) = eH , logo f (x.y −1 ) = eH . Como kerf {eG } segue que x.y −1 = eG , daı́ x = y e portanto f é injetor. Teorema 1.1.11 Dados os grupos (G, .) e (H, ∗) e o homomorfismo f : G → H, o núcleo do homomorfismo, Kerf , é um subgrupo normal de G. Demonstração: Seja N = Kerf , dados x, y ∈ N , temos que f (x) = eH e f (y) = eH , −1 daı́ f (x.y −1 ) = f (x) ∗ f (y −1 ) = f (x) ∗ f (y)−1 = eH ∗ e−1 ∈ N e portanto H = eH . logo x.y N é subgrupo de G. Além disso, para todo x ∈ N e todo g ∈ G temos que f (gxg −1 ) = f (g) ∗ f (x) ∗ f (g −1 ) = f (g) ∗ eH ∗ f (g −1 ) = f (g) ∗ f (g −1 ) = f (g.g −1 ) = f (eG ) = eH , daı́ gxg −1 ∈ N e portanto N é um subgrupo normal de G. Definição 1.1.5 Dados os grupos (G, .) e (H, ∗), dizemos que G é isomorfo a H e denotamos por G ≈ H se existir um isomorfismo de G em H. Exemplo 1.1.3 f : Zm → Z/mZ definido por a 7→ a + mZ é um isomorfismo, logo Zm ≈ Z/mZ. Com efeito, dados x, y ∈ Zm temos que f (x + y) = f (x + y) = (x + y) + mZ = (x + mZ) + (y + mZ) = f (x) + f (y). Logo f é um homomorfismo. Agora vejamos que f é bijetor, e portanto um isomorfismo. Se f (x) = mZ, então x + mZ = mZ, daı́ xx ∈ mZ, isto é x = 0, logo Kerf = {0} e portanto f é injetor. Além disso para todo y = a + mZ ∈ Z/mZ tomemos x = a em Zm e daı́ f (x) = f (a) = a + mZ = y, logo f é sobrejetor. 12 Exemplo 1.1.4 f : R2 → C dado por (a, b) 7→ a + bi é um isomorfismo, e portanto R2 ≈ C. Primeiramente mostremos que f é um homomorfismo. f ((a, b)+(a0 , b0 )) = f (a+a0 , b+ b0 ) = (a + a0 ) + (b + b)i = (a + bi) + (a0 + b0 i) = f (a, b) + f (a0 , b0 ). Agora mostremos que f é bijetor. Se f (a, b) = 0, então a + bi = 0, logo a = b = 0, daı́ Kerf + {(0, 0)} e portanto f é injetor. Além disso, para todo y = a + bi ∈ C tomemos x = (a, b) e desta forma temos f (x) = f (a, b) = a + bi = y. Exemplo 1.1.5 O número a + bi onde a, b ∈ Z é chamado de inteiro gaussiano. O conjunto {a + bi|a, b ∈ Z} é isomorfo a Z × Z. A demonstração deste fato é análoga ao exemplo anterior. Teorema 1.1.12 (Teorema do homomorfismo) Dados os grupos (G, .) e (H, ∗). Seja f : G → H um homomorfismo e N = Kerf , temos que G/N ≈ f (G). Em particular, se f é um epimorfismo, isto é, um homomorfismo sobrejetor, então G/N ≈ H. Demonstração: Considere a aplicação σ : G/N → f (G) dada por aN 7→ f (a). Devemos verificar se tal aplicação está bem definida. Com efeito, se aN = bN , então, pelo teorema 1.1.6, ab−1 ∈ N . Logo f (ab−1 ) = eH , isto é, f (a) ∗ f (b)−1 = eH , ou seja, f (a) = f (b), portanto σ(aN ) = σ(bN ). Para provar que σ é injetora basta seguir o caminho inverso do raciocı́nio anterior, ou então pode perceber que, se σ(aN ) = eH , então f (a) = eH . Logo a ∈ N , e pela afirmação 1.1.1 aN = N . Segue que Kerσ = {N }, e portanto σ é injetora. Lembre-se que N é o elemento neutro de G/N . Agora, para todo y ∈ f (G), existe a ∈ G tal que f (a) = y, então tomemos x = aN em G/N e assim temos que σ(x) = σ(aN ) = f (a) = y. Logo σ é sobrejetora. Por fim, dados aN, bN ∈ G/N temos que σ((aN )(bN )) = σ((ab)N ) = f (ab) = f (a) ∗ f (b) = σ(aN ) ∗ σ(bN ), logo σ é homomorfismo. Segue G/N ≈ f (G). 1.2 Anéis Na seção 1.1 definimos grupo como um conjunto não vazio munido de uma operação que é uma aplicação G × G → G satisfazendo a três axiomas. Para definir um anel 13 precisamos de duas operações sendo que para uma delas o conjunto dado é grupo. Definição 1.2.1 Chamamos de Anel ao conjunto não vazio A, munido de duas operações, que para simplificar a notação vamos chamá-las de adição + e multiplicação ., satisfazendo as seguintes condições. 1. A é grupo abeliano em relação a adição. 2. A multiplicação é associativa, isto é, a(bc) = (ab)c, ∀a, b, c ∈ A. 3. Vale a distributiva, isto é, a(b + c) = ab + ac e (a + b)c = ac + bc, ∀a, b, c ∈ A. Se além das condições supracitadas for verdade que ab = ba, ∀a, b ∈ A, então A é um anel comutativo e se existir 1 ∈ A tal que a.1 = 1.a = a ∀a ∈ A dizemos que A é um anel com unidade. Se as duas condições forem satisfeita, então dizemos que A é um anel comutativo com unidade. Neste texto sempre que nos referirmos a anel estaremos falando de anel comutativo com unidade. Usamos a notação (A, +, .) para denotar que A é anel com estas operações. Além disso, se para todo a ∈ A e a 6= 0 existir b ∈ A tal que ab = 1, então dizemos que A é um corpo. Exemplo 1.2.1 Z é um anel com as operações usuais. Exemplo 1.2.2 Zn , o conjunto dos inteiros módulo n, é anel com as operações usuais. Exemplo 1.2.3 Seja A um anel, o conjunto das matrizes quadradas de ordem n com entradas em A é um anel não-comutativo com as operações usuais de matrizes. Teorema 1.2.1 Em todo anel A temos que, ∀a, b ∈ A. 1. a0 = 0 2. (−1)a = −a 3. (−a)b = −(ab) 4. (−a)(−b) = ab onde 0 é o elemento neutro da adição. Demonstração: 14 1. Note que a0 = a(0 + 0) = a0 + a0, isto é, a0 = a0 + a0. Desta forma, a.0 − a.0 = (a0 + a0) − a0, daı́ 0 = a0 + (a0 − a0), e portanto 0 = a0. 2. Note que a + (−1)a = 1a + (−1)a = (1 + (−1))a = 0a = 0, isto é, a + (−1)a = 0, e daı́ −a +(a +(−1)a) = −a +0, logo (−a + a)+ (−1)a = −a, ou seja, 0 + (−1)a = −a e portanto (−1)a = −a. 3. Note que (−a)b + ab = ((−a) + a)b = 0b = 0, isto é, (−a)b + ab = 0, daı́ ((−a)b + ab) − (ab) = 0 − (ab), logo (−a)b + (ab − (ab)) = −(ab), isto é, (−a)b + 0 = −(ab), e portanto (−a)b = −(ab). 4. Note que (−a)(−b) + (−(ab)) = (−a)(−b) + (−a)b = (−a)((−b) + b) = (−a)0 = 0, isto é, (−a)(−b) + (−(ab)) = 0, daı́ [(−a)(−b) + (−(ab))] + ab = 0 + ab, logo (−a)(−b)+[(−(ab))+ab] = ab, ou seja, (−a)(−b)+0 = ab, portanto (−a)(−b) = ab. Definição 1.2.2 Seja A um anel, o subconjunto S de A é um subanel de A, se for anel com as mesmas operações de A. Definição 1.2.3 Dados os anéis (A, +, .) e (B, +, .) chamamos de homomorfismo de anéis a toda aplicação f : A → B tal que f (a + b) = f (a) + f (b) e f (ab) = f (a)f (b), ∀a, b ∈ A. Assim como na definição 1.1.3 definimos monomorfismo, epimorfismo e isomorfismo de anéis a todo homomorfismo injetor, sobrejetor e bijetor, respectivamente. Dois anéis serão ditos isomorfos se existir um isomorfismo entre eles. Teorema 1.2.2 Seja f : A → B um homomorfismo de anéis é verdade que: 1. f (0A ) = 0B 2. f (−a) = −f (a) Demonstração: Segue da definição 1.2.1 item 1 e do teorema 1.1.7. Vale ressaltar que nem sempre se tem que f (1A ) = f (1B ), onde 1A é a unidade do anel A e 1B é a unidade do anel B. 15 Teorema 1.2.3 Seja A um corpo, se existe um homomorfismo sobrejetor de anéis de A em B, então B também é corpo. Demonstração: Como f é sobrejetor segue que f (1A ) = 1B . Com efeito, como f é sobrejetor, então existe x ∈ A tal que f (x) = 1B . Agora suponhamos que f (1A ) = y 6= 1B . Daı́ f (1A )f (x) = y1B . Logo f (x) = y. Concluı́mos que f (x) = 1B e f (x) = y, o que é um absurdo. O absurdo é proveniente da hipótese de que y 6= 1B . Logo f (1A ) = 1B . Agora, dado um 0 6= b ∈ B temos pela sobrejetividade de f que existe 0 6= a ∈ A tal que f (a) = b. Como A é um corpo segue que existe a−1 . Então tomemos b0 = f (a−1 ) ∈ B e daı́ bb0 = f (a)f (a−1 ) = f (aa−1 ) = f (1A ) = 1B , isto é, b0 = b−1 . Portanto todo elemento não nulo b ∈ B possui um inverso multiplicativo. Logo B é um corpo. 1.2.1 Ideais Definição 1.2.4 Dado o anel A, chamamos de ideal de A, a todo subconjunto I que satisfaz as seguintes condições: 1. se a, b ∈ I então a − b ∈ I. (I é grupo em relação à adição) 2. se a ∈ I e c ∈ A, então ac ∈ I. Exemplo 1.2.4 O conjunto nZ é um ideal do anel Z. Com efeito, se a, b ∈ nZ, então existem x, y ∈ Z tais que a = nx, b = ny e daı́, a − b = nx − ny = n(x − y) ∈ nZ. Além disso, dados a ∈ nZ e c ∈ Z, temos que a = nx, com x ∈ Z e daı́ ac = (nx)c = n(xc) ∈ nZ. Exemplo 1.2.5 Dado um subconjunto X = {a1 , · · · , an } de um anel A. O conjunto (X) = {a1 x1 + · · · + an xn |xi ∈ A} é um ideal de A. Com efeito, sejam x = a1 x1 + · · · + an xn e y = a1 y1 + · · · + an yn ∈ (X), temos que x − y = (a1 x1 + · · · + an xn ) − (a1 y1 + · · · + an yn ) = a1 (x1 − y1 ) + · · · + an (xn − yn ) ∈ (X), já que xi −yi ∈ A. Além disso, ∀z ∈ A, zx = z(a1 x1 +· · ·+an xn ) = (za1 )x1 +· · ·+(zan )xn = (a1 z)x1 + · · · + (an z)xn = a1 (zx1 ) + · · · + an (zxn ) ∈ (X), já que zxi ∈ A. Em particular, quando X = {a}, escrevemos (a) no lugar de (X). O ideal (a) é denominado ideal principal. Um anel em que todo ideal é principal é denominado de anel principal. Z é um anel principal. 16 Teorema 1.2.4 Dados os ideais I e J de um anel A. O conjunto I + J de todas somas i + j, com i ∈ I e j ∈ J, e o conjunto I ∩ J também são ideais de A. Demonstração: Se a, b ∈ I + J, então existem i1 , i2 ∈ I e j1 , j2 ∈ J tais que a = i1 + j1 e b = i2 + j2 . Segue que a − b = (i1 + j1 ) − (i2 + j2 ) = (i1 − i2 ) + (j1 − j2 ) ∈ I + J. Além disso, se a ∈ I + J e c ∈ A, então ac = (i1 + j1 )c = i1 c + j1 c ∈ I + J, já que i1 c ∈ I e j1 c ∈ J. Logo I + J é ideal de A. Agora, se a, b ∈ I ∩ J e c ∈ A, então a, b ∈ I e a, b ∈ J. Daı́, como I e J são ideais, a − b, ac ∈ I e a − b, ac ∈ J, logo a − b, ac ∈ I ∩ J, portanto I ∩ J é um ideal de A. Definição 1.2.5 Seja I um ideal do anel A, definimos classe lateral ao conjunto a + I = {a + i| a ∈ A, i ∈ I} Como todo anel é um grupo abeliano aditivo não se faz necessária a distinção entre classe lateral à esquerda ou à direita. Teorema 1.2.5 Seja I um ideal do anel A, o conjunto A/I de todas as classes laterais é um anel. Demonstração: Precisamos definir duas operações em A/I satisfazendo as condições da definição 1.2.1. Então definimos as operações (a + I) + (b + I) = (a + b) + I e (a + I)(b + I) = ab + I, onde o elemento neutro da adição é I e o da multiplicação é 1 + I. Sabemos do teorema 1.1.5 que a primeira delas está bem definida e satisfaz o axioma 1 da definição 1.2.1. A demonstração de que a segunda operação está bem definida e satisfaz as demais condições da definição de anel fica como exercı́cio para o leitor. Teorema 1.2.6 Dado o homomorfismo de anéis f : A → B, o núcleo de f é um ideal de A. Demonstração: Inicialmente ressaltamos que a definição de núcleo aqui usada é análoga a definição para grupos, isto é, o núcleo de f é o conjunto Kerf = {x ∈ A|f (x) = 0}. Então, tomemos a, b ∈ Kerf , segue que f (a − b) = f (a) − f (b) = 0 − 0 = 0, logo a − b ∈ Kerf . Além disso, dado a ∈ Kerf e c ∈ A, temos que f (ac) = f (a)f (c) = 0.f (c) = 0, logo ac ∈ Kerf . Portanto Kerf é um ideal de A. 17 Teorema 1.2.7 Seja I um ideal do anel A a aplicação f : A → A/I definida por a 7→ a+I é um homomorfismo denominado de homomorfismo canônico. Demonstração: Pelo teorema 1.1.8 f está bem definida é sobrejetiva e preserva a soma. Então basta provar que f preserva a multiplicação. Com efeito, temos que f (ab) = ab = ab = f (a)f (b), ∀a, b ∈ A. Teorema 1.2.8 (Teorema do homomorfismo para anéis) Seja f : A → B um homomorfismo de anéis e Kerf o seu núcleo, temos que A/Kerf e f (A) são isomorfos. Em particular, se f é sobrejetor então A/Kerf ≈ B. Demonstração: Ora, como A, B são grupos aditivos então pelo teorema 1.1.7 σ é bijetor e σ(x + y) = σ(x) + σ(y) ∀x, y ∈ f (A). Agora basta provar que σ(x.y) = σ(x).σ(y) ∀x, y ∈ f (A). Com efeito, σ(x.y) = x.y + Kerf = (x + Kerf ).(y + Kerf ) = σ(x).σ(y). Definição 1.2.6 Dado um anel A, dizemos que um ideal I 6= A é um ideal primo sempre que a seguinte condição é satisfeita. Se ab ∈ I então a ∈ Iou b ∈ I. Exemplo 1.2.6 Se p é primo, então pZ é um ideal primo de Z. Com efeito, se ab ∈ pZ, então existe n ∈ Z tal que ab = pn, isto é, p divide ab, daı́ p|a ou p|b, isto é, a ∈ pZ ou b ∈ pZ. Definição 1.2.7 Um ideal I de um anel A é maximal se I 6= A e para todo ideal J tal que I ⊂ J ⊂ A tem-se que I = J ou J = A. Exemplo 1.2.7 2Z é um ideal maximal do anel Z. Com efeito, tomemos um ideal J tal que 2Z ⊂ J ⊂ Z. Se J 6= 2Z, então existe x tal que x ∈ J e x não pertence a 2Z. Segue que x = 2k + 1 com k ∈ Z. Mas 2k ∈ 2Z e portanto 2k ∈ J, daı́ pela definição 1.2.4 1 = (2k + 1) − 2k ∈ J. Novamente pela definição 1.2.4, segue que ∀a ∈ Z a = a.1 ∈ J, daı́ J = Z. Teorema 1.2.9 Todo ideal maximal é primo. 18 Demonstração: Seja M um ideal maximal do anel A. Suponhamos que ab ∈ M , mas a 6∈ M . Ora M ⊂ M + (a) ⊂ A. Daı́, como M é maximal, segue que M + (a) = M ou M + (a) = A. Se M + (a) = M , então podemos encontrar m1 , m2 ∈ M tais que m1 + a = m2 . Logo a = m2 − m1 ∈ M , mas por hipótese a 6∈ M . Segue que M + (a) 6= M . Logo M + (a) = A. Daı́ 1 ∈ M + (a). Então podemos encontrar m ∈ M e n ∈ A tais que 1 = m + na. Multiplicando esta última equação por b, obtemos b = mb + nab. Logo b ∈ M , já que ab ∈ M e m ∈ M . Portanto M é primo, pois provamos que se ab ∈ M , então a ∈ M ou b ∈ M . Teorema 1.2.10 Seja A um anel e I um ideal de A, temos que A/I é corpo sempre que I é maximal. Demonstração: Suponhamos que A/I não seja um corpo. Logo existe um elemento a + I não invertı́vel, isto é, não existe b + I ∈ A/I tal que (a + I)(b + I) = 1 + I. Mas se (a + I)(b + I) = 1 + I, então ab + I = 1 + I e pelo teorema 1.1.6 segue que ab − 1 ∈ I. Concluı́mos que se a + I não é invertı́vel então ab − 1 ∈ / I ∀b ∈ A. Tomemos agora o ideal M = I + (a) ⊃ I. 1 ∈ / M , pois caso contrário existiria c ∈ I e b ∈ A tal que 1 = c + ab, logo ab − 1 = −c ∈ I o que é um absurdo. Logo M ⊃ I e M 6= A, portanto I não é maximal. É fácil ver que a aplicação f : Z → Zn é um homomorfismo sobrejetor e o seu núcleo é Kerf = nZ. Segue do teorema fundamental do homomorfismo para anéis que Z/nZ é isomorfo a Zn , o que já tı́nhamos provado no exemplo 1.1.3. Mas p é primo se, e somente se, pZ é maximal, e portanto, pelo teorema 1.2.10 Z/pZ é corpo. Logo Zp é corpo se, e somente se p é primo. 1.2.2 Anéis de polinômios Dado um corpo F , definimos um polinômio sobre F na indeterminada x à toda exk X k k−1 ai xi , onde ai ∈ F e pressão do tipo ak x + ak−1 x + · · · + a1 x + a0 , ou simplesmente i=0 x é um elemento de F tomado arbitrariamente. Definimos como grau do polinômio não k X ai xi como sendo o maior expoente da indeterminada x cujo coeficiente é nulo p(x) = i=0 não nulo, neste caso gr(p(x)) = k, desde que ak 6= 0. 19 Teorema 1.2.11 O conjunto F [x] de todos os polinômios sobre o corpo F na indeterminada x é um anel com as operações usuais. Demonstração: Para demonstrar este fato precisamos definir duas operações sobre k1 k2 X X (1) i (2) ai x , p2 (x) = ai xi ∈ F [x], tomemos, sem F [x]. Com efeito, dados p1 (x) = i=0 i=0 k2 X perda de generalidade que k1 < k2 . Então tomemos p1 (x) = (1) ai xi = (1) (1) ai xi , onde ai (1) a i xi + i=0 i=0 k2 X k1 X = 0 para todo i > k1 . Daı́ podemos definir a soma como p1 (x) + i=k1 +1 k2 X p2 (x) = (p1 + p2 )(x) = (1) (2) (ai + ai )xi . É fácil ver que F [x] é um grupo abeliano com i=0 esta operação. Com efeito, 1. Associatividade da adição k1 X Dados p1 (x) = (1) ai xi , k2 X p2 (x) = i=0 k1 X X (3) (ai + ai )xi = i=0 (3) (1) ai xi +[ k2 X (2) ai xi + i=0 (1) (2) (1) (3) ai xi ∈ F [x] temos (3) a i xi ] = i=0 max{k1 ,k2 ,k3 } (3) i=0 X k3 X [ai + (ai + ai )]xi = X k1 X (1) a i xi + i=0 (1) (2) [(ai + ai ) + i=0 max{k1 ,k2 } ai ]xi = p3 (x) = i=0 i=0 max{k1 ,k2 ,k3 } max{k2 ,k3 } (2) k3 X i=0 que p1 (x) + [p2 (x) + p3 (x)] = X (2) ai xi , (2) (ai + ai )xi ] + i=0 k3 X (3) ai xi = [p1 (x) + p2 (x)] + p3 (x). i=0 2. Existência do elemento neutro k0 k1 X X (1) i O elemento neutro é p0 (x) = 0x , pois para todo p1 (x) = ai xi temos que i=0 i=0 max{k0 ,k1 } p0 (x) + p1 (x) = X (1) (0 + ai )xi = i=0 k1 X (1) ai xi = p1 (x). i=0 Em geral, quando não houver risco de confusão representaremos p0 (x) simplesmente por 0. 3. Simetrização O simétrico de p1 (x) = k1 X (1) ai xi é (−p1 )(x) = i=0 i=0 k1 X i=0 (1) (1) (ai + (−ai ))xi = k1 X k1 X 0xi = 0. i=0 4. Comutatividade da adição 20 (1) (−ai )xi , pois p1 (x)+(−p1 )(x) = Dados p1 (x) = k1 X (1) ai xi , p2 (x) = k2 X i=0 k1 X (1) ai xi + i=0 k1 X (2) ai xi ∈ F [X], temos que p1 (x) + p2 (x) = i=0 max{k1 ,k2 } max{k1 ,k2 } k2 X (2) ai xi X = i=0 (1) (2) (ai +ai )xi X = i=0 (2) (1) (ai +ai )xi = i=0 k2 X (2) ai xi + i=0 (1) ai xi = p2 (x) + p1 (x). i=0 Agora para provar que F [x] é um anel precisamos de uma segunda operação. Então definimos a multiplicação de polinômios como k1 X onde (3) ai = (1) ai xi . k2 X = kX 1 +k2 i=0 i=0 X (2) ai xi (3) ai xi i=0 (2) a(1) s at . s+t=i 1. Associatividade da multiplicação. k1 X Sejam p1 (x) = (1) a i xi , i=0 k1 X que p1 (x)p2 (x) = (1) a i xi . [p1 (x)p2 (x)]p3 (x) = ( i=0 (1) (2) (3) as at )av = X u+v=i s+t=u X a(1) s ( s+u=i X (2) a i xi , p3 (x) = i=0 i=0 kX 1 +k2 X p2 (x) = k2 X (2) at a(3) v ), k2 X (2) a i xi = (4) ai xi . (3) ai xi ∈ F [x], temos i=0 kX 1 +k2 i=0 k3 X k3 X (4) (4) ai xi , onde ai i=0 k1 +k 2 +k3 X (3) ai xi = i=0 (2) (3) (a(1) s at )av s+t+v=i X i=0 = X = (2) a(1) s at . Logo s+t=i (5) X (5) ai xi , onde ai = (3) a(4) u av = u+v=i X (2) (3) a(1) s (at av ) = s+t+v=i mais estes são exatamente os coeficientes de p1 (x)[p2 (x)p3 (x)], t+v=u isto implica que [p1 (x)p2 (x)]p3 (x) = p1 (x)[p2 (x)p3 (x)]. 2. Comutatividade da multiplicação. p1 (x)p2 (x) = k1 X (1) ai xi . k2 X i=0 (2) a i xi = i=0 kX 1 +k2 ( i=0 X (2) i a(1) s at )x = kX 2 +k1 i=0 s+t=i X ( (2) i at a(1) s )x = s+t=i p2 (x)p1 (x). 3. Distributividade Dados p1 (x) = k1 X (1) a i xi , p2 (x) = i=0 que p1 (x)[p2 (x) + p3 (x)] = k1 X (1) k2 X i=0 k2 X ai xi .( i=0 (3) ai )xi = kX 1 +k3 i=0 ( X (2) 3 i a(1) s (at +at ))x = s+t=i (2) ai xi , (2) ai xi + i=0 21 (3) ai xi ∈ F [x], temos i=0 i=0 kX 1 +k3 p1 (x)p2 (x) + p1 (x)p3 (x). p3 (x) = k3 X k3 X (3) ai xi ) = i=0 ( X s+t=i (2) i a(1) s at )x + k1 X (1) ai xi . k3 X (2) (ai + i=0 i=0 kX 1 +k3 X i=0 s+t=i ( (3) i a(1) s at )x = Note que não usamos o fato de F ser um corpo. Usamos apenas o fato de F ser um anel. A necessidade de F ser corpo vai garantir que F [x] seja um domı́nio de integridade. Um domı́nio de integridade é um anel que possui a propriedade de que o produto de dois elementos não nulos resulta em um elemento ainda não nulo. Afirmação 1.2.1 Seja A um anel e sejam p1 (x), p2 (x) ∈ A[x] tais que p1 (x), p2 (x) 6= 0. Segue que se A[X] é um domı́nio de integridade, então gr(p1 (x)p2 (x)) = gr(p1 (x)) + gr(p2 (x)) Demonstração: Segue diretamente da definição de multiplicação em A[x]. A igual- dade acima só não valeria se tivéssemos dois polinômios não nulos p1 (x) e p2 (x) tais que p1 (x)p2 (x) = 0, o que jamais ocorre já que A[x] é um domı́nio de integridade. Definição 1.2.8 Uma raiz de um polinômio p(x) sobre um anel A é um elemento a ∈ A tal que p(a) = 0 1.2.3 Funções simétricas Nós definimos o anel de polinômios A[x] na indeterminada x sobre o anel A. Podemos definir também A[x, y] = (A[x])[y] como sendo o anel de polinômios nas indeterminadas x e y sobre A. Assim definimos por recorrência (A[x1 , · · · , xn−1 ])[xn ] = A[x1 , · · · , xn ], o anel de polinômios nas indeterminadas x1 , · · · , xn sobre A. Os elementos de A[x1 , · · · , xn ] são da forma p(x1 , · · · , xn ) = X ai1 ···in xi11 · · · xinn 0≤i1 ≤r1 ··· 0≤in ≤rn O grau de p(x1 , · · · , xn ) é o máximo das somas i1 + · · · + in para ai1 ···in 6= 0, por exemplo, o polinômio p(x1 , x2 ) = a00 + a01 x2 + a10 x1 + a11 x1 x2 é um polinômio de duas indeterminadas e de grau dois. Um polinômio em A[x1 , x2 ] é dito simétrico se p(x1 , x2 ) = p(x2 , x1 ), por exemplo, os polinômios s1 (x1 , x2 ) = x1 + x2 e s2 (x1 , x2 ) = x1 x2 são os chamados polinômios simétricos elementares. Definimos na seção 1.1 do capı́tulo 1 o grupo das bijeções Sn agindo sobre A = {1, · · · , n}. Podemos fazer Sn agir sobre A(x1 , · · · , xn ), onde A(x1 , · · · , xn ) é o corpo 22 de frações de A[x1 , · · · , xn ], isto é, A(x1 , · · · , xn ) = ½ ¾ p(x1 , · · · , xn ) = | p(x1 , · · · , xn ), q(x1 , · · · , xn ) ∈ A[x1 , · · · , xn ] e q(x1 , · · · , xn ) 6= 0 . q(x1 , · · · , xn ) Procederemos da seguinte forma; Dado σ ∈ Sn e r(x1 , · · · , xn ) ∈ A(x1 , · · · , xn ) definimos uma aplicação de A(x1 , · · · , xn ) em si mesmo dada por r(x1 , · · · , xn ) 7→ r(xσ(1) , · · · , xσ(n) ). Chamaremos esta aplicação também de σ. Os elementos r(x1 , · · · , xn ) de A(x1 , · · · , xn ) tais que r(x1 , · · · , xn ) = r(xσ(1) , · · · , xσ(n) ) são chamados de funções racionais simétricas. Não é difı́cil ver que r1 , · · · , rn ∈ A(x1 , · · · , xn ) tais que r1 (x1 , · · · , xn ) = n X xi = x1 + · · · + xn 1 r2 (x1 , · · · , xn ) = X xi xj = x1 x2 + x1 x3 + · · · + xn−1 xn i<j r3 (x1 , · · · , xn ) = ... X xi xj xk = x1 x2 x3 + x1 x2 x4 + · · · + xn−1 xn−2 xn−3 i<j<k rn (x1 , · · · , xn ) = x1 · · · xn são funções racionais simétricas. Estas são as chamadas funções simétricas elementares. Para simplificar a notação escrevemos a1 = r1 (x1 , · · · , xn ), · · · , a2 = r2 (x1 , · · · , xn ). Segue que para cada xi temos que xni − a1 xn−1 + · · · + (−1)n an = 0. Então as funções i simétricas elementares nos fornecem relações entre os coeficientes e as raı́zes de um polinômio. 23 Capı́tulo 2 Solução de equações polinomiais de grau ≤ 4 Dado um polinômio p(x) sobre um corpo F , definimos equação polinomial como equação p(x) = 0. A busca de soluções para equações polinomiais tem grande importância na história da matemática, uma vez que propulsou o desenvolvimento de novas teorias. Já no final do século XVI a comunidade matemática já havia solucionado as equações polinomiais de grau menor que cinco. A partir daı́ os matemáticos se empenharam para resolver a equação quı́ntica, isto é, a equação polinomial do quinto grau. Contudo em 1824 o matemático norueguês Niels Abel provou que é impossı́vel resolver equações polinomiais de grau maior que 4. Isto quer dizer que a raiz da equação não pode ser escrita explicitamente em função √ de seus coeficientes utilizando as operações +, ., n . Esta é exatamente a noção de solução por radicais. Infelizmente Abel morreu sem ter seu devido reconhecimento. O leitor pode se questionar sobre a impossibilidade de se solucionar equações polinomiais de grau maior que cinco, pois é fácil ver que a equação x5 −32 = 0 pode ser resolvida por radicais. Na verdade o que se prova é a insolubilidade da equação geral. Nesta perspectiva, Everiste Galois se propõe a estudar sobre quais condições um dado polinômio é resolúvel por radicais. Para isto ele estabelece uma relação entre o que chamamos de grupo de Galois e o chamado corpo de raı́zes do polinômio. Com isto ele consegue provar que equação geral de grau maior que cinco não é resolúvel por radicais. Mas estas idéias serão trabalhadas no próximo capı́tulo. Neste capı́tulo trataremos das equações polinomiais de grau menor que cinco tomando polinômios definidos sobre o corpo dos reais. 25 2.1 Equação quadrática Começaremos com a equação quadrática, pois o caso linear é trivial. Seja a equação a2 x2 + a1 x + a0 = 0, onde a2 6= 0. Façamos a substituição x = y − a2 (y − a1 . Daı́ obtemos; 2a2 a1 a1 2 ) + a1 (y − ) + a0 = 0 2a2 2a2 Logo, a2 y 2 + a21 a2 − 1 + a0 = 0 4a2 2a2 daı́, p y=± Mas, como x = y − a21 − 4a2 a0 2a2 a1 , segue que 2a2 a1 x=− ± 2a2 2.2 p a21 − 4a2 a0 2a2 Equação cúbica Dada a equação a3 x3 + a2 x2 + a1 x + a0 = 0, com a3 6= 0 (2.1) Sempre podemos reescrevê-la como x3 + A2 x2 + A1 x + A0 = 0 Fazendo x = y − A2 , obtemos 3 1 2 1 y 3 − (A1 − A22 )y + A32 − A1 A2 + A0 = 0 3 27 3 Então podemos reescrever a equação de uma forma ainda mais simples, como y 3 + py + q = 0 Agora, seja y = u + v uma raiz da equação. Segue que (u + v)3 + p(u + v) + q = 0 26 (2.2) Daı́, u3 + v 3 + (3uv + p)(u + v) + q = 0 Segue que y = u + v é uma solução da equação 2.2 se o sistema não linear u3 + v 3 = −q (1) 3uv = −p tiver solução. Mas toda solução deste sistema também é solução do sistema u3 + v 3 = −q (2) u3 v 3 = − p3 27 Segue da definição de funções simétricas elementares que u3 e v 3 são as raı́zes da equação do segundo grau t2 + qt − p3 =0 27 Resolvendo a equação obtemos −q t= ± 2 r³ ´ q 2 ³ p ´3 + 2 3 Como y = u + v, segue que uma solução de 2.2 é s s r³ ´ r³ ´ ³ ´ 2 3 p q q 2 ³ p ´3 3 −q 3 −q + + + y= + − 2 2 3 2 2 3 (2.3) Esta é a conhecida fórmula de Cardan. Agora, seja y1 = u + v a raiz da equação 2.2 obtida pela fórmula 2.3 onde u e v são tais como no sistema (1) e seja w 6= 1 uma raiz cúbica da unidade temos que y2 = wu + wv e y3 = wu + wv, também são raı́zes de 2.2. Isto pode ser demonstrado substituindo diretamente y2 ou y3 em 2.3, ou ainda construindo as funções simétricas elementares em a2 . y1 , y2 , y3 . Portanto as raı́zes de 2.1 são xi = yi − 3a3 2.3 Equação quártica Dada a equação a4 x4 + a3 x3 + a2 x2 + a1 x + a0 = 0 (2.4) Como fizemos na seção anterior podemos reescrever 2.4 como x4 + A3 x3 + A2 x2 + A1 x + A0 = 0 27 (2.5) e por meio da substituição x = y − a3 escrevemos 2.5 como 4 y 4 + py 2 + qy + r = 0 (2.6) Agora seja x = u + v + z uma raiz de 2.6, temos que x2 − (u2 + v 2 + z 2 ) = 2(uv + uz + vz) Elevando ambos os membros ao quadrado, temos x4 − 2(u2 + v 2 + z 2 )x2 + (u2 + v 2 + z 2 )2 = 4(uv + uz + vz)2 Mas 4(uv + uz + vz)2 = 4(u2 v 2 + u2 z 2 + v 2 z 2 ) + 8(u2 vz + uv 2 z + uvz 2 ) = 4(u2 v 2 + u2 z 2 + v 2 z 2 ) + 8uvz(u + v + z) = 4(u2 v 2 + u2 z 2 + v 2 z 2 ) + 8(uvz)x. Daı́, x4 − 2(u2 + v 2 + z 2 )x2 − 8(uvz)x + (u2 + v 2 + z 2 )2 − 4(u2 v 2 + u2 z 2 + v 2 z 2 ) = 0 u2 + v 2 + z 2 = Segue de 2.6 que uvz = − 8q u2 v 2 + v 2 z 2 + z 2 u2 = − p2 p2 −r 4 4 = p2 −4r 16 Mas toda solução deste sistema é solução do sistema u2 + v2 u2 v 2 z 2 = q2 64 u2 v 2 + z2 = + v 2 z 2 + z 2 u2 = − p2 p2 −4r 16 Novamente usando a idéia de funções simétricas elementares concluı́mos que u2 , v 2 e z 2 são as raı́zes da equação p2 − 4r q2 p t− =0 t3 + t2 + 2 16 64 (2.7) Então o problema resume-se a resolver a equação cúbica 2.7 que já sabemos como resolver. Porém nem toda solução do segundo sistema é uma solução do primeiro. Isto quer dizer que as raı́zes de 2.7 podem não fornecer os u,v e w que procuramos. Para resolver este problema podemos escolher duas raı́zes de 2.7 u2 e v 2 e a partir da relação √ √ √ uvz = − 8q determinar o valor de z. Agora sendo u = α, v = β e z = γ, as raı́zes de 28 2.6 são x1 = x2 = √ √ α + α − √ α √ α x3 = − x4 = − √ √ β + β − √ β √ β + − √ γ √ γ − + √ √ γ γ A partir das raı́zes de 2.6 é fácil determinar as raı́zes de 2.4. Pela discussão que fizemos aqui somos impelidos a intuir que se pode dar o mesmo tratamento para a equação polinomial geral de grau maior que 4. Poderı́amos, por exemplo, escrever uma raiz de um polinômio do quinto grau como x = u + v + z + t e utilizando uma álgebra básica e um pouco de engenhosidade encontrarmos relações em termos das funções simétricas elementares que reduziria o problema ao caso de grau quatro. Mas isto na realidade não acontece. O nosso objetivo agora é provar a impossibilidade de se resolver estas equações por método direto. Na próxima seção apresentaremos alguns resultados sobre polinômios culminando na demonstração de que as equações supracitadas não são resolúveis por radicais. 29 Capı́tulo 3 Teoria de Galois Antes de nos lançarmos sobre a Teoria de Galois veremos alguns resultados da Teoria de Corpos. 3.1 Extensão de corpos Como já vimos na seção 1.2 do capı́tulo 1 em Álgebra abstrata definimos corpo como sendo um anel comutativo com unidade onde todo elemento não nulo possui um inverso multiplicativo. Se um corpo K contém o corpo F , então dizemos que K é uma extensão de F . Chamamos de grau de K sobre F e denotamos por [K : F ] a dimensão de K quando visto como espaço vetorial sobre F . Desta forma, a extensão K de F será considerada uma extensão finita se e somente se K for um espaço vetorial de dimensão finita sobre F . Agora já temos dados suficientes para enunciar nosso primeiro resultado, cuja demonstração segue as idéias presentes em [6]. Teorema 3.1.1 Se K é uma extensão finita de F e F é uma extensão finita de P , então K é uma extensão finita de P e [K : P ] = [K : F ].[F : P ]. Demonstração: Com efeito, Sendo K uma extensão finita de F e F uma extensão finita de P , podemos considerar [K : F ] = m e [F : P ] = n, com m e n inteiros positivos. Desta forma tomemos {u1 , ..., um } uma base para K e {v1 , ..., vn } uma base para F . Segue que para todo u ∈ K existem α1 , ..., αm ∈ F tais que u = α1 u1 + ... + αm um . Por outro n X lado para cada αi ∈ F existem βi1 , ..., βin ∈ P tais que αi = βi1 v1 + ... + βin vn = βij vj . j=1 31 Logo podemos inferir que u = u1 u= X n X β1j vj + ... + um j=1 n X βmj vj . Disto podemos obter j=1 βij ui vj . 1≤i≤m 1≤j≤n A conclusão é que todo elemento u de K pode ser escrito como combinação linear dos mn elementos ui vj de K com coeficientes em P . Então basta provar que que o conjunto {ui vj } 1≤i≤m é linearmente independente. 1≤j≤n n n X X X Ora, se βij ui vj = 0, então u1 β1j vj + ... + um βmj vj = 0. Mas {u1 , ..., um } j=1 1≤i≤m 1≤j≤n é base, logo n X j=1 βij vj = 0 para todo i ∈ {1, ..., m}. Mas {v1 , ..., vn } é base, logo βij = 0 j=1 para todo i e todo j. Definição 3.1.1 Seja F um corpo, K uma extensão de F e a ∈ K, definimos F (a) como a menor extensão de F que contém a. O corpo F (a) também pode ser visto como o conjunto de todos os elementos que podem ser expressos como um quociente de polinômios em a. Definição 3.1.2 Uma raiz de um polinômio p(x) ∈ F [x] é um a ∈ K ⊃ F , tal que p(a) = 0. Definição 3.1.3 Seja F um corpo e K uma extensão de F . Um elemento a ∈ K é dito algébrico sobre F quando é raiz de algum polinômio em F [x]. Um elemento a ∈ K é dito algébrico de grau n se o polinômio de menor grau que ele é raiz tem grau n. Diremos que tal polinômio(que é único) é minimal para a. Definição 3.1.4 Uma extensão onde todo elemento é algébrico é chamada de extensão algébrica. Definição 3.1.5 Se não existir um polinômio p(x) ∈ F [x] tal que p(a) = 0, então o elemento a ∈ K é dito transcendente. Uma extensão onde pelo menos um elemento é transcendente é chamada de extensão transcendente. Definição 3.1.6 Teorema 3.1.2 Seja F um corpo, K uma extensão de F e a ∈ K, temos que a é algébrico de grau n sobre F se, e somente se, F (a) é uma extensão finita de F e [F (a) : F ] = n 32 Demonstração: Se a é algébrico de grau n então existe um polinômio p(x) ∈ F [x] de grau n e minimal para a. O polinômio p(x) é irredutı́vel em F [x]. Caso contrário existiriam polinômios f (x), g(x) ∈ F [x] de graus menores que n tais que p(x) = f (x)g(x). Segue que f (a)g(a) = p(a) = 0. Logo f (a) = 0 ou g(a) = 0. Mas isto contraria a hipótese de que p(x) é minimal para a. Portanto temos um absurdo. Além disso, todo polinômio f (x) que tem a como raiz é múltiplo de p(x). De fato, pelo algoritmo da divisão temos que existem q, r ∈ F [x] tais que f (x) = p(x)q(x) + r(x) onde 0 ≤ gr(r(x)) < gr(p(x)). Segue que r(a) = −p(a)q(a) + f (a) = 0.q(a) + 0 = 0. Como p(x) é minimal para a temos que r(x) = 0. Logo f (x) = p(x)q(x). Segue das considerações acima que (p(x)) o ideal gerado por p(x) consiste de todos os polinômios em F [X] que tem a como raiz. Agora afirmamos que a aplicação φ : F [x] → F (a) dada por f (x) 7→ f (a) é um homomorfismo sobrejetor e tem (p(x)) como núcleo. max{k1 .k2 } k1 k2 X X X i i De fato, φ( αi x + βi x ) = φ( (αi + βi )xi ) = i=0 k1 X k2 X αi ai + i=0 kX 1 +k2 = i=0 fismo. i=0 ( X s+t=i i=0 k1 X βi ai = φ( i=0 k2 X αi xi )+φ( i=0 k1 X αs βt )ai = i=0 k1 X βi xi ) e φ( i=0 αi ai . k2 X αi xi . i=0 k2 X max{k1 .k2 } X i=0 kX 1 +k2 βi xi ) = φ( i=0 (αi + βi )ai = i=0 ( X αs βt )xi ) s+t=i k1 k2 X X i i βi a = φ( αi x ).φ( βi xi ). Logo φ é homomor- i=0 i=0 i=0 Agora tomemos o polinômio i(x) = x. A sua imagem pela φ é φ(i(x)) = i(a) = a. Agora tomemos β ∈ F e tomemos o polinômio j(x) = β. A imagem de j(x) pela φ é φ(j(x)) = j(a) = β. Segue que a imagem de φ é um subcorpo de F (a) que contém F e a. Logo a imagem de φ, Imφ = F (a). Portanto φ é um homomorfismo sobrejetor. Além disso, note que Kerφ = {f (x) ∈ F [x] | φ(f (x)) = 0} = {f (x) ∈ F [x] | f (a) = 0} = (p(x)). Segue do teorema do homomorfismo que F [x]/(p(x)) é isomorfo a F (a). Pelo teorema 1.2.3, F [x]/(p(x)) é corpo. O conjunto {1 + (p(x)), x + (p(x)), x2 + (p(x)), · · · , xn−1 + (p(x))} é uma base para F [X]/(p(x)) quando visto como espaço vetorial sobre F . De fato, mostremos primeiramente que o conjunto é linearmente independente. Então dados α0 , ..., αn−1 ∈ F tais que α0 (1+(p(x)))+α1 (x+(p(x)))+· · ·+αn−1 (xn−1 +(p(x))) = (p(x)). Segue que α0 + α1 x + · · · + αn−1 xn−1 + (p(x)) = (p(x)). Logo f (x) = α0 + α1 x + 33 · · · + αn−1 xn−1 ∈ (p(x)). Daı́ f (a) = 0, mas isto só acontece se α0 = α1 = · · · = αn−1 = 0, já que p(x) é minimal para a e tem grau n. Agora provemos que o conjunto é gerador. Com efeito, os elementos de F [x]/(p(x)) são da forma f (x) + (p(x)). Suponhamos que gr(f (x)) = k < n, então f (x) + (p(x)) = α0 + α1 x + · · · + αk xk + 0xk+1 + · · · + 0xn−1 + (p(x)) = α0 (1 + (p(x))) + α1 (x + (p(x))) + · · · + αk (xk + (p(x))) + 0(xk+1 + (p(x))) + · · · + 0(xn−1 + (p(x))). Por outro lado, suponhamos que gr(f (x)) ≥ n. Pelo algoritmo da divisão segue que f (x) = p(x)q(x) + r(x) onde 0 ≤ gr(r(x)) < gr(p(x)) e daı́ f (x) + (p(x)) = r(x) + (p(x)). Logo o problema se reduz ao caso anterior. Portanto F [x]/(p(x)) é um espaço vetorial de dimensão n sobre F , ou ainda uma extensão finita de grau n. Como F (a) é isomorfo a F [x]/(p(x)) segue que F (a) é uma extensão finita de F e [F (a) : F ] = n. Agora para provar a volta do teorema, suponhamos que [F (a) : F ] = n. Então F (a) pode ser visto como um espaço vetorial sobre F de dimensão n. Sabemos da álgebra linear que qualquer conjunto com mais de n vetores é linearmente dependente. Logo o conjunto {1, a, a2 , a3 , · · · , an } é L.D., isto é, qualquer um de seus elementos pode ser escrito como combinação linear dos demais. Então consideremos an = α0 1 + α1 a + · · · + αn−1 an−1 onde αi ∈ F . Logo o polinômio f (x) = α0 + α1 x + · · · + αn−1 xn−1 − xn tem a como raiz. Logo a é algébrico de grau n, pois se existisse um polinômio de grau diferente de n e que tivesse a como raiz então F (a) seria uma extensão de F de grau diferente de n. Teorema 3.1.3 Se a ∈ K é uma raiz de p(x) ∈ F [x], então existe q(x) ∈ K[x] tal que p(x) = (x − a)q(x). Demonstração: Ora pelo algoritmo da divisão temos que p(x) = (x − a)q(x) + r(x) e 0 ≤ gr(r(x)) < gr(x − a). Como gr(x − a) = 1, segue que r(x) é uma constante ou o polinômio nulo. Mas r(a) = p(a) − (a − a)q(a) = 0. Portanto r(x) = 0, e daı́ p(x) = (x − a)q(x). Definição 3.1.7 Dizemos que uma raiz a ∈ K do polinômio p(x) ∈ F [x], onde F é um subcorpo de K, é de multiplicidade m se (x − a)m divide p(x) e (x − a)m+1 não divide. Teorema 3.1.4 Se a1 , · · · , ak ∈ K são raı́zes de p(x) ∈ F [x] de multiplicidades n1 , · · · , nk respectivamente, então existe q(x) ∈ K[x] tal que p(x) = (x − a1 )n1 . · · · .(x − ak )nk q(x). 34 Demonstração: Ora, seja a1 uma raiz de p(x) de multiplicidade n1 . Segue que existe q1 (x) ∈ K[x] tal que p(x) = (x − a1 )n1 q1 (x). Mas (a2 − a1 )n1 q1 (a2 ) = p(a2 ) = 0. Como a2 6= a1 segue que q1 (a2 ) = 0, isto é, a2 é raiz de q1 (x). Logo existe q2 (x) ∈ K[x] tal que q1 (x) = (x − a2 )n2 q2 (x), e daı́ p(x) = (x − a1 )n1 (x − a2 )n2 q2 (x). Repetindo sucessivamente este processo para a3 , · · · , ak concluı́mos que p(x) = (x − a1 )n1 . · · · .(x − ak )nk qk (x). Teorema 3.1.5 Seja f (x) um polinômio de grau n sobre o corpo F . O polinômio f (x) pode ter no máximo n raı́zes em qualquer extensão de F . Demonstração: Vale ressaltar que uma raiz de multiplicidade ni está sendo contada aqui ni vezes. Suponhamos que E seja uma extensão de F que contenha todas as raı́zes de p(x). Sejam a1 , · · · , ak todas as raı́zes de p(x) de multiplicidades n1 , · · · , nk respectivamente. Pelo teorema 3.1.4 temos que p(x) = (x − a1 )n1 . · · · .(x − ak )nk q(x), onde q(x) ∈ K[x]. Segue da afirmação 1.2.1 que o grau do polinômio (x − a1 )n1 . · · · .(x − ak )nk é menor ou igual a n = gr(p(x)), o que demonstra o teorema. Definição 3.1.8 Seja F um corpo e f (x) ∈ F [x] de grau n. Uma extensão K de F é um corpo de raı́zes para f (x) se f (x) pode ser fatorado como um produto de fatores lineares em K e não pode ser fatorado como um produto de fatores lineares em nenhuma extensão de F de grau menor. Teorema 3.1.6 Para todo polinômio f (x) de grau n sobre um corpo F existe uma extensão finita de F de grau no máximo n na qual f (x) tem uma raiz. Demonstração: Seja p(x) um fator irredutı́vel de f (x). Segue que as raı́zes de p(x) são todas raı́zes de f (x). Então basta provar que existe uma extensão de F na qual p(x) tem uma raiz. O ideal (p(x)) de F [x] é maximal, já que p(x) é irredutı́vel. Logo pelo teorema 1.2.10 F [x]/(p(x)) é corpo. Segue do teorema 1.2.7 que a aplicação φ : F [x] → F [x]/(p(x)) dada por g(x) 7→ g(x) + (p(x)) é um homomorfismo sobrejetor. Logo a restrição φ\F : F → F [x]/(p(x)) também é um homomorfismo sobrejetor. Além disso, dados α, β ∈ F , se α + (p(x)) = β + (p(x)), então α − β ∈ (p(x)). Segue que α − β = 0. Logo α = β e 35 portanto φ\F é injetiva. Concluı́mos que a imagem de F pela φ\F que denotaremos por Im(F ) é isomorfa a F . O que estamos a provar é que existe uma extensão de Im(F ) na qual p(x) = φ(p(x)) tem uma raiz. Notemos que φ(p(x)) = (p(x)), isto é, a imagem de p(x) pela φ é o zero de F [x]/(p(x)). Por outro lado tomemos q(x) = β0 + β1 x + · · · + βk xk e denotemos βi + (p(x)) por βi . Segue que φ(β0 + β1 x + · · · + βk xk ) = β0 + β1 x + · · · + βk xk . Logo x = x + (p(x)) ∈ F [x]/(p(x)) é raiz do polinômio q(x) = β0 + β1 x + · · · + βk xk sobre Im(F ). Além disso, F [x]/(p(x)) é uma extensão de F de grau igual a gr(p(x)) ≤ n, uma vez que, como já verificamos no decorrer da demonstração do teorema 3.1.2, o conjunto {1 + (p(x)), x + (p(x)), · · · , xgr(p(x))−1 + (p(x))} é base para o espaço vetorial F [x]/(p(x)). Teorema 3.1.7 Para todo polinômio f (x) de grau n sobre um corpo F existe uma extensão finita de F de grau no máximo n! na qual f (x) tem n raı́zes. Demonstração: Usaremos indução sobre n = gr(f (x)). Para n = 1, f (x) é da forma αx + β, onde α, β ∈ F . Segue que − αβ ∈ F é raiz de f (x) e [F : F ] = 1. Suponhamos que o resultado seja válido para todo inteiro positivo e menor que n. Pelo teorema 3.1.6 existe uma extensão E0 de F na qual f (x) tem uma raiz. Seja a ∈ E0 uma raiz de f (x). Segue f (x) = (x − a)q(x), onde q(x) ∈ E0 e tem grau n − 1. Pela hipótese de indução existe uma extensão E de E0 na qual q(x) tem n − 1 raı́zes. Como toda raiz de q(x) é raiz de f (x), segue que f (x) tem n raı́zes em E. Além disso = [E : F ] = [E : E0 ][E0 : F ] ≤ (n − 1)!n = n!. Teorema 3.1.8 Seja σ um isomorfismo entre os corpos F e F 0 , então F [x] e F 0 [x] são k k X X i 0 σ(ai )xi . ai x 7−→ isomorfos por meio do isomorfismo σ1 : F [x] −→ F [x] dado por i=0 i=0 Demonstração: Com efeito, temos que k X i ai x = k X i=0 σ(bi ) ⇔ k X i=0 σ(ai )xi = k X i=0 bi xi ⇔ ai = bi ⇔ σ(ai ) = i=0 k k X X i i bi xi ). Acabamos de provar que ai x ) = σ1 ( σ(bi )x ⇔ σ1 ( i=0 i=0 σ1 está bem definida e é injetiva. Agora, da sobrejetiva de σ segue que ∀bi ∈ F 0 existe k k X X i 0 ai ∈ F tal que σ(ai ) = bi . Logo para todo bi x ∈ F [x] tomemos ai xi ∈ F [x] e daı́ i=0 36 i=0 temos que σ1 ( k X i ai x ) = i=0 k X i σ(ai )x = i=0 k X bi xi . Logo σ1 é sobrejetiva. Para finalizar a i=0 demonstração mostremos que σ1 preserva as operações. Para simplificar a notação vamos omitir os ı́ndices dos somátorios que definem um polinômio. Então temos que, X X X X X σ1 ( ai xi + bi xi ) = σ1 ( (ai + bi )xi ) = σ(ai + bi )xi = [σ(ai ) + σ(bi )]xi = X X X X σ(ai )xi + σ(bi )xi = σ1 ( ai xi ) + σ1 ( bi xi ). Além disso, X X X X X X X X σ(as )σ(bt )xi as bt )xi = ( σ1 ( ai xi . bi xi ) = σ1 ( ( as bt )xi ) = σ( X X = σ1 ( ai xi ).σ1 ( bi xi ). s+t=i s+t=i s+t=i Teorema 3.1.9 Seja σ um isomorfismo entre os corpos F e F 0 . Seja f (x) um polinômio irredutı́vel sobre F e f 0 (x) o polinômio correspondente em F 0 , isto é, a imagem de f (x) pela σ1 . Sejam F (α) e F 0 (β) extensões de F e F 0 respectivamente, tais que f (α) = 0 e f 0 (β) = 0, então σ induz um isomorfismo entre F (α) e F (β) Demonstração: Primeiramente notemos que os corpos F [x]/(f (x)) e F 0 [x]/(f 0 (x)) também são isomorfos por meio do isomorfismo σ2 : F [x]/(f (x)) −→ F 0 [x]/(f 0 (x)) dado por p(x) + (f (x)) 7−→ σ1 (p(x)) + (f 0 (x)). Com efeito, notemos que p1 (x) + (f (x)) = p2 (x) + (f (x)) ⇔ p1 (x) − p2 (x) ∈ (f (x)) ⇔ ∃ q(x) ∈ F [x] tal que p1 (x) − p2 (x) = f (x)q(x) ⇔ σ1 (p1 (x) − p2 (x)) = σ1 (f (x)q(x)) ⇔ σ1 (p1 (x)) − σ1 (p2 (x)) = f 0 (x)σ1 (q(x)) ⇔ σ1 (p1 (x)) − σ1 (p2 (x)) ∈ (f 0 (x)) ⇔ σ1 (p1 (x)) + (f 0 (x)) = σ1 (p2 (x)) + (f 0 (x)) ⇔ σ2 (p1 (x) + (f (x))) = σ2 (p2 (x) + (f (x))). Portanto a aplicação σ2 está bem definida e é injetiva. Agora, segue da sobrejetividade de σ1 que ∀q(x) ∈ F 0 [x] existe p(x) ∈ F [x] tal que σ1 (p(x)) = q(x). Então dado q(x) + (f 0 (x)) ∈ F 0 [x]/(f 0 (x)) tomemos p(x) + (f (x)) ∈ F [x]/(f (x)) e daı́ σ2 (p(x) + (f (x))) = σ1 (p(x)) + (f 0 (x)) = q(x) + (f 0 (x)). Logo σ2 é sobrejetiva. Para completar esta etapa da demonstração mostremos que σ2 preserva as operações. Para simplificar a notação vamos considerar p(x) + (f (x)) = p(x) e q(x) + (f 0 (x)) = 0 q(x) . Então temos que, 0 0 0 σ2 (p1 (x) + p2 (x)) = σ2 (p1 (x) + p2 (x)) = σ1 (p1 (x) + p2 (x)) = σ1 (p1 (x)) + σ1 (p2 (x)) = 0 σ2 (p1 (x)) + σ2 (p2 (x)). Além disso, σ2 (p1 (x).p2 (x)) = σ2 (p1 (x).p2 (x)) = σ1 (p1 (x).p2 (x)) = 37 0 0 σ1 (p1 (x)) .σ1 (p2 (x)) = σ2 (p1 (x)).σ2 (p2 (x)). Agora, notemos que f (x) é minimal para α. Caso contrário existiria um polinômio p(x) de grau menor que gr(f (x)) minimal para α. Como foi provado no decorrer da demonstração do teorema 3.1.2, todo polinômio que tem α como raiz é um múltiplo de p(x). Segue que f (x) seria um múltiplo de p(x), o que seria um absurdo, já que por hipótese f (x) é irredutı́vel. Analogamente f 0 (x) é minimal para β. Nestas circunstâncias segue que existe um isomorfismo φ1 de F [x]/(f (x)) em F (α) e um isomorfismo φ2 de F 0 [x]/(f 0 (x)) em F (β). Concluı́mos que φ−1 1 ◦ σ2 ◦ φ2 é um isomorfismo de F (α) em F (β). Teorema 3.1.10 Seja σ um isomorfismo entre os corpos F e F 0 . Seja f (x) um polinômio sobre F e f 0 (x) o polinômio correspondente em F 0 . Seja E um corpo de raı́zes para F e E 0 um corpo de raı́zes para F 0 , então σ induz um isomorfismo de E em E 0 . Demonstração: Usaremos indução sobre [E : F ] = n. Se n = 1, então E = F e todas as raı́zes de f (x) estão em F . Segue do isomorfismo entre F [x] e F 0 [x], definido na demonstração do teorema 3.1.8, que F 0 contém todas as raı́zes de f 0 (x), logo E 0 = F 0 . Portanto, os corpos E e E 0 são isomorfos pelo isomorfismo σ. Suponhamos que o resultado seja válido para todo inteiro positivo menor que n. Seja p(x) um fator irredutı́vel de f (x) de grau gr(p(x)) = r > 1. Se u é uma raiz de f (x), então u também é raiz de p(x). Segue do teorema 3.1.2 que F (u) é uma extensão de F de grau r. Logo, [E : F (v)] = n [E : F ] = <n [F (v) : F ] r Afirmamos que E é um corpo de raı́zes para f (x) quando visto como um polinômio sobre F (u), pois se existisse um subcorpo E0 de E contendo F (u) e todas as raı́zes de f (x), então E0 seria uma extensão de F menor que E contendo todas as raı́zes de f (x), o que contrária a hipótese de que E é um corpo de raı́zes para f (x) ∈ F [x]. Analogamente E 0 é um corpo de raı́zes para f 0 (x) quando visto como um polinômio sobre F (v), onde v é uma raiz de f 0 (x) e [E : F (v)] < n. Pela hipótese de indução segue que existe um isomorfismo de E em E 0 . Corolário 3.1.1 Quaisquer dois corpos de raı́zes de um polinômio f (x) sobre o corpo F são isomorfos. 38 Demonstração: 3.2 Segue diretamente do teorema 3.1.10. O Teorema Fundamental da Teoria de Galois Nesta seção apresentaremos mais alguns resultados sobre a teoria de corpos. Estes resultados nos darão subsı́dios para demonstrar o clássico Teorema Fundamental da Teoria de Galois. Este teorema, por sua vez, terá grande importância na demonstração de que o polinômio geral de grau n ≥ 5 não é resolúvel por radicais, que é o objetivo principal deste capı́tulo. Teorema 3.2.1 Sejam K um corpo, a1 , ..., an ∈ K e σ1 , ..., σn ∈ AutK tais que σi 6= σj , temos que a1 σ1 (u)+· · ·+an σn (u) = 0 para todo u ∈ K se, e somente se a1 = · · · = an = 0. Demonstração: Usaremos indução sobre n. Se n = 1, então a1 σ(u) = 0 para todo u ∈ K. Podemos escolher u0 ∈ K tal que σ(u0 ) 6= 0. Logo a1 = 0. Suponhamos que a afirmação seja válida para todo natural não nulo menor que n e suponhamos que a1 σ1 (u) + · · · + an σn (u) = 0 (3.1) Como a equação 3.1 vale para todo u ∈ K, vale também para bu onde 0 6= b ∈ K. Logo, a1 σ1 (bu) + · · · + an σn (bu) = 0 (3.2) Como cada σi é um isomorfismo, segue que a1 σ1 (b)σ1 (u) + · · · + an σn (b)σn (u) = 0 (3.3) Multiplicando 3.1 por σ1 (b) e subtraindo por 3.3 concluı́mos que a2 (σ1 (b) − σ2 (b))σ2 (u) + · · · + an (σ1 (b) − σn (b))σn (u) = 0 (3.4) Como os isomorfismos são dois a dois distintos, podemos escolher d de forma que σ1 (d) 6= σi (d) pelo menos para um número 1 ≤ r < n de ı́ndices. Suponhamos σ1 (d) 6= σi (d) para todo i 6= 1. Como σ1 (d) − σi (d) ∈ K segue da equação 3.4 e da hipótese de 39 indução que a2 = · · · = an = 0. Substituindo tudo isso em 3.1 concluı́mos que a1 = 0 e o teorema está demonstrado. Agora, suponhamos que σ1 (d) 6= σi (d) apenas para um número 1 ≤ r < n de ı́ndices. Sem perda de generalidade suponhamos que este fato seja verdade para os r primeiros ı́ndices com exceção de i = 1. Segue que a2 (σ1 (d) − σ2 (d))σ2 (u) + · · · + ar (σ1 (d) − σr (d))σr (u) = 0 (3.5) Segue da hipótese de indução que a1 = · · · = ar = 0. Substituindo tudo isso em 3.1 obtemos ar+1 σr+1 (u) + · · · + an σn (u) = 0 (3.6) Segue novamente da hipótese de indução que ar+1 = · · · = an = 0. A recı́proca é imediata. Definição 3.2.1 Seja G um subgrupo de AutK, onde K é corpo, chamamos de corpo fixo ao conjunto de todos os elementos de K que permanecem invariantes para todo automorfismo de G, isto é, o conjunto KG = {a ∈ K|σ(a) = a ∀σ ∈ AutG} Teorema 3.2.2 KG é um subcorpo de K. Demonstração: Dados a, b ∈ KG , temos que provar que a−b e ab−1 ainda são elementos de KG . Com efeito, para todo automorfismo σ ∈ AutK temos que σ(a−b) = σ(a)−σ(b) = a − b e σ(a.b−1 ) = σ(a)σ(b)−1 = ab−1 , isto é, todo automorfismo σ ∈ AutK deixa fixos os elementos a − b e ab−1 . Logo KG é um subcorpo de K. Definição 3.2.2 Seja K uma extensão do corpo F , chamamos de grupo dos automorfismos de K relativos a F ao conjunto de todos os automorfismos de K que deixam fixo todo elemento de F , isto é, o conjunto G(K, F ) = {σ ∈ AutK|σ(u) = u ∀u ∈ F } Teorema 3.2.3 G(K, F ) é um subgrupo de AutK. Demonstração: Dados σ1 , σ2 ∈ G(K, F ), temos que σ1 (u) = u e σ2 (u) = u, ∀u ∈ F . Logo (σ1 ◦ σ2 )(u) = σ1 (σ2 (u)) = σ1 (u) = u, ∀u ∈ F . Portanto σ1 ◦ σ2 ∈ G(K, F ), e se σ1 (u) = u, ∀ u, então σ1−1 (u) = u, ∀u ∈ F . Logo σ1−1 ∈ G(K, F ). Portanto G(K, F ) < AutK. 40 Teorema 3.2.4 Se K é uma extensão finita de um corpo F , então G(K, F ) é um grupo finito e |G(K, F )| ≤ [K : F ]. Demonstração: Seja [K : F ] = n e seja {u1 , · · · , un } ⊂ K uma base para K. Segue que para todo t ∈ K existem α1 , · · · , αn ∈ F tais que t = α1 u1 + · · · + αn un . Como todo automorfismo σi ∈ G(K, F ) deixa fixo todo elemento de F , segue que σi (t) = α1 σi (u1 ) + · · · + αn σi (un ). Sabemos da álgebra linear que um sistema homogêneo de r incógnitas e n equações tal que r > n possui uma solução não trivial. Logo o sistema σ1 (u1 )x1 + · · · + σr (u1 )xr = 0 . . . σ1 (un )x1 + · · · + σr (un )xr = 0 tem uma solução não trivial. Seja a1 , · · · , ar uma solução não trivial do sistema. Então, σ1 (u1 )a1 + · · · + σr (u1 )ar = 0 . . . σ1 (un )a1 + · · · + σr (un )ar = 0 multiplicando a primeira equação por α1 , a segunda por α2 e assim sucessivamente, e somando tudo no final obtemos a1 (α1 σ1 (u1 ) + · · · + αn σ1 (un )) + · · · + ar (α1 σr (u1 ) + · · · + αn σr (un )) = 0 Mas σi (t) = α1 σi (u1 ) + · · · + αn σi (un ), daı́ a1 σ1 (t) + · · · + ar σr (t) = 0, o que é um absurdo pelo teorema 3.2.1. O absurdo veio do fato de termos considerado a existência de r > n = [K : F ] automorfismos em G(K, F ). Segue que G(K, F ) é finito e |G(K, F )| ≤ [K : F ]. Teorema 3.2.5 Seja K uma extensão do corpo F , F (x1 , · · · , xn ) o corpo das funções racionais em x1 , · · · , xn e S o corpo das funções simétricas elementares, temos que: 41 1. F (x1 , · · · , xn ) é o corpo de raı́zes do polinômio p(t) = tn − a1 tn−1 + · · · + (−1)n an sobre F (a1 , · · · , an ) 2. [F (x1 , · · · , xn ) : S] = n! 3. Se a1 , · · · , an são as funções simétricas elementares em x1 , · · · , xn , então S = F (a1 , · · · , an ) 4. G(F (x1 , · · · , xn ), S) = Sn Demonstração: 1. Segue das considerações feitas na seção 1.2 do capı́tulo 1, que o polinômio p(t) = tn − a1 tn−1 + · · · + (−1)n an tem todas as suas raı́zes em F (x1 , · · · , xn ). Além disso nenhum subcorpo de F (x1 , · · · , xn ) que contém F (a1 , · · · , an ) contém todas as raı́zes de p(t), pois F (x1 , · · · , xn ) pode ser visto como a menor extensão de F que contém x1 , · · · , xn . Logo F (x1 , ..., xn ) é o corpo de raı́zes de p(t). 2. De 1 temos que F (x1 , · · · , xn ) é o corpo de raı́zes de p(t) = tn −a1 tn−1 +· · ·+(−1)n an sobre F (a1 , · · · , an ). Logo, pelo teorema 3.1.7, [F (x1 , · · · , xn ) : F (a1 , · · · , an )] ≤ n!. Por outro lado, segue do teorema 3.2.4 que |G(F (x1 , · · · , xn ), F (a1 · · · , an ))| ≤ [F (x1 , · · · , xn ) : F (a1 · · · , an )]. Além disso, todo automorfismo σ de F (x1 , · · · , xn ) deixa fixos os elementos de F (a1 , · · · , an ). Logo Sn ⊂ G(F (x1 , · · · , xn ), F (a1 · · · , an )). Daı́ [F (x1 , · · · , xn ) : F (a1 · · · , an )] ≥| G(F (x1 , · · · , xn ), F (a1 · · · , an )) |≥ n!. Concluı́mos que [F (x1 , · · · , xn ) : F (a1 · · · , an )] = n!. Além disso [F (x1 , · · · , xn ) : F (a1 , · · · , an )] = [F (x1 , · · · , xn ) : S][S : F (a1 , · · · , an )]. Logo [F (x1 , · · · , xn ) : S][S : F (a1 , · · · , an )] = n!. Mas, todo automorfismo σ ∈ Sn de F (x1 , · · · , xn ) deixa fixos os elementos de S. Logo Sn ⊂ G(F (x1 , · · · , xn ), S) e portanto | G(F (x1 , · · · , xn ), S) |≥ n!. Concluı́mos que [F (x1 , · · · , xn ) : S] = n!. 3. Provamos no decorrer da demonstração do item 2 que [F (x1 , · · · , xn ) : S] = n! e [F (x1 , · · · , xn ) : S][S : F (a1 · · · , an )] = n!. Segue daı́ que [S : F (a1 , · · · , an )] = 1, e portanto S = F (a1 , · · · , an ). 4. Provamos no decorrer da demonstração do item 2 que | G(F (x1 , · · · , xn ), S) |≥ n!. Pelo teorema 3.2.4 e novamente pelo item 2 segue que | G(F (x1 , · · · , xn ), S) |≤ 42 [F (x1 , · · · , xn ) : S] = n!. Logo | G(F (x1 , · · · , xn ), S) |= n!, isto é, Sn é um subgrupo de G(F (x1 , · · · , xn ), S) que tem a mesma ordem. Logo Sn = G(F (x1 , · · · , xn ), S). Definição 3.2.3 Uma extensão K do corpo F é dita extensão simples se existir um a ∈ K tal que K = F (a). Definição 3.2.4 Dizemos que um anel A é de caracterı́stica n se n for o menor inteiro positivo tal que na = 0, onde na = |a + ·{z · · + a}. Se não existir um inteiro positivo n tal nvezes que na = 0, então dizemos que A é um anel de caracterı́stica 0. Teorema 3.2.6 Toda extensão de um corpo de caracterı́stica zero é uma extensão simples. A demonstração deste fato pode ser vista em [1]. Mas uma observação que deve ser feita é que em um corpo de caracterı́stica zero todo elemento da extensão K é raiz de um polinômio separável. Um polinômio é dito separável quando não tem raı́zes múltiplas. Definição 3.2.5 Seja K uma extensão do corpo F , dizemos que K é uma extensão normal de F sempre que K é uma extensão finita de F tal que F é o corpo fixo de G(K, F ). Teorema 3.2.7 Seja K uma extensão normal de F , H um subgrupo de G(K, F ) e KH o corpo fixo de H, temos que 1. H = G(K, KH ) 2. [K : KH ] = |H| em particular |G(K, F )| = [K : F ] Demonstração: De fato, se σ ∈ H, então para todo u ∈ KH , σ(u) = u, pois por definição os elementos de KH são invariantes para todo automorfismo σ ∈ H. Segue que σ ∈ G(K, KH ) e daı́ H ⊂ G(K, KH ). Por outro lado, se σ ∈ G(K, KH ), então σ deixa fixo todo elemento de KH . Mas os automorfismos de σ ∈ AutK que deixam fixos os elemento de KH são exatamente os automorfismos de H. Segue que σ ∈ H, e portanto G(K, F ) ⊂ H. Logo H = G(K, KH ). 43 Para demostrar o item 2, observe que pelo teorema 3.2.2, K é uma extensão finita de KH . Pelo teorema 3.2.4 |G(K, KH )| ≤ [K : KH ] e pelo item 1 | H |≤ [K : KH ]. Por outro lado podemos provar que | H |≥ [K : KH ]. Com efeito, pelo teorema 3.2.6, como K é uma extensão de KH , existe a ∈ K tal que K = KH (a). Sejam σ1 , · · · , σh todos os automorfismos de H com σ1 = I. Segue que a satisfaz o polinômio p(x) = (x − σ1 (a)) · · · (x − σh (a)), pois σ1 (a) = a. Expandindo o polinômio p(x) obtemos p(x) = xh − α1 xh−1 + · · · + (−1)h αh , onde α1 , · · · , αh são as funções simétricas elementares em σ1 (a), · · · , σh (a), isto é, α1 = σ1 (a) + · · · + σh (a) α2 = σ1 (a)σ2 (a) + · · · + σh−1 (a)σh (a) . . . αh = σ1 (a) · · · σh (a) Agora, observe que para cada σi ∈ H tem-se que σi (α1 ) = σi (σ1 (a))+· · ·+σi (σh (a)) = σj1 (a) + · · · + σjh (a). Mas σ1 , · · · , σh são todos os automorfismos de H sem repetições. Segue que σj1 , · · · , σjh são novamente todos os automorfismos de H sem repetições. Logo a única ação dos σi sobre α1 é mudar a ordem dos σi (a). Daı́ σi (α1 ) = α1 para todo i. Analogamente concluı́mos que σi (α2 ) = α2 , · · · , σi (αh ) = αh , para todo i. Segue que α1 , · · · , αh ∈ KH , e portanto p(x) ∈ KH [x]. Como K = KH (a) é uma extensão finita de KH de grau n = [K : KH ] segue do teorema 3.1.2 que a satisfaz um polinômio de grau n sobre KH e não satisfaz outro polinômio de grau menor. Como a satisfaz p(x) segue que gr(p(x)) = h ≥ [K : KH ], isto é, | H |≥ [K : KH ]. Das duas desigualdades | H |≤ [K : KH ] e | H |≥ [K : KH ] segue que | H |= [K : KH ]. Teorema 3.2.8 K é uma extensão normal de F se, e somente se K é o corpo de raı́zes de algum polinômio sobre F . Demonstração: Seja K uma extensão normal de F . Pelo teorema 3.2.6, existe a ∈ K Y tal que K = F (a). O polinômio p(x) = (x − σ(a)) tem todas as suas raı́zes em σ∈G(K,F ) 44 K. Expandindo p(x) obtemos p(x) = xn − α1 xn−1 + · · · + (−1)n αn , onde α1 , · · · , αn são as funções simétricas elementares em I = σ1 (a), · · · , σn (a). Logo cada αi é invariante por todo σ ∈ G(K, F ). Segue que αi ∈ F , já que F é o corpo fixo de G(K, F ). Agora como a gera K, a não pode estar em nenhum subcorpo de K que contém F . Como a é raiz de p(x), já que σ1 (a) = a, nenhum subcorpo de K que contém F tem todas as raı́zes de p(x). Logo K é o corpo de raı́zes de p(x) sobre F . Reciprocamente, suponhamos que K seja o corpo de raı́zes f (x) = xn − a1 xn−1 + · · · + (−1)n an sobre F . Sejam α1 , · · · , αn as raı́zes de f (x), então valem as relações a1 = α1 + · · · + αn a2 = α1 α2 + · · · + αn−1 αn . . . an = α1 · · · αn Então a1 , · · · , an são as funções simétricas elementares em α1 , · · · , αn . Segue do teorema 3.2.5 que F (α1 , · · · , αn ) é corpo de raı́zes de f (x) sobre F (a1 , · · · , an ). Como a1 , · · · , an ∈ F segue que F (a1 , · · · , an ) = F . Segue do corolário 3.1.1 que K é isomorfo a F (α1 , · · · , αn ), neste caso tomemos K = F (α1 , · · · , αn ). Segue do teorema 3.2.5 que o corpo fixo de G(F (α1 , · · · , αn ), F (a1 , · · · , an )) é o corpo F (a1 , · · · , an ). Logo o corpo fixo de G(K, F ) é F , isto é, K é uma extensão normal de F . Definição 3.2.6 Seja K o corpo de raı́zes do polinômio f (x) ∈ F [x]. O grupo de Galois de f (x) é o grupo G(K, F ). Teorema 3.2.9 (Teorema Fundamental da Teoria de Galois) Seja K o corpo de raı́zes do polinômio f (x) ∈ F [x], G(K, F ) grupo de galois de f (x) e T um subcorpo de K que contém F , então 1. A aplicação ψ : {subgrupos de G(K, F )} → {subcorpos de K que contém F } definida por H 7→ KH é uma bijeção. 2. [K : T ] = |G(K, T )| e [T : F ] = (G(K, F ) : G(K, T )) 45 3. T é uma extensão normal de F se, e somente se G(K, T ) ¢ G(K, F ) 4. Se T é uma extensão normal de F então G(T, F ) é isomorfo a G(K, F )/G(K, T ) Demonstração: 1. Primeiramente observe que KH é realmente um subcorpo de K que contém F . Que KH é um subcorpo de K já provamos no teorema 3.2.2. Que KH é uma extensão de F segue do fato de que os elementos de F ficam invariantes para todo automorfismo σ ∈ G(K, F ), e portanto para todo automorfismo σ ∈ H < G(K, F ). Salta à vista que ψ é injetiva, pois se KH1 = KH2 , então H1 = H2 . Vamos agora provar que ψ é sobrejetiva. Seja T um subcorpo de K que contém F . Por hipótese K é o corpo de raı́zes de f (x) sobre F . Podemos tomar f (x) como um polinômio sobre T . Daı́ K será também o corpo de raı́zes de f (x) sobre T . Pelo teorema 3.2.8 K é uma extensão normal de T . Logo por definição T é o corpo fixo de G(K, T ). Temos ainda que G(K, T ) é um subgrupo de G(K, F ), já que os automorfismos de G(K, T ) deixam fixos os elementos de T , e portanto de F . Logo os automorfismos de G(K, T ) estão todos em G(K, F ). Isto garante a sobrejetividade de ψ. 2. Seja T um subcorpo de K que contém F , pela sobrejetividade de ψ, T é o corpo fixo de algum subgrupo H de G(K, F ), isto é, T = KH . Pelo teorema 3.2.7 segue que [K : T ] = |G(K, T )|. Agora, como G(K, T ) é um subgrupo de G(K, F ), segue do teorema de lagrange (teorema 1.1.2) que | G(K, F ) |=| G(K, T ) | (G(K, F ) : G(K, T )). Mas pelo teo[K : F ] rema 3.2.7 G(K, F ) = [K : F ]. Logo (G(K, F ) : G(K, T )) = . Por outro [K : T ] [K : F ] , daı́ lado, pelo teorema 3.1.1, [K : F ] = [K : T ][T : F ]. Logo [T : F ] = [K : T ] [T : F ] = (G(K, F ) : G(K, T )). 3. Como T é uma extensão de F , segue do teorema 3.2.6 que existe a ∈ T tal que T = F (a). Sendo T uma extensão normal de F , segue do teorema 3.2.8 que T é o corpo de raı́zes do polinômio minimal p(x) para a sobre F . Seja p(x) = β0 + β1 x + · · · + βn xn , temos que β0 +β1 a+· · ·+βn an = 0. Daı́ σ(β0 +β1 a+· · ·+βn an ) = σ(0) ∀σ ∈ G(K, F ). Logo β0 + β1 σ(a) + · · · + βn σ(a)n = 0 ∀σ ∈ G(K, F ). Portanto σ(a) também é uma raiz de p(x). Como T contém todas as raı́zes de p(x) segue que T contém σ(a) para todo σ ∈ G(K, F ). 46 Agora como T = F (a), segue que para todo x ∈ T existem β1 , · · · , βk tais que x = β0 + β1 a + · · · + βk ak . Logo σ(x) = β0 + β1 σ(a) + · · · + βk σ(a)k . Como βi ∈ F ⊂ T e σ(a) ∈ T segue que σ(x) ∈ T . Logo σ(T ) ⊂ T . Podemos agora definir o homomorfismo φ : G(K, F ) → G(T, F ) dada por σ 7→ σ|T , onde σ|T é a restrição de σ a T . Que σ|T é um automorfismo de T segue do fato de que σ(T ) ⊂ T . Além disso é fácil ver que (σ1 ◦σ2 )|T = σ1 |T ◦σ2 |T ∀σ1 , σ2 ∈ G(K, F ). Isto garante que φ é homomorfismo. O núcleo de φ consiste de todos os automorfismos de G(K, F ) que são levados a aplicação identidade em G(K, T ) pela φ, isto é, Kerφ = G(T, F ). Segue do teorema 1.1.11 que G(T, F ) / G(K, F ). Reciprocamente, se G(T, F ) / G(K, F ), então pela definição de subgrupo normal temos que σ −1 ◦ τ ◦ σ ∈ G(K, T ), para todo σ ∈ G(K, F ) e todo τ ∈ G(K, T ). Segue que para todo t ∈ T , temos τ (σ(u)) = σ(u) para todo σ ∈ G(K, F ) e todo τ ∈ G(K, T ). Logo σ(T ) ⊂ T . Agora, sendo T uma extensão de F , pelo teorema 3.2.6, existe a ∈ T talque T = F (a). Como σ(T ) ⊂ T , segue que σ(a) ∈ T . Logo como já provamos T é corpo de raı́zes do polinômio p(x) = (x−σ1 (a)) · · · (x−σn (a)), onde σ1 = I, · · · , σn são todos os automorfismos de G(K, F ). Segue do teorema 3.2.8 que T é uma extensão normal de F . 4. Como acabamos de ver φ : G(K, F ) → G(T, F ) dada por σ 7→ σ|T é um homomorfismo cujo núcleo é G(T, F ). Segue do teorema do homomorfismo (teorema 1.1.12) que G(K, F )/G(K, T ) é isomorfo a φ(G(K, F )). Pelo item 2 temos que |φ(G(K, F ))| = |G(K, F )/G(K, T )| = [G(K, F ) : G(K, T )] = [T : F ] = |G(T, F )|. Logo φ(G(K, F )) = G(T, F ), e portanto G(K, F )/G(K, T ) é isomorfo a G(T, F ). 3.3 A equação geral de grau n Agora faremos uma conexão entre os resultados sobre teoria de corpos e a solubilidade de equações polinomiais. Para isto precisamos introduzir o conceito de grupo solúvel e abordar alguns resultados sobre o mesmo. 47 Definição 3.3.1 Seja G um grupo, dizemos que G é solúvel se existir uma sequência de subgrupos G = G0 ⊃ G1 ⊃ G2 ⊃ · · · ⊃ Gk = {e} onde Gi é um subgrupo normal de Gi−1 e Gi−1 /Gi é abeliano. Teorema 3.3.1 Seja H um subgrupo de Sn (n > 4) que contém todo 3-ciclo, e seja N um subgrupo normal de H tal que H/N é abeliano, então N contém todo 3-ciclo de Sn . Demonstração: Seja f : H → H/N dado por f (x) = x o homomorfismo canônico e sejam x = (i1 i2 i3 ) e y = (i3 i4 i5 ) elementos de H. Podemos tomar x e y desta forma, pois n > 4. Como H/N é abeliano, segue que f (x−1 y −1 xy) = x−1 y −1 xy = x−1 y −1 x y = e, isto é, x−1 y −1 xy = e. Pelo teorema 1.1.6, x−1 y −1 xy ∈ N . Por outro lado x−1 y −1 xy = (i1 i2 i3 )−1 (i3 i4 i5 )−1 (i1 i2 i3 )(i3 i4 i5 ) = [(i3 i2 i1 )(i5 i4 i3 )][(i1 i2 i3 )(i3 i4 i5 )] = (i1 i3 i5 i4 i2 )(i1 i2 i3 i4 i5 ) = (i2 i5 i3 ). Logo (i2 i5 i3 ) ∈ N para quaisquer i2 , i3 , i5 . Teorema 3.3.2 Sn não é um grupo solúvel para n ≥ 5 Demonstração: Como n ≥ 5, Sn contém todo 3-ciclo. Se existisse uma cadeia de subgrupos G = G0 . G1 . · · · . Gk = {e} com Gi−1 /Gi abeliano, então pelo teorema 3.3.1 todo subgrupo Gi conteria todo 3-ciclo de Sn , e portanto a cadeia nunca chegaria no grupo trivial. Definição 3.3.2 Dizemos que o polinômio p(x) sobre o corpo F é resolúvel por radicais se existe uma seqüência de corpos F1 = F (w1 ) ⊂ F2 = F1 (w2 ) ⊂ · · · ⊂ Fk = Fk−1 (wk ) tal que w1r1 ∈ F, w2r2 ∈ F1 , · · · , wkrk ∈ Fk−1 e Fk contém todas as raı́zes de p(x). Dizer que o polinômio p(x) é resolúvel por radicais significa dizer que podemos escrever √ sua raı́zes em função de seus coeficientes envolvendo as operações (+, ., n ). q p √ 7 4 Por exemplo, digamos que α = 1 − 3 3 + 7 13 é a raiz de um polinômio sobre o corpo dos racionais que esta sendo escrita em função dos deste ¶ polinômio, µqcoeficientes 7 ³p p √ 2 √ ´4 √ √ 7 4 4 ∈ F2 = temos que 13 ∈ F, 3 + 7 13 ∈ F1 = F ( 13), 1 − 3 3 + 7 13 p √ 4 F1 ( 3 + 7 13) e F ⊂ F1 ⊂ F2 . Teorema 3.3.3 (Critério de Galois) Se o polinômio f (x) ∈ F [x] é resolúvel por radicais então o grupo de Galois de f (x) sobre F é um grupo solúvel. 48 Demonstração: Seja K o corpo de raı́zes de p(x) sobre F , e seja G(K, F ) o grupo de Galois de p(x). Usaremos o fato de que se K é o corpo de raı́zes do polinômio p(x) ∈ F [x] e F contém todas as raı́zes n-ésimas da unidade, então K = F (u), onde u é uma raiz de p(x) e G(K, F ) é abeliano. A demonstração deste fato pode ser vista em [6]. Se p(x) é resolúvel por radicais, então existe uma cadeia de subcorpos F ⊂ F1 = F (w1 ) ⊂ F2 = F1 (w2 ) ⊂ · · · ⊂ Fk = Fk−1 (wk ) onde w1r1 ∈ F, w2r2 ∈ F1 , · · · , wkrk ∈ Fk−1 . Sempre podemos encontrar Fk de modo que Fk seja uma extensão normal de F . Logo Fk é uma extensão normal de Fi , para todo i. Segue que da observação feita no inı́cio que Fi é o corpo de raı́zes de algum polinômio sobre Fi−1 e portanto pelo teorema 3.2.8 é uma extensão normal. Segue do teorema 3.2.9 que G(Fk , F ) . G(Fk , F1 ) . · · · . G(Fk , Fk−1 ) . {e} e G(Fk , Fi ) é abeliano G(FK , Fi−1 ) Segue que G(Fk , F ) é solúvel. Como K é corpo de raı́zes de p(x) sobre F , podemos considerar K como corpo de raı́zes de p(x) sobre Fk , logo pelo terema 3.2.8 K é uma extensão normal de Fk . Segue do teorema 3.2.9 que G(Fk , K) / G(Fk , F ) e G(K, F ) é isomorfo a G(Fk , F )/G(Fk , K). Concluı́mos que G(K, F ) é uma imagem homomorfa de G(Fk , F ) que é solúvel. Usando o fato de que a imagem homomorfa de um grupo solúvel é um grupo solúvel concluı́mos que G(K, F ) é solúvel. A demonstração de que a imagem homomorfa de um grupo solúvel é um grupo solúvel pode ser vista tanto em [1] quanto em [6] ou em [7]. Teorema 3.3.4 (Abel) O polinômio geral de grau n ≥ 5 não é resolúvel por radicais. Demonstração: Ora, pelo teorema 3.2.5 Sn é o grupo de Galois do polinômio p(t) = n X (−1)k ak xk sobre F (a1 , · · · , an ). Pelo teorema 3.3.2 Sn não é solúvel para n ≥ 5. k = 1 n X Logo, pelo teorema 3.3.3 o polinômio p(t) = para n ≥ 5 k = 1 49 (−1)k ak xk não é resolúvel por radicais Capı́tulo 4 Métodos numéricos para se obter raı́zes de equações A Teoria de Galois originalmente fazia um estudo de polinômios sobre o corpo dos números complexos, posteriormente foi abrangida para corpos arbitrário, como foi feito neste trabalho. Faremos agora uma discussão acerca dos polinômios definidos no corpo dos reais. No capı́tulo anterior provamos que as raı́zes do polinômio geral de grau ≥ 5 não podem ser escritas em função dos coeficientes deste polinômio. Isto quer dizer que o problema de achar as raı́zes de um polinômio de grau ≥ 5 não pode ser resolvido por método direto. Contudo, o método direto é apenas uma maneira de resolver um problema matemático. Podemos muitas vezes usar métodos iterativos que consistem em determinar aproximações sucessivas da solução procurada. Embora geralmente não se encontre a solução exata, podemos encontrar soluções convenientemente próximas. 4.1 Raı́zes reais Os métodos iterativos para se obter raı́zes de equações consistem em fazer aproximações de raı́zes localizadas num intervalo real [a, b]. Então antes de começar a procurar as raı́zes precisamos determinar a existência de raı́zes no intervalo [a, b]. Estes métodos não são válidos apenas para funções polinomiais, podemos aplicá-los também à funções transcendentes (não polinomiais). Porém nosso interesse está nas funções polinomiais. 51 4.1.1 Isolamento de raı́zes Teorema 4.1.1 Seja f uma função contı́nua em [a, b], se f (a)f (b) < 0, então f tem no mı́nimo uma raiz em [a, b]. Demonstração: Este resultado segue diretamente do teorema do valor intermediário. O teorema do valor intermediário diz que se f é contı́nua no intervalo fechado [a, b] e se γ for um real compreendido entre f (a) e f (b), então existirá no mı́nimo um c ∈ [a, b] tal que f (c) = γ. A demonstração do teorema do valor intermediário pode ser vista em qualquer bom livro de cálculo diferencial. Então, como f (a)f (b) < 0, segue que f (a) e f (b) tem sinais contrários. Logo γ = 0 esta entre f (a) e f (b). Pelo teorema do valor intermediário existe c ∈ [a, b] tal que f (c) = γ = 0. Logo c ∈ [a, b] é uma raiz de f (x). No caso particular de funções polinomiais temos o seguinte teorema devido a Cauchy que será enunciado sem demonstração. Teorema 4.1.2 (Cauchy) Dado o polinômio p(x) = an xn +· · · a1 x+a0 as raı́zes de p(x) estão no disco centrado na origem e raio R = 1 + A , |an | onde A = max{|a0 |, · · · .|an−1 |}. Este resultado na verdade permite localizar tanto raı́zes reais quanto raı́zes complexas. O leitor interessado na demonstração pode consultar [8] 4.1.2 Método da bissecção Seja p(x) uma função polinomial tal que o polinômio p(x) tem uma raiz ζ no intervalo [a, b]. Seja x0 = a+b 2 o ponto médio de [a, b]. Se x0 é a raiz de p(x) em [a, b], então o pro- cesso acaba aqui. Caso contrário a raiz esta ou em [a, x0 ] ou em [x0 , b]. Seguindo com este processo encontraremos em algum momento a raiz ζ de p(x) ou uma seqüência infinita de intervalos encaixados [a0 , b0 ] ⊃ [a1 , b1 ] ⊃ · · · ⊃ [an , bn ] ⊃ · · · todos contendo ζ. Segue que a0 , a1 , · · · , an , · · · formam uma seqüência monótona não-decrescente e b0 , b1 , · · · , bn , · · · formam uma seqüência monótona não-crescente. Segue que as duas seqüências são convergentes. Por outro lado, da forma como os intervalos são obtidos segue que bn − an = b−a 2n e daı́ lim bn − lim an = 0, portanto lim an = lim bn . Mas an ≤ ζ ≤ bn ∀n. Segue que lim an = limbn = limζ = ζ. Um caso mais geral do teorema 4.1.1 é o teorema 52 Teorema 4.1.3 Seja f uma função contı́nua em [a, b], se f (a)f (b) < 0, então f tem um número ı́mpar de raı́zes em [a, b] e se f (a)f (b) > 0, então f não tem raı́zes ou tem um número par de raı́zes em [a, b]. Não demonstraremos este resultado, vamos apenas discutir novamente o método da bissecção. Se p(a)p(b) < 0 então teremos um número ı́mpar de raı́zes para p(x). Suponhamos que nunca obtemos uma raiz de p(x) ao tomar o ponto médio xi do segmento [ai , bi ]. Então obtemos dois intervalos [ai , xi ] e [xi , bi ] um contendo um número ı́mpar de raı́zes e outro não contendo raı́zes ou contendo um número par de raı́zes. Sempre descartaremos o intervalo que não contém raı́zes ou contém um número par de raı́zes. Em algum momento encontraremos uma sequência de intervalos encaixados [ak , bk ] ⊃ · · · ⊃ [an , bn ] ⊃ · · · , onde k < n, cada um contendo um número ı́mpar de raı́zes de f (x) e novamente teremos lim an = limbn = limζ = ζ. 4.1.3 Método da iteração linear Este método consiste em escrever a função contı́nua p(x), como p(x) = f (x) − x e daı́ construir a seqüência xn+1 = f (xn ). Se ∀x ∈ I = [a, b], |f 0 (x)| ≤ L < 1 e f (I) ⊆ I, então xn+1 converge para um x0 tal que f (x0 ) = x0 . Este x0 é chamado de ponto fixo da função f e será uma raiz de p(x). Com efeito, primeiramente vamos provar a existência de pontos fixos no intervalo [a, b]. Como f (I) ⊆ I, segue que a ≤ f (a) ≤ b e a ≤ f (b) ≤ b. Logo 0 ≤ f (a) − a ≤ b − a e a − b ≤ f (b) − b ≤ 0. Suponhamos que f (a) 6= a e f (b) 6= b. Logo f (a) − a > 0 e f (b) − b < 0. Daı́ p(a) > 0 e p(b) < 0. Logo p(x) tem uma raiz x0 em [a, b] que é o ponto fixo de f . Agora suponhamos que f tenha dois pontos fixos x1 e x2 . Segue do teorema do valor médio que existe um c entre x1 e x2 tal que f (x1 ) − f (x2 ) = f 0 (c) x1 − x2 Segue que ¯ ¯ ¯ f (x1 ) − f (x2 ) ¯ x1 − x2 ¯ ¯= |f (c)| = ¯ =1 x1 − x2 ¯ x1 − x2 0 Mas c ∈ [a, b], logo f 0 (c) < 1. Temos portanto um absurdo que certamente veio da hipótese de que existem dois pontos fixos. 53 Provemos agora que a seqüência xn+1 = f (xn ) converge para x0 . Segue do teorema do valor médio que existe um cn entre xn e x0 tal que f (xn )−f (x0 ) xn −x0 = f 0 (cn ). Daı́ f (xn )−f (x0 ) = f 0 (cn )(xn −x0 ). Logo |f (xn )−f (x0 )| = |f 0 (cn )||xn −x0 | ≤ L|xn − x0 |. Segue que |xn+1 − x0 | = |f (xn ) − f (x0 )| ≤ L|xn − x0 |. Analogamente existe um cn−1 entre xn−1 e x0 tal que |xn − x0 | ≤ L|xn−1 − x0 |. Daı́ temos que |xn+1 − x0 | ≤ L2 |xn−1 − x0 |. Por recorrência, obtemos |xn+1 − x0 | ≤ Ln+1 |x0 − x0 |. Como 0 < L < 1 segue que lim Ln+1 = 0 e portanto lim xn+1 = x0 . 4.1.4 Método de Newton Seja x uma raiz do polinômio p(x) = a0 xn + a1 xn−1 + · · · + an−1 x + an num intervalo I = [a, b] e seja x0 uma aproximação de x com erro relativo ε, isto é, |x − x0 | = ε. Suponhamos que x > x0 . Daı́ x = x0 + ε. Logo a0 (x0 + ε)n + a1 (x0 + ε)n−1 + an−1 (x0 + ε) · · · + an = 0 Desenvolvendo cada binômio, obtemos n(n − 1) n−2 2 x0 ε + · · · + εn ) + a1 (x0n−1 + (n − 1)x0n−2 ε + 2 (n − 1)(n − 2) n−3 2 x0 ε + · · · + εn−1 ) + · · · + an−1 (x0 + ε) + an = 0 2 a0 (xn0 + nxn−1 ε+ 0 Para um ε suficientemente pequeno podemos tomar ε2 , ε3 , · · · , εn todos iguais a zero. Obtemos assim a equação (a0 xn0 + a1 xn−1 + · · · + an ) + (na0 xn−1 + (n − 1)a1 x0n−2 + · · · + an−1 )ε = 0 0 0 Logo p(x0 ) + p0 (x0 )ε = 0 Mas ε = x − x0 . Logo, p(x0 ) + p0 (x0 )(x − x0 ) = 0 Daı́ x = x0 − 54 p(x0 ) p0 (x0 ) Na verdade obtemos uma aproximação melhor que a inicial para a raiz de p(x). Nestas condições, obtemos a seqüência xn+1 = xn − p(xn ) p0 (xn ) que converge para a raiz de p(x) em [a, b]. O mesmo se obtém quando se toma x < x0 . Para uma função contı́nua arbitrária f (x), com f ”(x)f (x) < 0 consideremos a função g(x) = x − f (x) . f 0 (x) Temos que g 0 (x) = 1 − f 0 (x)2 −f (x)f ”(x) f 0 (x)2 = g(I) = I, então pelo resultado anterior xn+1 = g(xn ) = xn − f (x)f ”(x) < 1. f 0 (x)2 f (xn ) converge f 0 (xn ) Se além disso para uma raiz de f (x). 4.2 Raı́zes complexas Um método para se obter raı́zes complexas de um polinômio P (x) é o método de Newton-Bairstow que consiste em determinar os coeficientes de um polinômio do segundo grau x2 + px + q que divide P (x). Nestas condições as raı́zes de x2 + px + q que podem ser facilmente determinadas são raı́zes de P (x). A idéia reside no fato de que todo polinômio de coeficientes reais pode ser decomposto no corpo dos reais em fatores de grau no máximo dois. Como as raı́zes complexas sempre aparece aos pares, segue que elas são raı́zes de fatores quadráticos de P (x). O método também pode ser utilizado para se obter raı́zes reais. 4.2.1 Método de Newton-Bairstow Seja P (x) = an xn + an−1 xn−1 + · · · + a0 (4.1) um polinômio sobre o corpo dos reais. Dividindo P (x) por x2 + px + q = 0, obtemos P (x) = Q(x)(x2 + px + q) + R(x) (4.2) onde Q(x) é de grau n − 2 e R(x) é de grau 1, o que nos permite reescrever P (x) = Q(x)(x2 + px + q) + b1 (x + p) + b0 (4.3) Q(x) = bn xn−2 + bn−1 xn−3 + · · · + b2 (4.4) e 55 Substituindo 4.4 em 4.3 e comparando com 4.1, obtemos; bn = an bn−1 = an−1 − pbn bn−2 = an−2 − pbn−1 − qbn .. . b1 = a1 − pb2 − qb3 b0 = ao − pb1 − qb2 Queremos que x2 + px + q seja um divisor exato de P (x), para isto é necessário que R(x) = 0 e daı́ b1 = b0 = 0. Ora, pelas relações acima podemos expressar b0 e b1 em função de p e q calculando sucessivamente bn , bn−1 , · · · , b0 . Então o problema se reduz a resolver o sistema de equações não lineares. b (p, q) = 0 0 b (p, q) = 0 1 Para resolver um sistema de equações não lineares polinomiais ou transcendentes utilizamos o método de Newton. Não faremos nenhuma discussão da validade deste método. Apenas apresentaremos o método para sistemas de duas equações, o leitor interessado no assunto pode consultar [3]. Então para o sistema f (x, y) = 0 g(x, y) = 0 A solução pode ser encontrada a partir de uma aproximação inicial (x0 , y0 ), por xk+1 = xk − yk+1 ∂g f. ∂y − ∂g .g ∂y D(x, y) ∂g ∂f .f g. ∂x − ∂x = yk − D(x, y) (4.5) (4.6) ∂f ∂g ∂f ∂g − é o determinante da matriz jacobiana e ambos os nume∂x ∂y ∂y ∂x radores são aplicados em (xk , yk ). onde D(x, y) = 56 Então o problema agora é determinar ∂b0 ∂b0 ∂b1 . ∂q , ∂p ∂p e ∂b1 . ∂q Para isto basta observar que bj = aj − pbj+1 − qbj+2 . Daı́ ∂bj+1 ∂bj+2 ∂bj = −bj+1 − p −q ∂p ∂p ∂p para j = 0, · · · , n − 2. ∂b0 ∂p Logo, para se calcular e ∂b1 ∂p basta se calcular sucessivamente ∂bn ∂p 0 · · · ∂b . ∂p ∂bn ∂q 0 · · · ∂b . ∂q Analogamente ∂bj ∂bj+2 ∂bj+1 = −bj+2 − q −p . ∂q ∂q ∂q ∂b0 ∂q Logo, para se calcular e ∂b1 ∂q basta se calcular sucessivamente Exemplo 4.2.1 Vamos discutir as raı́zes do polinômio P (x) = x5 − 8x + 2 q Ora, como P (x) = 5x − 8, temos que P (x) = 0 se, e somente se x = ± 4 85 . Portanto 0 4 0 P (x) tem pelo menos um par de raı́zes complexas conjugadas. Para calcular estas raı́zes vamos utilizar o método de Newton-Bairstow. Para isto temos que determinar p e q de forma que P (x) = (x2 + px + q)(b5 x3 + b4 x2 + b3 x + b2 ), onde b5 = a 5 b4 = a4 − pb5 b3 = a3 − pb4 − qb5 b2 = a2 − pb3 − qb4 b1 = a1 − pb2 − qb3 b0 = a0 − pb1 − qb2 Daı́, calculando sucessivamente b5 , b4 , b3 e b2 , obtemos b1 = −8 + p4 − 3p2 q + q 2 b0 = 2 + 8p − p5 + 4p3 q − 3pq 2 Mas também vamos precisar das derivadas parciais de b0 e b1 . Com efeito, 57 ∂b0 ∂p ∂b0 ∂q ∂b1 ∂p ∂b1 ∂q = 8 − 5p4 + 12qp2 − 3q 2 = 4p3 − 6pq = 4p3 − pq = −3p2 + 2q Para começar a utilizar o método de Newton-Bairtow, precisamos de uma aproximação inicial dos coeficientes p e q. Pelo Teorema 4.1.2 as raı́zes de P (x) estão em um disco 8 1 centrado na origem e de raio R = 1 + = 9. Então podemos tomar p0 = −0, 5 e q0 = 3, que determinam o polinômio x2 − 0, 5x + 3 cujas raı́zes são complexas e têm módulo √ ρ = 3 < 9. k pk qk b0 (pk , qk ) b1 (pk , qk ) 0 0,5 3 -6,03125 -1,1875 1 0,29880 2,69128 -1,81741 2 0,27599 2,78655 -1,98851 3 0,20845 2,80972 4 0,16597 5 ∂b0 ∂p ∂b0 ∂q ∂b1 ∂p ∂b1 ∂q (pk , qk ) D(pk , qk ) pk+1 qk+1 -10,3125 -8,5 -8,5 5,25 -126,39062 0,298801 2,69128 -1,46990 -10,88540 -4,71823 -4,71823 5,114711 -77,93735 0,27599 2,78655 -0,86610 -12,776512 -4,53035 -4,53035 5,34459 -88,80929 0,20845 2,80972 -1,16779 -0,46986 -14,22795 -3,47784 -3,47785 5,48908 -90,19381 0,16597 2,83881 2,83881 -0,63305 -0,17502 -15,24185 -2,80869 -2,80869 5,59497 -93,166441 0,13846 2,84835 0,13846 2,84835 -0,23225 -0,05034 -15,68588 -2,35578 -2,35578 5,63919 -94,00536 0,12755 2,8509 6 0,12755 2,85093 -0,06614 -0,01106 -15,82819 -2,17358 -2,17358 5,65306 -94,20215 0,12425 2,85127 7 0,12425 2,85127 -0,01448 -0,00209 -15,86216 -2,11792 -2,11792 5,65622 -94,20546 0,12350 2,85129 8 0,12350 2,85129 -0,00273 -0,00037 -15,86888 -2,10535 -2,10535 5,65683 -94,19999 0,12336 2,85129 9 0,12336 2,85129 -0,00048 -6,43219E-05 -15,87009 -2,10295 -2,10295 5,65693 -94,19846 0,12334 2,85129 10 0,12334 2,85129 -8,40883E-05 -1,11483E-05 -15,87031 -2,10252 -2,10252 5,65695 -94,19817 0,12333 2,85129 11 0,12333 2,85129 -1,4574E-05 -1,93096E-06 -15,87034 -2,10245 -2,10245 5,65695 -94,19812 0,12333 2,85129 (pk , qk ) (pk , qk ) (pk , qk ) Daı́ obtemos p11 = 0, 12333 e q11 = 2, 85129. Agora o problema se resume a calcular as raı́zes da equação x2 + 0, 12333x + 2, 85129 que são z1 = −0, 061666008 + 1, 687451253i e z2 = −0, 061666008 − 1, 687451253i. Para calcular as demais raı́zes basta reduzir o grau do polinômio P (x), já que conhecemos duas de suas raı́zes. Assim obtemos o polinômio R(x) = x3 −0, 12333x2 −2, 836084x+ 0, 701436. Pelo teorema 4.1.2 as raı́zes reais estão no intervalo [−3, 836084; 3, 836084]. Mais precisamente, pela tabela abaixo R(x) tem uma raiz no intervalo [-2,-1], uma raiz no intervalo [0,1] e uma raiz em [1,2]. x -2 -1 0 1 2 p(x) -14 9 2 -5 18 58 Para obter uma aproximação da raiz do intervalo [−2, −1] vamos utilizar o método de Newton que consiste em obter o limite da sequência xk+1 = xk − R(xk ) . R0 (xk ) Com efeito, k xk xk+1 R(xk+1 ) 0 -2 -1,78050 -0,28444 1 -1,78050 -1,74052 -0,00868 2 -1,74052 -1,73922 -0,00002 3 -1,73922 -1,73922 -0,00002 Por tanto x0 = −1, 73922 é uma raiz de R(x) com margem de erro de ² = 10−4 . Para obter uma aproximação da raiz do intervalo [0, 1] vamos utilizar o método da bissecção. Com efeito, k a b p(a) p(b) 0 0 1 2 -5 - 1 1 0 0,5 2 -1,696 - 0,5 2 0 0,25 2 0,001 + 0,25 3 0,25 -0,992 - 0,125 0,375 0,001 p(a)p(b) |a − b| Portanto x1 = 0, 25 é uma raiz de R(x) com margem de erro de ² = 10−3 Para calcular a última raiz vamos utilizar o método da iteração linear. Com efeito, queremos encontrar a solução de x3 −0, 12333x2 −2, 836084x+0, 701436 = 0. Daı́ x = 0, 12333 + 2,836084 x − fixo da função f (x) = 0, 12333 + 0,701436 . x2 2,836084 x Logo o problema se resume a calcular o ponto 0,701436 . x2 − Como f 0 (2) = −0, 533662 < 1, então f (x) tem um ponto fixo no intervalo [1,2]. Assim temos, k xk xk+1 = f (xk ) 0 2 1,366013 1 1,366013 1,823601 2 1,823601 1,467615 3 1,467615 1,730114 ... ... ... 50 1,612429 59 1,612429 Assim obtemos x2 = 1, 612429, a última raiz de R(x), com margem de erro de ² = 10−6 , já que R(1, 612429) = 0, 000001. O que fizemos até aqui foi encontrar aproximações convenientes das raı́zes de P (x). Esta foi uma discussão do ponto de vista da matemática aplicada. Agora iremos discutir a natureza da solução e investigar se P (x) é resolúvel por radicais. Com efeito, as possı́veis raı́zes racionais de P (x) = x5 − 8x + 2 são -2, -1 , 0, 1 e 2. Logo P (x) é irredutı́vel sobre Q. Como já vimos as raı́zes de P (x) são todas distintas. Se θ1 , θ2 , θ3 , θ4 e θ5 são as raı́zes de P (x) então K = Q(θ1 , θ2 , θ3 , θ4 , θ5 ) é o corpo de raı́zes de P (x). Como as raı́zes são todas distintas então G = G(K, Q), o grupo de Galois de P (x), é um subgrupo de S5 . Como P (x) é irredutı́vel, segue do teorema 3.1.2 que ∀i = 1, ..., 5 [Q(θi : Q)] = 5. Pelo teorema da Torre [K : Q] = 5 (ver [7]). Logo, pelo teorema 3.2.7 |G| = 5. Daı́, como todo grupo de ordem prima é cı́clico segue que G possui um elemento de ordem 5. A aplicação z 7→ z de C induz um automorfismo de K, que mantém fixa as 3 raı́zes reais e permuta as 2 complexas. Mas isto corresponde ao 2-ciclo. Logo G contém uma transposição (2-ciclo) e um ciclo de ordem 5. Se pode provar que qualquer ciclo de ordem 5 e um 2-ciclo geram o S5 . Logo G = S5 e portanto pelo teorema 3.3.3 P (x) não é resolúvel por radicais. 60 Considerações Finais As equações polinomiais foi e ainda é fonte de estudo de muitos. Durante muitos séculos, matemáticos dos mais diversos lugares se empenharam em achar fórmulas que solucionassem tais equações. Até que Niels Abel demonstrou que uma equação polinomial de grau maior ou igual a cinco não resolúvel por radicais. Vale ressaltar que Abel não provou que as fórmulas não existem. Ele apenas provou que as raı́zes não podem ser escritas em função dos coeficientes do polinômio usando as quatro operações e a extração de raiz. Nada impede que as raı́zes possam ser escritas em função dos coeficientes do polinômio utilizando outras funções elementares, como as trigonométricas por exemplo. Em contraponto, como já vou dito, em determinadas circunstância o método iterativo pode ser mais oportuno que o método direto. Nesta perspectiva, este trabalho teve como objetivo fazer uma discussão detalhada das equações polinomiais abordando desde as soluções das equações polinomiais de grau menor que quatro, demonstrando a insolubilidade por radicais das equações de grau ≥ 5 e discorrendo sobre alguns métodos iterativos para se obter raı́zes de equações. 61 Referências Bibliográficas [1] Artin, E., Galois Theory, second edition, Notre Dame Mathematical Lectures, Number 2. [2] Bastos, G., G., Resolução de Equações por Radicais. Segunda Bienal da SBM. Disponı́vel em www.bienasbm.ufba.br [3] Cláudio, D. M., & Marins, J. M. Cálculo numérico computacional: teoria e prática. 2. ed.-São Paulo: Atlas, 1994. [4] Garcia, A. & Lequain, Y., Álgebra: um curso de introdução. Rio de Janeiro, Instituto de Matemática Pura e Aplicada, 1988.(Projeto Euclides) [5] Gonçalves, A., Introdução à álgebra. Rio de Janeiro, Instituto de Matemática Pura e Aplicada, 1979.(Projeto Euclides) [6] Herstein I., N., Tópicos de Álgebra. Tradução de Adalberto P. Bergamasco e L. H. Jacy Monteiro. SP. Editora da Univ. e Polı́gono, 1970. [7] Hungerford, W., T., Algebra. Springer, 1974. [8] Santos, I., L., D., & Silva, G., N., Zeros de Polinômios. Disponı́vel em www.mtm.ufsc.br/ bosing/07-2/files/ [9] Teixeira, M., V., & Martins, C., R., P., A Resolução das equações algébricas por radicais: As origens da Teoria de Galois. Terceira Bienal da SBM. Dispinı́vel em www.ime.ufg.br/bienal/2006/minicursos.php 63