Notas de Curso Ivan Pan 28 de Maio de 2008 2 Capı́tulo 1 Números Complexos Começaremos este capı́tulo fazendo uma brevı́ssima introdução aos sistemas numéricos (poderı́amos dizer, números reais) cuja única intenção é chamar a atenção do leitor para, em primeiro lugar, a naturalidade da concepção de número real e, em segundo lugar, da necessidade de construir os números complexos na medida que queremos desenvolver uma teoria razoável das equações algébricas. Ou seja, ao desenvonvolvermos o conceito de número, na parte introdutória do capı́tulo, isso não será suficiente, nem minimamente, para que um leitor leigo possa apreender como utilizá-los sem antes ter tido um apreendizado, nem que seja superficial, abordando este conceito; vamos começar argumentando com alguns exemplos do cotidiano e logo depois com exemplos mais abstratos vinculados à resolução de equações, de forma a sugerir que a “invenção” dos números é bem mais natural do que muitas vezes pode parecer. Logo após, introduziremos o conceito de número complexo, e estudaremos detalhadamente as suas propriedades básicas. Finalmente, formalizamos a concepção de algumas estruturas algébricas estreitamente relacionadas aos sistemas numéricos. 1.1 Introdução Os números que conhecemos são de fato de natureza diversa, o que está associado de forma bastante clara à utilização que fazemos deles. Por exemplo, contamos objetos de qualquer tipo com os números 1, 2, 3, . . . , etc; estes são os chamados Números Naturais; denotamos por N o conjunto constituı́do por estes números e suporemos que o número 0 está em N. Sem dúvida, os 3 4 CAPÍTULO 1. NÚMEROS COMPLEXOS naturais é o primeiro tipo de números que a humanidade concebeu; mesmo antes de possuir uma linguagem tão evoluı́da como a que hoje possuı́mos, já sabı́amos contar: basta constatar a presença de um objeto, e logo a de um outro objeto diferente sem ter esquecido a do primeiro, que estamos contando. 1 . Suponhamos agora que uma determinada pessoa que usufrui das vantagens (ou desvantagens) do chamado cheque especial, paga uma dı́vida de 200 reais com um cheque quando há na sua conta bancária tão somente 123 reais. Assim que o cheque for descontado pela administração do banco, dizemos que ficamos com “saldo negativo” de 77 reais, que poderı́amos convencionar escrever na forma -77 R$; estamos então insinuando a existência de números muito parecidos com os naturais, mas com uma qualidade especial que os faz opostos (ou simétricos) com aqueles em certo sentido: se depositarmos 77 reais na nossa conta (logo depois de contrairmos a dı́vida com o banco para não termos de pagar juros), o resultado é que ficamos sem dinheiro e sem dı́vida, isto é: -77+77=0. O conjunto dos naturais acrescentado destes novos “naturais negativos” é o que chamamos de Números Inteiros; denotaremos por Z o conjunto dos números inteiros. Resumindo, e de maneira heurı́stica, podemos dizer que estes números permitem-nos contar “para frente e para trás”. Quando precisamos dividir alguma coisa (por exemplo um bolo) em partes iguais, os números inteiros não são adequados para “contar” as diferentes partes, pois precisamos de uma contagem das partes, relativa ao todo, de forma a sabermos quanto do total do bolo as respectivas partes representam; podemos pensar nesta contagem relativa em contraposição à contagem “absoluta” realizada com os números naturais. Estamos então obrigados a introduzir o conceito de fração. Dizemos que comemos dois terços do bolo ou que ficamos uma meia hora esperando, etc; também precisamos de frações negativas, pois também podemos dever meia hora de trabalho ao nosso serviço por termos saı́do antes no dia anterior. Estes novos números são os Números Racionais que nos permitem de certa forma, contar, para frente e para trás, de maneira “relativa”; como também podemos comer o bolo inteiro comendo todas as partes em que foi previamente dividido, os números inteiros deveriam ser considerados como casos particulares de números racionais. O conjunto dos números racionais será denotado por Q. 1 Pesquisadores de Biolingüı́stica acreditam hoje que mesmo crianças com pocos meses de vida sabem contar até três (ver por exemplo [5] e artigos relativos) 5 1.1. INTRODUÇÃO Finalmente, quando tentamos medir a diagonal de um triângulo retângulo, pode acontecer (e de fato acontece “quase sempre” embora esta afirmação não seja tão simples de ser demonstrada rigorosamente) que o resultado da medição, não seja uma fração; porém deveria de existir um número com sua medida, já que tanto as diagonais de triângulos como seus comprimentos parecem existir. Para entender isto, consideremos um triângulo retângulo cujos catetos têm comprimento 1. Pelo teorema de Pitágoras, o comprimento da diagonal deveria ser um número a tal que a2 = 2. Suponhamos que a = p/q onde p e q são números inteiros sem fatores comuns (isto é, cujo máximo divisor comum é 1), ou seja, suponhamos que a é um número racional. Vamos ver que isto nos conduz a uma contradição. Com efeito, neste caso a = p2 /q 2 donde p2 = 2q 2 . Como p divide 2q 2 e não divide q (logo não divide q 2 ), terı́amos que p divide 2; para isto acontecer, deveriamos ter p = 1 ou p = 2 (e então p2 = 4), o que não é possı́vel como o leitor poderá facilmente verificar. O conjunto dos números que permitem representar com precisão qualquer medida de um certo comprimento, como por exemplo aquele da diagonal de um triângulo retângulo, ou o negativo de qualquer comprimento, chamase o conjunto dos Números Reais, que denotaremos R (tente dar alguma utilidade para os comprimentos negativos !). O leitor pode observar que enquanto os racionais podem ser construı́dos tomando frações de números inteiros e os inteiros tomando opostos (negativos) de números naturais, ou seja, que em última instância parece bastar a existência dos naturais para chegarmos à existência dos racionais.Os números reais possuem uma natureza um tanto diferente, pois não podem ser construı́dos a partir de números “mais simples” por meio de operações elementares (soma, substração, multiplicação e divisão); de fato, os primeiros reais não racionais que conseguimos conceber, a partir de nosso exemplo, provém de realizar uma operação de natureza diferente, a raiz quadrada. É sabido que todo número real positivo possui duas raı́zes também reais, uma positiva e uma negativa (a prova deste resultado não é inteiramente banal e se faz nos cursos de análise real: veja por exemplo [6, Cap. III, §3]). Por definição de raiz quadrada, esta pode ser extraı́da daqueles números reais que forem positivos ou zero. 6 CAPÍTULO 1. NÚMEROS COMPLEXOS Observe-se que, de acordo com o que temos concluı́do acima, temos as seguintes inclusões estritas de conjuntos N ⊂ Z ⊂ Q ⊂ R. Vejamos agora como os diferentes conjuntos de números que conhecemos surgem naturalmente como uma necessidade, na tentativa de resolver equações polinomiais. Consideremos a equação linear ax + b = 0, onde a, b ∈ R. Se a = 0, então não temos equação alguma (pois a incógnita sumiu !); então suponhamos que a 6= 0. Como sabemos desde o ensino fundamental, se a 6= 0, o único valor possı́vel de x é b x=− . a Para obter este resultado, devemos somar o oposto −b de b aos dois lados da igualdade (pois duas magnitudes iguais não podem ser alteradas ao somar um mesmo número a cada uma delas) e logo devemos multiplicar a ambos lados da nova igualdade, por 1/a, que é chamado de inverso de a, para enfim obter o resultado conhecido por todos. Em particular, observe-se que precisamos das operações elementares para resolver esta simples equação! Mesmo sendo a e b númeos naturais, é facil ver que a solução obtida deixa de sê-lo na mair parte dos casos. Precisamos então, no mı́nimo, dos números racionais para resolver uma equação linear. De fato, os números racionais podem ser definidos, como o conjunto das soluções de equações lineares da forma qx = p onde p e q são números inteiros arbitrários com q 6= 0. Consideremos agora uma equação quadrática, isto é, da forma ax2 + bx + c = 0, (1.1) onde a, b, c ∈ R e a 6= 0. Multiplicando por 1/a podemos escrever a equação acima na forma equivalente seguinte b c x2 + x + = 0. a a 7 1.1. INTRODUÇÃO Mais ainda, um pequeno cálculo nos mostra que esta equação é de fato equivalente à seguinte: 2 c b2 b − 2 + = 0. x+ 2a 4a a Desta forma obtemos b x+ 2a o que mostra que a expressão 2 = b2 c − , 2 4a a b 2a 2 2 deve ser uma raı́z quadrada de b /4a − c/a; em particular para podermos calcular as soluções da equação quadrática, precisamos que esta expressão seja não negativa. Formalmente podemos escrever r b b2 c x=− ± − . (1.2) 2 2a 4a a x+ Observamos, por um lado, que devemos ter c b2 − ≥0 2 4a a para podermos calcular as raı́zes quadradas; mais ainda, mesmo tendo a, b, c ∈ Z, o resultado, mesmo que exista, pode não ser racional: faça por exemplo b = 0, a = 1, c = −2. Por outro lado, se quiséssemos resolver a equação quadrática para quaisquer valores de a, b e c, então deverı́amos conhecer um conjunto de números que contivesse no seu interior raizes de números reais negativos; isto aparentemente não faz muito sentido (pense sobre isso!!). Vejamos um exemplo. Vamos admitir que o leitor conheça, o que é assunto de ensino médio (e que analisaremos em detalhe no capı́tulo 2), que quando temos uma solução x0 de uma equação polinomial, podemos dividir o polinômio por x − x0 obtendo assim uma fatoração deste como produto de x − x0 por um polinômio de grau um a menos. De qualquer modo, vamos aceitar este fato apenas para podermos dar um exemplo que, esperamos, motive o leitor a fazer o esforço de continuar a leitura. Exemplo 1.1.1. Consideremos a equação cúbica x3 − 4ax2 + a2 x − 1 = 0. 8 CAPÍTULO 1. NÚMEROS COMPLEXOS Um cálculo facil envolvendo derivadas nos mostra que a função f (x) := x3 − 4ax2 + a2 x − 1 possui um máximo relativo em x = 2a e um mı́nimo relativo em x = 6a; obtemos diretamente f (2a) = −6a3 − 1 < 0, f (6a) = 214a3 − 1. Como o sinal de f (x) coincide com o sinal de x para valores de x cujo valor absoluto seja o suficientemente grande, concluı́mos que o gráfico de f (x) corta a reta y = 0 uma única vez, donde segue que a equação cúbica acima possui uma única raiz real. Suponhamos agora que temos à mão a solução real, digamos x0 , desta equação. Dividindo por x − x0 , podemos fatorar a equação na forma x3 − 4ax2 + a2 x − 1 = (x − x0 )g(x), onde g(x) é uma expressão de grau dois; estamos então na situação onde g(x) = 0 não possui solução real, isto é, b2 /4a2 − c/a < 0 para a equação quadrática g(x) = 0. Se tivermos um método para encontrar as soluções não reais desta equação como em (1.2), digamos x1 e x2 , então poderı́amos dividir por (x − x1 ) e por (x − x2 ), obtendo finalmente a solução real x0 . 1.2 Definição e operações elementares Retomemos a equação (1.1). Trabalhando de maneira puramente formal com a solução (1.2) (isto é, não se preocupando com o fato da solução existir ou não) e escrevendo, para simplificar, ∆ := b2 − 4ac, podemos escrever (1.2) na forma √ ∆ b x=− ± . 2a 2a Evidentemente o resultado faz sentido como número real se e somente se ∆ ≥ 0. 1.2. DEFINIÇÃO E OPERAÇÕES ELEMENTARES 9 Por outro lado, se ∆ for negativo, podemos escrevê-lo como ∆ = (−1)|∆|, onde as barras indicam o valor absoluto do número real ∆ que neste caso será estritamente positivo. Se continuaramos trabalhando de maneira formal, e esperando que as propriedades usuais dos números que conhecemos sejam ainda válidas, teremos p (−1)|∆| b x = − ± 2a √ 2a p −1 |∆| b ; = − ± 2a 2a √ aqui a única expressão que não faz sentido dentro dos números reais é −1. Concluı́mos que para resolver a equação √ quadrática em todos os casos só precisamos de dar um sentido à expressão −1. Todas as soluções podem ser então escritas na forma √ x = A + B −1 onde √ ∆ b A=− ± 2a 2a se ∆ ≥ 0, e p |∆| b A=− , B=± 2a 2a quando ∆ < 0; observemos que A e B sempre são números √ reais. Para simplificar a notação, escreveremos ı no lugar de −1. Esqueçamos por um momento a equação e trabalhemos com “números” da forma a + bı onde a, b ∈ R. Se quisermos que expressões desta forma sejam verdaderos números (embora não reais !), devemos saber operar com eles, isto é, devemos saber como somá-los, sustraı́-los, multiplicá-los e dividı́-los, quando esta última operação for possı́vel (lembrar do que acontece com os inteiros que não possuem divisão exata sempre). Mais ainda, estas operações devem satisfazer as propriedades básicas de associatividade, comutatividade e distributividade, como as satisfazem todos os números que conhecemos. 10 CAPÍTULO 1. NÚMEROS COMPLEXOS Finalmente, seria necessário que os números reais pudessem ser considerados como um caso particular destes novos números, afim de poder usá-los para resolver a equação quadrática sem ter que diferenciar o caso em que o resultado é real do caso onde não o é. Tomando b = 0 em a+bı parece bem razoável que só obtenhamos números reais, já que a ∈ R. Para definir a soma, dado que cada expressão da forma a + bı possui duas partes distintas, uma real, o número real a, e√outra, o número real b, que vem acompanhada de um objeto novo (o ı = −1 que certamente não é real), parece natural então somar dois destes números não misturando suas partes; mais precisamente, vamos somar a + bı e c + dı como (a + bı) + (c + dı) = (a + b) + (c + d)ı, que faz sentido pois sabemos o que significa a + b e c + d De maneira análoga, multipliquemos formalmente dois destes números usando as propiedades que conhecemos das operações elementares: (a + bı) · (c + dı) = = = = ac + adı + bıc + bıdı ac + adı + bcı + bd(ı)2 ac + adı + bcı + bd(−1) ac − bd + (ad + bc)ı; observe-se que ac − bd + (ad + bc)ı é uma expressão da forma A + Bı onde A, B ∈ R. Quando não houver perigo de ambigüidade, também escreveremos zw para indicar a multiplicação z · w de dois números complexos z = a + bi e w = c + di. Isto motiva a seguinte Definição 1.2.1. O conjunto dos números complexos é o conjunto C := {a + bı : a, b ∈ R} com as operações de soma e multiplicação definidas por (a + bı) + (c + dı) = (a + b) + (c + d)ı e (a + bı) · (c + dı) = ac − bd + (ad + bc)ı, respectivamente. Si z = a + bı ∈ C dizemos que a e b são as partes real e imaginária, respectivamente; denotamos a = ℜ(z) e b = ℑ(z). 1.2. DEFINIÇÃO E OPERAÇÕES ELEMENTARES 11 Se z = a + bı, dizemos que a + bı é a Notação Binômica ou Cartesiana; a segunda denominação é motivada em certa medida pela seguinte observação. Observação 1.2.2. A existência de um número complexo equivale então à existência de dois números reais, sua partes real e sua parte imaginária, de maneira independente. Desta forma podemosrepresentar um número complexo z ∈ C como um par ordenado (a, b); de fato esta observação permite entender que os números complexos efetivamente existem, e sua existência está vinculada à existência dos números reais: observe que nossa construção dos números complexos pressupõe a existência de um número bastante singular que denotamos ı; a forma de entender que este “número” efetivamente existe, é pensar os números complexos como pares ordenados da forma (a, b) junto com as operações definidas acima, reinterpretadas em termos de pares, isto é: (a, b) + (c, d) = (a + c, b + d), (a, b) · (c, d) = (ac − bd, ad + bc). Deixamos como exercı́cio para o leitor verificar que o par ordenado (0, 1) satisfaz (0, 1) · (0, 1) = (−1, 0); como (0, 1) corresponde exatamente ao nosso ı, isto mostra que o quadrado dele corresponde ao nosso número complexo −1 = −1 + 0ı. A representação de um número complexo como um par ordenado, permitenos representar geometricamente tal número na forma de um vetor do plano; a ponta do vetor ou ponto do plano correspondente terá como abscissa e ordenada as parte real e imaginária do número complexo, respectivamente. a+ib b a Figura 1.1: Representação geométrica de um número complexo Geometricamente podemos obter a soma de números complexos z = a+ıb e w = c+ıd pela chamada Regra do Paralelograma, que consiste em construir 12 CAPÍTULO 1. NÚMEROS COMPLEXOS um paralelogramo, cujos lados adjacentes são os vetores (a, b) e (c, d) que est øsendo somados, (a+c)+i(c+d) a+ib b c+id a Figura 1.2: Representação geométrica da soma de complexos Como nosso objetivo é resolver equações polinomiais, é claro que,deverı́amos poder operar com nossos novos números. Para isto, precisamos não só multiplicar e somar, mas também subtrair e dividir. Mais concretamente, tendo em mente o exemplo 1.1.1, podemos conceber que os números complexos possam nos auxiliar no intuito de encontrar as soluções reais de uma equação algébrica (polinomial) mediante obtenção de uma solução arbitrária; mesmo sendo esta imaginária. Para isto podemos dividir a expressão de nossa equação por x − α, onde α é a solução achada em primeira instância; desta forma, nossa equação original fatora-se como produto de x − α por uma expressão de grau um a menos do que o grau daquela. Não é dificil de se convencer que para dividir expressões polinomiais com coeficientes em C (observe que agora α pode não ser real), é necessário poder subtrair e dividir números complexos (para divisão de polinômios veja capı́tulo 2. O Módulo de um número complexo z := a + ıb é o número real não negativo √ |z| := a2 + b2 . Da representação geométrica concluı́mos que |z| é o comprimento do vetor (a, b) correspondente; evidentemente Z = 0 se e somente se |z| = 0. Como caso particular, observa-se que se z = a é um número real, então |a| é o valor absoluto usual de a. De acordo com a definição de multiplicação de números complexos, obsevamos que a2 + b2 = (a + ıb)(a − ıb); 1.2. DEFINIÇÃO E OPERAÇÕES ELEMENTARES 13 o número complexo z̄ := a−ıb chama-se o Conjugado de z = a+ıb. Obtemos então z · z̄ = |z|2 . (1.3) Com a ajuda da equação (1.3) podemos demonstrar a existência de inverso de um número complexo não nulo de maneira muito simples. Com efeito, se z 6= 0, teremos que r := |z| é um número real não nulo (de fato positivo) donde 1 z · ( 2 z̄) = 1, r o que mostra que o inverso de z existe e escreve-se na forma 1 z −1 = z̄; r em notação binômica z −1 b a ı. + − 2 = 2 a + b2 a + b2 Se z, w ∈ C com w 6= 0, definimos a divisão de z por w como Z : w := z · w−1 ; como para números reais, denotamos também z z:w= . w Como exercı́cio o leitor pode tentar demonstrar o seguinte resultado que resume as propriedades algébricas do conjunto dos números complexos: Teorema 1.2.3. A terna (C, +, ·) é um corpo. Para terminar esta seção, enunciamos sem demonstração as propriedades métricas mais importantes do módulo; consideramos estas propriedades como conhecidas dos leitores, já que são as mesmas consideradas para vetores do plano e que, graças à representação geométrica dos números complexos, continuam válidas para estes últimos; em todo o caso, tentar uma demonstração destas propriedades é um exercı́cio útil para obter desenvoltura no cálculo com números complexos. Proposição 1.2.4. Sejam z1 , z2 ∈ C e λ ∈ R. Temos as seguintes afirmações: (a) (Desigualdade Tringular) |z1 + z2 | ≤ |z1 | + |z2 |; (b) |λZ1 | = |λ||z1 |; (c) Se Z2 6= 0, então |z1 z2−1 | = |z1 |/|z2 |. 14 1.3 CAPÍTULO 1. NÚMEROS COMPLEXOS Coordenadas polares Analogamente ao que acontece com os vetores do plano, temos uma representação polar para números complexos. Por razões históricas se z = a + bı é um número complexos, o ângulo na representação polar do vetor (a, b) chama-se o Argumento de z. Antes de definir o argumento precisamos de alguns preliminares. Da mesma maneira que para dar posições de pontos numa reta é necessário antes fixar um ponto de referência nesta, a partir do qual as coordenadas de pontos arbitrários da reta serão definidas, precisamos de uma semireta de referência com relação à qual a inclinação dos vetores do plano será determida. Mais precisamente, fixemos um sistema de coordenadas cartesiano cuja origem (0, 0) denotamos O, que representa o número complexo 0 = 0 + 0ı. Fixemos uma semireta l com origem em O; denotamos λ ∈ [0, 2π) o ângulo formado por l e a semireta constituı́da pelos pontos de abscissa não negativa, medido em sentido anti-horário. Nosso objetivo é definir coordenadas angulares para um vetor não nulo v do plano. Quando o vetor v for nulo, isto é, estiver representado pelo ponto O, a coordenada angular não estará definida. Então a coordenada angular de v relativa à reta l, é um número real θ(v) ∈ [λ, λ + 2π), que por definição, é o valor do ângulo formado por v e o vetor (1, 0) medido em sentido anti-horário. Desta forma, a coordenada angular está bem determinada sempre que v 6= 0, dependendo seu valor, da semireta l pré-fixada; na literatura sobre o assunto, quando fixada a semireta l, diz-se as vezes que fixamos uma determinação da coordenada angular. Por convenção se θ ∈ [λ, λ + 2π), os identificamos com θ, os valores θ + 2kπ, onde k ∈ Z: observe que tais valores definem o mesmo ângulo que θ. As semiretas mais comumente utilizadas para determinar a coordenada angular são as duas semiretas determinadas pela origem O no eixo x: a dos pontos cujas abscissas são não negativas e não positivas respectivamente. No primeiro caso a coordenada θ(v) varia no intervalo [0, 2π) e no segundo caso no intervalo [−π, π). Aos efeitos da utilização que faremos dos números complexos, é suficiente considerarmos apenas a primeira determinação da coordenada angular; determinação esta que fixamos e que consideraremos sem mensão explı́cita a partir de agora. Exemplo 1.3.1. O vetor v = (−1, −1) tem coordenada angular θ = 7π/4, ou somando −2π, também θ = −π/4, que é um valor do argumento na determinação θ ∈ [−π, π). 1.3. COORDENADAS POLARES 15 Seja z ∈ C um número complexo. Se z 6= 0, a coordenada angular do vetor que representa z chama-se o argumento, que denotamos arg(z) ou arg z. As coordenadas polares de z é o par (|z|, arg z); se z = 0 o valor de arg z não existe (isto é, a função argumento não está definida em 0) mas |z| = 0 neste caso, o que determina z (ou seja, não precisamos de argumento para determinar z = 0). Se z = a + bı 6= 0 com coordenadas polares (r, θ), temos evidentemente a = r cos θ, b = r sin θ; concluı́mos que as coordenadas polares de z determinam a parte real e imaginária de z. Reciprocamente, dados a e b podemos determinar as coordenadas polares mas temos que ter certo √ cuidado com o argumento; com efeito o módulo r, como já sabemos vale a2 + b2 , mas para o argumento devemos utilizar as funções trigonométricas inversas e alguma das relações b a cos θ = , sin θ = ; r r podemos ainda utilizar b arctan . a É preciso, na hora de calcular θ, representar geometricamente o número complexo, de forma a poder interpretar corretamente os valores das funções arcos: vejamos um exemplo. Exemplo 1.3.2. Seja z = −1 − ı;√está representado pelo vetor (−1, −1) no terceiro quadrante. Temos |z| = 2. Se calculamos ingenuamente −1 arctan = arctan(1) −1 obteremos o valor π/4, pois os valores da função arctan variam entre −π/2 e π/2; devemos então corrigir este valor subtraindo-o de π, pois nosso vetor está de fato no terceiro quadrante. Analogamente, para o complexo z = −1 + ı que está no segundo quadrante, devemos corrigir o valor arctan(−1) = −π/4 somando-lhe π. O leitor pode refletir sobre o que devemos corrigir no caso de utilizar as funções arccos e arcsin. Exemplo 1.3.3. Consideremos z = bı; é um número complexo imaginário puro, isto é, sua parte real é nula. Se tratarmos de calcular seu algumento 16 CAPÍTULO 1. NÚMEROS COMPLEXOS utilizando arctan, observaremos que em princı́pio isto não é possı́vel, pois a = 0. Mas um momento de reflexão nos mostra que não é necessária a utilização de fórmula alguma, pois evidentemente o argumento de um tal número é π/2 quando b > 0 e 3π/2 quando b < 0. Se z = a + bı, usando as fórmulas acima, podemos escrever z = r(cos θ + ı sin θ). Dizemos que z está escrito em Notação Trigonométrica, em contraposição com a escrita z = a + bı que é chamada de Notação Cartesiana ou Binômica. √ Exemplo 1.3.4. A notação trigonométrica do número complexo 1 + ı 3 é z = 2(cos 1.3.1 π π + ı sin ). 3 3 Fórmulas de De Moivre Vamos agora multiplicar dois números complexos escritos em notação trigonométrica. Sejam zj = rj (cos θj + ı sin θj ), j = 1, 2; ou seja que rj = |zj |, θj = arg zj para j = 1, 2. Então z1 z2 = = = = r1 (cos θ1 + ı sin θ1 )r2 (cos θ2 + ı sin θ2 ) r1 r2 (cos θ1 + ı sin θ1 )(cos θ2 + ı sin θ2 ) r1 r2 [(cos θ1 cos θ2 − sin θ1 sin θ2 ) + ı(cos θ1 sin θ2 + sin θ1 cos θ2 )] r1 r2 [cos(θ1 + θ2 ) + ı sin(θ1 + θ2 )] , onde usamosa conhecida fórmula para seno e cosseno de uma soma de ângulos. Concluı́mos que o módulo de z1 z2 é o produto dos módulos de z1 e z2 , e o seu argumento é a soma dos argumentos de z1 e z2 , respectivamente. Exercı́cio 1.3.1. Interprete geometricamente as conclusão acima sobre as coordenadas polares do produto de números complexos. Consideremos n números complexos zj := rj (cos θj + ı sin θj ), j = 1, . . . , n. 1.4. RAÍZES N -ÉSIMAS 17 Por indução matemática no número de fatores podemos demonstrar (o que mostramos para dois fatores é o caso n = 2) z1 · · · zn = r1 · · · rn [cos(θ1 + · · · + θn ) + ı sin(θ1 + · · · + θn )] . Como caso particular, escolhendo z = z1 = · · · = zn obtemos uma fórmula para a potência n−ésima [r(cos θ + ı sin θ)]n = rn [cos(nθ) + ı sin(nθ)] , (1.4) onde r = r1 = · · · = rn e θ = θ1 = · · · = θn . Aplicando esta fórmula para um número complexo z de módulo r = 1 obtemos a fórmula equivalente (cos θ + ı sin θ)n = cos(nθ) + ı sin(nθ). (1.5) Tanto a fórmula (1.4) quanto a fórmula (1.5) são conhecidas como Fórmula de De Moivre. Esta última pode ser utilizada para escrever cos(nθ) e sin(nθ) como funções polinomiais em cos θ e sin θ com coeficientes inteiros: Exemplo 1.3.5. Seja n = 2. Neste caso a fórmula (1.5) fornece cos(2θ) + ı sin(2θ) = (cos θ + ı sin θ)2 = (cos2 θ − sin2 θ) + ı(2 cos θ sin θ); donde, igualando partes real e imaginárias, obtemos cos(2θ) = cos2 θ − sin2 θ, sin(2θ) = 2 cos θ sin θ. Para os casos n = 3, 4 veja o exercı́cio 1.7.7. Mais geralmente, o leitor pode tentar obter uma fórmula geral como sugerida no seguinte: Exercı́cio 1.3.2. Utilizando a fórmula do binômio de Newton (caso não a conheça veja o exercı́cio 2.4.20 no final do capı́tulo), escreva cos(nθ) e sin(nθ) como funções polinomiais em cos θ e sin θ com coeficientes inteiros. 1.4 Raı́zes n-ésimas Seja w ∈ C. Uma raiz n-ésima de w é um número complexo z ∈ C tal que z n = w. 18 CAPÍTULO 1. NÚMEROS COMPLEXOS Se w = 0, aplicando módulos de ambos lados da equação obtemos |z n | = |z|n = 0, donde |z| = 0, isto é, z = 0. Ou seja, a única raiz n-ésima de 0 é o próprio 0. Suponhamos agora que w 6= 0; escrevamos w em notação trigonométrica: w = s(cos φ + ı sin φ), com s = |w| > 0 e φ = arg w. Procuramos raı́zes n-ésimas também escritas em notação trigonométricas da forma z = r(cos θ + ı sin θ), com r = |z| e θ = arg z. Por definição z n = w; da fórmula de De Moivre (1.4) obtemos z n = = rn [cos(nθ) + ı sin(nθ)] = s(cos φ + ı sin φ) = w. Primeiramente concluı́mos que o módulo de w é s = rn , donde obtemos o 1 módulo r de z: como r > 0, seu valor é a raiz n-ésima (real) positiva s n de s. Simplificando rn com s obtemos cos(nθ) + ı sin(nθ) = cos φ + ı sin φ, que igualando partes real e imaginária equivale ao sistema de equações trigonométricas cos(nθ) = cos φ (1.6) sin(nθ) = sin φ. Analisando o gráfico das funções cos e sin (ou equivalentemente as projeções nos eixos x e y de um ponto variando no cı́rculo trigonométrico, respectivamente), constatamos que dois ângulos distintos com valores entre 0 e 2π que possuem o mesmo cosseno estão nos quadrantes primeiro e quarto, nos quadrantes segundo e terceiro, ou são π/2 e −π/2. Analogamente, se possuem o mesmo seno, estão nos quadrantes terceiro e quarto ou nos quadrantes primeiro e segundo. Concluı́mos que dois ângulos (distintos) em [0, 2π) não podem, ao mesmo tempo, possuir o mesmo cosseno e o mesmo seno. Portanto, a única forma para que ângulos distintos, agora com valores arbitrários, 1.4. RAÍZES N -ÉSIMAS 19 possuam o mesmo cosseno e o mesmo seno é que seus valores difiram por múltiplos inteiros de 2π. Da digressão acima, concluı́mos que as soluções do sistema de equações trigonométricas (1.6) é nθ = φ + 2kπ, k ∈ Z; o argumento procurado θ tem então vários valores possı́veis que dependem de k: φ 2kπ , k ∈ Z. θk = + n n Fazendo k variar entre 0 e n − 1 o ângulo θ toma os n valores distintos φ φ 2π φ 4π φ 2(n − 1)π , + , + ,..., + ; n n n n n n n quando k varia entre n e 2n − 1 reobtemos os valores de θ = θ0 , θ1 , . . . , θn−1 , pois estes diferem daqueles por 2π (nossa convenção para valores de ângulos: veja página 14). Raciocinando desta forma não é difı́cil de se convencer que os únicos valores distintos para o argumento θ são o n valores acima. Demostramos então o seguinte resultado: Teorema 1.4.1. Seja w ∈ C um número complexo não nulo; escrevemos w = s(cos φ + ı sin φ). Então existem n raı́zes (distintas) zk = r(cos θk + ı sin θk ), k = 0, 1, . . . , n − 1, onde 1 r = s n , θk = φ 2kπ + . n n Observação 1.4.2. Todas as raı́zes n-ésimas de w possuem o mesmo módulo que é exatamente a raiz n-ésima positiva real do módulo de w; para obter os argumentos das raı́zes n-ésimas, podemos proceder da forma seguinte: primeriro dividimos o argumento de w por n, o que fornece o argumento de z0 ; logo após acrescentamos ao argumento de z0 o valor 2π/n, o que fornece o argumento de z1 ; logo após acrescentamos ao argumento de z1 o valor 2π/n; e assim por diante, até obtermos o argumento de zn−1 . Se repetirmos mais uma vez o procedimento, reobteremos o argumento de z0 . 20 CAPÍTULO 1. NÚMEROS COMPLEXOS A observação acima fornece a seguinte interpretação geométrica: as raı́zes n-ésimas de w 6= 0 representam-se no plano como os vértices de um polı́gono 1 regular de n lados inscrito numa circunferência de raio s n . Figura 1.3: representação geométrica de raı́zes sextas Exemplos 1.4.3. (a) Consideremos w = −1 − ı. Evidentemente w = cos 5π 5π + ı sin . 4 4 Ou seja que s = 1 e φ = 5π/4. As raı́zes quintas de w são π π z0 = cos + ı sin 4 4 π 2π π 2π z1 = cos + ı sin + + 4 5 4 5 π 4π π 4π z2 = cos + ı sin + + 4 5 4 5 π 6π π 6π + + ı sin + z3 = cos 4 5 4 5 π 8π π 8π z4 = cos + + + ı sin 4 5 4 5 (b) Seja w 6= 0 arbitrário; temos w = s(cos φ + ı sin φ). As raı́zes quadradas de w são 1 φ φ φ φ z0 = s (cos + ı sin ), z1 = s 2 cos( + π) + ı sin( + π) ; 2 2 2 2 1 2 1.4. RAÍZES N -ÉSIMAS 21 como somar π troca o sinal do cosseno e do seno, concluı́mos que z1 = −z0 . Em outras palavras, as raı́zes quadradas de números complexos são números complexos simétricos. (c) Seja w = a ∈ R um número real não nulo. Temos dois casos: (c1 ) a > 0: temos arg a = 0. Então 1 zk = a n (cos 2kπ 2kπ + ı cos ), k = 0, 1, . . . , n − 1; n n em particular, quando é par, digamos n = 2m, as duas raı́zes reais são z0 e zm−1 ; quando n é ı́mpar, z0 é a raiz real de a. (c2 ) a < 0: temos arg a = π. Então 1 zk = |a| n (cos (2k + 1)π (2k + 1)π + ı cos ), k = 0, 1, . . . , n − 1; n n em particular quando n é ı́mpar, novamente z0 é a raiz real. Exemplo 1.4.4. Raı́zes da unidade. As raı́zes n-ésimas da unidade complexa w = 1 (ou seja, o neutro da multiplicação) obtém-se como caso particular do exemplo 1.4.3(c1 ): zk = cos 2kπ 2kπ + ı cos , k = 0, 1, . . . , n − 1; n n todas são números complexos de módulo um. Observamos que estão representadas no plano como os vértices de um polı́gono regular de n lados, inscrito numa cisrcunferência de raio um; um dos vértices é o ponto (1, 0) que representa o complexo 1, a raiz n−ésima real positiva de 1. A raiz nésima z1 , que denotaremos ωn chama-se a Raiz n-ésima Primitiva da unidade. Pela fórmula de De Moivre (1.5) temos que ωnn = 1 e zk = ωnk , k = 0, . . . , n − 1. Esta propriedade implica que o conjunto Cn := {1, ωn , . . . , ωnn−1 } é fechado para a multiplicação, isto é, z, w ∈ Cn implica z · w ∈ Cn (mostre esta afirmação !). Finalmente, por definição de raiz n-ésima, observamos que o conjunto Cn das raı́zes n-ésimas da unidade é o conjunto de soluções da equação xn − 1 = 0. 22 1.4.1 CAPÍTULO 1. NÚMEROS COMPLEXOS Raı́zes quadradas em forma binômica Consideremos um número complexo w = a + bı. Podemos estar interessados em obter as raı́zes n-ésimas deste número na forma binômica; no caso onde n = 2, isto pode ser feito diretamente, ou seja, sem passar pela forma trigonométrica, essencial para extrair raı́zes pelo método descrito no parágrafo precedente. Um número complexo z = x + yı é raiz quadrada de w se e somente se a + bı = (x + yı)2 = x2 − y 2 + (2xy)ı. Isto é, igualando partes real e imaginária, se e somente se 2 x − y2 = a 2xy = b Suponhamos w 6= 0, pois o caso w = 0, como sabemos, fornece z = 0. Se b = 0 obtemos x = 0 ou y = 0, e a 6= 0; se a > 0, como x e y são reais, devemos ter y = 0, donde obtemos os pares (x, y) seguintes: √ √ ( a, 0), (− a, 0), isto é, as raı́zes quadradas reais de w = a: √ z = ± a. Analogamente, se a < 0 obteremos as raı́zes imaginárias puras de w = a: p ± |a|ı. Suponhamos agora que b 6= 0; em particular x 6= 0 e y 6= 0. Podemos substituir y = b/2x na equação de cima para obter x2 − b2 = a; 4y 2 multiplicando por 4x2 esta equação encontramos x4 − ax2 − b2 = 0, 1.5. TRANSFORMAÇÕES DO PLANO 23 que é uma equação biquadrada. Como o leitor certamente sabe, esta pode ser resolvida utilizando a fórmula de Baskara numa nova variável u := x2 , pois é uma equação quadrática em x2 ; mais precisamente, temos √ a ± a2 + b 2 2 . u=x = 2 √ Como b 6= 0 temos 0 ≤ a2 < a2 +b2 , donde |a| < a2 + b2 ; desta desigualdade concluı́mos que x2 é um dos dois valores √ √ a − a2 + b 2 a + a2 + b 2 > 0, < 0. 2 2 Como x deve ser real, só pode ser x2 = a+ √ a2 + b 2 ; 2 daqui obtemos dois valores x1 e x2 para x donde os valores de y correspondentes y1 = b/2x1 e y2 = b/2x2 . O leitor poderá obter fórmulas explı́citas para as duas raı́zes quadradas (uma simétrica da outra) x1 + y1 ı e x2 + y2 ı. De todas maneiras não é necessário termos tais fórmulas explı́citas, pois não é difı́cil de repetir o procedimento cada vez que precisemos calcular raı́zes quadradas desta forma. 1.5 Transformações do plano Denotemos R2 o plano real. Chamaremos de transformação do plano qualquer bijeção T : R2 → R2 que pode ser escrita como composição dos seguintes tipos de Transformações elementares que supomos conhecidas dos cursos de geometria elementar: 1. Translação; 2. Homotetia; 3. Rotação de ângulo θ e 4. Reflexão com relação a uma reta do plano. A representação geométrica dos números complexos nos permite pensar C como se fosse R2 do ponto de vista geométrico; de fato, para sermos rigorosos, C é exatamente R2 como conjunto, só que introduzimos operações que o fazem um objeto matemático diferente do plano usual; digamos que o “enriquecem” de certa forma, pois isto nos permite fazer outras coisas com os pontos do plano que não podı́amos fazer quando pensávamos neles apenas geometricamente. 24 CAPÍTULO 1. NÚMEROS COMPLEXOS De acordo com a interpretação que demos para a soma de complexos, uma translação nada mais é do que uma aplicação (isto é, função) T : C → C da forma T (z) = z + α, onde α ∈ C é um número complexo fixo dado e não nulo; diz-se que T é uma translação de vetor α. Da mesma forma, da interpretação que demos para o produto em termos do módulo e o argumento, se α = r(cos θ + ı sin θ), uma aplicação H : C → C da forma H(z) = αz transforma um número complexo do plano num outro número complexo cujo módulo fica multiplicado por r e cujo argumento fica acrescido de θ. Concluı́mos que a transformação H tem o efeito de uma homotetia de razão r combinada (ou seja, composta) com uma rotação de ângulo θ; no caso particular onde r = 1 teremos apenas uma rotação de ângulo θ e no caso onde θ = 0 e r 6= 1 uma homotetia de razão r. Finalmente, a transformação S : C → C definida por S(z) = z̄ é uma reflexão em relação ao eixo x; deixamos para o leitor refletir sobre como definir corretamente uma reflexão em relação a uma reta arbitrária: observe, por um lado, que uma reta paralela ao eixo x pode ser vista como uma translação de um vetor que é um complexo imaginário puro; por outro lado, que uma reta não paralela ao eixo x corta este num ponto e podeser vista como uma translação adequada combinada com uma rotação cujo ângulo é o ângulo entre as retas. Como veremos no próximo capı́tulo, para conseguirmos entender de forma adequada a resolução de equações polinomiais, seremos obrigados a compreender melhor os polinômios e a relação de seus coeficientes (o que corresponde aos dados num problema prático que queiramos resolver) com as suas raı́zes, que são nada mais nem menos que as soluções das equações correspondentes. Por outro lado, a “manipulação” com polinômios só é possı́vel operando com eles, ou seja, efetuando, à semelhança do que fazemos com os números, operações elementares; é então de se esperar que as propriedades do conjunto dos polinômios sejam o mero reflexo, em última instância, da forma com que operamos com eles, isto é, das propriedades que estes polinômios têm em relação às operações elementares. 1.6. ESTRUTURA SUBJACENTE DE C 1.6 25 Estrutura subjacente de C Os objetos nos quais nos interessamos, sejam estes números de algum dos tipos conhecidos, sejam estes polinômios (que será tratado minuciosamente no capı́tulo 2), possuem em comum alguns atributos. Primeiramente, aqueles de uma mesma natureza constituem um conjunto, digamos A, que vamos considerar, evidentemente, diferente do conjunto vazio. Segundo, existem “maneiras” de operar com os elementos do conjunto A que tem sido chaamadas de operações elementares; aparentemente há em todos os casos uma forma de somar “+” e uma forma de multiplicar “·”, e em alguns casos, uma forma de subtrair e outra de dividir. Aceitando a filosofia segundo a qual é através das propriedades destas operações que poderemos entender qualquer outra propriedade algébrica dos elementos de A, é então razoável pensar que muitos dos fenômenos que nos parecem própios, por exemplo dos números inteiros, sejam de fato fenômenos que podem ser observados em qualquer outro conjunto sobre o qual saibamos operar de forma similar que com números inteiros: por exemplo, não é dificil mostrar que x2 + 1 = (x + ı)(x − ı) é a melhor fatoração que podemos obter da expressão x2 + 1, pois a equação x2 + 1 = 0 tem ı e −ı como únicas soluções e evidentemente qualquer outra fatoração deveria ter uma ou outra das soluções. Então, se só permitirmos números reais nos nossos cálculos, a expressão (polinômio) x2 +1 não poderia se fatorar! Nós já encontramos este tipo de fenômeno no caso dos números inteiros: quando um número inteiro não pode ser fatorado de maneira não óbvia (isto é, salvo escrevendo o próprio número vezes 1), dizemos que ele é primo. No próximo capı́tulo veremos como muitas das noções sobre divisibilidade tais como a de número primo podem ser “estendidas” ao caso de polinômios. Vamos resumir muitas das propriedades dos números (e como veremos no próximo capı́tulo, também dos polinômios) na seguinte definição. Vamos chamar de operação 2 num conjunto A 6= ∅ a uma função de A × A em A. Definição 1.6.1. Seja A um conjunto não vazio e sejam + : A×A → A e · : A × A → A duas operações em A, que chamaremos de soma e multiplicação. 2 Diz-se também operação binária interna pelo fato de estar definida para pares de elementos do conjunto A e o resultado desta ser também um elemento de A. 26 CAPÍTULO 1. NÚMEROS COMPLEXOS Dizemos que (A, +, ·) é um Anel Commutativo com Unidade se se verificam as seguintes oito propriedades: S1 ) Associativa: a + (b + c) = (a + b) + c, ∀a, b, c ∈ A. S2 ) Commutativa: a + b = b + a, ∀a, b ∈ A. S3 ) Neutro: ∃e ∈ A tal que e + a = a + e = a, ∀a ∈ A; denotamos este elemento e = 0. S4 ) Simétrico: ∀a ∈ A, ∃ā ∈ A tal que a + ā = ā + a = 0. M1 ) Associativa: a · (b · c) = (a · b) · c, ∀a, b, c ∈ A. M2 ) Commutativa: a · b = b · a, ∀a, b ∈ A. M3 ) Neutro: ∃u ∈ A tal que u · a = a · u = a, ∀a ∈ A; denotamos este elemento u = 1. SM ) Distributiva: a · (b + c) = a · b + a · c, ∀a, b, c ∈ A. Se além disso também verifica-se D) Cancelamento: Se a·b = a·c e a 6= 0 então b = c, ∀a ∈ A−{0}, ∀b, c ∈ A, dizemos que o anel é um Domı́nio de Integridade. Exercı́cio 1.6.1. Convença-se do fato que todo sistema numérico é um domı́nio de integridade. Que pensa do conjunto dos polinômios ? A propriedade de simétrico nos permite subtrair: diremos que a − b é a + b̄. Na definição acima nada é dito sobre a divisão, que, à semelhança do que acontece com a subtração, dependerá da existência de um “simétrico” mas com respeito à multiplicação, que chamamos de inverso. Podemos então definir um novo tipo de estrutura algébrica sobre um conjunto que é mais rica, no sentido que possui mas atributos: é o conceito de Corpo. Definição 1.6.2. Seja K um conjunto não vazio e sejam + : · : K × K → K e · : K ×K → K duas operações em K. Dizemos que (K, +, ·) é um Corpo se for um anel commutativo com unidade e além disso verifica-se a propriedade seguinte: M4 ) Inverso: ∀a ∈ K − {0}, ∃â ∈ K tal que a · â = 1. Denotaremos o inverso de um elemento a ∈ K\{0} como â = a−1 . Num corpo podemos então dividir um elemento a por um elemento b 6= 0 fazendo a : b = a · b−1 ; 27 1.7. EXERCÍCIOS isto motiva a notação (também muito utilizada): 1 b−1 = . b Também escreveremos ab ao invez de a · b, desde que isto não induza a confusão. Exercı́cio 1.6.2. Mesma questão que no exercı́cio anterior mas substituı́ndo domı́nio de integridade por corpo. Exemplo 1.6.3. Vejamos que um corpo também possui a propriedade de cancelamento, isto é, que também é um domı́no de integridade. Com efeito, suponhamos que K é um corpo e que a, b, c ∈ K, com a 6= 0, tais que ab = ac. Basta multiplicar pelo inverso de a aos dois lados da equação. Exercı́cio 1.6.3. Mostre que a propriedade de cancelamente (D) é equivalente (ou seja, pode ser substituı́da por) a propriedade (D′ ) ab = 0 implica a = 0 ou b = 0, para todo a, b ∈ A. 1.7 Exercı́cios 1.7.1 Reduza √à forma a + bı cada √ uma das expressões seguintes: a) 3 − 2ı − ı[2 − ı( 3 + 4)]; b) (3 − 5ı)(−2 − 4ı); c) (3ı − 1)(ı/2 + 1/3); d) (2 + 3ı)2 . 1.7.2 Mostre que as seguintes igualdades são válidas: a) (x + ıy)2 = x2 − y 2 + 2ıxy; b) (1 + ı)3 = −2 + 2ı; c) 1 + ı5 + 2ı10 + 3ı13 = −1 + 4ı; 1.7.3 Idem que no exercı́cio 1.7.1 com as seguintes frações: 2 2 1 1+ı 3 − ı 4 − 3ı 1−ı 1+ı 1 ; ; ; −√ ; . ; 2 + 3ı 3 − 2ı −1 + 2ı −1 + ı 1−ı 2−ı 1+ı 28 CAPÍTULO 1. NÚMEROS COMPLEXOS 1.7.4 Represente graficamente os números z2 , z1 z2 e z1 /z √2 : √ complexos z1 ,√ a) z1 = 3 +√4ı, z2 = (1 − ı)/5 2; b) z1 = (1 + ı) 3/2, z2 = ( 3 + ı)/2; c) z1 = (1 + ı)/2√ 2, z2 = 1 + ı 3. 1.7.5 Calcule a parte real e imaginária dos seguintes números complexos: √ 2 2 (1 − ı 3) −ı(2 − 3ı) , . −2 + ı 1.7.6 Escreva os seguintes números complexos na forma polar e represente-os geométricamente: −2 + 2ı, 1 −3 + 3ı −4 √ , −1 − ı, √ ,√ . −1 − ı 3 1+ı 3 3−ı 1.7.7 Obtenha fórmulas para cos 3θ e sin 3θ em função de sin θ e cos θ. Idem para cos 4θ e sin 4θ. 1.7.8 Calcule as raı́zes dos seguintes números complexos e represente-as geométricamente: q √ √ 1/2 √ √ 1/4 √ √ 3 3 −4, (1 + ı 3) , ı, −ı, (−1 + ı 3) ; −1 − ı 3. Encontre todas as soluções da equação P (z) = 0 nos casos em que P (z) é um dos polinômios seguintes: z 6 − 64, z 3 − 1, 5z 3 + 8, z 2 − 2z + 2, 2z 2 + z + 1, z 2 + (1 − 2ı)z + (1 + 5ı), z 4 + 9. Capı́tulo 2 Equações de grau ≤ 4 2.1 Generalidades sobre equações polinomiais Uma equação polinomial é uma equação da forma an xn + an−1 xn−1 + · · · + a1 x + a0 = 0, (2.1) onde n é um número natural, an , an−1 , . . . , a1 , a0 ∈ C são chamados de coeficientes da equação e x é uma indeterminada ou variável. Diremos que a equação 2.1 é de grau n se an 6= 0. Uma solução desta equação é um número (em geral) complexo α que substituı́do no lugar do x satisfaz a igualdade, isto é, an αn + an−1 αn−1 + · · · + a1 α + a0 = 0. Consideremos a seguinte expressão polinomial f (x) = (x − α1 )(x − α2 ) · · · (x − αn ) onde αi é um número complexo para todo i = 1, . . . , n. É evidente que α1 , . . . , αn são soluções da equação polinomial f (x) = 0. Como veremos no próximo capı́tulo toda equação polinomial de grau n pode ser escrita na forma f (x) = 0 para certos números complexos α1 , . . . , αn ; em particular esses números são as únicas soluções dessa equação. 29 30 CAPÍTULO 2. EQUAÇÕES DE GRAU ≤ 4 Vamos analisar quais são os coeficientes da expressão f (x). Basta efetuar o produto dos fatores da forma (x − αi ) entre si. Comecemos observando que cada termo do produto obtido como resultado de multiplicação dos n fatores forma-se escolhendo um dos termos de cada fator e multiplicandoos entre si. Por exemplo quando escolhemos o termo x em cada binômio x − αi e os multiplicamos entre si obtemos xn pois temos n fatores; donde segue que o coeficiente an que acompanha xn deve ser 1. Analogamente, para obtermos o coeficiente que acompanha xn−1 devemos escolher n − 1 vezes a indeterminada x e apenas uma vez o número −αi . Como temos n possibilidades para escolher −αi (pois i = 1, . . . , n) obteremos n termos com xn−1 , a saber, os termos −αi xn−1 ; somando-os, concluı́mos que an−1 = −α1 − · · · − αn = − n X αi . i=1 Raciocinando de maneira análoga, teremos que an−2 é a soma dos produtos da forma (−αi )(−αj ) = αi αj para cada escolha de i e j. Um pouco de reflexão nos mostra que X an−2 = α1 α2 + · · · + α1 αn + α2 α3 + · · · αn−1 αn = αi αj . i<j n Ou seja que an−1 constitue-se somando os n = 1 valores de αi ; para formar n an−2 escolhemos todos os pares αi , αj possı́veis, tem 2 , multiplicamos-los e finalmente somamos estes produtos. Generalizando este raciocı́nio, obtemosa forma geral de um coeficiente ak arbitrário: constitui-se escolhendo as nk combinações possı́veis de k elementos do conjunto {α1 , . . . , αn }, multiplicando os k elementos de cada combinação e somando os nk resultados obtidos; observe que, em particular, o último coeficiente a0 será o produto de todos os números −αi , ou seja a0 = (−1)n α1 · · · αn . Podemos escrever o coeficiente que acompanha xk para k > 0 como X an−k = αi1 · · · αik , k = 1, . . . , n. i1 <...ik Estas igualdades chaman-se, relações entre coeficientes e raı́zes de uma equação. 2.1. GENERALIDADES SOBRE EQUAÇÕES POLINOMIAIS 31 Exercı́cio 2.1.1. a) Mostre estas relações diretamente no caso n = 1, n = 2 e n = 3. b) Demonstre o caso geral usando indução matemática em n. Uma das utilidades destas relações é a de construir equações com soluções prescritas. Por exemplo, se queremos construir uma equação cujas soluções sejam ı, −ı, 5, então pegamos n = 3 e α1 = ı, α2 = −ı e α3 = 5. Obtemos a3 = 1, a2 = 5, a1 = 1, a0 = 5. Para terminar este breve parágrafo de generalidades, dada uma equação polinomial como na equação (2.1), vamos descobrir uma mudança de variáveis (linear) da forma x = y + h para h ∈ C de forma que o termo de grau n − 1 (agora em y) não apareça, isto é, seu coeficiente seja nulo. Substituı́ndo x por y + h na equação (2.1) obtemos an (y + h)n + an−1 (y + h)n−1 + · · · + a1 (y + h) + a0 = 0. (2.2) Ao desenvolver as potências de cada binômio da forma (y + h)k é claro que obteremos uma expressão polinomial de grau k em y. Por outro lado, queremos escolher h para que o coeficiente em y n−1 da expressão (2.2) se anule. Basta então entender quais são as contribuições para tal coeficiente da parte an (y + h)n + an−1 (y + h)n−1 da expressão, pois os termos restantes terão grau menor do que n − 1 e portanto não contribuı́rão. Usando a fórmula do binômio de Newton (veja exercı́cio 2.4.20), ou diretamente a relação entre coeficientes e raı́zes obtida acima aplicada à expressão (y + h)(y + h) · · · (y + h) (uma vez com n fatores e outra com n − 1) concluı́mos que o coeficiente de an (y + h)n em y n−1 é nan h e aquele de an−1 (y + h)n−1 é an−1 . Portanto o termo de grau n − 1 de (2.2) é (nan h + an−1 )y n−1 . Deduzimos que h=− an−1 nan é o número procurado. Observemos que dada uma equação de grau n, digamos em x, podemos sempre fazer uma mudança de variaveis x = y + h de forma que a nova equação, agora em y, tenha termo de grau n − 1 nulo. Encontrar as soluções desta nova equação equivale a encontrar as soluções da antiga, pois dada uma CAPÍTULO 2. EQUAÇÕES DE GRAU ≤ 4 32 solução y = α da equação transformada, basta considerar α − h obteremos uma solução da equação original; reciprocamente, somando h às soluções da equação em x obtemos as soluções da equação em y. Para ver a utilidade deste procedimento o leitor pode fazer o exercı́cio seguinte: Exercı́cio 2.1.2. a) Aplicando a mudança de variaveis acima no caso n = 2 mostre que resolver uma equação geral de grau 2 reduz-se a resolver uma equação da forma y 2 + b = 0. b) Deduza uma outra forma de resolver a equação de grau 2 que não seja utilizando a fórmula de Baskara. 2.2 Equação de grau 3 No restante do capı́tulo seguiremos de perto o capı́tulo XIII de [2]. 2.2.1 Método e Hudde e Equações de Cardano Agora vamos utilizar os números complexos para resolver a equação geral de grau 3. É uma equação da forma Ay 3 + By 2 + Cy + D = 0, (2.3) onde A, B, C, D são números reais e A 6= 0; como estamos trabalhando num corpo, basta dividir por A, podemos supor que A = 1: com efeito, escrevemos B ′ := B ′ C D , C := , D′ := , A A A e obtemos uma equação da forma y 3 + B ′ y 2 + C ′ y + D′ = 0, cujas soluções são exatamente aquelas da equação (2.3). Como vimos no parágrafo precedente, fazendo a mudança de variaveis linear da forma y = x + h, onde h = −B ′ /3 obtemos uma equação em x da forma x3 + ax + b = 0; (2.4) dizemos que a equação cúbica está escrita na forma reduzida. 33 2.2. EQUAÇÃO DE GRAU 3 As soluções de (2.3) obtem-se a partir das soluções de (2.4) somando o valor de h achado. Vamos agora encontrar as soluçãoes da equação (2.4) utilizando um procedimento desenvolvido por Juan Hudde (1633-1704) e conhecido como Método de Hudde. Cabe salientar que foi Scipione Dal Ferro (1465-1526) quem resolveu pela primeira vez a equação de grau três mas não publicou seu trabalho. Outro Matemático, Nicolás de Brescia, conhecido sob o pseudônimo de Tartaglia (1499-1557) também resolveu esta equação e tampouco publicou a solução achada; sob promessa de não divulgá-lo Tartaglia comunicou seu descubimento a Girolamo Cardano (1501-1576), quem o publicou em 1545 como sendo seu, no seu compêndio titulado Ars Magna. Na equação de grau 2, as soluçãos são obtidas como soma de dois números, que dependem dos coeficientes, cuja natureza pode ser diversa (isto é, podem ser imaginários, mesmo que os coeficientes sejam reais) . É de esperar que no caso de grau 3 a situação seja bem mais complicada. De fato, vamos mostrar que toda solução pode ser escrita como soma de dois números complexos cujas partes real e imaginária dependem dos coeficientes da equação. Pocuremos então soluções da equação (2.4) escritas na forma x = u + v, onde u, v ∈ C. Um tal x será solução de (2.4) se e somente se (u + v)3 + a(u + v) + b = 0. Por outro lado, ao desenvolver (u + v)3 é facil observar que (u + v)3 − 3uv(u + v) − (u3 + v 3 ) = 0. Então, se encontrarmos u e v tais que a = −3uv, b = −(u3 + v 3 ), teremos achado uma solução. Elevando ao cubo a primeira igualdade, obtemos a3 − = u3 v 3 , 27 3 3 donde segue que u e v são as raı́zes da equação de grau dois seguinte: z 2 + bz − a3 = 0. 27 Esta equação chama-se a resolvente da equação 2.4. 34 CAPÍTULO 2. EQUAÇÕES DE GRAU ≤ 4 Concluı́mos que se z1 , z2 são as soluções da equação resolvente, basta escolher como u e v quaisquer raı́zes cúbicas ζ1 , ζ2 ∈ C de z1 e z2 , respectivamente, satisfazendo a seguinte relação: −3ζ1 ζ2 = a; (2.5) temos então uma solução x := ζ1 + ζ2 da equação cúbica reduzida (2.4). Observemos não obstante que este procedimento é sempre possı́vel mas requer um certo cuidado: com efeito, as soluções z1 e z2 da equação resolvente verificam a equação a3 − = z1 z2 27 e então −a/3 é uma das (em princı́pio) três raı́zes cúbicas do produto z1 z2 que, pelas propriedades de raı́zes complexas, devem ser necessariamente produto de raı́zes cúbicas de z1 com raı́zes cúbicas de z2 . Porém, observe-se que no caso onde z1 6= 0 e z2 6= 0 (isto é, quando a 6= 0) temos três raı́zes cúbicas para z1 e três para z2 o que nos dá nove produtos; em geral estaremos obrigados a escolher adequadamente as raı́zes cúbicas de z1 e z2 . Uma forma fácil de fazer isso é a seguinte: Quando a 6= 0 (se a = 0 a equação (2.4) resolve-se sem necessidade do método de Hudde), escolhemos u = ζ1 uma qualquer das raı́zes cúbicas de z1 e logo calculamos v = ζ2 a partir da equação (2.5): isto é, a v := − . 3u verifiquemos que u3 e v 3 são ainda soluções da equação resolvente; só precisamos verificar que u3 + v 3 = −b. Sabemos que (u3 )2 + b(u3 ) − a3 = 0; 27 como u3 6= 0 neste caso, dividindo ambos termos da igualdade acima obtemos u3 − a3 = −b, 27u3 donde segue a afirmação. Não é difı́cil de se convencer que x′ := ωu + ω 2 v e x′′ := ω 2 u + ωv 35 2.2. EQUAÇÃO DE GRAU 3 também são soluções de (2.4), onde ω é a raiz cúbica primitiva da unidade, isto é, √ 1 3 . ω := − + ı 2 2 Com efeito, se x′ = u′ + v ′ com u′ = ωu e v ′ = ω 2 v, temos (u′ )3 + (v ′ )3 = u3 + v 3 , u′ v ′ = uv; analogamente para x′′ . Resumindo, as três soluções da equação (2.4) estão dadas pelas seguintes equações conhecidas como Equaçãoes de Cardano: x1 = u + v x2 = ωu + ω 2 v x3 = ω 2 u + ωv. Ou equivalentemente x1 = u + v, √ x2 = − u+v + ı√3 u−v 2 2 u−v 3 x3 = − u+v − ı . 2 2 Observe que se u 6= v, estas soluções são efetivamente diferentes, tendo então atingido o número máximo de raı́zes diferentes para uma equação de gau 3, e que se u = v, como ω 2 + ω = −1, obtemos as soluções 2u e −u, sendo esta última dupla. Vejamos alguns exemplos. Exemplos 2.2.1. Consideremos as seguintes equações cúbicas na forma reduzida: a) x3 − 6x − 9 = 0, b) x3 − 12x − 16 = 0, c) x3 − 15x − 4 = 0. No caso (a) a resolvente é z 2 − 9z + 8 = 0, cujas soluções são z1 = 8, z2 = 1. Escolhemos u = 2, a raiz cúbica real de 8. Da equação de compatibilidade uv = 2 obtemos v = 1 que é a raiz cúbica CAPÍTULO 2. EQUAÇÕES DE GRAU ≤ 4 36 real de 1. Observemos que dado que as outras raı́zes cúbicas de 8 e de 1 são imaginárias, podemos concluir de forma direta que v = 1 é a única raiz cúbica de z1 = 1 que pode satisfazer a equação de compatibilidade. Das equações de Cardano, obtemos as três soluções da equação cúbica: √ √ 3 3 3 3 , x3 = − − ı . x1 = 3, x2 = − + ı 2 2 2 2 No caso (b) a resolvente é z 2 − 16z + 64 = 0, cujas soluções são z1 = z2 = 8. Então podemos escolher u = v = 2 donde obtemos x1 = 4, x2 = x3 = −2. Finalmente, no caso (c) a resolvente é z 2 − 4z + 125 = 0, donde z1 = 2 + 11ı, z2 = 2 − 11ı. Observemos que (2 + ı)3 = 2 + 11ı, o que mostra que podemos escolher u = 2 + ı; da equação de compatibilidade obtemos v= 15 = 2 − ı. 3(2 + ı) As soluções obtidas são: x1 = 4, x2 = −2 − 2.2.2 √ 2, x3 = −2 + √ 3. Discussão da equação cúbica Consideremos a equação cúbica na sua forma reduzida x3 + ax + b = 0, com a, b ∈ R. Vamos tentar responder às perguntas seguintes: 37 2.2. EQUAÇÃO DE GRAU 3 Existem raı́zes múltiplas ? Existem soluções reais ? E em caso afirmativo: Quantas ? Para começar, consideremos alguns casos especiais: Se b = 0, as soluções da equação são √ x = 0, x = ± −a; ou seja que existe sempre a raiz real x = 0 e só haverá outras raı́zes reais quando a for negativo. Se a = 0, as soluções estão dadas pelas raı́zes cúbicas de −b; então sempre existe raiz real e, quando b 6= 0 mais duas raı́zes imaginárias. Consideremos agora o caso geral, isto é, quando a 6= 0 e b 6= 0. Para valors de x diferentes de zero, podemos escrever a equação cúbica na forma b x2 + a = − . x De maneira análoga a como vimos no capı́tulo de introdução, as raı́zes reais correspondem aos valores da abscissa dos pontos de interseção dos gráficos das funções reais b y = x2 + a, y = − . x Existem três situações possı́veis para valores de b negativos e três para valores de b positivos. Por exemplo, suponhamos b < 0. Se a é suficientemente negativo, é claro que os gráficos se interceptarão em três pontos cujas abscissas são diferentes, fornecendo três soluções reais e distintas da equação cúbica. Se, pelo contrário, o valor de a for positivo e suficientemente grande, então existirá uma única interseção obtendo desta forma uma única solução real. Finalmente, se imaginarmos o valor de a percorrendo todos os valores reais possı́veis, podemos antecipar que haverá um único valor de a onde a equação deixa de ter três soluçoes reais e não tem ainda uma única solução real; para este valor preciso de a os gráficos se cortam transversalmente num ponto, isto é, possuem retas tangentes distintas neste ponto (na figura, isto acontece no primeiro quadrante) e possuem a mesma reta tangente num outro ponto. Isto fornece duas únicas raı́zes reais. Porém, a raı́z obtida a partir do ponto onde ambos gráficos são tangentes, parece ser de natureza diferente da outra: com efeito, suponhamos que a0 é o valor de a para o qual o gráficos tem um ponto cujas retas tangentes coincidem. Se considerarmos as instâncias onde a < a0 , então estaremos na primeira situação, onde o ponto CAPÍTULO 2. EQUAÇÕES DE GRAU ≤ 4 38 Figura de tangência bifurca em dois pontos distintos onde há transversalidade (não mais tangência). Então, podemos entender este ponto como a posição limite de dois pontos diferentes; em linguagem moderna um tal ponto de interseção dos gráficos chama-se um ponto duplo ou ponto de multiplicidade dois. Nesta situação, teremos então uma solução da nossa equação cúbica que conta duas vezes, o que chamaremos uma solução dupla 1 Em particular concluı́mos que para toda equação cúbica, existe pelo menos uma solução ou raı́z real. Vamos agora obter um critério análogo ao que conhecemos para a equação quadrática, onde basta conhecer o sinal de um certo número, chamado discriminante, para decidir sobre a qualidade e quantidade de raı́zes. Analisando o Método de Hudde, não é dificil de se convencer que uma equação cúbica possuirá certamente soluções duplas se esse for o caso da equação resolvente associada. Por outro lado, a equação resolvente possui soluções duplas se e somente se 4a3 + 27b2 = 0, pois um cálculo fácil mostra que o discriminante da equação resolvente é precisamente 4a3 27b2 + 4a3 b2 + = . 27 27 Isto sugere que este número esteja relacionado com a existência e natureza das soluções de forma análoga ao que acontece com a equação quadrática, o que motiva a seguinte definição. Definição 2.2.2. Chamamos discriminante da equação cúbica reduzida (1.2) o número real D := −(4a3 + 27b2 ). O sinal na frente é por razões históricas; como veremos a continuação desta forma obteremos um resultado análogo ao da equação quadrática, onde a presença de soluções imaginárias corresponde ao caso onde D < 0. 1 Aqui não fomos suficientemente rigorosos, pois formalisar adequadamente esta situação não é completamente trivial. Mas o leitor pode considerar uma situação análoga com a equação quadrática x2 + bx + c = 0 e observar que quando b2 se aproxima de 4ac as duas soluções tendem a uma só, o que ocorre unicamente quando b2 = 4ac. 39 2.2. EQUAÇÃO DE GRAU 3 Mantemos todas as notações introduzidas no métoto de Hudde acima. Distinguimos três casos: (i) Caso onde D < 0. Neste caso as raı́zes z1 e z2 da equação resolvente são reais. Se u é a raiz cúbica real de z1 , da relação de “compatibilidade” a uv = − , 3 teremos que v também é a raiz cúbica real de z2 . Como u 6= v, a equação cúbica reduzida de coeficientes reais terá uma raiz real e duas imaginárias conjugadas que, segundo as equações de Cardano são: x1 = u + v, real√ x2 = − u+v + ı√3 u−v 2 2 u−v 3 − ı . x3 = − u+v 2 2 (ii) Caso onde D = 0. Neste caso z1 = z2 = −b/2. A equação reduzida possui tr es raı́zes, uma simples e uma dupla: p simples x1 = 2 3 −b/2, p 3 x2 = x3 = −b/2. (iii) Caso onde D > 0. Agora z1 e z2 são imaginárias; mais precisamente, como o leitor pode verificar logo de um cálculo fácil,temos: r r −b D D −b +ı , − −ı . z1 = − 2 108 2 108 Escrevamos u = α + ıβ uma das raı́zes cúbicas de z1 ; como já observamos anteriormente, uma das raı́zes cúbicas de z2 deve ser conjugada desta, pois z1 e z2 o são. Tomamos v = α − ıβ. O produto uv = α2 + β 2 satisfaz a equação de compatibilidade. Aplicando as fórmulas de cardano, como o leitor poderá verificar sem maiores problemas, obtemos x1 = 2α √ x2 = −α + β √3 x3 = −α − β 3. Podemos então resumir o estudo qualitativo da equação cúbica na sua forma reduzida no teorema seguinte. CAPÍTULO 2. EQUAÇÕES DE GRAU ≤ 4 40 Teorema 2.2.3. Consideremos a equação cúbica x3 + ax + b = 0; (2.6) denotemos D seu discriminante. Temos as seguintes afirmações. a) Si D = 0, então (2.6) possui raiz dupla, sendo todas as soluções reais; b) Si D > 0, então (2.6) possui trêss soluções reais e distintas; c) Si D < 0, então (2.6) possui duas soluções imaginárias conjugadas e uma solução real. Exemplo 2.2.4. Retomamos o exemplo 2.2.1. Um cálculo fácil mostra que o discriminante D é negativo no caso (a), zero no caso (b) e positivo no caso (c), em concordância com a natureza das soluções encontradas. Exemplo 2.2.5. Consideremos a equação cúbica x3 + x + b = 0, b ∈ R. Analisemos quando é que esta equação possui uma única raiz real em função do parâmetro b. Basta encontrar b para que −D = 27b + 4 seja zero (observe que a = 1 nesta equação). Concluı́mos que b = −4/27. 2.3 Equação de grau 4 Neste parágrafo vamos resolver a equação geral de grau 4, ou Equação Quártica. Uma equação quártica é uma equação da forma Ay 4 + By 3 + Cy 2 + Dy + E = 0, com A 6= 0; embora o método que utilizaremos independe da natureza dos coeficientes A, B, C, D, E, como no caso de grau 3, estaremos interessados apenas no caso de coeficientes reais, isto é, suporemos A, B, C, D, E ∈ R. Começamos escrevendo nossa equação na forma y4 + B 3 C 2 D E y + y + y+ =0 A A A A 41 2.3. EQUAÇÃO DE GRAU 4 Mediante a mudança de variáveis y =x+ B , 4A encontramos a equação equivalente cujo coeficiente cúbico é nulo; ou seja, uma equação da forma x4 + px2 + qx + r = 0, (2.7) com p, q, r ∈ R. Antes de passar à resolução propriamente dita, obteremos a relação entre coeficientes e raı́zes de uma equação polinômial de grau 3, o que é um caso particular de uma relação geral que desenvolveremos no capı́tulo 2 (ver....); cabe lembrar que o caso de grau 2, que é bem conhecido, foi utilizado para introduzir a equação resolvente da equação cúbica reduzida. De fato, no intuito de generalizar a construção do método de Hudde, precisamos conhecer apenas como construir os coeficientes de uma equação de grau 3 que possua como raı́zes três números predeterminados; no caso de grau 2, o fato correspondente é que α, β são raı́zes da equação z 2 − s1 z + s2 = 0, onde s1 = α + β e s2 = αβ. Sejam α, β, γ ∈ C. Um cálculo direto mostra que (t − α)(t − β)(t − γ) = t3 − s1 x2 + s2 x − s3 , onde s1 = α + β + γ, s2 = αβ + βγ + αγ, s3 = αβγ. Vê-se então que α, β, γ são raı́zes da equação t3 − s1 t2 + s2 t − s3 = 0. 2.3.1 Método de Euler O método desenvolvido por Leonard Euler (1707-1783) é uma generalização mais ou menos imediata do método de Hudde, com a complicação subjacente do aumento de grau. Cabe salientar, não obstante, que foi Ludovico Ferrari (1522-1565), aluno de Cardano, quem resolveu a equação quártica 42 CAPÍTULO 2. EQUAÇÕES DE GRAU ≤ 4 na forma reduzida; Cardano também publicou o trabalho de Ferrari no seu Ars Magna, desta vez com a devida autoria (Veja [2, pág. 422] para mais resenhas históricas). Começamos testando uma solução hipotética da equação quártica reduzida (2.7) da forma x = u + v + w, (2.8) com u, v, w ∈ C. Elevando ao quadrado (2.8)obtemos x2 − (u2 + v 2 + w2 ) = 2(uv + uw + vw); elevando mais uma vez ao quadrado e tendo em conta (2.8)obtemos x4 − 2(u2 + v 2 + w2 )x2 − 8uvwx + (u2 + v 2 + w2 )2 − 4(u2 v 2 + u2 w2 + v 2 w2 ) = 0. Comparando esta última equação com (2.7), concluı́mos que basta determinar u, v, w de forma que sejam satisfeitas as seguintes condições: −2(u2 + v 2 + w2 ) = p −8uvw = q (2.9) 2 (u + v 2 + w2 ) − 4(u2 v 2 + u2 w2 + v 2 w2 ) = r, pois u + v + w verifica a equação (2.7). Finalmente, elevando ao quadrado a segunda das equações (2.9) e substituı́ndo a primeira na terceira, obtemos 2 p 2 2 u + v + w2 = − 2 q u2 v 2 w2 = 64 2 2 p2 u v + u2 w2 + v 2 w2 = 16 − 4r . Portanto, para x = u+v+w ser solução de (2.7), devemos necessariamente ter que u2 , v 2 , w2 são raı́zes da equação cúbica 2 r q2 p p 2 3 − = 0. (2.10) t− t + t + 2 16 4 64 A equação (2.10) é a Resolvente da Equação Quártica Reduzida. De maneira análoga a como fizemos no método de Hudde, se t1 , t2 , t3 são as raı́zes de (2.10), escolhemos u, v, w de forma que q (i) u2 = t1 , v 2 = t2 , w2 = t3 , e (ii) uvw = − . 8 2.3. EQUAÇÃO DE GRAU 4 43 Mais precisamente, de (i) obtemos √ √ √ u = ± t1 , v = ± t2 , w = ± t3 , donde temos oito possibilidades para u + v + w. Utilizando (ii), eliminaremos quatro destas; na prática, escolhemos os quatro pares de valores de, por exemplo, u e v, segundo (i), e de (ii) obtemos os correspondentes valors de w. Embora o discriminante também possa ser definido para a equação quártica não é possı́vel fazer uma discussão sobre a natureza das raı́zes (no caso de p, q, r ∈ R, que embora não seja necessário para a aplicação do método de Euler, estamos supondo desde o inı́cio) de maneira taõ contundente como no caso de grau 3. Não obstante, temos uma descrição bastante precisa em termos da natureza da equação resolvente, cuja demonstração fica a cargo do leitor: (i) Se (2.10) possui três raı́zes positivas, então (2.7) possui quatro raı́zes reais. (ii) Se (2.10) possui uma raiz positiva e duas negativas distintas, então (2.7) possui quatro raı́zes imaginárias conjugadas duas a duas. (iii) Se (2.10) possui uma raiz positiva e uma negativa doble, então (2.7) possui uma raiz doble real y duas imaginárias conjugadas. (iv) Se (2.10) possui uma raiz positiva e duas complexas conjugadas, então (2.7) possui duas raı́zes reais diferentes y duas imaginárias conjugadas. Observação 2.3.1. No caso onde q = 0, a equação (2.7) é biquadrada e podemos resolve-la de maneira elementar. Se r = 0 então x = 0 é solução e basta então resolver uma equação de grau 3. Por outro lado, o caso geral requere, na maior parte das situações, de calculos intrincados, pois geralmente a equação resolvente não estará na forma reduzida; porém, quando p = 0, estaremos lidando com um caso suficientemente geral como para estarmos obrigados a usar o método de Euler, mas com uma significativa simplificação, pois a resolvente estará na forma reduzida: daremos exemplos só nesta situação. Exemplos 2.3.2. ...exemplos onde a resolvente seja uma das dos exemplos anteriores.... CAPÍTULO 2. EQUAÇÕES DE GRAU ≤ 4 44 2.4 Exercı́cios 2.4.1 Resolva as equações cúbicas seguintes: a) x3 +9x−6 = 0; b) x3 −18x−30 = 0; c) x3 + 18x + 50 = 0; d) x3 − 2x + 1 = 0; e) y 3 − 9y 2 − 9y − 15 = 0; f) y 3 − 3y 2 + 12y + 16 = 0. 2.4.2 Faça a discussão das equações cúbicas do exercı́cio 2.4.1. 2.4.3 Encontre a para que a equação x3 + ax + 1 = 0 possua soluções múltiplas. 2.4.4 Sejam t, s ∈ R números reais não nulos. Considere a equação cúbica x3 + t2 x + s3 = 0. Determine todos os valores de t e s que fazem com que a equação acima tenha raı́zes múltiplas. 2.4.5 Mostre que a equação x3 − ax + 2 = 0 possui três raı́zes reais se e somente se a ≥ 3. 2.4.6 Escreva as seguintes equaçãoes quárticas na forma reduzida e monte a resolvente correspondente a cada uma delas: a) x4 + x3 − 3x2 + 6x − 2 = 0; b) y 4 + 2y 3 − y 2 + 2y − 1 = 0. 2.4.7 Escreva as equações quárticas na forma reduzida cuja resolvente é cada uma das três primeiras equações cúbicas do exercı́cio 2.4.1. 2.4. EXERCÍCIOS 45 2.4.8 Determine as soluções das seguintes equaçãoes quárticas: a) x4 − 3x2 + 6x − 2 = 0; b) y 4 − y 2 + 2y − 1 = 0. 2.4.9 Encontre o quociente e o resto de dividir a(x) por b(x) onde o par (a(x), b(x)) é um dos seguintes: 3 3 a) (3x4 −x2 −2, x2 −1); b) (ıx3 +(4−2ı)x+1, x2 +1); c) (x5 +3x √ , x +x+1); n 4 6 d) (x − 1, x − 1), n ∈ N; e) (x + 1, x + ı); f)(x − 1, x − 1 − ı 3). 2.4.10 Mostre que para todo inteiro n ≥ 1 vale a seguinte igualdade: y n+1 − z n+1 = (y − z)(y n + y n−1 z + y n−2 z 2 + · · · + yz n−1 + z n ) (sugestão: divida por z n+1 e introduza a nova variável x := y/z). 2.4.11 Para os polinômios abaixo analise a irredutibilidade e encontre os divisores correspondentes em R[x] e C[x] respectivamente, quando isto fizer sentido: a) 3x4 − x2 − 2; b) x2 + x + 1; c) x4 + x; d) x2 − ıx + 1; e) x3 − 6x − 9. 2.4.12 Considere o polinômio f (x) = 2x4 − 4x3 + 4x − 2. Sabendo que f (1) = f (−1) = 0, encontre todos os divisores mônicos de f (x) em R[x]. 2.4.13 Idem que no exercı́cio 2.4.12, mas em R[x] e também em C[x], para com o polinômio g(x) = x4 + x3 − x − 1 sabendo que √ ! √ ! 3 3 −1 −1 +ı −ı =g = 0. g 2 2 2 2 46 CAPÍTULO 2. EQUAÇÕES DE GRAU ≤ 4 2.4.14 Encontre um polinômio de grau 5, a coeficientes reais, que possua as raı́zes 0, ı e 1 − ı. Quantos polinômios existem com esta propriedade ? 2.4.15 Sem fazer a divisão, mostre que o polinômio f (x) := x3 + 6x2 + 11x + 6 é divisı́vel por x + 1, x + 2 e x + 3; deduza que f (x) é um produto de três polinômios lineares. 2.4.16 Dê exemplos de: a) polinômio irredutı́vel em R[x] de grau 2; b) polinômios irredutı́veis em Q[x] de graus 2 e 3 que sejam redutı́veis em R[x]. 2.4.17 Encontre o polinômio b(x) de grau 3 que satisfaz às condições seguintes: b(0) = 0, b(1) = 0, b(−1) = 1, b(2) = −1. 2.4.18 Considere um polinômio mônico de grau n ≥ 1. Mostre que o termo independente é (−1)n vezes o produto das suas raı́zes e que o termo de grau n − 1 é o oposto da soma destas. Pode dizer alguma coisa sobre os outros termos ? 2.4.19 Pn k Seja f (x) = k=0 ak x ∈ C[x] um polinômio mônico de grau n tal que f (0) = 1; notemos α1 , . . . , αn ∈ C suas raı́zes. Mostre que −a1 = (sugestão: utilize o exercı́cio 2.4.18). n X 1 αi i=1 2.4. EXERCÍCIOS 47 2.4.20 Utilizando a relação entre coeficientes e raı́zes de um polinômio, demonstre a fórmula n X n n−i i n x a, (x + a) = i i=0 n onde i indica o número de combinações de n elementos tomados de i em i, isto é n! n = , i (n − i)! i! cenhecida como fórmula do Binômio de Newton. 48 CAPÍTULO 2. EQUAÇÕES DE GRAU ≤ 4 Capı́tulo 3 Polinômios 3.1 Introdução Neste capı́tulo estudaremos de maneira mais abstrata as expressões que definem nossas equações algébricas. Mais precisamente analisaremos o vı́nculo existente entre a natureza dos coeficientes encontrados numa tal expressão e a natureza da expressão em si; afim de esclarecer, vejamos um exemplo. 2 Exemplo 3.1.1. Consideremos a equação x√ − 3 = 0; como sabemos é possı́vel √ √ escrever x2 −3 = (x− 3)(x− 3), onde ± 3 são as soluções da equacão. Observemos, por um lado, que os coeficientes envolvidos na equação de grau dois sao números racionais enquanto as soluções desta são irracionais; por outro lado, a existência das soluções nos permitiu fatorar a expressão quadrática como produto de duas expressões lineares cujos coeficientes deixam de ser racionais. Não é dificil de se convencer que a equação quadrática original, não pode ser fatorada como produto de duas expressões lineares com coeficientes racionais (tente demonstrar isto). 3.2 O Anel de polinômios Seja D um domı́nio de integridade (veja definição 1.6.1). Definição 3.2.1. Um polinômio com coeficientes em D é uma expressão da forma f (x) = a0 + a1 x + · · · + an−1 xn−1 + an xn , 49 50 CAPÍTULO 3. POLINÔMIOS onde n é um inteiro não negativo e a0 , a1 , · · · , an−1 , an ∈ D; ai chama-se o coeficiente i-ésimo de f (x), i = 0, . . . , n. Se an 6= 0 dizemos que an é o coeficiente lı́der e que o inteiro n é o grau de f (x). Dois polinômios n X f (x) = k ak x , g(x) = m X bj xj j=0 k=0 são iguais se para todo inteiro não negativo i tal que ai 6= 0 ou bi 6= 0, temos ai = b i ; desta forma o polinômio f (x) é igual, por exemplo, ao polinômio n X ak xk + 0xn+1 . k=0 Definimos o Polinômio Nulo que denotaremos 0(x) ou, quando não houver motivo para ambigüidade, simplesmente 0 como sendo qualquer um dos polinômios iguais cujos coeficientes são todos nulos; de maneira equivalente, o polinômio nulo é qualquer polinômio que não possui coeficiente lı́der. De maneira análoga, o Polinômio Unidade ou Polinômio Um é o polinômio de grau 0 cujo coeficiente lı́der é a0 = 1. Denotaremos D[x] o conjunto de todos os polinômios com coeficientes em D, isto é n X D[x] := { ak xk : n ≥ 0, a0 , . . . , an ∈ D}. k=0 Por outro lado, os polinômios de grau 0 são aqueles cujo coeficiente lı́der acompanha à potência x0 de x, isto é, aqueles polinômios que não possuem indeterminada. Segundo nossa noção de igualdade acima, podemos considerar estes polinômios como sendo iguais a um único elemento do domı́nio D; desta maneira, podemos considerar o domı́nio D como estando contido no conjunto dos polinômios com coeficientes em D; simbolicamente, podemos então escrever D ⊂ D[x]; 3.2. O ANEL DE POLINÔMIOS 51 em particular estamos identificando o zero e a unidade de D com o polinômio nulo e o polinômio unidade respectivamente. Aos efeitos do objetivo destas notas, podemos supor que o domı́nio D é um dos seguintes: Z, Q, R, C; não obstante, e a tı́tulo informativo (e porque não, formativo), vamos ver alguns exemplos de polinômios com coeficientes em outros domı́nios e também com coeficientes em um anel comutativo com unidade (veja definição 1.6.1) que não é um domı́nio. Comecemos lembrando os conjuntos de inteiros módulo um inteiro positivo. Formalmente, é o conjunto de classes de equivalência em Z associado à relação de equivalência ser côngruo a. Mais precisamente, seja r ∈ N um inteiro positivo; dados m, n ∈ Z, dizemos que m é côngruo a n (ou que m e n são côngruos) módulo r, o que denotamos m ≡ n (mod r) , se m − n é múltiplo de r. Pela teoria da divisibilidade de números inteiros, é claro que dado um inteiro m arbitrário ele pode ser côngruo a apenas um dos r inteiros 0, 1, . . . , r − 1. Denotamos por i o conjunto de todos os inteiros côngruos a i ∈ {0, 1, . . . , r − 1}; podemos imaginar que aqueles inteiros que são côngruos a um mesmo inteiro i possuem uma mesma cor, tendo cores diferentes aqueles não côngruos a ele; desta forma existirão r cores diferentes de inteiros, onde cada cor corresponde a uma única classe. Denotamos Zr := {0, 1, . . . , r − 1}, o conjunto de classes de congruência módulo r (ou cores diferentes). Usando as propriedades da divisibilidade (como apreendidas nos cursos elementares de aritmética) vê-se sem dificuldade que Zr é um anel comutativo com unidade. Além disso, Zr é um domı́nio se e somente se n é um número primo, pois āb̄ = 0̄ se e somente se r divide ab: se r for primo, então n divide a ou b; reciprocamente, se r não for primo então ele é produto de dois inteiros positivos a, b ≤ n − 1. Observação 3.2.2. De fato Zr é um corpo se e somente se r é um número primo. Com efeito, é suficiente mostrar que todo elemento diferente de 0̄ 52 CAPÍTULO 3. POLINÔMIOS possui inverso se e só se p é um número primo; se a ∈ Z não é divisı́vel por p então mdc(p, a) = 1. Portanto existem m, n ∈ Z tais que am + pn = 1. Então am ≡ 1 ( mod p) o que significa que m̄ é inverso de ā em Zr . Deixamos como exercı́cio para o leitor a verificar que a recı́proca desta afirmação também é verdadeira. Exemplo 3.2.3. Consideremos Z6 . Temos que 2̄ · 3̄ = 6̄ = 0̄ em Z6 . Como 2̄ 6= 0̄ e 3̄ 6= 0̄ concluı́mos que Z6 não é um domı́nio de integridade. Vamos agora observar como as operações elementares em D “induzem” operações elementares P em D[x] compatı́veis P comj a inclusão D ⊂ D[x]. Sejam f (x) = ni=0 ai xi e g(x) = m j=0 bj x polinômios em D[x]. Sem perda da generalidade suporemos n ≥ m. Podemos então escrever g(x) = n X bj xj j=0 onde bm+1 = bm+2 = · · · = bn = 0. Soma: A soma f (x) + g(x) de f (x) e g(x) é a expressão f (x) + g(x) := n X (ak + bk )xk . k=0 Como ak + bk = bk + ak ∈ D concluı́mos por ou lado que f (x) + g(x) ∈ D[x] e por outro lado que f (x)+g(x) = g(x)+f (x), isto é, que a soma é comutativa; o leitor podera verificar sem dificuldade que também é associativa. É fácil verificar que o polinômio nulo 0(x) é o neutro da soma (faça-o !). P Denotamos −f (x) := ni=0 (−ai )xi onde −ai é o simétrico do elemento ai . Temos então f (x) + (−f (x) = 0(x) donde concluı́mos que −f (x) é o simétrico de f (x). Multiplicação O produto f (x) · g(x) de f (x) e g(x) é a expressão f (x) · g(x) := n+m X c k xk , k=0 onde ck := X i+j=k ai bj = (a0 bk + a1 bk−1 + · · · + ak b0 ), k = 0, . . . , n + m. 3.3. TEORIA DA DIVISIBILIDADE EM D[X] 53 Evidentemente f (x) · g(x) = g(x) · f (x) ∈ D[x]. O leitor pode verificar que este produto ou multiplicação de polinômios é uma operação associativa. Quando não houver lugar para confusão denotaremos f (x) · g(x) = f (x)g(x). Da definição de produto concluı́mos que se f (x) e g(x) não são nulos, ou seja an 6= 0 e bm 6= 0. Como D é um domı́nio de integridade an bm = cn+m 6= 0 o que implica que f (x)g(x) 6= 0 (propriedade (D) de domı́nio de integridade (1.6.1)). Então grau(f (x)g(x)) = grau f (x) + grau g(x) = n + m. Como já vimos no caso de domı́nios de integridade, a propriedade (D) equivale a dizer que f (x)g(x) = 0 implica f (x) = 0 ou g(x) = 0. O polinômio unidade 1(x) é o neutro da multiplicação (demonstre isto !). Analisemos agora a existência de inverso para a multiplicação. Suponhamos que f (x) não é o polinômio nulo, isto é, an 6= 0. Suponhamos também que f (x)g(x) = 1(x). Então f (x)g(x) tem grau 0, donde colcluı́mos que f (x) e g(x) tem graus 0. Portanto a0 6= 0, b0 6= 0 e a0 = b0 = 1 e então os únicos polinômios que possuem inverso são os polinômios constantes, onde as constantes correspondentes são invertı́veis em D; dito de outra forma, o conjunto de poinômios invertı́veis em D[x] é o conjunto de elementos invertı́veis de D. O seguinte teorema resume as propriedades estruturais de D[x] relativas às operações de soma e multiplicação, cuja demonstração deixamos para o leitor. Teorema 3.2.4. A tripla (D[x], +, ·) é um domı́nio de integridade cujos invertı́veis são os invertı́veis de D. 3.3 Teoria da Divisibilidade em D[x] Dado que D[x] não é um corpo, sabemos que não teremos uma divisão exata em D[x], da mesma forma que ocorre com Z. Gostariamos então de ter um argorı́tmo da divisão “não exata” análogo ao que temos no domı́nio Z de forma a poder dividir um polinômio por outro obtendo um quociente e um resto. Mais precisamente, consideremos polinômios f (x), g(x) ∈ D[x]; nos perguntamos se existem polinômios q(x) e r(x), também em D[x], tais que (i) f (x) = g(x)q(x) + r(x) onde r(x) é “menor” que g(x) em algum sentido que não é muito claro pois até o momento não temos definido uma relação de ordem no conjunto D[x] dos polinômios. 54 CAPÍTULO 3. POLINÔMIOS De acordo com as propriedades das potências, quando pegarmos f (x) = x e g(x) = xm , nosso método deverı́a fornecer um quociente q(x) = xn−m e um resto r(x) = 0 (o polinômio nulo); como xn−m é um polinômio só no caso onde n ≥ m, deveriamos pedir grau(f ) ≥ grau(g). Como inspiração, lembremos a divisão não exata de números inteiros escritos na base dez. Sejam n a = an 10n + an−1 10n−1 + · · · + a1 10 + a0 , com 0 ≤ an , an−1 , . . . , a1 , a0 ≤ 9 inteiros, e b > 0 um inteiro ≤ a. O algorı́tmo da divisão que apreendemos na escola é mais ou menos assim: calculamos o número de vezes que b “cabe” dentro de an 10n (an é o número de unidades quando n = 0, de dezenas quando n = 1, de centenas quando n = 2, etc) digamos q1 , que seria um quociente parcial, e subtraı́mos bq1 de a obtendo um resto parcial r1 ; se r1 é zero, a divisão acabou e dizemos que b divide a. Se r1 6= 0, nos perguntamos se r1 é ≥ b; caso negativo, a divisão acabou e escrevemos q = q1 e r = r1 . Caso afirmativo, o procedimento se repete subtraı́ndo de r1 o número máximo q2 de vezes que b cabe em r1 ; obtemos a − bq1 − bq2 = r2 , com r2 < r1 e q2 < q1 . E recomeçamos até obter um resto parcial que seja 0 ou menor que b. Como os restos parciais diminuem a cada passo, estamos certos que o procedimento deve para. O último resto parcial e a soma dos quocientes parciais são, respectivamente, o resto e o quociente da divisão. Exercı́cio 3.3.1. Faça a divisão de 1235 = 103 + 2 · 102 + 3 · 10 + 5 por 4 do jeito descrito acima. Voltando aos polinômios, para generalizar o procedimento descrito acima ao caso destes, podemos tratar as potências de x como as potências de 10 para os números; em particular isto nos sugere que o “tamanho”, que seria a magnitude a fazer decrescer no processo de divisão do polinômio, será entendido como sendo o grau deste. Além disto, o número de vezes que b cabe em an 10n deve ser substituı́do pelo número de vezes que o termo de maior grau de g(x) cabe dentro do termo de maior grau de f (x) e assim por diante; em particular, no caso dos polinômios, um quociente parcial, deverá forçosamente ter grau menor ou igual que o grau de f (x) e cada quociente parcial terá grau menor que o anterior. 3.3. TEORIA DA DIVISIBILIDADE EM D[X] 55 Guiados pela disgressão precedente, estamos prontos agora para construir um algorı́tmo da divisão de polinômios de forma coerente com o que já sabemos. Escrevamos f (x) = an xn + fˆ(x), g(x) = bm xm + ĝ(x), onde n ≥ m e fˆ(x), ĝ(x) são polinômios de graus menores que n e m respectivamente. Como xn−m ∈ D[x], podemos escrever q1 (x) = an n−m x , r1 (x) = f (x) − g(x)q1 (x) = fˆ(x) − ĝ(x)q1 (x); bm se r1 (x) = 0 a divisão acabou e temos q(x) = q1 (x). Se r1 (x) 6= 0, nos perguntamos se grau r1 (x) ≥ grau g(x). Se a resposta é negativa, a divisão também acabou e temos r(x) = r1 (x) e q(x) = q1 (x). Caso afirmativo, recomeçamos o procedimento, até obter um resto parcial que, ou é zero, ou possui grau menor que grau g(x). Como o grau dos restos parciais diminui a cada iteração do procedimento, desde que não tenha se tornado nulo, concluı́mos que este deve parar após um número finito de iterações; de fato, precisamos não mais do que grau f (x) aplicações do procedimento. Por outro lado, observemos que no procedimento empregado, precisamos dividir por bm a cada passo. Se pretendermos que os resultados obtidos da divisão sejam polinômios com coeficientes no domı́nio D onde f (x) e g(x) tem os seus, devemos pedir que bm seja um invertı́vel em D. Por exemplo, no caso onde D = Z, as únicas possibilidades são bm = 1 ou bm = −1. No caso onde D for um corpo, a divisão será possı́vel para todo bm 6= 0. De fato temos o seguinte teorema: Teorema 3.3.1. Sejam f (x), g(x) ∈ D[x] polinômios de graus n e m respectivamente (em particular, ambos diferentes de zero). Se n ≥ m e o coeficiente lı́der de g(x) é invertı́vel em D, então existem únicos polinômios q(x), r(x) ∈ D[x] tais que (i) f (x) = g(x)q(x) + r(x), (ii) r(x) = 0 ou grau(r) < grau(g). Demonstração. A existência de q(x) e r(x) foi demonstrada de maneira mais ou menos rigorosa acima. Para demonstrar a unicidade, suponhamos que 56 CAPÍTULO 3. POLINÔMIOS temos q ′ (x), r′ (x) ∈ D[x] também satisfazendo (i) e (ii) e demonstremos que então q(x) = q ′ (x) e r(x) = r′ (x). De (i) obtemos g(x)(q(x) − q ′ (x)) = r′ (x) − r(x). (3.1) Suponhamos por um momento que r′ (x) 6= r(x). Então r′ (x) − r(x) 6= 0, donde q(x) − q ′ (x) 6= 0, pois g(x) 6= 0 e D[x] é um domı́nio de integridade. Mas então o lado direito da equação (3.1) tem grau ≥ graug(x) enquanto o lado esquerdo, graças à condição (ii), tem grau < graug(x): contradição ! Concluı́mos que nossa suposição, isto é, que r′ (x) 6= r(x) não está correta. Logo r′ (x) = r(x), e então q(x) = q ′ (x), pela equação (3.1). Observação 3.3.2. No caso onde f (x) = 0, a divisão por qualquer g(x) 6= 0 é evidentemente possı́vel obtendo q(x) = r(x) = 0. No caso onde f (x) e g(x) forem polinômios em Z[x], o coeficiente lı́der de g(x) deve ser 1 ou −1, pois são estes os únicos inverı́tiveis em Z; em particular, quando f (x) e g(x) forem polinômios constantes em Z[x], isto é, números inteiros, a divisão entre eles pensados como números inteiros não esta contemplada no teorema precedente, salvo quando g(x) = ±1. Definição 3.3.3. Sejam f (x), g(x) ∈ D[x], onde g(x) 6= 0. Dizemos que f (x) é divisı́vel por g(x) em D[x], o que denotamos g(x)|f (x), quando podemos dividir f (x) por g(x) obtendo resto 0. Exemplos 3.3.4. (a) Se D é um domı́nio e g(x) = b0 é um polinômio constante com b0 invertı́vel em D (isto é, existe a ∈ D tal que ab0 = 1), então f (x) = b0 · ( 1 f (x)). b0 Pela unicidade do teorema, temos q(x) = 1 f (x), r(x) = 0. b0 (b) Se g(x) é um polinômio mônico, então a divisão como no teorema é sempre possı́vel. É facil ver que neste caso o coeficiente lı́dr do quociente é o mesmo que o coeficiente lı́der de f (x). (c) Seja g(x) = x + a, a ∈ D. Pelo teorema, f (x) = (x + a)q(x) + r(x) (3.2) 3.3. TEORIA DA DIVISIBILIDADE EM D[X] 57 onde r(x) = 0 ou grau(r) < grau(g) = 1. Concluı́mos que r(x) é constante, isto é, zero ou uma constante não nula r = r(x). Substituindo x por −a na equação (3.2), obtemos o resto r = f (−a). (d) Consideremos f (x) = 3x4 − 5x3 + 2x2 − x + 6, g(x) = x2 − 3x + 1; pelo teorema obteremos quociente e resto q(x), r(x) em Z[x]. Usando as notações introduzidas anteriormente, obtemos q1 (x) = 3x2 , r1 (x) = 4x3 − x2 − x + 6. Como graur1 (x) ≥ graug(x) repetimos o procedimento, obtendo q2 (x) = 4x, r2 (x) = 11x2 − 5x + 6; repetindo mais uma vez q3 (x) = 11, r3 (x) = 28x − 5. Concluı́mos q(x) = q1 (x) + q2 (x) + q3 (x) = 3x2 + 4x + 11, r(x) = r3 (x) = 28x − 5. O exemplo (c) acima é conhecido como Teorema do Resto: Teorema 3.3.5 (do Resto). O resto da divisão de f (x) ∈ D[x] por x + a é f (−a). Este teorema, que parece apenas uma simples observação é muito importante. De fato, é a chave para compreender o vı́nculo entre a teoria algébrica que começamos a desenvolver neste capı́tulo e o nosso objetivo principal, a saber, o de resolver equaçãoes polinomiais. Para precisar isto, começamos com uma definição, onde estamos considerando a situação em que D é um domı́nio qualquer contido dentro do corpo dos números complexos, como por exemplo Z, Q, R ou mesmo o próprio C. Definição 3.3.6. Sejam f (x) ∈ D[x] e α ∈ C. Dizemos que α é raiz de f (x) se f (α) = 0. 58 CAPÍTULO 3. POLINÔMIOS O teorema do resto nos dá imediatamente o seguite vı́nculo espetacular que traduz esta noção em termos de divisibilidade, conhecido como Teorema de Ruffini, e cuja demonstração é deixada para o leitor: Corolário 3.3.7 (Teorema de Ruffini). Um número complexo α ∈ C é raiz de um polinômio f (x) ∈ D[x] se e somente se f (x) é divisı́vel por x − α. A sguir descrevemos o chamado esquema de Ruffini (veja figura abaixo) para dividir um polinômio da forma f (x) = n X ai x i , i=0 por x − a. Como no algoritmo da divisão começamos dividindo por x, o primeiro quociente parcial é q1 (x) = an xn−1 ; multiplicando por x − a e subtraı́ndo de f (x) obtemos r1 (x) = (an a + an−1 )xn−1 + an−2 xn−2 + · · · + a1 x + a0 . Repetindo o procedimento obteremos então q2 (x) = (an−1 +aan )xn−2 , r2 (x) = (an a2 +an−1 a+an−2 )xn−2 +an−3 xn−3 +· · ·+a0 . Não é difı́cil de se convencer que os coeficientes do quociente e o resto r(x) podem ser obtidos da seguinte forma: escrevemos numa linha horizontal todos os coeficientes de f (x), da direita para a esquerda, começando pelo lı́der e não esquecendo aqueles que são nulos. Os coeficientes do quociente são, escritos na mesma ordem: o lı́der é o próprio an ; para o seguinte multiplicamos o anterior (isto é, o lı́der neste caso) por a e somamos o resultado com o próximo coeficiente da linha horizontal, ou seja, com an−1 ; para obter o terceiro coeficiente de q(x) repetimos o procedimento arterior, ou seja, multiplicamos o coeficiente obtido precedentemente por a e somamos o resultado com o terceito da linha horizontal, isto é, com an−2 ; etc...O resto r(x) será o último resultado obtido pelo procedimento anterior, que é precisamente f (a) = an an + an−1 an−1 + · · · + a1 a + a0 ; em particular redemonstramos o teorema do Resto 3.3.5. Figura com esquema de Ruffini 3.3. TEORIA DA DIVISIBILIDADE EM D[X] 59 Exemplo 3.3.8. Consideremos o polinômio f (x) = x4 + bx2 − cx + 4 com b, c ∈ R. Encontremos b, c para que o polinômio tenha raı́zes 1 e −1. Aplicando o corolário 3.3.7 temos um sistema de equações b − c = −5; b + c = −5. Concluı́mos b = −5 e c = 0. Exemplo 3.3.9. Consideremos o polinômio f (x) = x2 + bx + c com b, c ∈ R. Se quisermos encontrar b, c para que o polinômio tenha raiz dupla igual a 1, o método utilizado no exemplo anterior não funciona pois obteremos a mesma equação duas vezes (verifique isto !). Por outro lado, se o fato de um polinômio possuir raiz 1 equivale a este polinômio ser divisı́vel por (x − 1), é razoável pensar que ter raiz dupla 1 equivalha ao fato do polinômio poder ser dividido duas vezes por (x − 1) (observe que talvez ainda não tenhamos muito claro o quê significa um polinômio ter raiz dupla); como veremos, a é esta a definição correta da noção de raiz dupla. Levando isto em consideração, podemos dividir f (x) por (x − 1) e logo dividir o quociente obtido também por (x − 1): ambos restos deverão ser nulos. Aplicando o esquema de Ruffini o primeiro resto é 1 + b + c, o primeiro quociente tem coeficientes 1 e b + 2 e e o segundo resto é b + 2. Concluı́mos que b = −2 e c = 1. Exercı́cio 3.3.2. Trabalhando como no exemplo precedente obtenha condições para que o polinômio geral de grau 2 possua uma raiz dupla α; compare o resultado obtido com o que já sabe da discussão da equação quadrática. O teorema de Ruffini (corolário 3.3.7) pode ser generalizado; no momento estamos em condições de generalizar apenas uma das implicações (para a implicação recı́proca veja proposição 3.5.1): Proposição 3.3.10. Sejam f (x), g(x) ∈ D[x]. Se g(x)|f (x), então toda raiz de g(x) é raiz de f (x). Demonstração. Temos f (x) = g(x)q(x) para certo q(x) ∈ D[x]. Se α ∈ C é uma raiz de g(x), então f (α) = g(α)q(α) = 0, donde segue o resuntado. 60 CAPÍTULO 3. POLINÔMIOS Quando estudamos aritmética em Z partimos do algorı́tmo da divisão para logo definirmos o conceito de divisor de um número. Entre os divisores, encontramos alguns muito especiais: por um lado, aqueles “triviais” que são o próprio número ou seu oposto, e ±1. Por outro lado, encontramos certos números que admitem apenas divisores trivias como estes; quando positivos, chamamos esses números de números primos. Depois demonstramos o teorema fundamental da Aritmética que diz que todo número positivo fatora-se como produto de números primos; se o número é negativo, multiplicamos por −1 a fatoração do seu valor absoluto. Agora que temos em D[x] um algorı́tmo de divisão, podemos nos perguntar sobre a fatoração de um polinômio como produto de fatores “primordiais”, que não acietam mais fatoração que aquelas trivias; observe que fatores do tipo x − α correspondem a raı́zes do polinômio em questão. Vamos então definir os conceitos equivalentes, para polinômios, daqueles de número primo e divisor trivial de um número inteiro. A seguinte definição é bastante intuitiva e omitimos comentários (reflita sobre ela; veja o exemplo (a) acima) Definição 3.3.11. Seja f (x) ∈ D[x]. Os divisores triviais de f (x) são os polinômios constantes d(x) = d ∈ D e os polinômios da forma df (x), onde d é invertı́vel em D. Depois de termos a noção de divisor trivial, o equivalente ao conceito de número primo decorre imediatamente: Definição 3.3.12. Seja f (x) ∈ D[x] um polinômio de grau ≥ 1. Dizemos que f (x) é irredutı́vel, se seus únicos divisores em D[x] são os trivias. Caso contrário dizemos que f (x) é redutı́vel. Vejamos alguns exemplos para exclarecer esta noção. Exemplos 3.3.13. (a) Seja f (x) = ax + b ∈ D[x]. Suponhamos primeiramente que D = Z. Seja d = mdc(a, b) ∈ Z. Temos f (x) = d(a′ x + b′ ), onde mdc(a′ , b′ ) = 1. Se d > 1, então d é um divisor não trivial em D[x] pois não é invertı́vel em D. Concluı́mos que, neste caso, f (x) é redutı́vel. Se d = 1, suponhamos que f (x) possui um divisor g(x) ∈ Z; então ax + b = g(x)q(x). 61 3.3. TEORIA DA DIVISIBILIDADE EM D[X] Por causa do grau de f (x) ser um, concluı́mos que g(x) ou q(x) devem ser constantes; digamos g(x) = a1 x + b1 e q(x) = c ∈ Z. Então a = a1 c, b = b1 c, donde c|mdc(a, b). Como mdc(a, b) = d = 1, que é invertı́vel, concluı́mos que f (x) é irredutı́vel. Finalmente, no caso onde D é um corpo, é evidente que f (x) = ax + b será sempre irredutı́vel. (b) Consideremos o polinômio f (x) = x2 − 2 ∈ Z[x]. É claro que temos a fatoração x2 − 2 = (x − √ 2)(x + √ 2), o que mostra que f (x) é redutı́vel em R[x] e também em C[x]. Porém ele é irredutı́vel em Q[x]: com efeito, soponhamos que f (x) possui um divisor não trivial em Q[x]. Por causa do grau de f (x) ser 2, a única possibilidade é termos x2 − 2 = (ax + b)(a1 x + b1 ), com a, b, a1 , b1 ∈ Q. Um cálculo fácil mostra que aa1 = 1, ab1 + ba1 = 0, bb1 = −2. Multiplicando por ab1 a igualdade do meio, obtemos a2 b21 − 2 = 0, que não possui solução em Q (observe que ab1 6= 0). Então a fatoração acima não é possı́vel em Q[x]. Um cálculo ainda mais simples mostra que o polinômio x2 −2 é irredutı́vel em Z[x]: com efeito, de aa1 = 1 obtemos a = ±1 e a1 = ±1; de bb1 = −2 obtemos b = ±1, b1 = ±(−2). Estes valores para a, a1 , b, b1 são incompatı́veis com a equação do meio ab1 + ba1 = 0. (c) Seja f (x) = 3x2 − 6. É redutı́vel em Z[x] pois fatora-se como 3(x2 − 2) sendo 3 ∈ Z um divisor não trivial em Z[x]; trabalhando como no exemplo (b) mostra-se que o polinômio é irredutı́vel em Q[x] e redutı́vel quando D = R ou D = C. 62 CAPÍTULO 3. POLINÔMIOS Quando estudamos aritmética em Z, um inteiro n e seu oposto −n possuem os mesmos divisores; isto deve-se ao fato de podermos passar de um para o outro multiplicando por −1 que é um invertı́vel de Z. Temos um fenômeno análogo em D[x], é o conteúdo da seguinte definição. Definição 3.3.14. Dizemos que dois polinômios f (x), g(x) ∈ D[x] são associados em D[x] (ou sobre D), denotando f (x) ∼ g(x), se possuem os mesmos divisores. Se f (x) ∼ g(x) em D[x], como f (x)|g(x) e g(x)|f (x), temos f (x) = g(x)q(x), g(x) = f (x)q ′ (x). Então f (x) = q(x)q ′ (x)f (x), donde segue que, ou f (x) = g(x) = 0, ou, caso contrário q(x) e q(x) são invertı́veis em D[x], isto é, são constantes invertı́veis em D. Isto demonstra o seguinte resultado: Proposição 3.3.15. Dois polinômios f (x), g(x) ∈ D[x] são associados em D[x] se e somente se f (x) = ag(x) com a ∈ D invertı́vel; neste caso g(x) = bf (x) com b ∈ D tal que ab = 1. Exemplo 3.3.16. Os polinômios 3x2 − 6 e x2 − 2 não são associados em Z[x], pois o primeiro é múltiplo do segundo via uma constante que não é invertı́vel em Z. A demonstração do seguinte corolário (da proposição precedente) é deixada como exercı́cio para o leitor. Corolário 3.3.17. Se f (x), g(x) ∈ D[x] são polinômios associados, então f (x) é irredutı́vel em D[x] se e somente se g(x) é irredutı́vel em D[x] . P Definição 3.3.18. Seja f (x) = ni=0 ai xi ∈ Z[x]. O conteúdo de f (x) é o máximo divisor comum dos coeficientes c(f ) := mdc(a0 , . . . , an ). Exemplo 3.3.19. Se f (x) = 3x2 − 6, temos c(f ) = 3. A seguinte proposição, cuja demonstração daremos mais adiante (veja a demonstração antes do lema 3.6.2) explica o fenômeno aparentemente não intuitivo que acontece com o polinômio 3x2 − 6 que é irrédutı́vel sobre Q mas não sobre Z que é um domı́nio muito menor (e então com menos possibilidade de escolha para os coeficientes). 3.3. TEORIA DA DIVISIBILIDADE EM D[X] 63 Proposição 3.3.20. Seja g(x) ∈ Z[x]. Suponhamos que g(x) é irredutı́vel em Q[x]. Se c(g) = 1, então g(x) é irredutı́vel em Z[x]. Vamos agora introduzir os conceitos de máximo divisor comum e mı́nimo múltiplo comum de dois ou mais polinômios. Comecemos pelo primeiro: é importante observar as diferenças entre os casos onde D é Z e D é um corpo (de fato arbitrário contendo Z, mas nos sempre pensaremos nos casos onde o corpo é um dos dos três corpos Q, R e C). Definição 3.3.21. Sejam f (x), g(x) ∈ D[x] polinômios não ambos nulos. Seja d(x) ∈ D[x] um polinômio que, quando D for um corpo suporemos mônico e quando D = Z suporemos de coeficiente lı́der positivo. Dizemos que d(x) é o máximo divisor comum de f (x) e g(x) se satisfaz as seguintes condições: (i) d(x)|f (x) e d(x)|g(x). (ii) se c(x)|f (x) e c(x)|g(x), então c(x)|d(x). Neste caso denotamos mdc(f, g) := d(x) Exemplo 3.3.22. Se f (x) = −3x2 + 6 e g(x) = 12x2 − 24 é mais ou menos evidente que mdc(f, g) = 3x2 − 6 em Z[x] mas x2 − 2 em D[x] para D sendo um corpo pois o máximo divisor comum é mônico por definição neste caso. Vamos agora introduzir o Algoritmo de Euclides para calcular o mdc de dois polinômios. Por simplicidade concentraremos nossa atenção no caso onde D é um corpo; o leitor interessado, poderá tentar obter o mdc para polinômios em Z[x] usando o algorı́tmo no caso de Q[x] com ligeiras modificações. Precisamos do seguinte lemma cuja demonstração é deixada para o leitor. Lema 3.3.23. Sejam f (x), g(x) ∈ D[x]. Se d(x) ∈ D[x] é um divisor commun de f (x) e g(x), então d(x) divide o polinômio f (x)h(x) + g(x)k(x) para todos h(x) ∈ D[x] e k(x) ∈ D[x]. Seja D um corpo que contém os números inteiros (o leitor pode pensar no caso onde D é um dos três corpos numéricos). Sejam f (x), g(x) ∈ D[x] 64 CAPÍTULO 3. POLINÔMIOS polinômios não nulos com grau(f ) ≥ grau(g). Pelo algorı́tmo da divisão, existem únicos q(x) e r(x), polinômios em D[x], tais que (i) f (x) = g(x)q(x) + r(x) e (ii) r(x) = 0 ou grau(r) < grau(g). Por outro lado, do lema precedente segue facilmente que todo divisore comum de f (x) e g(x) é divisor comum de g(x) e r(x): com efeito, se d(x)|f (x) e d(x)|g(x), então o lema aplicado com h(x) = 1 e k(x) = −q(x) mostra que d(x)|r(x), pois r(x) = f (x) + g(x) (−q(x)) . Reciprocamente, se d(x)|g(x) e d(x)|r(x), aplicamos o lema aos polinômios g(x) e r(x) multiplicando o primeiro por h(x) = q(x) e o segundo por k(x) = 1 para concluir que d(x)|f (x). Do raciocı́nio acima concluı́mos mais ou menos diretamente o seguinte resultado, que é a clave para construir o algorı́tmo de Euclides. Lema 3.3.24. Temos mdc(f, g) = mdc(g, r) Algorı́tmo Dados de entrada: f (x) e g(x) com g(x) 6= 0 e grau(f ) ≥ grau(g). 1. Primeiro passo: Dividimos f (x) por g(x), obtendo f (x) = g(x)q(x) + r(x) Usando o corolário, temos duas situações: (1) r(x) = 0; neste caso, o mdc procurado é o g(x) multiplicado pelo inverso de seu coeficiente lı́der (para “tornar” mônico o polinômio, de acordo com a definição de mdc). (2) r(x) 6= 0; neste caso grau(r) < grau(g). Então repetimos o feito no primeiro passo: 2. Segundo passo: Dividimos g(x) por r(x), obtendo g(x) = r(x)q1 (x) + r1 (x). Novamente temos duas situações: (1) r1 (x) = 0; neste caso o mdc procurado é r(x) multiplicado pelo inverso de seu coeficiente lı́der. (2) r1 (x) 6= 0; neste caso grau(r1 ) < grau(r). Pelo corolário teremos mdc(f, g) = mdc(g, r) = mdc(r, r1 ) 3.3. TEORIA DA DIVISIBILIDADE EM D[X] 65 Então recomeçamos, dividindo agora r(x) por r1 (x), e assim em diante. Os restos r(x), r1 (x), r2 (x), etc, serão chamados de restos parciais. É claro que o procedimento acima pára em algum momento: isto é, não pode acontecer que toda vez que dividimos, a primeira situação não aconteça (ou seja, o resto da divisão correspondente não seja zero), pois a cada repetição do procedimento o resto obtido, quando não nulo, tem grau menor que o anterior. De fato, teremos no máximo, grau(g) passos a realizar. Concluı́mos desta forma, que o mdc(f, g) é o último resto parcial diferente de zero, multiplicado pelo inverso de seu coeficiente lı́der. Teorema 3.3.25. Sejam f (x), g(x) ∈ D[x] com D um corpo. Então existe um único máximo comum divisor de f (x) e g(x). Demonstração. A existência foi provada usando o algorı́tmo de Euclides. A demonstração da unicidade é deixada para o leitor. Numa primeira instância o mdc de dois polinômios depende do domı́nio D[x] onde estamos trabalhando; não obstante, no caso onde D for um corpo, segue do algorı́tmo de Euclides que mdc(f, g) independe de D, isto é, o polinômio achado pelo algorı́tmo é o mesmo independentemente do fato de trabalharmos com Q, R ou C, quando isto fizer sentido (ou seja, quando os polinômios f (x) e g(x) puderem ser considerados com coeficientes em um ou outro corpo): é o conteúdo do seguinte corolário. Corolário 3.3.26. Suponhamos que D é um corpo. Então mdc(f, g) independe de D. Demonstração. Basta observa que os dois lemas utilizados para demonstrar o algorı́tmo de Euclides independem de D. Exemplo 3.3.27. Sejam f (x) = x8 +5x7 −3x6 −42x5 −25x4 +92x3 −+78x2 −35x−15, g(x) = x5 +5x4 −27x2 −25x+10. Dividindo f (x) por g(x) obtemos q(x) = x3 − 3x, r(x) = x3 + 3x2 − 5x − 15; dividindo g(x) por r(x) obtemos q1 (x) = x2 + 2x − 1, r1 (x) = x2 − 5. 66 CAPÍTULO 3. POLINÔMIOS Finalmente, ao dividir r(x) por r1 (x) obtemos q2 (x) = x + 3, r2 (x) = 0. Concluı́mos mdc(f, g) = x2 − 5. Em particular temos que mdc(f, g) = g(x) + r(x)(−q1 ); utilizando que f (x) = g(x)q(x) + r(x) podemos eliminar r(x) para obter mdc(f, g) = g(x) + (f (x) + g(x)(−q(x))(−q1 (x)), donde mdc(f, g) = (−q1 (x))f (x) + (1 + q(x)q1 (x)) o que mostra que mdc(f, g) é uma combinação linear de f (x) e g(x) com coeficientes em D[x]; neste caso podemos supor D = Q. O raciocı́nio feito no exemplo precedente pode ser generalizado, obtendo o seguinte resultado (a demonstração pode ser omitida numa primeira leitura): Teorema 3.3.28. Sejam f (x), g(x) ∈ D[x]. Existem polinômios h(x), k(x) ∈ D[x] tais que mdc(f, g) = f (x)h(x) + g(x)k(x). Demonstração. ..... Corolário 3.3.29. Sejam f (x), g(x) ∈ D[x] e α ∈ C. Então α é uma raiz comum de f (x) e g(x) se e só se α é uma raiz de mdc(f, g). Demonstração. Se α é raiz de f (x) e de g(x), pelo teorema α também é raiz de mdc(f, g). Reciprocamente, seja α uma raiz de d(x) = mdc(f, g); como d(x) é um divisor comum de f (x) e g(x) temos f (x) = d(x)q1 (x), g(x) = d(x)q2 (x) para certos q1 (x), q2 (x) ∈ D[x]. Então f (α) = d(α)q1 (α) = 0, g(α) = d(α)q2 (α) = 0, donde segue a afirmação. 3.3. TEORIA DA DIVISIBILIDADE EM D[X] 67 O corolário precedente mostra o vı́nculo existente entre o mdc é a resolução de sistemas de equações, como mostra o exemplo seguinte. Exemplo 3.3.30. Vamos resolver o sistema de equaçãoes: 4 x + x3 + 3x − 2 = 0 x3 − 3x + 2 = 0. Se f (x) = x4 + x3 + 3x − 2 e g(x) = x3 − 3x + 2, queremos encontrar as raı́zes comuns de f (x) e g(X); denotemos d(x) = mdc(f, g). Pelo corolário, isto corresponde a encontrar as raı́zes de d(x). Utilizando o algorı́tmo de Euclides, obtemos d(x) = x + 2, donde concluı́mos que x = −2 é a única solução do sistema de equações. Definição 3.3.31. Dois polinômios f (x), g(x) ∈ D[x] são primos entre si se mdc(f, g) = 1. Proposição 3.3.32. Suponhamos que existem k(x), h(x) ∈ D[x] tais que 1 = k(x)f (x) + h(x)g(x). Então mdc(f, g) = 1. Demonstração. Se d(x) é um divisor comum de f (x) e de g(x), então d(x) divide 1 pelo lema 3.3.23. Então mdc(f, g) = 1 Corolário 3.3.33. Sejam f (x), g(x) ∈ D[x]. Se d(x) = mdc(f, g), então f (x) = d(x)f1 (x), g(x) = d(x)g1 (x), onde f1 (x) e g1 (x) polinômios em D[x] primos entre si. Demonstração. Pelo teorema 3.3.28 d(x) = k(x)f (x) + h(x)g(x), donde segue facilmente 1 = k(x)f1 (x) + h(x)g1 (x). O corolário é entaõ conseqüência da proposição precedente. 68 CAPÍTULO 3. POLINÔMIOS Teorema 3.3.34 (Teorema de Euclides). Sejam f (x), g(x), g1 (x) ∈ D[x]. Se f (x)|g(x)g1 (x) e mdc(f, g) = 1, então f (x)|g1 (x). Demonstração. Pelo teorema 3.3.28 existem h(x), k(x) ∈ D[x] tais que 1 = f (x)h(x) + g(x)k(x). (3.3) Por outro lado g(x)g1 (x) = f (x)q(x) para certo q(x) ∈ D[x]. Multiplicando a igualdade da equação (3.3) por g1 (x) obtemos então g1 (x) = f (x)g1 (x)h(x) + g(x)g1 (x)k(x) = f (x)g1 (x)h(x) + f (x)q(x)k(x) = f (x) (g1 (x)h(x) + q(x)k(x)) demonstrando que f (x) divide g1 (x). O seguinte corolário do teorema de Euclides é deixado como exercı́cio para o leitor. Corolário 3.3.35. Sejam f (x), g(x), h(x) ∈ D[x]. Se f (x) é irredutı́vel e f (x)|g(x)h(x), então f (x)|g(x) ou f (x)|h(x). Exercı́cio 3.3.3. Sejam f (x), f1 (x), . . . , fℓ (x) ∈ D[x]. Suponha que f (x)|f1 (x) · · · fℓ (x). Demonstra por indução matemática no número ℓ de fatores que se f (x) é irredutı́vel, então existe j, 1 ≤ j ≤ ℓ tal que f (x)|fj (x). A continuação introduzimos o conceito de Mı́nimo Múltiplo Comum. Definição 3.3.36. Seja f (x) ∈ D[x]. Um múltiplo de f (x) em D[x] é um polinômio da forma f (x)q(x), onde q(x) ∈ D[x]. Um polinômio m(x) é múltiplo de f (x) em D[x] se e somente se f (x)|m(x) (demonstre isto !). Definição 3.3.37. Sejam f (x), g(x) ∈ D[x]. Sejam a, b os coeficientes lı́der de f (x) e g(x) quando D for um corpo e seus conteúdos quando D for Z, respectivamente. O Mı́nimo comum múltiplo de f (x) e g(x) é o polinômio em D[x], que denotaremos mmc(f, g) quociente de dividir f (x)g(x) por abmdc(f, g). Com esta definição fica claro que mmc(f, g) está univocamente definido, porém não é claro que seja um múltiplo comum de f (x) e g(x) nem que seja o menor possı́vel. 3.3. TEORIA DA DIVISIBILIDADE EM D[X] 69 Teorema 3.3.38. Sejam f (x), g(x), m(x) ∈ D[x]. Então m(x) é o mı́nimo múltiplo comum de f (x) e g(x) se e somente se satisfaz as seguintes condições: (i) f (x)|m(x), g(x)|m(x). (ii) Se h(x)|f (x) e h(x)|g(x), então m(x)|h(x). (iii) m(x) é mônico quando D for um corpo e um inteiro positivo quando D for Z. Demonstração. Faremos a prova no caso onde D é um corpo; o caso onde D = Z é deixado para o leitor interessado e pode ser demonstrado adaptando a demonstração que faremos. Denotemos d(x) = mdc(f, g). Temos f (x) = d(x)f1 (x) e g(x) = d(x)g1 (x) com mdc(f1 , g1 ) = 1. Suponhamos que m(x) = mmc(f, g) e demonstremos que m(x) satisfaz as condições (i), (ii) e (iii). Observemos que a condição (i) segue diretamente da definição; a condição (ii) é conseqüência do fato que d(x) é mônico. Como f (x) e g(x) dividem h(x), temos h(x) = d(x)f1 (x)q(x) = d(x)g1 (x)q ′ (x) para certos q(x), q ′ (x) ∈ D[x]; em particular g1 (x)|d(x)f1 (x)q(x). Pelo teorema de Euclides, g1 (x)|d(x)q(x). Finalmente, dado que m(x) = abd(x)f1 (x)g1 (x) concluı́mos que m(x)|h(x), o que demonstra (ii). Reciprocamente, suponhamos que m(x) satisfaz (i), (ii) e (iii). Temos f (x)g(x) = abd2 (x)f1 (x)g1 (x). A primeira parte da demonstração nos diz que o polinômio abd(x)f1 (x)g1 (x) satisfaz (i), (ii) e (iii). Basta então mostrar que dois polinômios que satisfazem estas trêss condições são iguais. Seja m′ (x) um polinômio satisfazendo (i), (ii), e (iii). Temos m′ (x)|m(x) e m(x)|m′ (x). Então m(x) = cm′ (x), m′ (x)c′ m(x), com c, c′ ∈ D. Como ambos polinômios são mônicos eles devem coincidir. Exemplo 3.3.39. Sejam f (x) = x8 + 5x7 − 3x6 − 42x5 − 25x4 + 92x3 − +78x2 − 35x − 15, g(x) = x5 + 5x4 − 27x2 − 25x + 10. Como vimos no exemplo 3.3.27 temos mdc(f, g) = x2 − 5. Basta dividir f (x)g(x) por x2 − 5 para obter mmc(f, g) (faça-o !). 70 CAPÍTULO 3. POLINÔMIOS Terminamos este parágrafo generalizando o conceito de máximo comum divisor e mı́nimo múltiplo comum para o caso de um número finito de polynômios (o que pode ser omitido numa primeira leitura). Porém, não demonstraremos só enunciaremos, sem demonstração, as principais propriedades destes. Definição 3.3.40. Sejam f1 (x), . . . , fℓ (x) ∈ D[x]. O Máximo divisor comum dos polinômios f1 (x), . . . , fℓ (x) é um polinômio d(x) ∈ D[x] tal que: (i) d(x)|fi (x) para i = 1, . . . , ℓ. (ii) Se c(x)|fi (x) para i = 1, . . . , ℓ, então c(x)|d(x). (iii) d(X) é mônico se D for um corpo e com coeficiente lı́der positivo se D = Z. Denota-se d(x) = mdc(f1 , . . . , fℓ ). De maneira análoga ao que acontece no caso ℓ = 2 pode-se demonstrar que dois polinômios satisfazendo (i), (ii) e (iii) são necessariamente inguais, o que prova que a definição está bem posta, isto é, que não pode haver dois polinômios diferentes virificando a definição acima. Por exemplo se ℓ = 3, não é difı́cil demonstrar que mdc(mdc(f1 , f2 ), f3 ) e mdc(f1 , mdc(f2 , f3 )) satisfazem as condições (i), (ii) e (iii), donde que eles concidem (ambos) com o mdc dos três polinômios. O leitor pode imaginar como é que devemos proceder para obter o mdc de mais do que três polinômios... Analogamente, o mmc de ℓ polinômios f1 (x), . . . , fℓ (x) ∈ D[x], que denotase mmc(f1 , . . . , fℓ ), pode ser definido como satisfazendo f1 (x) · · · fℓ (x) = a1 · · · aℓ mdc(f1 , . . . , fℓ ), onde a1 , . . . , aℓ ∈ D os coeficientes lı́der dos respectivos polinômios. 3.4 Irredutibilidade e Fatoração Canônica Agora vamos estudar o problema da fatoração de polinômios, com coeficientes num corpo, como produto de polinômios irredutı́veis. Comecemos analizando alguns casos particulares. Seja f (x) ∈ D[x] de grau n ≥ 1. 1 Se n = 1, como sabemos pelo exemplo 3.3.13a), o polinômio é irredutı́vel e nada temos a fatorar. 3.4. IRREDUTIBILIDADE E FATORAÇÃO CANÔNICA 71 2 Se n = 2, temos duas possibilidades mutuamente excluentes: (i) f (x) é irredutı́vel em D[x], e nada temos para fatorar, como acontece por exemplo com o polinômio x2 − 2 em Q[x] (ref. 3.3.13b)) ou x2 + 1 em R[x]. √ √ (ii) f (x) é redutı́vel, como acontece com x2 − 2 = (x − 2)(x + 2) em R[x] ou x2 + 1 = (x − ı)(x + ı) em C[x]. Neste caso podemos escrever f (x) = f1 (x)f2 (x), onde f1 (x) e f2 (x) são divisores não triviais de f (x); isto é, são polinômios de grau 1. Concluı́mos, pelo visto no item (i) que f1 (x) e f2 (x) são irredutı́veis, e então a fatoração acima é a fatoração procurada. 3 Se n = 3 temos novamente duas possibilidades mutuamente excluentes: (i) f (x) é irredutı́vel (conhece algum exemplo ?). (ii) f (x) é redutı́vel, então f (x) = f1 (x)g(x), com f1 (x) de grau 1 e g(x) de grau 2. Se g(x) for irredutı́vel, esta é a fatoração procurada. Senão, aplicamos o feito no caso de polinômios de grau 2 acima e obtemos uma fatoração para g(x) como g(x) = f2 (x)f3 (x) com f2 (x) e f3 (x) de grau 1; neste caso f (x) = f1 (x)f2 (x)f3 (x) é uma fatoração de f (x) como produto de polinômios irredutı́veis. Este raciocı́nio pode ser continuado agora para grau 4, utilizando o já feito para grau 3, e asim por diante. Este procedimento é um caso particular do que chama-se um procedimento “indutivo”, onde a “indução” acontece no grau dos polinômios envolvidos. O caso geral, demonstra-se por indução matemática, no grau n do polinômio f (x). Mais precisamente, temos: Teorema 3.4.1 (Teorema de fatoração). Seja f (x) ∈ D[x] um polinômio de grau n ≥ 1. Então i) Existem polinômios irredutı́veis f1 (x), . . . , fℓ (x) ∈ D[x] tais que f (x) = f1 (x) · · · fℓ (x). ii) Se temos outra fatoração f (x) = g1 (x) · · · gm (x) onde g1 (x), . . . , gm (x) são irredutı́veis, então m = ℓ e cada gi (x) é associado a algum fj (x). 72 CAPÍTULO 3. POLINÔMIOS Demonstração. Existência. Vamos mostrar a parte (i) por indução matemática no grau n. Se n = 1, o resultado é claro, pois todo polinômio de grau um com coeficientes num corpo é irredutı́vel. Suponhamos como hipótese de indução que o resultado é verdadeiro para todo polinômio de grau menor que k. Vamos então demonstrar que o resultado também é verdadeiro para todo polinômio de grau k. Seja f (x) um polinômio de grau k. Se f (x) é irredutı́vel, nada temos a demonstrar. Se f (x) é redutı́vel, então f (x) = g(x)h(x) com g(x) e h(x) divisores não triviais de f (x); em particular o grau de g(x) e de h(x) não pode ser nem 0 nem k. Por hipótese de indução existem fatorações para g(x) e h(x) como produto de polinômios irredutı́vis g(x) = f1 (x) · · · fr (x), h(x) = fr+1 · · · fℓ (x). Concluı́mos f (x) = f1 (x) · · · fℓ (x), como queriamos demonstrar. Unicidade. Agora mostraremos a parte (ii). Suponhamos que f (x) = g1 (x) · · · gm (x), com g1 (x), . . . , gm (x) irredutı́veis em D[x]. Fixemos i ∈ {1, . . . , m} e denotemos g(x) = gi (x). Temos g(x)|f1 (x) · · · fℓ (x). Como g(x) é irredutı́vel, pelo exercı́cio 3.3.3 existe j tal que g(x) divide fj (x); como gi (x) = g(x) e fj (x) são ambos irredutı́veis, eles são associados. Em particular m ≤ ℓ. Refazendo o argumento com fi (x) no lugar de gi (x) também obtemos que cada fi (x) divide algum gj (x) e então ℓ ≤ m, o que completa a demonstração. 3.4. IRREDUTIBILIDADE E FATORAÇÃO CANÔNICA 73 Observação 3.4.2. a) Os polinômios irredutı́veis em (i) podem aparecer muitas vezes, como mostra o seguinte exemplo: (3x2 − 6)2 (x2 + 1)3 (4x − 1) que é uma fatoração em Q[x]. b) A parte (ii) do teorema significa que dadas duas fatorações, o número de fatores irredutı́veis deve ser o mesmo em ambas, e, além disso, os polinômios que aparecem nestas ou são, a menos da ordem de aparição, os mesmos, ou diferem pela multiplicação de uma constante. Por exemplo, a fatoração dada acima, pode ser modificada como 1 1 (4x2 − 8)(3x2 − 6)(3x2 + 3)3 (x − ). 9 4 Observe que pondo em evidência os coeficientes lı́deres de cada fator irredutı́vel da fatoração e multiplicando-os entre si, devemos obter o coeficiente lı́der de f (x). Isto, junto com a observação acima mostra o seguinte corolário: Corolário 3.4.3. Seja f (x) ∈ D[x] um polinômio de grau n ≥ 1 com coeficiente lı́der an . Então Existem polinômios irredutı́veis e mônicos f1 (x), . . . , fk (x) ∈ D[x] tais que f (x) = an f1n1 (x) · · · fknk (x). Vamos chamar a fatoração de f (x) enunciada no corolário 3.4.3 da fatoração canônica de f (x) em D[x]. A continuação vamos analizar, separadamente, o que acontece quando D é C, R ou Q. Começamos enunciando o famoso e mais imporante teorema na teoria de polinômios com coeficientes complexos: o Teorema Fundamental da Álgebra cujo enunciado é adjudicado ao matemático francés A. Girard e cuja demonstração foi obtida por Gauss em 1799 na sua tese de doutorado. Existem hoje em dia muitas demonstrações deste teorema, algumas delas relativamente elementares, mas todas envolvendo conceitos qeu escapam do escopo deste livro, motivo pelo qual será omitida. Teorema 3.4.4 (Teorema Fundamental da Álgebra). Seja f (x) ∈ C[x] de grau maior ou igual que 1. Existe α ∈ C tal que f (α) = 0. 74 CAPÍTULO 3. POLINÔMIOS Como sabemos, todo polinômio de grau 1, em particular aqueles com coeficientes complexos, é irredutı́vel. Se f (x) ∈ C[x] é de grau maior que um, pelo teorema fundamental, existe uma raı́z α ∈ C; pelo corolário 3.3.7 temos então f (x) = (x − α)q(x) para certo q(x) ∈ C[x], com grau(q) > 0. Concluı́mos que f (x) é redutı́vel. Ou seja: Corolário 3.4.5. Os unicos polinômios irredutı́veis em C[x] são os polinômios de grau um. Como conseqüência se f (x) é um polinômio de grau n ≥ 1 com coeficiente lı́der an , o corolário 3.4.3, no caso onde D = C, fica na forma seguinte f (x) = an (x − α1 )n1 · · · (x − αk )nk , (3.4) onde n = n1 + · · · + nk e α1 , . . . , αk são as raı́zes distintas de f (x). Diremos que esta é a fatoração canônica complexa de f (x). O expoente ni é a multiplicidade da raı́z αi , i = 1, . . . , k. Dizemos também que αi é uma raiz simple quando ni = 1 e múltipla quando ni > 1, sendo este ni a ordem ou multiplicidade. Se ni = 2, 3,etc. tabém diremos que a raiz é dupla, tripla etc. No fim do parágrafo analisaremos mais detalhadamente a relação entre a multiplicidade de uma raiz e a divisibilidade (ref. corolário do teorema do resto 3.3.7). Um corolário importante da fatoração de f (x) como produto de fatores irredutı́veis mônicos de grau um é a relação entre coeficientes e raı́zes de um polinômio, problema este que já tratamos no (ver §2 do capı́tulo 1) de maneira menos sistemática do que o faremos agora; em particular o leitor poderá verificar as relações obtidas surgiam como consequência de considerar expressões que estavam fatoradas como produto de binômios de grau 1. Para isso comecemos observando que ! ! ℓ X X Y n γi γj + · · · + (−1)n γ1 · · · γn . γj + (x − γi ) = x − i=1 j i<j Esta expressão é então um polinômio mônico de grau n com coeficientes, fora o lı́der que é um, certas funções cujas variáveis são precisamente as raı́zes γ1 , . . . , γ n . 3.4. IRREDUTIBILIDADE E FATORAÇÃO CANÔNICA 75 Mais explicitamente, definimos as funções simétricas s1 , . . . , sℓ de γ1 , . . . , γn , como sendo X sj (γ1 , . . . , γn ) = γi1 · γi2 · · · γij , j = 1, . . . , n. i1 <...,ij Por simplicidade, e quando não houver perigo de confusão, denotaremos sj = sj (γ1 , . . . , γn ), j = 1, . . . , n; sj é a j-ésima função simétrica de γ1 , . . . , γn . A demonstração do seguinte corolário deveria ser um exercı́cio relativamente fácil para o leitor Corolário 3.4.6. Seja g(x) ∈ C[x] um polinômio mônico de grau n; denotemos γ1 , . . . , γn as raı́zes (eventualmente repetidas) de g(x). Então g(x) = n X (−1)n sj xj , j=1 onde s0 = 1 e, para j ≥ 1, sj é a j-ésima função simétrica de γ1 , . . . , γn . Para analisar a fatoração de polinômios com coeficientes reais, precisamos de um resultado preliminar que é interessante em si mesmo. Lema 3.4.7. Sejam f (x) ∈ R[x] e α ∈ C um número complexo imaginário. Então f (α) = 0 se e só se f (α) = 0. Demonstração. Escrevemos f (x) = n X i=0 ai xi , ai ∈ R, 0 ≤ i ≤ n. Por hipótese f (α) = 0 = n X ai α i . i=0 Comecemos observando que, por um lado αi = αi ; por outro lado ai = ai para todo i = 0, . . . , n, pois ai ∈ R. 76 CAPÍTULO 3. POLINÔMIOS Tendo em conta que o conjugado de uma soma de números é a soma dos conjugados destes números, concluı́mos 0 = f (α) n X ai α i = i=0 = n X ai α i i=0 = f (α) o que termina a demonstração. Exemplo 3.4.8. No lema precedente é essencial que os coeficientes do polinômio sejam reais. Por exemplo se f (x) = x2 − ı, as duas raı́zes de f (x) são as raı́zes quadradas da unidade imaginária ı, isto é √ √ √ √ 2 2 2 2 +ı e − −ı . 2 2 2 2 O seguinte é um exercı́cio fácil que deixamos para o leitor. Exercı́cio 3.4.1. Seja f (x) ∈ R[x] um polinômio de grau 2. Mostre que f (x) é irredutı́vel sobre R se e somente se ele possui uma raiz imaginária. Seja f (x) ∈ R[x] um polinômio com coeficientes reais de grau n ≥ 1. Suponhamos que suas raı́zes em C sejam α1 , . . . , αr , α1 , . . . , αr , β1 , . . . , βs , onde αj é imaginária para todo j e βk é real para todo k. A fatoração de f (x) em C[x] pode ser escrita na forma f (x) = an (x−α1 )n1 (x−α1 )m1 · · · (x−αr )nk (x−αr )nk (x−β1 )m1 · · · (x−βs )ms . Por outro lado, um cálculo direto mostra que se α é imaginário, então o polinômio (x − α)(x − α) = x2 − 2ℜ(α)x + |α|2 , 3.4. IRREDUTIBILIDADE E FATORAÇÃO CANÔNICA 77 que é evidentemente um polinômio com coeficientes reais, é irredutı́vel (vide exercı́cio 3.4.1); se α = a + ıb, o polinômio acima também escreve-se como (x − a)2 + b2 , o que evidencia a existência de soluções imaginárias. Aplicando este cálculo à fatoração de f (x) concluı́mos n nr f (x) = an (x − a1 )2 + b21 1 · · · (x − ar )2 + b2r (x − β1 )m1 · · · (x − βs )ms . (3.5) Diremos que esta é a fatoração canônica real de f (x) Como vimos no exemplo 3.3.4, todos os fatores de grau 2 e 1 nesta fatoração são irredutı́veis em R[x]. Em particular, podemos enunciar o seguinte corolário: Corolário 3.4.9. Um polinômio com coeficientes reais é irredutı́vel se e somente se for de grau 1 ou de grau 2 com raı́zes imaginárias. Exemplo 3.4.10. O polinômio (x2 + 1)(x2 + 2) possui todas suas raı́zes imaginárias, mas é redutı́vel. Exemplo 3.4.11. Consideremos o polinômio f (x) = x4 + x2 + 1. Se ω é a raiz cúbica primitiva da unidade, é claro que ω e seu oposto −ω são raı́zes de f (x); logo ω e −ω também o serão. Estas são quatro raı́zes de f (x). Um cálculo direto mostra que a fatoração canônica real de f (x) é então f (x) = (x2 + x + 1)(x2 − x + 1). Agora nos resta compreender a fatoração canônica no caso racional; em outras palavras, precisamos saber que polinômios com coeficientes racionais podem aparecer como fatores irredutı́veis. Isto é um problema bem mais delicado como iremos vendo aos poucos. Uma forma de obter a fatoração canônica no caso racional de um polinômio Q[x], é de escrevermos primeiro a fatoração canônica real de f (x); se os fatores que aparecem nesta forem 78 CAPÍTULO 3. POLINÔMIOS polinômios com coeficientes racionais, pela unicidade da fatoração, esta será a fatoração canônica racional de f (x): com efeito, todo polinômio irredutı́vel em R[x] o será também em Q[x]. A fatoração canônica real do polinômio do exemplo 3.4.11 é então a fatoração canônica racional. Quais são os graus possı́veis de um polinômio irredutı́vel em Q[x] ? Analizaremos, para começar, alguns exemplos do que pode acontecer. Exemplo 3.4.12. Seja f (x) = x3 − 5. As raı́zes de f (x) são precisamente as três raı́zes cúbicas de 5, isto é, √ √ √ 3 3 3 5, ω 5, ω 2 5. É então claro que x3 − 5 = g(x)(x − √ 3 5), √ √ onde g(x) é o polinômio mônico de grau 2 em R[x] cujas raı́zes são ω 3 5, ω 2 3 5 (como exercı́cio o leitor poderia escrever explicitamente g(x)). É conhecido √ que 3 p é um número irracional sempre que p ∈ Z for um número primo (por quê ?). Concluı́mos então que f (x) é irredutı́vel. Outra forma de estudar o polinômio do exemplo 3.4.12 pode ser a partir da própria definição de irredutibilidade. Mais geralmente, seja f (x) ∈ Q[x] um polinômio de grau 3. Ele é redutı́vel se e somente se f (x) = f1 (x)f2 (x), com f1 (x) e f2 (x) polinômios com coeficientes racionais de graus 1 e 2 respectivamente. Em particular f1 (x) = ax + b para certos a, b ∈ Q, com a 6= 0. Mas então α := −b/a, que é um número racional, será raiz de f (x), necessariamente. Então, um polinômio de grau 2 será irredutı́vel quando não possuir raı́zes racionais. Em particular, isto mostra, de uma outra forma, que x3 − 5 é irredutı́vel; porém como sabemos, calcular as raı́zes de um polinômio de grau 3, salvo casos particulares, não é tarefa fácil. Mas no nosso raciocı́nio, precisamos apenas conhecer a natureza das raı́zes, isto é, não queremos calcular todas as raı́zes, mas apenas saber se há alguma racional: isto é muito mais fácil, como observaremos a continuação. Seja f (x) ∈ Z[x] um polinômio de grau n com coeficientes inteiros, ou seja n X f (x) = ai xi , an , . . . , a0 ∈ Z. i=0 3.4. IRREDUTIBILIDADE E FATORAÇÃO CANÔNICA 79 Suponhamos que α = p/q é uma raı́z racional de f (x) com p, q ∈ Z números primos entre si. Então f (p/q) = 0, ou, de maneira equivalente p q n f ( ) = 0, q isto é an pn + an−1 pn−1 q + an−2 pn−2 q 2 + · · · + a1 pq n−1 + a0 q n = 0. Portanto p divide a0 q n e q divide an pn . Como p e q são primos entre si, tanto p e q n como q e pn serão primos entre si; pelo teorema de Euclides no caso dos números inteiros, concluı́mos que p|a0 , q|an . (3.6) Estas relações de divisibilidade são conhecidas como condições necessárias para existência de raiz racional. No caso do polinômio x3 − 5, q só pode ser 1 ou −1 e p ∈ {1, −1, 5, −5}. As únicas raı́zes racionais deste polinômio podem ser então 1, −1, 5, −5; é facil de verificar que nenhum destes números anula o polinômio. Observação 3.4.13. (a) Se a0 = an = 1 as únicas raı́zes racionais possı́veis são 1 e −1. Isto mostra facilmente que o polinômio do exemplo 3.4.11 não possui raı́zes racionais; observe não obstante que ele é redutı́vel em Q[x], o que mostra que nosso método acima funciona apenas para polinômios de grau 3 (evidentemente também para polinômios de graus 1 e 2). (b) Se os coeficientes de f (x) forem números racionais da forma ai = bi , i = 0, 1 . . . , n, ci com bi , ci ∈ Z para todo i = 0, 1 . . . , n, escolhemos um múltiplo comum m dos denominadores (por exemplo o produto deles ou o mmc). É fácil constatar que mf (x) é um polinômio com coeficientes inteiros. Como as raı́zes de f (x) e de mf (x) são as mesmas, podemos aplicar o método acima a este último para saber se f (x) possui ou não raı́zes racionais. Resumindo, se f (x) for de grau 3, ou ainda menor, ele será irredutı́vel em Q[x] só quando não tiver raı́zes racionais; na direção contrária, se um polinômio, agora de qualquer grau maior que um, tiver uma raiz racional, digamos α ∈ Q, então será divisı́vel por x − α em Q[x]. Logo, todo polinômio de grau maior que um em Q[x] que possui raiz racional é redutı́vel. Vejamos agora um exemplo um pouco mais complicado. 80 CAPÍTULO 3. POLINÔMIOS Exemplo 3.4.14. Seja f (x) = 2x4 − 20x + 2. É f (x) irredutı́vel em Q[x] ? Encontrar todas as raı́zes de f (x) é ainda mais difı́cil que nos casos anteriores; além disto, corremos o risco de obtê-las de maneira aproximada, o que impederia de encontrar a fatoração canônica real e em conseqüência a correspondente fatoração racional. É fácil constatar que f (x) não posui raı́zes racionais, mas isto não implica que o polinômio seja irredutı́vel. Com efeito, não possuir raı́zes racionais nos diz apenas que f (x) não aceita fatores de grau um, como já sabemos (e utilizamos, novamente, acima). Conseqüêntentente, f (x) será redutı́vel em Q[x] só se pudermos escrever f (x) = 2g(x)h(x) com g(x) e h(x) polinômios mônicos de grau 2; ou seja, se existirem a, b, c, d ∈ Q tais que x4 − 10x + 1 = (x2 + ax + b)(x2 + cx + d). Neste caso, logo de desenvolver o produto de polinômios acima, deveremos ter c + a = 0, ac + b + d = 0, ad + bc = −10, bd = 1. Substituı́ndo c = −a nas duas equações do meio, obtemos b + d = a2 , a(d − b) = −10; donde: 10 10 , 2d = a2 − . a a Como bd = 1, multiplicando as duas equações temos 2b = a2 + a6 − 4a2 − 100. Ou seja que a2 é uma solução racional da equação com coeficientes inteiros y 3 − 4y − 100 = 0. Finalmente, é fácil constatar que esta equação não possui raı́zes racionais (observe que toda raiz racional desta equação deve ser inteira, positiva e menor que 10). Isto mostra que a suposição de termos uma fatoração de f (x) como produto de polinômios de grau dois, nos leva a uma contradição, demonstrando então que f (x) é efetivamente irredutı́vel. 3.5. MULTIPLICIDADE DE RAÍZES 81 Se considerarmos agora um polinômio de grau 5, as possı́veis fatorações (não triviais) são como produto de dois poinômios de graus 1 e 4, ou 2 e 3; não é difı́cil de imaginar que os argumentos utilizados no exemplo 3.4.14 possam ser adaptados, mas a complexidade dos cálculos cresce rezoavelmente. De fato, na medida que o grau do polinômio é maior, tanto maior será a complexidade dos cálculos. Isto torna inviável o tratamento da irredutibilidade nesta perspectiva, desde que o grau do polinômio é “sufucientemente grande”. Como veremos mais adiante, existe um critério muito eficaz que nos permite concluir que certo tipo de polinômios é irredutı́vel; infelizmente não existe um critério geral. Mas postergaremos esta análise para o último parágrafo do presente capı́tulo. 3.5 Multiplicidade de raı́zes Quando obtivemos a fatoração canônica de um polinômio f (x) ∈ C[x] em C[x], chamamos os expoentes de cada polinômio irredutı́vel (de grau 1) de multiplicidade ou ordem da raiz, digamos α, correspondente. Neste parágrafo analisaremos mais detalhadamente este conceito. De fato, caracterizaremos o conceito de multiplicidade de três maneiras: a primeira, em termos de de divisibilidade por potências do polinômio irredutı́vel (x − α); a segunda em função da anulação do polinômio f (x) e de outros polinômios associados a este, chamados de derivadas de f (x): é o critério das derivadas para a multiplicidade de uma raiz. Ambas caracterizações podem ser interpretadas como generalizações do teorema de Ruffini (corolário 3.3.7). Finalmente, caracterizaremos a multiplicidade de uma raı́z de f (x) em termos da multiplicidade com que aparece no mdc de f (x) e a sua primeira derivada f ′ (x). Proposição 3.5.1. Sejam f (x) ∈ D[x] e α ∈ C. Então α é uma raiz de multiplicidade m de f (x) se e somente se m é o maior inteiro positivo tal que (x − α)m divide f (x). Demonstração. Seja m como no enunciado da proposição. Consideremos a fatoração canônica complexa de f (x); nela f (x) escreve-se na forma f (x) = a(x − α)n q(x), onde a é o coeficiente lı́der de f (x) e q(x) é um produto de fatores da forma (x − β) com β 6= α; em particular q(α) 6= 0. Temos de mostrar que m = n. 82 CAPÍTULO 3. POLINÔMIOS Como (x − α)n |f (x), pela maximalidade de m temos diretamente que m ≥ n. Por outro lado observamos que d(x) := mdc(q(x), (x − α)m ) = 1: com efeito, como d(x)|(x−α)m , a unica raiz possı́vel para d(x) é α; mas d(x)|q(x) e α não é raiz de q(x). Como (x−α)m |f (X), do teorema de Euclides concluı́mos que (x − α)m divide (x − α)n , donde n ≥ m. Seja f (x) = n X i=0 ai xi ∈ D[x]. A Derivada de f (x) é o polinômio f ′ (x) := X iai xi−1 : i=1 é um polinômio em D[x]. Por indução matemática definimos as derivadas superiores de f (x). A derivada n-ésima f (n) (x) de f (x) é a derivada da derivada (n − 1)-ésima f (n−1) (x). Também denotaremos f ′′ (x) para a derivada segunda, f ′′′ (x) a terceira, f IV (x) para a quarta, etc. Observação 3.5.2. A proposição acima generaliza o teorema de Ruffini (corolário 3.3.7). Exemplo 3.5.3. Consideremos o polinômio 2 1 f (x) = x6 + x5 − x4 − 6x2 − 2. 3 7 Então 8 24 f ′ (x) = 2x5 + 5x4 − x3 − 12x, f ′′ (x) = 10x4 + 20x3 − x2 − 12. 7 7 O leitor pode calcular as restantes derivadas observando que a sexta sera constante e igual a 6!/3 e da sétima em diante nulas. Exercı́cio 3.5.1. Mostre que um polinômio tem grau n se e somente se f (n) (x) é uma constante não nula. O conceito de derivada pode ser definido para funções de uma variável num contexto muito mais alplo, o que é feito nos cursos de cálculo. Considerando um polinômio como uma tal função, a derivada definida desta forma 83 3.5. MULTIPLICIDADE DE RAÍZES coincide com nossa definição. O resultado na proposição abaixo é bem conhecido nos cursos de cáculo neste contexto mais geral; nos daremos uma demonstração da proposição adaptada ao nosso contexto podendo a leitura desta ser omitida sem comprometer a compreensão do conceito. Proposição 3.5.4. Sejam f (x), g(x) ∈ D[x]. temos (a) (f (x) + g(x))′ = f ′ (x) + g ′ (x). (b) Fórmula de Leibnitz: (f (x)g(x))′ = f ′ (x)g(x) + f (x)g ′ (x). Demonstração. A parte (a) é deixada para o leitor. Para demonstrar (b) escrevemos n m X X i f (x) = ai x , g(x) = bj xj . i=0 Então ′ f (x) = n−1 X j=0 i ′ iai x , g (x) = i=0 m−1 X jbj xj−1 . j=0 Pela fórmula do produto de polinômios temos f (x)g(x) = n+m X c k xk k=0 onde ck = a0 bk + · · · + ak b0 . Derivando f (x)g(x) escrito como acima, observamos que o coeficiente do termo de grau (k − 1)-ésimo é kck = k(a0 bk + · · · + ak b0 ). Por outro lado, pela mesma fórmula (do produto de polinômios) o coeficiente do termo de grau (k − 1) de f ′ (x)g(x) é (k − 1)a1 bk−1 + 2(k − 2)a2 bk−2 + · · · + (k − 1)ak−1 b1 + kak b0 ; analogamente o coeficiente do termo de grau (k − 1) de f (x)g ′ (x) é (k − 1)a0 bk−1 + (k − 1)a1 bk−1 + · · · + ak−1 b1 . Concluı́mos que o coeficiente do termo de grau (k − 1) de f ′ (x)g(x) + f (x)g ′ (x) é k(a0 bk + · · · + ak b0 ), donde segue a afirmação. 84 CAPÍTULO 3. POLINÔMIOS Exemplos 3.5.5. (a) Seja f (x) = (x − α)n . A derivada k-ésima de f (x) é n(n1 ) · · · (n − k)(x − α)n−k . (b) A derivada de um polinômio constante é evidentemente 0. Se h(x) = ag(x) com a ∈ D, pela fórmula de Leibnitz (proposição 3.5.4, parte (b)) teremos então h′ (x) = ag ′ (x). Demonstramos então o seguinte corolário da proposição 3.5.1: Corolário 3.5.6 (Critério da Derivada). Um número α ∈ C é raiz de um polinômio f (x) ∈ D[x], de multiplicidade m se e somente se f (α) = f ′ (α) = · · · = f (m−1) (α) = 0, f (m) (α) 6= 0. Demonstração. É claro que se m = 0 nada temos a provar. Então suporemos m > 0. Se α é raiz de multiplicidade m, pela propisição 3.5.1 (x − α)m |f (x) e (x − α)m+1 6 |f (x). Em particular f (x) = (x − α)m q(x); observe que então α nao é raiz de q(x) (veja a prova da proposição). Pela fórmula de Leibnitz f ′ (x) = m(x − α)m−1 q(x) + (x − α)m q ′ (x). (3.7) Então (x − α)m−1 divide f ′ (x) e (x − α)m não o divide: com efeito, caso contrário (x − α) dividiria q(x), o que não é possı́vel por hipótese; em particular, se m = 1 o corolário está demonstrado. Para demonstrar o caso geral procedemos por indução matemática em m. Suponhamos que m > 1. Pela fórmula (3.7), (m − 1) é a maior potência de (x − α) que divide h(x) := f ′ (x). Aplicando a hipótese de indução a h(x) concluı́mos que h(α) = h′ (α) = · · · = h(m−2) (α) = 0, h(m−1) (α) 6= 0. 85 3.5. MULTIPLICIDADE DE RAÍZES Como h(i−1) (x) = f (i) (x) para i = 1, . . . , m, por definição de derivada, obtemos a tese de indução. Reciprocamente, suponhamos que f (α) = f ′ (α) = · · · = f (m−1) (α) = 0, f (m) (α) 6= 0. Então α é uma raiz de multiplicidade, digamos, n: temos f (x) = (x − α)n q(x) onde, como já vimos, q(α) 6= 0. A primeira parte da prova nos mostra em particular que [f (α) = f ′ (α) = · · · = f (m−1) (α) = 0, f (n) (α) 6= 0, donde segue que m = n. Exemplos 3.5.7. (a) Consideremos o polinômio f (x) = ax2 + bx + c ∈ D[x], a 6= 0. Uma raiz α ∈ C de f (x) é dupla se e somente se f (α) = f ′ (α) = 0, f ′′ (α) 6= 0. Um cálculo fácil de derivadas mostra que f ′ (x) = 2ax + b, f ′′ (x) = 2a; observemos que f ′′ (x) é um polinômio constante não nulo e portanto a condição f ′′ (α) 6= 0 é automáticamente satisfeita. Então a condição para α ser raiz dupla é de ser uma raiz tal que 2aα + b = 0, isto é α=− b ; 2a substituı́ndo este valor de α em f (x) = 0 obtemos a b2 b2 − +c=0 4a2 4a que equivale b2 − 4ac = 0, nossa conhecida condição de discriminante nulo para a equação quadrática. (b) Encontraremos as raı́zes de f (x) = 2x4 + 5x3 + 3x2 − x − 1, 86 CAPÍTULO 3. POLINÔMIOS sabendo que possui uma raı́z tripla α. A raiz tripla tem de ser também raiz da derivada segunda, que é f ′′ (x) = 24x2 + 30x + 1 cujas raı́zes são −1 e −4. Como −1 também é raiz da derivada primeira f ′ (x) = 8x3 + 15x2 + 6x − 1 concluı́mos que α = −1. Então (x + 1)3 divide f (x); efetuando a divisão obtemos f (x) = (x + 1)3 (2x − 1), e então 1/2 é a raiz diferente de α. Exercı́cio 3.5.2. Trabalhando de maneira análoga a como fizemos no exemplo (a) acima reobtenha a condição de discriminante nulo para a existência de raiz de multiplicidade pelo menos 2 da equação cúbica na forma reduzida x3 + ax + b = 0. Do critério da derivada (corolário 3.5.6) concluı́mos imediatamente o seguinte corolário. Corolário 3.5.8. α é raı́z de multiplicidade m de f (x) se e somente se α é raiz de multiplicidade m − 1 de f ′ (x). Observação 3.5.9. O corolário precedente pode ser generalizado da seguinte forma: Sejam f (x) ∈ D[x] um polinômio de grau n e α ∈ C; fixemos um inteiro k tal que 1 < k < n. Então α é raı́z de multiplicidade m de f (x) se e somente se α é raiz de multiplicidade m − k da derivada k-ésima f (k) (x) de f (x). Exercı́cio 3.5.3. Demonstre a generalização do corolário 3.5.8 enunciada na observação precedente. Proposição 3.5.10. Sejam f (x) ∈ D[x] e α ∈ C; denotemos d(x) := mdc(f, f ′ ). Então α é raiz de multiplicidade m de f (x) se e somente se ela é raiz de multiplicidade m − 1 de d(x). 3.5. MULTIPLICIDADE DE RAÍZES 87 Demonstração. Suponhamos que α seja raiz de multiplicidade m de f (x); pelo corolário 3.5.8 α é raiz de multiplididade m − 1 de f ′ (x). Então (x − α)m divide f (x) mas (x−α)m+1 não o divide e (x−α)m−1 divide f ′ (x) mas (x−α)m não o divide; como caso particular temos que (x − α)m−1 divide f (x) e f ′ (x). Por outro lado, pelo teorema 3.3.28 existem polinômios h(x), k(x) tais que d(x) = f (x)h(x) + f ′ (x)k(x). Concluı́mos que (x − α)m−1 divide d(x), mas (x − α)m nao o faz, pois se o dividisse, também dividiria f ′ (x). Então α é raiz de multiplicidade m − 1 de d(x). Reciprocamente, suponhamos que α é raiz de multiplicidade m de d(x). Como (x − α)m−1 divide d(x), também dividirá f (x) e f ′ (x) pela proposição 3.3.10; donde tiramos que a multiplicidade de f ′ (x) é pelo menos m − 1 e então a de f (x) pelo menos m pelo corolário 3.5.8. Como (x − α)m não divide d(x) então não pode dividir f (x) e f ′ (x) ao mesmo tempo, mas já sabemos que divide f (x); portanto não divide f ′ (x) o que nos diz que α é raiz de multiplicidade m − 1 de f ′ (x) e (exatamente) m de f (x), de novo pelo corolário 3.5.8. Isto termina a demonstração. A proposição 3.5.10 fornece uma outra abordagem para o cálculo das raı́zes múltiplas de um polinômio. A tı́tulo de exemplo resolveremos, desde esta nova ótica, o exercı́cio 3.5.2. Exemplo 3.5.11. Consideremos o polinômio f (x) = x3 + ax + b ∈ C[x]. Sua derivada é f ′ (x) = 3x2 + a. Executando o algorı́tmo de Euclides vemos que o último resto parcial diferente de zero é de fato constante (isto é, que não depende mais de x) e vale 27b2 + a, ou b 4a2 dependendo que a 6= 0 ou a = 0. No caso onde a 6= 0, podemos escrever este resto D − 2, 4a onde D é o discriminante da equação f (x) = 0. Em qualquer caso, do corolário precedente concluı́mos então que f (x) possui raı́zes múltiplas se e 88 CAPÍTULO 3. POLINÔMIOS somente se D = 0, o que demonstra novamente que a anulação do discriminante equivale à existência de soluções múltiplas de uma equação cúbica (na forma reduzida). O exemplo nos mostra um caminho para definir o discriminante de um polinômio genérico (isto é pensando os coeficientes como “indeterminadas”) da forma f (x) = xn + an−1 xn−1 + · · · a1 x + a0 . Como os coeficientes são genéricos, ao executar o algorı́tmo de Euclides, o primeiro resto parcial é um polinômio onde aparece xn−2 , no segundo aparece xn−3 , e assim por diante, até chegarmos no caso em que o resto parcial correspondente não mais depende de x; se dividirmos mais uma vez o resto será necessariamente nulo. Este último resto não nulo é uma expressão polinomial nos coeficientes an−1 , . . . , a1 , a0 de f (x) com números racionais como coeficientes (observe que já quando dividimos f (x) por f ′ (x) o coeficiente do primeiro termo do quociente é 1/n). Extraı́ndo comum denominador nestes coeficientes racionais escrevemos este resto parcial como um quociente cujo numerador é uma expressão polinomial em a0 , a1 , . . . , an−1 , mas agora com coeficientes inteiros; denotemos esta expressão ∆ = ∆(a0 , a1 , . . . , an−1 ). Pela proposição 3.5.10 existem raı́zes múltiplas de f (x) se e somente se f (x) e f ′ (x) não são primos entre si, isto é, se e somente se d(x) 6= 1. Mas d(x) 6= 1 significa que no algorı́mo de Euclides o último resto parcial diferente de zero tem que ser um polinômio de grau ≥ 1. Então este resto parcial não pode ser independente de x; isto significa que nosso ∆ acima deve ser nulo. Motivados pelo raciocı́nio que fizemos, podemos definir ∆ como o discriminant de f (x) pois a sua anulação equivale à existência de raı́zes múltiplas (o sinal deste é irrelevante no que diz respeito a existência de soluções múltiplas); observe em particular que o raciocı́nio independe da natureza dos coeficientes a0 , a1 , . . . , an de f (x). Exercı́cio 3.5.4. (a) Calcule o discriminante δ dos seguintes polinômios (no caso da equação cúbica compare com o visto no capı́tulo 1. f (x) = x3 + ax2 + bx + c, g(x) = x4 + px2 + qx + r. (b) Modificando adequadamente o raciocı́nio feito acima, defina o discriminante ∆(a0 , . . . , an ) para um polinômio genérico de grau n que não seja 3.6. LEMA DE GAUSS E CRITÉRIO DE EINSENSTEIN 89 mômico; teste seu resultado com polinômios de graus 3 e 4, comparando com a parte (a). Terminamos o parágrafo com o seguinte corolário, cuja demonstração é deixada como exercı́cio para o leitor. Corolário 3.5.12. O polinômio f (x) mdc(f, f ′ ) é um polinômio cujas raı́zes são as raı́zes de f (x), todas de multiplicidade 1. Exercı́cio 3.5.5. Considere o polinômio f (x) = x5 − 13x4 + 68x3 − 176x2 + 220x − 100. Encontre o polinômio mônico cujas raı́zes simples são as raı́zes de f (x), todas com multiplicidade 1. 3.6 Lema de Gauss e Critério de Einsenstein Agora retomamos o estudo da irredutibilidade em Q[x]. Seja f (x) ∈ Q[x], isto é pn p1 p0 f (x) = xn + · · · + x + , qn q1 q0 onde pi , qi ∈ Z saõ inteiros primos entre si. Se m := mmc(q0 , · · · , qn ) é o mı́nimo múltiplo comum de todos os denominadores, então m é o menor número positivo tal que mf (x) é um polinômio com coeficientes inteiros; denotemos g(x) = mf (x). Evidentemente f (x) será irredutı́vel sobre Q se e somente se g(x) o é, pois ambos polinômios diferem por uma constante multiplicativa, que é um divisor trivial em Q[x]. Porém, o polinômio g(x) tem uma vantagem de termos de trabalhar com números inteiros: observe por exemplo que se quisermos implementar um algoritmo em computador para decidir sobre a irredutibilidade de um determinado polinômio, é de se esperar que isto só possa ser feito trabalhando com números inteiros, pois um número racional é substituı́do pelo computador apenas por uma de suas aproximações decimais. Por outro lado, não é claro por enquanto que isto possa nos ajudar a decidir se g(x) é ou não é irredutı́vel sobre Q. Vejamos não obstante um exemplo concreto onde decidimos sobreum polinômio g(x) ser ou não irredutı́vel em Z[x], de forma a podermos “imaginar” um eventual algorı́tmo. 90 CAPÍTULO 3. POLINÔMIOS Exemplo 3.6.1. Consideremos o polinômio g(x) = x4 − 5x + 2 ∈ Z[x] Para começar, é claro que o conteúdo c(g) de g(x) é 1. É fácil observar que g(x) não possui raı́zes racionais, logo o polinômio não pode ser fatorado como produto de dois polinômios de graus 1 e 3 respectivamente. Suponhamos a continuação que g(x) = (αx2 + βx + γ)(α′ x2 + β ′ x + γ ′ ), onde todos os coeficientes são inteiros. Como g(x) é mônico, αα′ = 1, e então ou α = α′ = 1, ou α = α′ = −1. Multiplicando, quando no segundo caso, por (−1)(−1) = 1, podemos finalmente escrever g(x) = (x2 + ax + b)(x2 + cx + d), a, b, c, d ∈ Z. Ou seja x4 − 5x + 2 = x4 + (a + c)x3 + (b + d + ac)x2 + (ad + bc)x + bd; Obtemos o seguinte sistema de equaçãoes diofantinas (isto é, com coeficientes inteiros e cujas soluções são procuradas em Z) a + c = 0, b + d + ac = 0, ad + bc = −5, bd = 1. Da última equação deduzimos b = 1, d = 2 ou b = 2, d = 1 ou b = −1, d = −2 ou b = −2, d = −1. Substituı́ndo c = −a na terceira equação, vemos facilmente que nenhuma das quatro possibilidades para b e d podem efetivamente acontecer. Concluı́mos então que g(x) é irredutı́vel sobre Z. Qual é a relação entre a irredutibilidade em Z[x] e em Q[x] ? Se pudermos responder a esta pergunta, de repente poderiamos nos auxiliar da maior facilidade de lidar com números inteiros, para decidirmos se um polinômio é ou não é irredutı́vel sobre Q. Começamos demonstrando a proposição 3.3.20, que nos dá certa informação nesta direção. Demonstração da Proposição 3.3.20 Suponhamos que g(x) ∈ Z[x] tem conteúdo 1. Se g(x) for redutı́vel sobre Z, então g(x) = h(x)k(x) 3.6. LEMA DE GAUSS E CRITÉRIO DE EINSENSTEIN 91 com h(x), k(x) ∈ Z[x] polinômios de grau maior que 0, já que c(g) = 1. Esta fatoração também é válida em Q[x], mostrando que g(x) também será redutı́vel em Q[x], donde segue a nossa proposição. Mas o quê que acontece na direção contrária ? isto é, quando g(x) for redutı́vel em Q, poderá ou não sê-lo em Z[x] ? Para responder a esta pergunta começamos com um resultado técnico que é a chave para responder a estas perguntas. Usualmente a demonstração deste faz parte da demonstração do resultado principal (teorema 3.6.3 abaixo), ambos conhecidos na literatura como Lemma de Gauss. Nos reservaremos esta denominação para o teorema. Lema 3.6.2. Se g(x), h(x) ∈ Z[x] são polinômios com coeficientes interos, então c(gh) = c(g)c(h). Demonstração. Faremos a demonstração em duas etapas: 1. Nesta primeira etapa mostraremos que c(g)c(h) e c(gh) possuem os mesmos divisores primos. Se n m X X i g(x) = ai x , h(x) = bj xj , i=0 j=0 como sabemos, o coeficiente k-ésimo de g(x)h(x), digamos ck , escreve-se na forma ck = a0 bk + a1 bk−1 + · · · + ak−1 b1 + ak b0 , onde evidentemente aℓ = 0 se ℓ > n e bℓ = 0 se ℓ > m. Se p é um divisor primo de todos os coeficientes de g(x), isto é, se p é um primo tal que p|c(g), é claro que p|ck para todo k = 0, 1, . . . , n + m, ou seja p|c(gh); analogamente p|c(h) implica p|c(gh). Reciprocamente, seja p um primo que divide c(gh). Suponhamos por absurdo que p não divide o produto c(g)c(h), donde p não divide c(g) nem c(h). Então g(x) e h(x) possuem coeficientes que não são múltiplos de p; sejam k ∈ {0, 1, . . . , n} e ℓ ∈ {0, 1, . . . , m} sub-ı́ndices tais que p|a0 , . . . , ak−1 , b0 , . . . , bℓ−1 , e p 6 |ak , p 6 |bℓ . Por outro lado, o coeficiente (k + ℓ)−ésimo de g(x)h(x) é ck+ℓ = a0 bk+ℓ + · · · + ak−1 bℓ+1 + ak bℓ + ak+1 bℓ−1 + · · · + ak+ℓ b0 . 92 CAPÍTULO 3. POLINÔMIOS Como p|ck+ℓ concluı́mos que p|ak bℓ o que fornece uma contradição. Então a primeira etapa da demonstração está completa. 2. Escrevendo g(x) = c(g)g1 (x), h(x) = c(h)h1 (x), obtemos g(x)h(x) = c(g)c(h)g1 (x)h1 (x); observemos que g1 (x) e h1 (x) são polinômios de conteúdo 1. Pelo demonstrado na primeira etapa, c(g1 )c(h1 ) = 1 se e somente se c(g1 h1 ) = 1, donde segue que c(g)c(h) é o conteúdo de g(x)h(x), terminando a demonstração. Suponhamos agora que f (x) é um polinômio em Z[x] que é redutı́vel sobre Q; então existem polinômios g0 (x), h0 (x) ∈ Q[x] não constantes, tais que f (x) = g0 (x)h0 (x). Sejam m1 e m2 os menores inteiros positivos tais que g(x) := m1 g0 (x) ∈ Z[x], h(x) := m2 h0 (x) ∈ Z[x]. Utilizando o lema 3.6.2, obtemos m1 m2 f (x) = g(x)h(x) = c(g)c(h)g1 (x)h1 (x) = c(gh)g1 (x)h1 (x), onde, como na demonstração do lema precedente, g1 (x) e h1 (x) tem conteúdo 1. Suponhamos que f (x) é irredutı́vel sobre Z; então c(f ) = 1. Portanto, aplicando o lema 3.6.2 ao polinômio m1 m2 f (x), deduzimos que c(gh) = m1 m2 . Então f (x) = g1 (x)h1 (x), o que contradiz a irredutiblidade de f (x) sobre Z. Isto demonstra o Lemma de Gauss: Teorema 3.6.3 (Lema de Gauss). Se f (x) ∈ Z[x] é irredutı́vel sobre Z, então também o será sobre Q. 3.6. LEMA DE GAUSS E CRITÉRIO DE EINSENSTEIN 93 Exemplo 3.6.4. Consideremos o polinômio 1 2 k(x) = x4 − x + . 5 5 Pelo exemplo 3.6.1, o polinômio 5k(x) é irredutı́vel sobre Z; então k(x) é irredutı́vel sobre Q, pois, pelo teorema, 5k(x) o é. Para terminar este parágrafo enunciaremos sem demonstração o critério de Eisenstein, que é um dos poucos critérios conhecidos para tratar a irredutibilidade sobre Z, que pelo lemma de Gauss (teorema) é essencialmente equivalente à irredutibilidade sobre Q (de acordo à proposição 3.3.20 o polinômio em Z[x] considerado deve ter conteúdo 1). O leitor interessado em estudar a demonstração deste belo teorema pode consultar [4, ...]; uma versão mais geral do critério pode ser encontrada em [3, Teo. III.2.8] Teorema 3.6.5 (Critério de Eisenstein). Seja f (x) = an xn + · · · + a1 xa0 ∈ Z[x]. Suponhamos que existe um número primo p tal que (i) p 6 |an , (ii)p|a0 , a1 , . . . , an−1 , (iii)p2 6 |a0 . Nestas condições, f (x) é irredutı́vel em Z[x] Exemplos 3.6.6. (a) Consideremos os seguintes polinômios f (x) = x3 +2x+10, g(x) = 2x7 +6x2 −18, h(x) = 5x6 +70x4 = 14x3 +98x−28. p = 2 está nas hipóteses do teorema referente ao polinômio f (x). Então o critério se aplica e f (x) é irredutı́vel sobre Z, logo sobre Q. Como 18 = 232 , no caso de g(x) o critério não se aplica, pois p = 2 divide o coeficiente lı́der de g(x) e 32 divide o coeficiente do termo independente; ou seja que nada podemos afirmar neste caso. Finalmente, h(x) também é irredutı́vel sobre Q, pois o critério se aplica com p = 7; observe que não se aplica com p = 2. (b) O critério se aplica com p = 2 ou p = 5 para o polinômio f (x) = 6 x + 10. (c) O polinômio xn + 5 é irredutı́vel sobre Q para todo n ∈ N: basta pegar p = 5; analogamente para xn + p, para todo primo p. Como foi evidenciado nos exemplos, o Critério não pode ser aplicado para cqualquer polinômio. Um momento de reflexão, nos convencerá do seguinte fato que são raros os polinômios para os quais o Critério de Eisenstein é aplicável, pois o primo p do enuneciado está sujeito a condições bastante 94 CAPÍTULO 3. POLINÔMIOS restritivas. Porém, polinômios para os quais o critério náo se aplica podem as vezes ser “modificados” de forma a poderemos aplicar o critério. Vejamos do que estamos falando: Se f (x) ∈ Z[x] e a ∈ Z, é facil ver que f (x) = g(x)h(x) =⇒ f (x + a) = g(x + a)h(x + a), pois basta substituir x por x + a na igauldade da esqueda para obtermos aquela da direita e, reciprocamente. Como a ∈ Z, a expressão f1 (x) := f (x + a) é um polinômio em Z[x]; analogamente para g1 (x) := g(x + a) e h1 (x) := h(x + a). Isto mostra que f (x) será irredutı́vel (sobre Z) se e somente se f1 (x) o for. Como aplicação do “truque” acima, vamos demonstrar, no exemplo abaixo, a irredutibilidade de um polinômio muito especial. Como veremos no próximo capı́tulo, este polinômio esta estreitamente vı́nculado à construtibilidade com régua e compasso de polı́gonos regulares. Exemplo 3.6.7. Seja n ∈ N. O Polinômio Ciclotômico (n+1)-ésimo, denotado φn+1 (x), é o quociente de dividir xn+1 −1 por x−1: um cálculo direto mostra que φn+1 (x) = xn + xn−1 + · · · + x + 1. Decidir sobre a irredutibilidade deste polinômio, para um certo valor de n, nos permite, a posteriori, decidir sobre a construtibilidade com régua e compasso de um polı́gono regular de (n + 1) lados (veja página ??). Evidentemente o critério de Eisenstein não se aplica para este polinômio. Consideremos, por simplicidade, o caso n = 4. Então φ5 (x) = x4 + x3 + x2 + x + 1. Com um pouco de paciência, podemos substituir x por x + 1 em φ5 (x) para obtermos φ5 (x + 1) = x4 + 5x3 + 10x2 + 10x + 5, que é irredutı́vel pelo critério de Eisenstein aplicado com p = 5. De fato, se n + 1 = p é um primo qualquer, mostra-se analogamente, o que deixamos como exercı́cio para o leitor, que φp (x) é irredutı́vel (sugestão: use o binômio de Newton para desenvolver (x + 1)ℓ para ℓ = p − 1, . . . , 2. 3.7. EXERCÍCIOS 3.7 95 Exercı́cios 3.7.1 Demonstre que se f (x), g(x) são polinômios associados, digamos em D[x], então f (x) é irrédutı́vel se e somente se g(x) é irrédutı́vel. Dê exemplos de pares de polinômios com coeficientes em Z que não são associados em Z[x] mas sim em Q[x]. 3.7.2 Sejam f (x), g(x) polinômios associados em Q[x]. Mostre que f (x) e g(x) também são associados em R[x] e C[x]. 3.7.3 Encontre mdc(f, g) onde f (x) e g(x) são os seguintes pares de polinômios x4 + x3 + 2x2 + x + 1 e x3 + 4x2 + 4x + 3 4x5 + 7x3 + 2x2 + 1 e 3x3 + x + 1 x4 + x3 + 2x2 + 3x + 1 e x4 + x3 − 2x2 − x + 1 3.7.4 No exercı́cio precedente, encontre a(x), b(x) tais que mdc(f, g) = a(x)f (x) + b(x)g(x). 3.7.5 Demonstre as seguintes afirmações onde a(x), b(x), c(x) ∈ D[x] são polinômios e D é um corpo (sugestão: faça uma revisão das principais propriedades do mdc que apreendeu no curso de aritmética) a) Se a(x)|b(x) e mdc(b, c) = 1, então mdc(a, c) = 1. b) Se a(x)|c(x), b(x)|c(x) e mdc(a, b) = 1, então a(x)b(x)|c(x). c) Se d(x) = mdc(a, b), então a(x) = d(x)a′ (x) e b(x) = d(x)b′ (x) com mdc(a′ , b′ ) = 1. 3.7.6 Calcule o mmc dos pares de polinômios do exercı́cio 3.7.3. 96 CAPÍTULO 3. POLINÔMIOS 3.7.7 Seria capaz de definir o máximo divisor comum e o mı́nimo múltiplo comum de três ou mais polinômios ? Em caso afirmativo, dê uma definição, pelo menos no caso de três polinômios; construa exemplos. 3.7.8 Obtenha a decomposição em fatores mônicos irredutı́veis em R[x] para os seguintes polinômios: a) x4 − 1, b) x4 + x2 + 1, c) x5 − 1, d) f (x) = x4 − 2x3 + 2x2 − 2x + 1; observe que f (ı) = 0. 3.7.9 Considere o polinômio f (x) = x3 + αx + 1 com α ∈ R a) Encontre α sabendo que 1/2 é raiz de f (x). b) Encontre a decomposição de f (x) em fatores mônicos irredutı́veis em R[x]. 3.7.10 Indique quais dos seguintes polinômios são redutı́veis em R[x] e/ou em Q[x] (justifique).√ a) x3 + 2x2 − x + 1, b) x2 + x − 2, c) x4 + 3x2 + 2. 3.7.11 Considere o polinômio f (x) = x6 − 1 (lembre a representação geométrica das raı́zes de um número complexo). a) Mostre que f (x) possui unicamente duas raı́zes reais; quais são estas raı́zes ? b) Deduza que f (x) é o produto de quatro fatores irredutı́veis em R[x]: dois de grau um e dois de grau 2. 3.7.12 Encontre as raı́zes múltiplas, com as suas respectivas ordens, dos seguintes polinômios: 97 3.7. EXERCÍCIOS a) 31 x3 − x2 + x, b) x5 − 4x4 + 4x2 , c) f (x) = x4 − 2x3 + 2x2 − 2x + 1. 3.7.13 Considere o polinômio f (x) = x3 + αx2 + 3x + 1 com α ∈ C. Encontre α para que f (x) possua uma raiz múltipla de ordem três; qual é a raiz ? 3.7.14 Faça o exercı́cio 3.7.12 utilizando o mdc. 3.7.15 Considere o polinômio f (x) = x4 + ax3 + (b + 1)x2 + ax + b, com a, b ∈ R. a) Mostre que f (x) = (x2 + ax + b)(x2 + 1). b) Encontre a e b para que x − 1 e x − 2 dividam f (x). c) Idem que na parte b) mas para que x2 + 2 divida f (x). 3.7.16 Encontre o polinômio mônico de grau três que possui as raı́zes 4, 1 + 3ı, 1 − 3ı. 3.7.17 Construa polinômios mônicos com coeficientes reais, e de grau o menor possı́vel, de forma que: a) Contenha a raiz −3 dupla e 2 simples. b) Idem que na parte a) mas com (2 + ı) dupla e 1 simples. 3.7.18 Achar o polinômio mônico cujas raı́zes tenham ordem 1 de forma que estas também sejam raı́zes de f (x) := x5 − 13x4 + 68x3 − 176x2 + 220x − 100. Deduza a decomposição em fatores mônicos irredutı́veis de f (x). 98 CAPÍTULO 3. POLINÔMIOS 3.7.19 Considere um polinômio da forma f (x) = x4 + ax2 + bx + 25, a, b ∈ R. Sabendo que f (x) possui raı́zes da forma α, −α, β, −β, encontre a, b, α e β. 3.7.20 Encontre o menor inteiro positivo m tal que mf (x) ∈ Z[x], e logo calcule c(mf ), para os seguintes polinômios f (x): 9 27 1 34 6 3 30 4 f (x) = x3 − x2 + x − ; f (x) = x4 + x − x− . 8 4 30 45 110 49 13 3.7.21 Estude a irredutibilidade em Q[x] dos seguintes polinômios: a) x4 + 2x3 + 2x2 + 2x + 2, b) 8x7 − 31, c) x6 + 15, d) x3 + 30x2 + 5x + 25, e) 7x4 + 10x3 + 20x2 + 30x + 22, f) 2/3x6 − 1/2x + 1, g) x4 + x − 1, h) 6x10 − 9x + 18. 3.7.22 Sabendo que m é uma raiz inteira da equação x2 − 289 = 0, mostre que o polinômio f (x) = x2n + mxn + 102 é irredutı́vel sobre Q para todo n ∈ N. 3.7.23 (a) Se f (x), g(x) ∈ Z[x], demonstre que o mdc dos conteúdos de f (x) e de g(x) divide o conteúdo de f (x) + g(x), que denotamos c(f + g), ou seja: mdc(c(f ), c(g))|c(f + g); com um exemplo mostre c(f + g) pode não dividir mdc(c(f ), c(g)). (b) Se m(x) ∈ Z[x] é um monômio, isto é, um polinômio com um único termo, demonstre diretamente (sem utilizar o lema de Gauss) que c(mf ) = c(m)c(f ), onde f (x) é como na parte (a). 99 3.7. EXERCÍCIOS 3.7.24 Seja g(x) = x4 + b onde b ∈ Z é um inteiro que possui pelo menos um divisor primo p tal que p2 6 |b. Mostre que g(x) é irredutı́vel. É o polinômio xn + b irredutı́vel para todo n ∈ N ? 3.7.25 Demonstre que o polinômio ciclotômico φ7 (x) é irredutı́vel sobre Q (fazendo a mudança de variáveis x = y + 1) e que o polinômio ciclotômico φ6 (x) é redutı́vel sobre Q. 3.7.26 Considere o polinômio f (x) = 2x3 + 5x + 5p, onde p é um número primo arbitrário. Analise a irredutibilidade de f (x) em Q[x]. 3.7.27 Idem que no exercı́cio precedente para os polinômios (a) f (x) = x4 + 7x2 + 7p, onde p é um primo. (b) g(x) = x3 + 3px2 + 5qx + pq, onde p, q são primos. 100 CAPÍTULO 3. POLINÔMIOS Bibliografia [1] G. Ávila, Variáveis Complexas e Aplicações, Livros Técnicos e Cientı́ficos Editoda, 1996. [2] A. E. S. Berra, G. Fernández, Álgebra y Cálculo Nunmérico, Editorial Capeluz, Buenos Aires, 1960. [3] A. Garcia, Y. Lequain, Elementos de Álgebra, Projeto Euclides, Impa, 2001. [4] A. Gonçalves, Introdução à Álgebra, Impa, quarta edição, 1999. [5] M. Lemle, Conhecimento e biologia, Ciência Hoje, vol. 31, 132, 2002, pags. 34-41. [6] E. L. Lima, Curso de Análise, vol 1, Projeto Euclides, Impa, sexta edição, 1989. [7] E. L. Lima, Curso de Álgebra Linear, Matemática Universitária, Impa, [8] E. Wagner, Construções Geométricas, SBM...... 101