Notas de Curso
Ivan Pan
28 de Maio de 2008
2
Capı́tulo 1
Números Complexos
Começaremos este capı́tulo fazendo uma brevı́ssima introdução aos sistemas
numéricos (poderı́amos dizer, números reais) cuja única intenção é chamar
a atenção do leitor para, em primeiro lugar, a naturalidade da concepção de
número real e, em segundo lugar, da necessidade de construir os números
complexos na medida que queremos desenvolver uma teoria razoável das
equações algébricas. Ou seja, ao desenvonvolvermos o conceito de número,
na parte introdutória do capı́tulo, isso não será suficiente, nem minimamente,
para que um leitor leigo possa apreender como utilizá-los sem antes ter tido
um apreendizado, nem que seja superficial, abordando este conceito; vamos
começar argumentando com alguns exemplos do cotidiano e logo depois com
exemplos mais abstratos vinculados à resolução de equações, de forma a sugerir que a “invenção” dos números é bem mais natural do que muitas vezes
pode parecer. Logo após, introduziremos o conceito de número complexo,
e estudaremos detalhadamente as suas propriedades básicas. Finalmente,
formalizamos a concepção de algumas estruturas algébricas estreitamente relacionadas aos sistemas numéricos.
1.1
Introdução
Os números que conhecemos são de fato de natureza diversa, o que está associado de forma bastante clara à utilização que fazemos deles. Por exemplo,
contamos objetos de qualquer tipo com os números 1, 2, 3, . . . , etc; estes são
os chamados Números Naturais; denotamos por N o conjunto constituı́do
por estes números e suporemos que o número 0 está em N. Sem dúvida, os
3
4
CAPÍTULO 1. NÚMEROS COMPLEXOS
naturais é o primeiro tipo de números que a humanidade concebeu; mesmo
antes de possuir uma linguagem tão evoluı́da como a que hoje possuı́mos, já
sabı́amos contar: basta constatar a presença de um objeto, e logo a de um outro objeto diferente sem ter esquecido a do primeiro, que estamos contando.
1
.
Suponhamos agora que uma determinada pessoa que usufrui das vantagens (ou desvantagens) do chamado cheque especial, paga uma dı́vida de 200
reais com um cheque quando há na sua conta bancária tão somente 123 reais.
Assim que o cheque for descontado pela administração do banco, dizemos que
ficamos com “saldo negativo” de 77 reais, que poderı́amos convencionar escrever na forma -77 R$; estamos então insinuando a existência de números
muito parecidos com os naturais, mas com uma qualidade especial que os faz
opostos (ou simétricos) com aqueles em certo sentido: se depositarmos 77
reais na nossa conta (logo depois de contrairmos a dı́vida com o banco para
não termos de pagar juros), o resultado é que ficamos sem dinheiro e sem
dı́vida, isto é: -77+77=0. O conjunto dos naturais acrescentado destes novos
“naturais negativos” é o que chamamos de Números Inteiros; denotaremos
por Z o conjunto dos números inteiros. Resumindo, e de maneira heurı́stica,
podemos dizer que estes números permitem-nos contar “para frente e para
trás”.
Quando precisamos dividir alguma coisa (por exemplo um bolo) em partes iguais, os números inteiros não são adequados para “contar” as diferentes
partes, pois precisamos de uma contagem das partes, relativa ao todo, de
forma a sabermos quanto do total do bolo as respectivas partes representam; podemos pensar nesta contagem relativa em contraposição à contagem
“absoluta” realizada com os números naturais. Estamos então obrigados a
introduzir o conceito de fração. Dizemos que comemos dois terços do bolo ou
que ficamos uma meia hora esperando, etc; também precisamos de frações negativas, pois também podemos dever meia hora de trabalho ao nosso serviço
por termos saı́do antes no dia anterior. Estes novos números são os Números
Racionais que nos permitem de certa forma, contar, para frente e para trás,
de maneira “relativa”; como também podemos comer o bolo inteiro comendo
todas as partes em que foi previamente dividido, os números inteiros deveriam ser considerados como casos particulares de números racionais. O
conjunto dos números racionais será denotado por Q.
1
Pesquisadores de Biolingüı́stica acreditam hoje que mesmo crianças com pocos meses
de vida sabem contar até três (ver por exemplo [5] e artigos relativos)
5
1.1. INTRODUÇÃO
Finalmente, quando tentamos medir a diagonal de um triângulo retângulo,
pode acontecer (e de fato acontece “quase sempre” embora esta afirmação
não seja tão simples de ser demonstrada rigorosamente) que o resultado da
medição, não seja uma fração; porém deveria de existir um número com sua
medida, já que tanto as diagonais de triângulos como seus comprimentos parecem existir. Para entender isto, consideremos um triângulo retângulo cujos
catetos têm comprimento 1. Pelo teorema de Pitágoras, o comprimento da
diagonal deveria ser um número a tal que
a2 = 2.
Suponhamos que a = p/q onde p e q são números inteiros sem fatores comuns
(isto é, cujo máximo divisor comum é 1), ou seja, suponhamos que a é um
número racional. Vamos ver que isto nos conduz a uma contradição. Com
efeito, neste caso a = p2 /q 2 donde
p2 = 2q 2 .
Como p divide 2q 2 e não divide q (logo não divide q 2 ), terı́amos que p divide
2; para isto acontecer, deveriamos ter p = 1 ou p = 2 (e então p2 = 4), o que
não é possı́vel como o leitor poderá facilmente verificar.
O conjunto dos números que permitem representar com precisão qualquer
medida de um certo comprimento, como por exemplo aquele da diagonal de
um triângulo retângulo, ou o negativo de qualquer comprimento, chamase o conjunto dos Números Reais, que denotaremos R (tente dar alguma
utilidade para os comprimentos negativos !). O leitor pode observar que
enquanto os racionais podem ser construı́dos tomando frações de números
inteiros e os inteiros tomando opostos (negativos) de números naturais, ou
seja, que em última instância parece bastar a existência dos naturais para
chegarmos à existência dos racionais.Os números reais possuem uma natureza
um tanto diferente, pois não podem ser construı́dos a partir de números “mais
simples” por meio de operações elementares (soma, substração, multiplicação
e divisão); de fato, os primeiros reais não racionais que conseguimos conceber,
a partir de nosso exemplo, provém de realizar uma operação de natureza
diferente, a raiz quadrada.
É sabido que todo número real positivo possui duas raı́zes também reais,
uma positiva e uma negativa (a prova deste resultado não é inteiramente
banal e se faz nos cursos de análise real: veja por exemplo [6, Cap. III, §3]).
Por definição de raiz quadrada, esta pode ser extraı́da daqueles números reais
que forem positivos ou zero.
6
CAPÍTULO 1. NÚMEROS COMPLEXOS
Observe-se que, de acordo com o que temos concluı́do acima, temos as
seguintes inclusões estritas de conjuntos
N ⊂ Z ⊂ Q ⊂ R.
Vejamos agora como os diferentes conjuntos de números que conhecemos surgem naturalmente como uma necessidade, na tentativa de resolver
equações polinomiais.
Consideremos a equação linear
ax + b = 0,
onde a, b ∈ R. Se a = 0, então não temos equação alguma (pois a incógnita
sumiu !); então suponhamos que a 6= 0. Como sabemos desde o ensino
fundamental, se a 6= 0, o único valor possı́vel de x é
b
x=− .
a
Para obter este resultado, devemos somar o oposto −b de b aos dois lados da
igualdade (pois duas magnitudes iguais não podem ser alteradas ao somar um
mesmo número a cada uma delas) e logo devemos multiplicar a ambos lados
da nova igualdade, por 1/a, que é chamado de inverso de a, para enfim obter
o resultado conhecido por todos. Em particular, observe-se que precisamos
das operações elementares para resolver esta simples equação! Mesmo sendo
a e b númeos naturais, é facil ver que a solução obtida deixa de sê-lo na
mair parte dos casos. Precisamos então, no mı́nimo, dos números racionais
para resolver uma equação linear. De fato, os números racionais podem ser
definidos, como o conjunto das soluções de equações lineares da forma
qx = p
onde p e q são números inteiros arbitrários com q 6= 0.
Consideremos agora uma equação quadrática, isto é, da forma
ax2 + bx + c = 0,
(1.1)
onde a, b, c ∈ R e a 6= 0. Multiplicando por 1/a podemos escrever a equação
acima na forma equivalente seguinte
b
c
x2 + x + = 0.
a
a
7
1.1. INTRODUÇÃO
Mais ainda, um pequeno cálculo nos mostra que esta equação é de fato equivalente à seguinte:
2
c
b2
b
− 2 + = 0.
x+
2a
4a
a
Desta forma obtemos
b
x+
2a
o que mostra que a expressão
2
=
b2
c
− ,
2
4a
a
b
2a
2
2
deve ser uma raı́z quadrada de b /4a − c/a; em particular para podermos
calcular as soluções da equação quadrática, precisamos que esta expressão
seja não negativa. Formalmente podemos escrever
r
b
b2
c
x=− ±
− .
(1.2)
2
2a
4a
a
x+
Observamos, por um lado, que devemos ter
c
b2
− ≥0
2
4a
a
para podermos calcular as raı́zes quadradas; mais ainda, mesmo tendo a, b, c ∈
Z, o resultado, mesmo que exista, pode não ser racional: faça por exemplo
b = 0, a = 1, c = −2.
Por outro lado, se quiséssemos resolver a equação quadrática para quaisquer valores de a, b e c, então deverı́amos conhecer um conjunto de números
que contivesse no seu interior raizes de números reais negativos; isto aparentemente não faz muito sentido (pense sobre isso!!).
Vejamos um exemplo. Vamos admitir que o leitor conheça, o que é assunto de ensino médio (e que analisaremos em detalhe no capı́tulo 2), que
quando temos uma solução x0 de uma equação polinomial, podemos dividir
o polinômio por x − x0 obtendo assim uma fatoração deste como produto
de x − x0 por um polinômio de grau um a menos. De qualquer modo, vamos aceitar este fato apenas para podermos dar um exemplo que, esperamos,
motive o leitor a fazer o esforço de continuar a leitura.
Exemplo 1.1.1. Consideremos a equação cúbica
x3 − 4ax2 + a2 x − 1 = 0.
8
CAPÍTULO 1. NÚMEROS COMPLEXOS
Um cálculo facil envolvendo derivadas nos mostra que a função
f (x) := x3 − 4ax2 + a2 x − 1
possui um máximo relativo em x = 2a e um mı́nimo relativo em x = 6a;
obtemos diretamente
f (2a) = −6a3 − 1 < 0, f (6a) = 214a3 − 1.
Como o sinal de f (x) coincide com o sinal de x para valores de x cujo valor
absoluto seja o suficientemente grande, concluı́mos que o gráfico de f (x)
corta a reta y = 0 uma única vez, donde segue que a equação cúbica acima
possui uma única raiz real.
Suponhamos agora que temos à mão a solução real, digamos x0 , desta
equação. Dividindo por x − x0 , podemos fatorar a equação na forma
x3 − 4ax2 + a2 x − 1 = (x − x0 )g(x),
onde g(x) é uma expressão de grau dois; estamos então na situação onde
g(x) = 0 não possui solução real, isto é, b2 /4a2 − c/a < 0 para a equação
quadrática g(x) = 0. Se tivermos um método para encontrar as soluções
não reais desta equação como em (1.2), digamos x1 e x2 , então poderı́amos
dividir por (x − x1 ) e por (x − x2 ), obtendo finalmente a solução real x0 .
1.2
Definição e operações elementares
Retomemos a equação (1.1). Trabalhando de maneira puramente formal com
a solução (1.2) (isto é, não se preocupando com o fato da solução existir ou
não) e escrevendo, para simplificar,
∆ := b2 − 4ac,
podemos escrever (1.2) na forma
√
∆
b
x=− ±
.
2a
2a
Evidentemente o resultado faz sentido como número real se e somente se
∆ ≥ 0.
1.2. DEFINIÇÃO E OPERAÇÕES ELEMENTARES
9
Por outro lado, se ∆ for negativo, podemos escrevê-lo como
∆ = (−1)|∆|,
onde as barras indicam o valor absoluto do número real ∆ que neste caso será
estritamente positivo. Se continuaramos trabalhando de maneira formal, e
esperando que as propriedades usuais dos números que conhecemos sejam
ainda válidas, teremos
p
(−1)|∆|
b
x = − ±
2a √ 2a
p
−1 |∆|
b
;
= − ±
2a
2a
√
aqui a única expressão que não faz sentido dentro dos números reais é −1.
Concluı́mos que para resolver a equação √
quadrática em todos os casos só
precisamos de dar um sentido à expressão −1. Todas as soluções podem
ser então escritas na forma
√
x = A + B −1
onde
√
∆
b
A=− ±
2a
2a
se ∆ ≥ 0, e
p
|∆|
b
A=− , B=±
2a
2a
quando ∆ < 0; observemos que A e B sempre são números
√ reais.
Para simplificar a notação, escreveremos ı no lugar de −1. Esqueçamos
por um momento a equação e trabalhemos com “números” da forma a + bı
onde a, b ∈ R. Se quisermos que expressões desta forma sejam verdaderos
números (embora não reais !), devemos saber operar com eles, isto é, devemos saber como somá-los, sustraı́-los, multiplicá-los e dividı́-los, quando
esta última operação for possı́vel (lembrar do que acontece com os inteiros
que não possuem divisão exata sempre). Mais ainda, estas operações devem satisfazer as propriedades básicas de associatividade, comutatividade
e distributividade, como as satisfazem todos os números que conhecemos.
10
CAPÍTULO 1. NÚMEROS COMPLEXOS
Finalmente, seria necessário que os números reais pudessem ser considerados como um caso particular destes novos números, afim de poder usá-los
para resolver a equação quadrática sem ter que diferenciar o caso em que o
resultado é real do caso onde não o é.
Tomando b = 0 em a+bı parece bem razoável que só obtenhamos números
reais, já que a ∈ R. Para definir a soma, dado que cada expressão da forma
a + bı possui duas partes distintas, uma real, o número real a, e√outra, o
número real b, que vem acompanhada de um objeto novo (o ı = −1 que
certamente não é real), parece natural então somar dois destes números não
misturando suas partes; mais precisamente, vamos somar a + bı e c + dı como
(a + bı) + (c + dı) = (a + b) + (c + d)ı,
que faz sentido pois sabemos o que significa a + b e c + d
De maneira análoga, multipliquemos formalmente dois destes números
usando as propiedades que conhecemos das operações elementares:
(a + bı) · (c + dı) =
=
=
=
ac + adı + bıc + bıdı
ac + adı + bcı + bd(ı)2
ac + adı + bcı + bd(−1)
ac − bd + (ad + bc)ı;
observe-se que ac − bd + (ad + bc)ı é uma expressão da forma A + Bı onde
A, B ∈ R. Quando não houver perigo de ambigüidade, também escreveremos
zw para indicar a multiplicação z · w de dois números complexos z = a + bi
e w = c + di.
Isto motiva a seguinte
Definição 1.2.1. O conjunto dos números complexos é o conjunto
C := {a + bı : a, b ∈ R}
com as operações de soma e multiplicação definidas por
(a + bı) + (c + dı) = (a + b) + (c + d)ı
e
(a + bı) · (c + dı) = ac − bd + (ad + bc)ı,
respectivamente.
Si z = a + bı ∈ C dizemos que a e b são as partes real e imaginária,
respectivamente; denotamos a = ℜ(z) e b = ℑ(z).
1.2. DEFINIÇÃO E OPERAÇÕES ELEMENTARES
11
Se z = a + bı, dizemos que a + bı é a Notação Binômica ou Cartesiana; a
segunda denominação é motivada em certa medida pela seguinte observação.
Observação 1.2.2. A existência de um número complexo equivale então à
existência de dois números reais, sua partes real e sua parte imaginária, de
maneira independente. Desta forma podemosrepresentar um número complexo z ∈ C como um par ordenado (a, b); de fato esta observação permite
entender que os números complexos efetivamente existem, e sua existência
está vinculada à existência dos números reais: observe que nossa construção
dos números complexos pressupõe a existência de um número bastante singular que denotamos ı; a forma de entender que este “número” efetivamente
existe, é pensar os números complexos como pares ordenados da forma (a, b)
junto com as operações definidas acima, reinterpretadas em termos de pares,
isto é:
(a, b) + (c, d) = (a + c, b + d), (a, b) · (c, d) = (ac − bd, ad + bc).
Deixamos como exercı́cio para o leitor verificar que o par ordenado (0, 1)
satisfaz
(0, 1) · (0, 1) = (−1, 0);
como (0, 1) corresponde exatamente ao nosso ı, isto mostra que o quadrado
dele corresponde ao nosso número complexo −1 = −1 + 0ı.
A representação de um número complexo como um par ordenado, permitenos representar geometricamente tal número na forma de um vetor do plano;
a ponta do vetor ou ponto do plano correspondente terá como abscissa e
ordenada as parte real e imaginária do número complexo, respectivamente.
a+ib
b
a
Figura 1.1: Representação geométrica de um número complexo
Geometricamente podemos obter a soma de números complexos z = a+ıb
e w = c+ıd pela chamada Regra do Paralelograma, que consiste em construir
12
CAPÍTULO 1. NÚMEROS COMPLEXOS
um paralelogramo, cujos lados adjacentes são os vetores (a, b) e (c, d) que
est øsendo somados,
(a+c)+i(c+d)
a+ib
b
c+id
a
Figura 1.2: Representação geométrica da soma de complexos
Como nosso objetivo é resolver equações polinomiais, é claro que,deverı́amos
poder operar com nossos novos números. Para isto, precisamos não só multiplicar e somar, mas também subtrair e dividir.
Mais concretamente, tendo em mente o exemplo 1.1.1, podemos conceber
que os números complexos possam nos auxiliar no intuito de encontrar as
soluções reais de uma equação algébrica (polinomial) mediante obtenção de
uma solução arbitrária; mesmo sendo esta imaginária. Para isto podemos
dividir a expressão de nossa equação por x − α, onde α é a solução achada
em primeira instância; desta forma, nossa equação original fatora-se como
produto de x − α por uma expressão de grau um a menos do que o grau
daquela. Não é dificil de se convencer que para dividir expressões polinomiais
com coeficientes em C (observe que agora α pode não ser real), é necessário
poder subtrair e dividir números complexos (para divisão de polinômios veja
capı́tulo 2.
O Módulo de um número complexo z := a + ıb é o número real não
negativo
√
|z| := a2 + b2 .
Da representação geométrica concluı́mos que |z| é o comprimento do vetor
(a, b) correspondente; evidentemente Z = 0 se e somente se |z| = 0.
Como caso particular, observa-se que se z = a é um número real, então
|a| é o valor absoluto usual de a.
De acordo com a definição de multiplicação de números complexos, obsevamos que
a2 + b2 = (a + ıb)(a − ıb);
1.2. DEFINIÇÃO E OPERAÇÕES ELEMENTARES
13
o número complexo z̄ := a−ıb chama-se o Conjugado de z = a+ıb. Obtemos
então
z · z̄ = |z|2 .
(1.3)
Com a ajuda da equação (1.3) podemos demonstrar a existência de inverso
de um número complexo não nulo de maneira muito simples. Com efeito, se
z 6= 0, teremos que r := |z| é um número real não nulo (de fato positivo)
donde
1
z · ( 2 z̄) = 1,
r
o que mostra que o inverso de z existe e escreve-se na forma
1
z −1 = z̄;
r
em notação binômica
z
−1
b
a
ı.
+ − 2
= 2
a + b2
a + b2
Se z, w ∈ C com w 6= 0, definimos a divisão de z por w como
Z : w := z · w−1 ;
como para números reais, denotamos também
z
z:w= .
w
Como exercı́cio o leitor pode tentar demonstrar o seguinte resultado que
resume as propriedades algébricas do conjunto dos números complexos:
Teorema 1.2.3. A terna (C, +, ·) é um corpo.
Para terminar esta seção, enunciamos sem demonstração as propriedades
métricas mais importantes do módulo; consideramos estas propriedades como
conhecidas dos leitores, já que são as mesmas consideradas para vetores do
plano e que, graças à representação geométrica dos números complexos, continuam válidas para estes últimos; em todo o caso, tentar uma demonstração
destas propriedades é um exercı́cio útil para obter desenvoltura no cálculo
com números complexos.
Proposição 1.2.4. Sejam z1 , z2 ∈ C e λ ∈ R. Temos as seguintes afirmações:
(a) (Desigualdade Tringular) |z1 + z2 | ≤ |z1 | + |z2 |;
(b) |λZ1 | = |λ||z1 |;
(c) Se Z2 6= 0, então |z1 z2−1 | = |z1 |/|z2 |.
14
1.3
CAPÍTULO 1. NÚMEROS COMPLEXOS
Coordenadas polares
Analogamente ao que acontece com os vetores do plano, temos uma representação polar para números complexos. Por razões históricas se z = a + bı
é um número complexos, o ângulo na representação polar do vetor (a, b)
chama-se o Argumento de z. Antes de definir o argumento precisamos de
alguns preliminares.
Da mesma maneira que para dar posições de pontos numa reta é necessário antes fixar um ponto de referência nesta, a partir do qual as coordenadas de pontos arbitrários da reta serão definidas, precisamos de uma
semireta de referência com relação à qual a inclinação dos vetores do plano
será determida. Mais precisamente, fixemos um sistema de coordenadas cartesiano cuja origem (0, 0) denotamos O, que representa o número complexo
0 = 0 + 0ı. Fixemos uma semireta l com origem em O; denotamos λ ∈ [0, 2π)
o ângulo formado por l e a semireta constituı́da pelos pontos de abscissa não
negativa, medido em sentido anti-horário. Nosso objetivo é definir coordenadas angulares para um vetor não nulo v do plano. Quando o vetor v for nulo,
isto é, estiver representado pelo ponto O, a coordenada angular não estará
definida.
Então a coordenada angular de v relativa à reta l, é um número real
θ(v) ∈ [λ, λ + 2π), que por definição, é o valor do ângulo formado por v e
o vetor (1, 0) medido em sentido anti-horário. Desta forma, a coordenada
angular está bem determinada sempre que v 6= 0, dependendo seu valor, da
semireta l pré-fixada; na literatura sobre o assunto, quando fixada a semireta
l, diz-se as vezes que fixamos uma determinação da coordenada angular. Por
convenção se θ ∈ [λ, λ + 2π), os identificamos com θ, os valores θ + 2kπ, onde
k ∈ Z: observe que tais valores definem o mesmo ângulo que θ.
As semiretas mais comumente utilizadas para determinar a coordenada
angular são as duas semiretas determinadas pela origem O no eixo x: a dos
pontos cujas abscissas são não negativas e não positivas respectivamente.
No primeiro caso a coordenada θ(v) varia no intervalo [0, 2π) e no segundo
caso no intervalo [−π, π). Aos efeitos da utilização que faremos dos números
complexos, é suficiente considerarmos apenas a primeira determinação da
coordenada angular; determinação esta que fixamos e que consideraremos
sem mensão explı́cita a partir de agora.
Exemplo 1.3.1. O vetor v = (−1, −1) tem coordenada angular θ = 7π/4,
ou somando −2π, também θ = −π/4, que é um valor do argumento na
determinação θ ∈ [−π, π).
1.3. COORDENADAS POLARES
15
Seja z ∈ C um número complexo. Se z 6= 0, a coordenada angular do
vetor que representa z chama-se o argumento, que denotamos arg(z) ou arg z.
As coordenadas polares de z é o par (|z|, arg z); se z = 0 o valor de arg z
não existe (isto é, a função argumento não está definida em 0) mas |z| = 0
neste caso, o que determina z (ou seja, não precisamos de argumento para
determinar z = 0).
Se z = a + bı 6= 0 com coordenadas polares (r, θ), temos evidentemente
a = r cos θ, b = r sin θ;
concluı́mos que as coordenadas polares de z determinam a parte real e imaginária de z. Reciprocamente, dados a e b podemos determinar as coordenadas polares mas temos que ter certo
√ cuidado com o argumento; com efeito o
módulo r, como já sabemos vale a2 + b2 , mas para o argumento devemos
utilizar as funções trigonométricas inversas e alguma das relações
b
a
cos θ = , sin θ = ;
r
r
podemos ainda utilizar
b
arctan .
a
É preciso, na hora de calcular θ, representar geometricamente o número
complexo, de forma a poder interpretar corretamente os valores das funções
arcos: vejamos um exemplo.
Exemplo 1.3.2. Seja z = −1 − ı;√está representado pelo vetor (−1, −1) no
terceiro quadrante. Temos |z| = 2. Se calculamos ingenuamente
−1
arctan
= arctan(1)
−1
obteremos o valor π/4, pois os valores da função arctan variam entre −π/2 e
π/2; devemos então corrigir este valor subtraindo-o de π, pois nosso vetor está
de fato no terceiro quadrante. Analogamente, para o complexo z = −1 + ı
que está no segundo quadrante, devemos corrigir o valor arctan(−1) = −π/4
somando-lhe π. O leitor pode refletir sobre o que devemos corrigir no caso
de utilizar as funções arccos e arcsin.
Exemplo 1.3.3. Consideremos z = bı; é um número complexo imaginário
puro, isto é, sua parte real é nula. Se tratarmos de calcular seu algumento
16
CAPÍTULO 1. NÚMEROS COMPLEXOS
utilizando arctan, observaremos que em princı́pio isto não é possı́vel, pois
a = 0. Mas um momento de reflexão nos mostra que não é necessária a
utilização de fórmula alguma, pois evidentemente o argumento de um tal
número é π/2 quando b > 0 e 3π/2 quando b < 0.
Se z = a + bı, usando as fórmulas acima, podemos escrever
z = r(cos θ + ı sin θ).
Dizemos que z está escrito em Notação Trigonométrica, em contraposição
com a escrita z = a + bı que é chamada de Notação Cartesiana ou Binômica.
√
Exemplo 1.3.4. A notação trigonométrica do número complexo 1 + ı 3 é
z = 2(cos
1.3.1
π
π
+ ı sin ).
3
3
Fórmulas de De Moivre
Vamos agora multiplicar dois números complexos escritos em notação trigonométrica. Sejam
zj = rj (cos θj + ı sin θj ), j = 1, 2;
ou seja que rj = |zj |, θj = arg zj para j = 1, 2.
Então
z1 z2 =
=
=
=
r1 (cos θ1 + ı sin θ1 )r2 (cos θ2 + ı sin θ2 )
r1 r2 (cos θ1 + ı sin θ1 )(cos θ2 + ı sin θ2 )
r1 r2 [(cos θ1 cos θ2 − sin θ1 sin θ2 ) + ı(cos θ1 sin θ2 + sin θ1 cos θ2 )]
r1 r2 [cos(θ1 + θ2 ) + ı sin(θ1 + θ2 )] ,
onde usamosa conhecida fórmula para seno e cosseno de uma soma de ângulos.
Concluı́mos que o módulo de z1 z2 é o produto dos módulos de z1 e z2 , e
o seu argumento é a soma dos argumentos de z1 e z2 , respectivamente.
Exercı́cio 1.3.1. Interprete geometricamente as conclusão acima sobre as coordenadas polares do produto de números complexos.
Consideremos n números complexos
zj := rj (cos θj + ı sin θj ), j = 1, . . . , n.
1.4. RAÍZES N -ÉSIMAS
17
Por indução matemática no número de fatores podemos demonstrar (o que
mostramos para dois fatores é o caso n = 2)
z1 · · · zn = r1 · · · rn [cos(θ1 + · · · + θn ) + ı sin(θ1 + · · · + θn )] .
Como caso particular, escolhendo z = z1 = · · · = zn obtemos uma fórmula
para a potência n−ésima
[r(cos θ + ı sin θ)]n = rn [cos(nθ) + ı sin(nθ)] ,
(1.4)
onde r = r1 = · · · = rn e θ = θ1 = · · · = θn . Aplicando esta fórmula para um
número complexo z de módulo r = 1 obtemos a fórmula equivalente
(cos θ + ı sin θ)n = cos(nθ) + ı sin(nθ).
(1.5)
Tanto a fórmula (1.4) quanto a fórmula (1.5) são conhecidas como Fórmula
de De Moivre. Esta última pode ser utilizada para escrever cos(nθ) e sin(nθ)
como funções polinomiais em cos θ e sin θ com coeficientes inteiros:
Exemplo 1.3.5. Seja n = 2. Neste caso a fórmula (1.5) fornece
cos(2θ) + ı sin(2θ) = (cos θ + ı sin θ)2
= (cos2 θ − sin2 θ) + ı(2 cos θ sin θ);
donde, igualando partes real e imaginárias, obtemos
cos(2θ) = cos2 θ − sin2 θ, sin(2θ) = 2 cos θ sin θ.
Para os casos n = 3, 4 veja o exercı́cio 1.7.7. Mais geralmente, o leitor
pode tentar obter uma fórmula geral como sugerida no seguinte:
Exercı́cio 1.3.2. Utilizando a fórmula do binômio de Newton (caso não a
conheça veja o exercı́cio 2.4.20 no final do capı́tulo), escreva cos(nθ) e sin(nθ)
como funções polinomiais em cos θ e sin θ com coeficientes inteiros.
1.4
Raı́zes n-ésimas
Seja w ∈ C. Uma raiz n-ésima de w é um número complexo z ∈ C tal que
z n = w.
18
CAPÍTULO 1. NÚMEROS COMPLEXOS
Se w = 0, aplicando módulos de ambos lados da equação obtemos
|z n | = |z|n = 0,
donde |z| = 0, isto é, z = 0. Ou seja, a única raiz n-ésima de 0 é o próprio
0. Suponhamos agora que w 6= 0; escrevamos w em notação trigonométrica:
w = s(cos φ + ı sin φ),
com s = |w| > 0 e φ = arg w. Procuramos raı́zes n-ésimas também escritas
em notação trigonométricas da forma
z = r(cos θ + ı sin θ),
com r = |z| e θ = arg z. Por definição z n = w; da fórmula de De Moivre
(1.4) obtemos
z n = = rn [cos(nθ) + ı sin(nθ)]
= s(cos φ + ı sin φ)
= w.
Primeiramente concluı́mos que o módulo de w é s = rn , donde obtemos o
1
módulo r de z: como r > 0, seu valor é a raiz n-ésima (real) positiva s n de
s. Simplificando rn com s obtemos
cos(nθ) + ı sin(nθ) = cos φ + ı sin φ,
que igualando partes real e imaginária equivale ao sistema de equações trigonométricas
cos(nθ) = cos φ
(1.6)
sin(nθ) = sin φ.
Analisando o gráfico das funções cos e sin (ou equivalentemente as projeções
nos eixos x e y de um ponto variando no cı́rculo trigonométrico, respectivamente), constatamos que dois ângulos distintos com valores entre 0 e 2π que
possuem o mesmo cosseno estão nos quadrantes primeiro e quarto, nos quadrantes segundo e terceiro, ou são π/2 e −π/2. Analogamente, se possuem
o mesmo seno, estão nos quadrantes terceiro e quarto ou nos quadrantes
primeiro e segundo. Concluı́mos que dois ângulos (distintos) em [0, 2π) não
podem, ao mesmo tempo, possuir o mesmo cosseno e o mesmo seno. Portanto, a única forma para que ângulos distintos, agora com valores arbitrários,
1.4. RAÍZES N -ÉSIMAS
19
possuam o mesmo cosseno e o mesmo seno é que seus valores difiram por
múltiplos inteiros de 2π.
Da digressão acima, concluı́mos que as soluções do sistema de equações
trigonométricas (1.6) é
nθ = φ + 2kπ, k ∈ Z;
o argumento procurado θ tem então vários valores possı́veis que dependem
de k:
φ 2kπ
, k ∈ Z.
θk = +
n
n
Fazendo k variar entre 0 e n − 1 o ângulo θ toma os n valores distintos
φ φ 2π φ 4π
φ 2(n − 1)π
, +
, +
,..., +
;
n n
n n
n
n
n
quando k varia entre n e 2n − 1 reobtemos os valores de θ = θ0 , θ1 , . . . , θn−1 ,
pois estes diferem daqueles por 2π (nossa convenção para valores de ângulos:
veja página 14). Raciocinando desta forma não é difı́cil de se convencer que
os únicos valores distintos para o argumento θ são o n valores acima.
Demostramos então o seguinte resultado:
Teorema 1.4.1. Seja w ∈ C um número complexo não nulo; escrevemos
w = s(cos φ + ı sin φ).
Então existem n raı́zes (distintas)
zk = r(cos θk + ı sin θk ), k = 0, 1, . . . , n − 1,
onde
1
r = s n , θk =
φ 2kπ
+
.
n
n
Observação 1.4.2. Todas as raı́zes n-ésimas de w possuem o mesmo módulo
que é exatamente a raiz n-ésima positiva real do módulo de w; para obter
os argumentos das raı́zes n-ésimas, podemos proceder da forma seguinte:
primeriro dividimos o argumento de w por n, o que fornece o argumento de
z0 ; logo após acrescentamos ao argumento de z0 o valor 2π/n, o que fornece o
argumento de z1 ; logo após acrescentamos ao argumento de z1 o valor 2π/n;
e assim por diante, até obtermos o argumento de zn−1 . Se repetirmos mais
uma vez o procedimento, reobteremos o argumento de z0 .
20
CAPÍTULO 1. NÚMEROS COMPLEXOS
A observação acima fornece a seguinte interpretação geométrica: as raı́zes
n-ésimas de w 6= 0 representam-se no plano como os vértices de um polı́gono
1
regular de n lados inscrito numa circunferência de raio s n .
Figura 1.3: representação geométrica de raı́zes sextas
Exemplos 1.4.3. (a) Consideremos w = −1 − ı. Evidentemente
w = cos
5π
5π
+ ı sin
.
4
4
Ou seja que s = 1 e φ = 5π/4. As raı́zes quintas de w são
π
π
z0 = cos + ı sin
4
4
π 2π
π 2π
z1 = cos
+ ı sin
+
+
4
5
4
5
π 4π
π 4π
z2 = cos
+ ı sin
+
+
4
5
4
5
π 6π
π 6π
+
+ ı sin
+
z3 = cos
4
5
4
5
π 8π
π 8π
z4 = cos
+
+
+ ı sin
4
5
4
5
(b) Seja w 6= 0 arbitrário; temos
w = s(cos φ + ı sin φ).
As raı́zes quadradas de w são
1
φ
φ
φ
φ
z0 = s (cos + ı sin ), z1 = s 2 cos( + π) + ı sin( + π) ;
2
2
2
2
1
2
1.4. RAÍZES N -ÉSIMAS
21
como somar π troca o sinal do cosseno e do seno, concluı́mos que z1 = −z0 .
Em outras palavras, as raı́zes quadradas de números complexos são números
complexos simétricos.
(c) Seja w = a ∈ R um número real não nulo. Temos dois casos:
(c1 ) a > 0: temos arg a = 0. Então
1
zk = a n (cos
2kπ
2kπ
+ ı cos
), k = 0, 1, . . . , n − 1;
n
n
em particular, quando é par, digamos n = 2m, as duas raı́zes reais são z0 e
zm−1 ; quando n é ı́mpar, z0 é a raiz real de a.
(c2 ) a < 0: temos arg a = π. Então
1
zk = |a| n (cos
(2k + 1)π
(2k + 1)π
+ ı cos
), k = 0, 1, . . . , n − 1;
n
n
em particular quando n é ı́mpar, novamente z0 é a raiz real.
Exemplo 1.4.4. Raı́zes da unidade. As raı́zes n-ésimas da unidade complexa
w = 1 (ou seja, o neutro da multiplicação) obtém-se como caso particular do
exemplo 1.4.3(c1 ):
zk = cos
2kπ
2kπ
+ ı cos
, k = 0, 1, . . . , n − 1;
n
n
todas são números complexos de módulo um. Observamos que estão representadas no plano como os vértices de um polı́gono regular de n lados,
inscrito numa cisrcunferência de raio um; um dos vértices é o ponto (1, 0)
que representa o complexo 1, a raiz n−ésima real positiva de 1.
A raiz nésima z1 , que denotaremos ωn chama-se a Raiz n-ésima Primitiva
da unidade. Pela fórmula de De Moivre (1.5) temos que ωnn = 1 e
zk = ωnk , k = 0, . . . , n − 1.
Esta propriedade implica que o conjunto Cn := {1, ωn , . . . , ωnn−1 } é fechado
para a multiplicação, isto é, z, w ∈ Cn implica z · w ∈ Cn (mostre esta
afirmação !).
Finalmente, por definição de raiz n-ésima, observamos que o conjunto Cn
das raı́zes n-ésimas da unidade é o conjunto de soluções da equação
xn − 1 = 0.
22
1.4.1
CAPÍTULO 1. NÚMEROS COMPLEXOS
Raı́zes quadradas em forma binômica
Consideremos um número complexo w = a + bı. Podemos estar interessados
em obter as raı́zes n-ésimas deste número na forma binômica; no caso onde
n = 2, isto pode ser feito diretamente, ou seja, sem passar pela forma trigonométrica, essencial para extrair raı́zes pelo método descrito no parágrafo
precedente.
Um número complexo z = x + yı é raiz quadrada de w se e somente se
a + bı = (x + yı)2
= x2 − y 2 + (2xy)ı.
Isto é, igualando partes real e imaginária, se e somente se
2
x − y2 = a
2xy = b
Suponhamos w 6= 0, pois o caso w = 0, como sabemos, fornece z = 0. Se
b = 0 obtemos x = 0 ou y = 0, e a 6= 0; se a > 0, como x e y são reais,
devemos ter y = 0, donde obtemos os pares (x, y) seguintes:
√
√
( a, 0), (− a, 0),
isto é, as raı́zes quadradas reais de w = a:
√
z = ± a.
Analogamente, se a < 0 obteremos as raı́zes imaginárias puras de w = a:
p
± |a|ı.
Suponhamos agora que b 6= 0; em particular x 6= 0 e y 6= 0. Podemos
substituir y = b/2x na equação de cima para obter
x2 −
b2
= a;
4y 2
multiplicando por 4x2 esta equação encontramos
x4 − ax2 − b2 = 0,
1.5. TRANSFORMAÇÕES DO PLANO
23
que é uma equação biquadrada. Como o leitor certamente sabe, esta pode
ser resolvida utilizando a fórmula de Baskara numa nova variável u := x2 ,
pois é uma equação quadrática em x2 ; mais precisamente, temos
√
a ± a2 + b 2
2
.
u=x =
2
√
Como b 6= 0 temos 0 ≤ a2 < a2 +b2 , donde |a| < a2 + b2 ; desta desigualdade
concluı́mos que x2 é um dos dois valores
√
√
a − a2 + b 2
a + a2 + b 2
> 0,
< 0.
2
2
Como x deve ser real, só pode ser
x2 =
a+
√
a2 + b 2
;
2
daqui obtemos dois valores x1 e x2 para x donde os valores de y correspondentes y1 = b/2x1 e y2 = b/2x2 .
O leitor poderá obter fórmulas explı́citas para as duas raı́zes quadradas
(uma simétrica da outra) x1 + y1 ı e x2 + y2 ı. De todas maneiras não é
necessário termos tais fórmulas explı́citas, pois não é difı́cil de repetir o procedimento cada vez que precisemos calcular raı́zes quadradas desta forma.
1.5
Transformações do plano
Denotemos R2 o plano real. Chamaremos de transformação do plano qualquer bijeção T : R2 → R2 que pode ser escrita como composição dos seguintes
tipos de Transformações elementares que supomos conhecidas dos cursos de
geometria elementar:
1. Translação; 2. Homotetia; 3. Rotação de ângulo θ e 4. Reflexão com
relação a uma reta do plano.
A representação geométrica dos números complexos nos permite pensar
C como se fosse R2 do ponto de vista geométrico; de fato, para sermos rigorosos, C é exatamente R2 como conjunto, só que introduzimos operações
que o fazem um objeto matemático diferente do plano usual; digamos que o
“enriquecem” de certa forma, pois isto nos permite fazer outras coisas com
os pontos do plano que não podı́amos fazer quando pensávamos neles apenas
geometricamente.
24
CAPÍTULO 1. NÚMEROS COMPLEXOS
De acordo com a interpretação que demos para a soma de complexos, uma
translação nada mais é do que uma aplicação (isto é, função) T : C → C da
forma
T (z) = z + α,
onde α ∈ C é um número complexo fixo dado e não nulo; diz-se que T é uma
translação de vetor α. Da mesma forma, da interpretação que demos para o
produto em termos do módulo e o argumento, se α = r(cos θ + ı sin θ), uma
aplicação H : C → C da forma
H(z) = αz
transforma um número complexo do plano num outro número complexo cujo
módulo fica multiplicado por r e cujo argumento fica acrescido de θ. Concluı́mos que a transformação H tem o efeito de uma homotetia de razão r
combinada (ou seja, composta) com uma rotação de ângulo θ; no caso particular onde r = 1 teremos apenas uma rotação de ângulo θ e no caso onde
θ = 0 e r 6= 1 uma homotetia de razão r.
Finalmente, a transformação S : C → C definida por
S(z) = z̄
é uma reflexão em relação ao eixo x; deixamos para o leitor refletir sobre
como definir corretamente uma reflexão em relação a uma reta arbitrária:
observe, por um lado, que uma reta paralela ao eixo x pode ser vista como
uma translação de um vetor que é um complexo imaginário puro; por outro
lado, que uma reta não paralela ao eixo x corta este num ponto e podeser vista
como uma translação adequada combinada com uma rotação cujo ângulo é
o ângulo entre as retas.
Como veremos no próximo capı́tulo, para conseguirmos entender de forma
adequada a resolução de equações polinomiais, seremos obrigados a compreender melhor os polinômios e a relação de seus coeficientes (o que corresponde
aos dados num problema prático que queiramos resolver) com as suas raı́zes,
que são nada mais nem menos que as soluções das equações correspondentes. Por outro lado, a “manipulação” com polinômios só é possı́vel operando
com eles, ou seja, efetuando, à semelhança do que fazemos com os números,
operações elementares; é então de se esperar que as propriedades do conjunto
dos polinômios sejam o mero reflexo, em última instância, da forma com que
operamos com eles, isto é, das propriedades que estes polinômios têm em
relação às operações elementares.
1.6. ESTRUTURA SUBJACENTE DE C
1.6
25
Estrutura subjacente de C
Os objetos nos quais nos interessamos, sejam estes números de algum dos
tipos conhecidos, sejam estes polinômios (que será tratado minuciosamente
no capı́tulo 2), possuem em comum alguns atributos. Primeiramente, aqueles de uma mesma natureza constituem um conjunto, digamos A, que vamos
considerar, evidentemente, diferente do conjunto vazio. Segundo, existem
“maneiras” de operar com os elementos do conjunto A que tem sido chaamadas de operações elementares; aparentemente há em todos os casos uma
forma de somar “+” e uma forma de multiplicar “·”, e em alguns casos, uma
forma de subtrair e outra de dividir.
Aceitando a filosofia segundo a qual é através das propriedades destas
operações que poderemos entender qualquer outra propriedade algébrica dos
elementos de A, é então razoável pensar que muitos dos fenômenos que nos
parecem própios, por exemplo dos números inteiros, sejam de fato fenômenos
que podem ser observados em qualquer outro conjunto sobre o qual saibamos
operar de forma similar que com números inteiros: por exemplo, não é dificil
mostrar que
x2 + 1 = (x + ı)(x − ı)
é a melhor fatoração que podemos obter da expressão x2 + 1, pois a equação
x2 + 1 = 0 tem ı e −ı como únicas soluções e evidentemente qualquer outra
fatoração deveria ter uma ou outra das soluções. Então, se só permitirmos
números reais nos nossos cálculos, a expressão (polinômio) x2 +1 não poderia
se fatorar! Nós já encontramos este tipo de fenômeno no caso dos números
inteiros: quando um número inteiro não pode ser fatorado de maneira não
óbvia (isto é, salvo escrevendo o próprio número vezes 1), dizemos que ele
é primo. No próximo capı́tulo veremos como muitas das noções sobre divisibilidade tais como a de número primo podem ser “estendidas” ao caso de
polinômios.
Vamos resumir muitas das propriedades dos números (e como veremos
no próximo capı́tulo, também dos polinômios) na seguinte definição. Vamos
chamar de operação 2 num conjunto A 6= ∅ a uma função de A × A em A.
Definição 1.6.1. Seja A um conjunto não vazio e sejam + : A×A → A e · :
A × A → A duas operações em A, que chamaremos de soma e multiplicação.
2
Diz-se também operação binária interna pelo fato de estar definida para pares de
elementos do conjunto A e o resultado desta ser também um elemento de A.
26
CAPÍTULO 1. NÚMEROS COMPLEXOS
Dizemos que (A, +, ·) é um Anel Commutativo com Unidade se se verificam
as seguintes oito propriedades:
S1 ) Associativa: a + (b + c) = (a + b) + c, ∀a, b, c ∈ A.
S2 ) Commutativa: a + b = b + a, ∀a, b ∈ A.
S3 ) Neutro: ∃e ∈ A tal que e + a = a + e = a, ∀a ∈ A; denotamos este
elemento e = 0.
S4 ) Simétrico: ∀a ∈ A, ∃ā ∈ A tal que a + ā = ā + a = 0.
M1 ) Associativa: a · (b · c) = (a · b) · c, ∀a, b, c ∈ A.
M2 ) Commutativa: a · b = b · a, ∀a, b ∈ A.
M3 ) Neutro: ∃u ∈ A tal que u · a = a · u = a, ∀a ∈ A; denotamos este
elemento u = 1.
SM ) Distributiva: a · (b + c) = a · b + a · c, ∀a, b, c ∈ A.
Se além disso também verifica-se
D) Cancelamento: Se a·b = a·c e a 6= 0 então b = c, ∀a ∈ A−{0}, ∀b, c ∈
A,
dizemos que o anel é um Domı́nio de Integridade.
Exercı́cio 1.6.1. Convença-se do fato que todo sistema numérico é um domı́nio
de integridade. Que pensa do conjunto dos polinômios ?
A propriedade de simétrico nos permite subtrair: diremos que a − b é
a + b̄.
Na definição acima nada é dito sobre a divisão, que, à semelhança do
que acontece com a subtração, dependerá da existência de um “simétrico”
mas com respeito à multiplicação, que chamamos de inverso. Podemos então
definir um novo tipo de estrutura algébrica sobre um conjunto que é mais
rica, no sentido que possui mas atributos: é o conceito de Corpo.
Definição 1.6.2. Seja K um conjunto não vazio e sejam + : · : K × K → K
e · : K ×K → K duas operações em K. Dizemos que (K, +, ·) é um Corpo se
for um anel commutativo com unidade e além disso verifica-se a propriedade
seguinte:
M4 ) Inverso: ∀a ∈ K − {0}, ∃â ∈ K tal que a · â = 1.
Denotaremos o inverso de um elemento a ∈ K\{0} como â = a−1 . Num
corpo podemos então dividir um elemento a por um elemento b 6= 0 fazendo
a : b = a · b−1 ;
27
1.7. EXERCÍCIOS
isto motiva a notação (também muito utilizada):
1
b−1 = .
b
Também escreveremos ab ao invez de a · b, desde que isto não induza a
confusão.
Exercı́cio 1.6.2. Mesma questão que no exercı́cio anterior mas substituı́ndo
domı́nio de integridade por corpo.
Exemplo 1.6.3. Vejamos que um corpo também possui a propriedade de cancelamento, isto é, que também é um domı́no de integridade. Com efeito,
suponhamos que K é um corpo e que a, b, c ∈ K, com a 6= 0, tais que
ab = ac.
Basta multiplicar pelo inverso de a aos dois lados da equação.
Exercı́cio 1.6.3. Mostre que a propriedade de cancelamente (D) é equivalente
(ou seja, pode ser substituı́da por) a propriedade
(D′ ) ab = 0 implica a = 0 ou b = 0, para todo a, b ∈ A.
1.7
Exercı́cios
1.7.1
Reduza
√à forma a + bı cada
√ uma das expressões seguintes:
a) 3 − 2ı − ı[2 − ı( 3 + 4)]; b) (3 − 5ı)(−2 − 4ı); c) (3ı − 1)(ı/2 + 1/3);
d) (2 + 3ı)2 .
1.7.2
Mostre que as seguintes igualdades são válidas:
a) (x + ıy)2 = x2 − y 2 + 2ıxy; b) (1 + ı)3 = −2 + 2ı; c) 1 + ı5 + 2ı10 + 3ı13 =
−1 + 4ı;
1.7.3
Idem que no exercı́cio 1.7.1 com as seguintes frações:
2 2
1
1+ı
3 − ı 4 − 3ı
1−ı
1+ı
1
;
;
;
−√
;
.
;
2 + 3ı 3 − 2ı −1 + 2ı −1 + ı
1−ı
2−ı 1+ı
28
CAPÍTULO 1. NÚMEROS COMPLEXOS
1.7.4
Represente graficamente os números
z2 , z1 z2 e z1 /z
√2 :
√ complexos z1 ,√
a) z1 = 3 +√4ı, z2 = (1 − ı)/5 2; b) z1 = (1 + ı) 3/2, z2 = ( 3 + ı)/2; c)
z1 = (1 + ı)/2√ 2,
z2 = 1 + ı 3.
1.7.5
Calcule a parte real e imaginária dos seguintes números complexos:
√ 2
2 (1 − ı 3)
−ı(2 − 3ı) ,
.
−2 + ı
1.7.6
Escreva os seguintes números complexos na forma polar e represente-os geométricamente:
−2 + 2ı,
1
−3 + 3ı −4
√ , −1 − ı,
√ ,√
.
−1 − ı 3
1+ı 3 3−ı
1.7.7
Obtenha fórmulas para cos 3θ e sin 3θ em função de sin θ e cos θ. Idem para
cos 4θ e sin 4θ.
1.7.8
Calcule as raı́zes dos seguintes números complexos e represente-as geométricamente:
q
√
√ 1/2 √
√ 1/4
√
√
3
3
−4, (1 + ı 3) , ı, −ı, (−1 + ı 3) ; −1 − ı 3.
Encontre todas as soluções da equação P (z) = 0 nos casos em que P (z)
é um dos polinômios
seguintes:
z 6 − 64, z 3 − 1, 5z 3 + 8, z 2 − 2z + 2, 2z 2 + z + 1, z 2 + (1 − 2ı)z + (1 + 5ı), z 4 + 9.
Capı́tulo 2
Equações de grau ≤ 4
2.1
Generalidades sobre equações polinomiais
Uma equação polinomial é uma equação da forma
an xn + an−1 xn−1 + · · · + a1 x + a0 = 0,
(2.1)
onde n é um número natural, an , an−1 , . . . , a1 , a0 ∈ C são chamados de coeficientes da equação e x é uma indeterminada ou variável. Diremos que a
equação 2.1 é de grau n se an 6= 0. Uma solução desta equação é um número
(em geral) complexo α que substituı́do no lugar do x satisfaz a igualdade,
isto é,
an αn + an−1 αn−1 + · · · + a1 α + a0 = 0.
Consideremos a seguinte expressão polinomial
f (x) = (x − α1 )(x − α2 ) · · · (x − αn )
onde αi é um número complexo para todo i = 1, . . . , n. É evidente que
α1 , . . . , αn são soluções da equação polinomial
f (x) = 0.
Como veremos no próximo capı́tulo toda equação polinomial de grau n
pode ser escrita na forma f (x) = 0 para certos números complexos α1 , . . . , αn ;
em particular esses números são as únicas soluções dessa equação.
29
30
CAPÍTULO 2. EQUAÇÕES DE GRAU ≤ 4
Vamos analisar quais são os coeficientes da expressão f (x). Basta efetuar
o produto dos fatores da forma (x − αi ) entre si. Comecemos observando
que cada termo do produto obtido como resultado de multiplicação dos n
fatores forma-se escolhendo um dos termos de cada fator e multiplicandoos entre si. Por exemplo quando escolhemos o termo x em cada binômio
x − αi e os multiplicamos entre si obtemos xn pois temos n fatores; donde
segue que o coeficiente an que acompanha xn deve ser 1. Analogamente,
para obtermos o coeficiente que acompanha xn−1 devemos escolher n − 1
vezes a indeterminada x e apenas uma vez o número −αi . Como temos n
possibilidades para escolher −αi (pois i = 1, . . . , n) obteremos n termos com
xn−1 , a saber, os termos −αi xn−1 ; somando-os, concluı́mos que
an−1 = −α1 − · · · − αn = −
n
X
αi .
i=1
Raciocinando de maneira análoga, teremos que an−2 é a soma dos produtos da forma (−αi )(−αj ) = αi αj para cada escolha de i e j. Um pouco de
reflexão nos mostra que
X
an−2 = α1 α2 + · · · + α1 αn + α2 α3 + · · · αn−1 αn =
αi αj .
i<j
n
Ou seja que an−1 constitue-se somando os n = 1 valores
de αi ; para formar
n
an−2 escolhemos todos os pares αi , αj possı́veis, tem 2 , multiplicamos-los e
finalmente somamos estes produtos.
Generalizando este raciocı́nio, obtemosa forma geral de um coeficiente
ak arbitrário: constitui-se escolhendo as nk combinações possı́veis de k elementos do conjunto
{α1 , . . . , αn },
multiplicando os k elementos de cada combinação e somando os nk resultados
obtidos; observe que, em particular, o último coeficiente a0 será o produto
de todos os números −αi , ou seja
a0 = (−1)n α1 · · · αn .
Podemos escrever o coeficiente que acompanha xk para k > 0 como
X
an−k =
αi1 · · · αik , k = 1, . . . , n.
i1 <...ik
Estas igualdades chaman-se, relações entre coeficientes e raı́zes de uma equação.
2.1. GENERALIDADES SOBRE EQUAÇÕES POLINOMIAIS
31
Exercı́cio 2.1.1. a) Mostre estas relações diretamente no caso n = 1, n = 2 e
n = 3.
b) Demonstre o caso geral usando indução matemática em n.
Uma das utilidades destas relações é a de construir equações com soluções
prescritas. Por exemplo, se queremos construir uma equação cujas soluções
sejam ı, −ı, 5, então pegamos n = 3 e α1 = ı, α2 = −ı e α3 = 5. Obtemos
a3 = 1, a2 = 5, a1 = 1, a0 = 5.
Para terminar este breve parágrafo de generalidades, dada uma equação
polinomial como na equação (2.1), vamos descobrir uma mudança de variáveis
(linear) da forma x = y + h para h ∈ C de forma que o termo de grau n − 1
(agora em y) não apareça, isto é, seu coeficiente seja nulo.
Substituı́ndo x por y + h na equação (2.1) obtemos
an (y + h)n + an−1 (y + h)n−1 + · · · + a1 (y + h) + a0 = 0.
(2.2)
Ao desenvolver as potências de cada binômio da forma (y + h)k é claro que
obteremos uma expressão polinomial de grau k em y. Por outro lado, queremos escolher h para que o coeficiente em y n−1 da expressão (2.2) se anule.
Basta então entender quais são as contribuições para tal coeficiente da parte
an (y + h)n + an−1 (y + h)n−1 da expressão, pois os termos restantes terão grau
menor do que n − 1 e portanto não contribuı́rão.
Usando a fórmula do binômio de Newton (veja exercı́cio 2.4.20), ou diretamente a relação entre coeficientes e raı́zes obtida acima aplicada à expressão
(y + h)(y + h) · · · (y + h)
(uma vez com n fatores e outra com n − 1) concluı́mos que o coeficiente de
an (y + h)n em y n−1 é nan h e aquele de an−1 (y + h)n−1 é an−1 . Portanto o
termo de grau n − 1 de (2.2) é (nan h + an−1 )y n−1 . Deduzimos que
h=−
an−1
nan
é o número procurado.
Observemos que dada uma equação de grau n, digamos em x, podemos
sempre fazer uma mudança de variaveis x = y + h de forma que a nova
equação, agora em y, tenha termo de grau n − 1 nulo. Encontrar as soluções
desta nova equação equivale a encontrar as soluções da antiga, pois dada uma
CAPÍTULO 2. EQUAÇÕES DE GRAU ≤ 4
32
solução y = α da equação transformada, basta considerar α − h obteremos
uma solução da equação original; reciprocamente, somando h às soluções da
equação em x obtemos as soluções da equação em y. Para ver a utilidade
deste procedimento o leitor pode fazer o exercı́cio seguinte:
Exercı́cio 2.1.2. a) Aplicando a mudança de variaveis acima no caso n = 2
mostre que resolver uma equação geral de grau 2 reduz-se a resolver uma
equação da forma
y 2 + b = 0.
b) Deduza uma outra forma de resolver a equação de grau 2 que não seja
utilizando a fórmula de Baskara.
2.2
Equação de grau 3
No restante do capı́tulo seguiremos de perto o capı́tulo XIII de [2].
2.2.1
Método e Hudde e Equações de Cardano
Agora vamos utilizar os números complexos para resolver a equação geral de
grau 3. É uma equação da forma
Ay 3 + By 2 + Cy + D = 0,
(2.3)
onde A, B, C, D são números reais e A 6= 0; como estamos trabalhando num
corpo, basta dividir por A, podemos supor que A = 1: com efeito, escrevemos
B ′ :=
B ′
C
D
, C := , D′ := ,
A
A
A
e obtemos uma equação da forma
y 3 + B ′ y 2 + C ′ y + D′ = 0,
cujas soluções são exatamente aquelas da equação (2.3).
Como vimos no parágrafo precedente, fazendo a mudança de variaveis
linear da forma y = x + h, onde h = −B ′ /3 obtemos uma equação em x da
forma
x3 + ax + b = 0;
(2.4)
dizemos que a equação cúbica está escrita na forma reduzida.
33
2.2. EQUAÇÃO DE GRAU 3
As soluções de (2.3) obtem-se a partir das soluções de (2.4) somando o
valor de h achado.
Vamos agora encontrar as soluçãoes da equação (2.4) utilizando um procedimento desenvolvido por Juan Hudde (1633-1704) e conhecido como Método
de Hudde. Cabe salientar que foi Scipione Dal Ferro (1465-1526) quem resolveu pela primeira vez a equação de grau três mas não publicou seu trabalho. Outro Matemático, Nicolás de Brescia, conhecido sob o pseudônimo de
Tartaglia (1499-1557) também resolveu esta equação e tampouco publicou
a solução achada; sob promessa de não divulgá-lo Tartaglia comunicou seu
descubimento a Girolamo Cardano (1501-1576), quem o publicou em 1545
como sendo seu, no seu compêndio titulado Ars Magna.
Na equação de grau 2, as soluçãos são obtidas como soma de dois números,
que dependem dos coeficientes, cuja natureza pode ser diversa (isto é, podem
ser imaginários, mesmo que os coeficientes sejam reais) . É de esperar que no
caso de grau 3 a situação seja bem mais complicada. De fato, vamos mostrar
que toda solução pode ser escrita como soma de dois números complexos
cujas partes real e imaginária dependem dos coeficientes da equação.
Pocuremos então soluções da equação (2.4) escritas na forma x = u + v,
onde u, v ∈ C. Um tal x será solução de (2.4) se e somente se
(u + v)3 + a(u + v) + b = 0.
Por outro lado, ao desenvolver (u + v)3 é facil observar que
(u + v)3 − 3uv(u + v) − (u3 + v 3 ) = 0.
Então, se encontrarmos u e v tais que
a = −3uv, b = −(u3 + v 3 ),
teremos achado uma solução. Elevando ao cubo a primeira igualdade, obtemos
a3
− = u3 v 3 ,
27
3
3
donde segue que u e v são as raı́zes da equação de grau dois seguinte:
z 2 + bz −
a3
= 0.
27
Esta equação chama-se a resolvente da equação 2.4.
34
CAPÍTULO 2. EQUAÇÕES DE GRAU ≤ 4
Concluı́mos que se z1 , z2 são as soluções da equação resolvente, basta escolher como u e v quaisquer raı́zes cúbicas ζ1 , ζ2 ∈ C de z1 e z2 , respectivamente,
satisfazendo a seguinte relação:
−3ζ1 ζ2 = a;
(2.5)
temos então uma solução x := ζ1 + ζ2 da equação cúbica reduzida (2.4).
Observemos não obstante que este procedimento é sempre possı́vel mas requer
um certo cuidado: com efeito, as soluções z1 e z2 da equação resolvente
verificam a equação
a3
− = z1 z2
27
e então −a/3 é uma das (em princı́pio) três raı́zes cúbicas do produto z1 z2
que, pelas propriedades de raı́zes complexas, devem ser necessariamente produto de raı́zes cúbicas de z1 com raı́zes cúbicas de z2 . Porém, observe-se que
no caso onde z1 6= 0 e z2 6= 0 (isto é, quando a 6= 0) temos três raı́zes cúbicas
para z1 e três para z2 o que nos dá nove produtos; em geral estaremos obrigados a escolher adequadamente as raı́zes cúbicas de z1 e z2 . Uma forma fácil
de fazer isso é a seguinte: Quando a 6= 0 (se a = 0 a equação (2.4) resolve-se
sem necessidade do método de Hudde), escolhemos u = ζ1 uma qualquer das
raı́zes cúbicas de z1 e logo calculamos v = ζ2 a partir da equação (2.5): isto
é,
a
v := − .
3u
verifiquemos que u3 e v 3 são ainda soluções da equação resolvente; só precisamos verificar que u3 + v 3 = −b. Sabemos que
(u3 )2 + b(u3 ) −
a3
= 0;
27
como u3 6= 0 neste caso, dividindo ambos termos da igualdade acima obtemos
u3 −
a3
= −b,
27u3
donde segue a afirmação.
Não é difı́cil de se convencer que
x′ := ωu + ω 2 v e x′′ := ω 2 u + ωv
35
2.2. EQUAÇÃO DE GRAU 3
também são soluções de (2.4), onde ω é a raiz cúbica primitiva da unidade,
isto é,
√
1
3
.
ω := − + ı
2
2
Com efeito, se x′ = u′ + v ′ com u′ = ωu e v ′ = ω 2 v, temos
(u′ )3 + (v ′ )3 = u3 + v 3 , u′ v ′ = uv;
analogamente para x′′ .
Resumindo, as três soluções da equação (2.4) estão dadas pelas seguintes
equações conhecidas como Equaçãoes de Cardano:

 x1 = u + v
x2 = ωu + ω 2 v

x3 = ω 2 u + ωv.
Ou equivalentemente

 x1 = u + v, √
x2 = − u+v
+ ı√3 u−v
2
2

u−v
3
x3 = − u+v
−
ı
.
2
2
Observe que se u 6= v, estas soluções são efetivamente diferentes, tendo
então atingido o número máximo de raı́zes diferentes para uma equação de
gau 3, e que se u = v, como
ω 2 + ω = −1,
obtemos as soluções 2u e −u, sendo esta última dupla. Vejamos alguns
exemplos.
Exemplos 2.2.1. Consideremos as seguintes equações cúbicas na forma reduzida:
a) x3 − 6x − 9 = 0,
b) x3 − 12x − 16 = 0,
c) x3 − 15x − 4 = 0.
No caso (a) a resolvente é
z 2 − 9z + 8 = 0,
cujas soluções são z1 = 8, z2 = 1. Escolhemos u = 2, a raiz cúbica real de
8. Da equação de compatibilidade uv = 2 obtemos v = 1 que é a raiz cúbica
CAPÍTULO 2. EQUAÇÕES DE GRAU ≤ 4
36
real de 1. Observemos que dado que as outras raı́zes cúbicas de 8 e de 1
são imaginárias, podemos concluir de forma direta que v = 1 é a única raiz
cúbica de z1 = 1 que pode satisfazer a equação de compatibilidade.
Das equações de Cardano, obtemos as três soluções da equação cúbica:
√
√
3
3
3
3
, x3 = − − ı
.
x1 = 3, x2 = − + ı
2
2
2
2
No caso (b) a resolvente é
z 2 − 16z + 64 = 0,
cujas soluções são z1 = z2 = 8. Então podemos escolher u = v = 2 donde
obtemos
x1 = 4, x2 = x3 = −2.
Finalmente, no caso (c) a resolvente é
z 2 − 4z + 125 = 0,
donde
z1 = 2 + 11ı, z2 = 2 − 11ı.
Observemos que (2 + ı)3 = 2 + 11ı, o que mostra que podemos escolher
u = 2 + ı; da equação de compatibilidade obtemos
v=
15
= 2 − ı.
3(2 + ı)
As soluções obtidas são:
x1 = 4, x2 = −2 −
2.2.2
√
2, x3 = −2 +
√
3.
Discussão da equação cúbica
Consideremos a equação cúbica na sua forma reduzida
x3 + ax + b = 0,
com a, b ∈ R. Vamos tentar responder às perguntas seguintes:
37
2.2. EQUAÇÃO DE GRAU 3
Existem raı́zes múltiplas ?
Existem soluções reais ? E em caso afirmativo: Quantas ?
Para começar, consideremos alguns casos especiais:
Se b = 0, as soluções da equação são
√
x = 0, x = ± −a;
ou seja que existe sempre a raiz real x = 0 e só haverá outras raı́zes reais
quando a for negativo.
Se a = 0, as soluções estão dadas pelas raı́zes cúbicas de −b; então sempre
existe raiz real e, quando b 6= 0 mais duas raı́zes imaginárias.
Consideremos agora o caso geral, isto é, quando a 6= 0 e b 6= 0. Para
valors de x diferentes de zero, podemos escrever a equação cúbica na forma
b
x2 + a = − .
x
De maneira análoga a como vimos no capı́tulo de introdução, as raı́zes reais correspondem aos valores da abscissa dos pontos de interseção dos gráficos
das funções reais
b
y = x2 + a, y = − .
x
Existem três situações possı́veis para valores de b negativos e três para valores de b positivos. Por exemplo, suponhamos b < 0. Se a é suficientemente
negativo, é claro que os gráficos se interceptarão em três pontos cujas abscissas são diferentes, fornecendo três soluções reais e distintas da equação
cúbica. Se, pelo contrário, o valor de a for positivo e suficientemente grande,
então existirá uma única interseção obtendo desta forma uma única solução
real. Finalmente, se imaginarmos o valor de a percorrendo todos os valores
reais possı́veis, podemos antecipar que haverá um único valor de a onde a
equação deixa de ter três soluçoes reais e não tem ainda uma única solução
real; para este valor preciso de a os gráficos se cortam transversalmente num
ponto, isto é, possuem retas tangentes distintas neste ponto (na figura, isto
acontece no primeiro quadrante) e possuem a mesma reta tangente num outro ponto. Isto fornece duas únicas raı́zes reais. Porém, a raı́z obtida a partir
do ponto onde ambos gráficos são tangentes, parece ser de natureza diferente da outra: com efeito, suponhamos que a0 é o valor de a para o qual o
gráficos tem um ponto cujas retas tangentes coincidem. Se considerarmos as
instâncias onde a < a0 , então estaremos na primeira situação, onde o ponto
CAPÍTULO 2. EQUAÇÕES DE GRAU ≤ 4
38
Figura
de tangência bifurca em dois pontos distintos onde há transversalidade (não
mais tangência). Então, podemos entender este ponto como a posição limite
de dois pontos diferentes; em linguagem moderna um tal ponto de interseção
dos gráficos chama-se um ponto duplo ou ponto de multiplicidade dois. Nesta
situação, teremos então uma solução da nossa equação cúbica que conta duas
vezes, o que chamaremos uma solução dupla 1
Em particular concluı́mos que para toda equação cúbica, existe pelo menos uma solução ou raı́z real.
Vamos agora obter um critério análogo ao que conhecemos para a equação
quadrática, onde basta conhecer o sinal de um certo número, chamado discriminante, para decidir sobre a qualidade e quantidade de raı́zes.
Analisando o Método de Hudde, não é dificil de se convencer que uma
equação cúbica possuirá certamente soluções duplas se esse for o caso da
equação resolvente associada.
Por outro lado, a equação resolvente possui soluções duplas se e somente
se
4a3 + 27b2 = 0,
pois um cálculo fácil mostra que o discriminante da equação resolvente é
precisamente
4a3
27b2 + 4a3
b2 +
=
.
27
27
Isto sugere que este número esteja relacionado com a existência e natureza
das soluções de forma análoga ao que acontece com a equação quadrática, o
que motiva a seguinte definição.
Definição 2.2.2. Chamamos discriminante da equação cúbica reduzida (1.2)
o número real
D := −(4a3 + 27b2 ).
O sinal na frente é por razões históricas; como veremos a continuação
desta forma obteremos um resultado análogo ao da equação quadrática, onde
a presença de soluções imaginárias corresponde ao caso onde D < 0.
1
Aqui não fomos suficientemente rigorosos, pois formalisar adequadamente esta situação não é completamente trivial. Mas o leitor pode considerar uma situação análoga
com a equação quadrática x2 + bx + c = 0 e observar que quando b2 se aproxima de 4ac
as duas soluções tendem a uma só, o que ocorre unicamente quando b2 = 4ac.
39
2.2. EQUAÇÃO DE GRAU 3
Mantemos todas as notações introduzidas no métoto de Hudde acima.
Distinguimos três casos:
(i) Caso onde D < 0. Neste caso as raı́zes z1 e z2 da equação resolvente
são reais. Se u é a raiz cúbica real de z1 , da relação de “compatibilidade”
a
uv = − ,
3
teremos que v também é a raiz cúbica real de z2 . Como u 6= v, a equação
cúbica reduzida de coeficientes reais terá uma raiz real e duas imaginárias
conjugadas que, segundo as equações de Cardano são:

 x1 = u + v, real√
x2 = − u+v
+ ı√3 u−v
2
2

u−v
3
−
ı
.
x3 = − u+v
2
2
(ii) Caso onde D = 0. Neste caso z1 = z2 = −b/2. A equação reduzida
possui tr es raı́zes, uma simples e uma dupla:
p
simples
x1 = 2 3 −b/2,
p
3
x2 = x3 = −b/2.
(iii) Caso onde D > 0. Agora z1 e z2 são imaginárias; mais precisamente,
como o leitor pode verificar logo de um cálculo fácil,temos:
r
r
−b
D
D
−b
+ı
, −
−ı
.
z1 = −
2
108
2
108
Escrevamos u = α + ıβ uma das raı́zes cúbicas de z1 ; como já observamos
anteriormente, uma das raı́zes cúbicas de z2 deve ser conjugada desta, pois
z1 e z2 o são. Tomamos v = α − ıβ. O produto
uv = α2 + β 2
satisfaz a equação de compatibilidade. Aplicando as fórmulas de cardano,
como o leitor poderá verificar sem maiores problemas, obtemos

 x1 = 2α
√
x2 = −α + β √3

x3 = −α − β 3.
Podemos então resumir o estudo qualitativo da equação cúbica na sua
forma reduzida no teorema seguinte.
CAPÍTULO 2. EQUAÇÕES DE GRAU ≤ 4
40
Teorema 2.2.3. Consideremos a equação cúbica
x3 + ax + b = 0;
(2.6)
denotemos D seu discriminante. Temos as seguintes afirmações.
a) Si D = 0, então (2.6) possui raiz dupla, sendo todas as soluções reais;
b) Si D > 0, então (2.6) possui trêss soluções reais e distintas;
c) Si D < 0, então (2.6) possui duas soluções imaginárias conjugadas e
uma solução real.
Exemplo 2.2.4. Retomamos o exemplo 2.2.1. Um cálculo fácil mostra que o
discriminante D é negativo no caso (a), zero no caso (b) e positivo no caso
(c), em concordância com a natureza das soluções encontradas.
Exemplo 2.2.5. Consideremos a equação cúbica
x3 + x + b = 0, b ∈ R.
Analisemos quando é que esta equação possui uma única raiz real em função
do parâmetro b. Basta encontrar b para que −D = 27b + 4 seja zero (observe
que a = 1 nesta equação). Concluı́mos que b = −4/27.
2.3
Equação de grau 4
Neste parágrafo vamos resolver a equação geral de grau 4, ou Equação Quártica.
Uma equação quártica é uma equação da forma
Ay 4 + By 3 + Cy 2 + Dy + E = 0,
com A 6= 0; embora o método que utilizaremos independe da natureza dos
coeficientes A, B, C, D, E, como no caso de grau 3, estaremos interessados
apenas no caso de coeficientes reais, isto é, suporemos
A, B, C, D, E ∈ R.
Começamos escrevendo nossa equação na forma
y4 +
B 3 C 2 D
E
y + y + y+ =0
A
A
A
A
41
2.3. EQUAÇÃO DE GRAU 4
Mediante a mudança de variáveis
y =x+
B
,
4A
encontramos a equação equivalente cujo coeficiente cúbico é nulo; ou seja,
uma equação da forma
x4 + px2 + qx + r = 0,
(2.7)
com p, q, r ∈ R.
Antes de passar à resolução propriamente dita, obteremos a relação entre
coeficientes e raı́zes de uma equação polinômial de grau 3, o que é um caso
particular de uma relação geral que desenvolveremos no capı́tulo 2 (ver....);
cabe lembrar que o caso de grau 2, que é bem conhecido, foi utilizado para
introduzir a equação resolvente da equação cúbica reduzida. De fato, no intuito de generalizar a construção do método de Hudde, precisamos conhecer
apenas como construir os coeficientes de uma equação de grau 3 que possua como raı́zes três números predeterminados; no caso de grau 2, o fato
correspondente é que α, β são raı́zes da equação
z 2 − s1 z + s2 = 0,
onde s1 = α + β e s2 = αβ.
Sejam α, β, γ ∈ C. Um cálculo direto mostra que
(t − α)(t − β)(t − γ) = t3 − s1 x2 + s2 x − s3 ,
onde
s1 = α + β + γ, s2 = αβ + βγ + αγ, s3 = αβγ.
Vê-se então que α, β, γ são raı́zes da equação
t3 − s1 t2 + s2 t − s3 = 0.
2.3.1
Método de Euler
O método desenvolvido por Leonard Euler (1707-1783) é uma generalização
mais ou menos imediata do método de Hudde, com a complicação subjacente do aumento de grau. Cabe salientar, não obstante, que foi Ludovico
Ferrari (1522-1565), aluno de Cardano, quem resolveu a equação quártica
42
CAPÍTULO 2. EQUAÇÕES DE GRAU ≤ 4
na forma reduzida; Cardano também publicou o trabalho de Ferrari no seu
Ars Magna, desta vez com a devida autoria (Veja [2, pág. 422] para mais
resenhas históricas).
Começamos testando uma solução hipotética da equação quártica reduzida (2.7) da forma
x = u + v + w,
(2.8)
com u, v, w ∈ C.
Elevando ao quadrado (2.8)obtemos
x2 − (u2 + v 2 + w2 ) = 2(uv + uw + vw);
elevando mais uma vez ao quadrado e tendo em conta (2.8)obtemos
x4 − 2(u2 + v 2 + w2 )x2 − 8uvwx + (u2 + v 2 + w2 )2 − 4(u2 v 2 + u2 w2 + v 2 w2 ) = 0.
Comparando esta última equação com (2.7), concluı́mos que basta determinar u, v, w de forma que sejam satisfeitas as seguintes condições:

 −2(u2 + v 2 + w2 ) = p
−8uvw = q
(2.9)
 2
(u + v 2 + w2 ) − 4(u2 v 2 + u2 w2 + v 2 w2 ) = r,
pois u + v + w verifica a equação (2.7).
Finalmente, elevando ao quadrado a segunda das equações (2.9) e substituı́ndo a primeira na terceira, obtemos
 2
p
2
2
 u + v + w2 = − 2
q
u2 v 2 w2 = 64
 2 2
p2
u v + u2 w2 + v 2 w2 = 16
− 4r .
Portanto, para x = u+v+w ser solução de (2.7), devemos necessariamente
ter que u2 , v 2 , w2 são raı́zes da equação cúbica
2
r
q2
p
p 2
3
−
= 0.
(2.10)
t−
t + t +
2
16 4
64
A equação (2.10) é a Resolvente da Equação Quártica Reduzida.
De maneira análoga a como fizemos no método de Hudde, se t1 , t2 , t3 são
as raı́zes de (2.10), escolhemos u, v, w de forma que
q
(i) u2 = t1 , v 2 = t2 , w2 = t3 , e (ii) uvw = − .
8
2.3. EQUAÇÃO DE GRAU 4
43
Mais precisamente, de (i) obtemos
√
√
√
u = ± t1 , v = ± t2 , w = ± t3 ,
donde temos oito possibilidades para u + v + w. Utilizando (ii), eliminaremos
quatro destas; na prática, escolhemos os quatro pares de valores de, por
exemplo, u e v, segundo (i), e de (ii) obtemos os correspondentes valors de
w.
Embora o discriminante também possa ser definido para a equação quártica
não é possı́vel fazer uma discussão sobre a natureza das raı́zes (no caso de
p, q, r ∈ R, que embora não seja necessário para a aplicação do método de
Euler, estamos supondo desde o inı́cio) de maneira taõ contundente como
no caso de grau 3. Não obstante, temos uma descrição bastante precisa em
termos da natureza da equação resolvente, cuja demonstração fica a cargo do
leitor:
(i) Se (2.10) possui três raı́zes positivas, então (2.7) possui quatro raı́zes
reais.
(ii) Se (2.10) possui uma raiz positiva e duas negativas distintas, então
(2.7) possui quatro raı́zes imaginárias conjugadas duas a duas.
(iii) Se (2.10) possui uma raiz positiva e uma negativa doble, então (2.7)
possui uma raiz doble real y duas imaginárias conjugadas.
(iv) Se (2.10) possui uma raiz positiva e duas complexas conjugadas, então
(2.7) possui duas raı́zes reais diferentes y duas imaginárias conjugadas.
Observação 2.3.1. No caso onde q = 0, a equação (2.7) é biquadrada e podemos resolve-la de maneira elementar. Se r = 0 então x = 0 é solução e basta
então resolver uma equação de grau 3. Por outro lado, o caso geral requere, na
maior parte das situações, de calculos intrincados, pois geralmente a equação
resolvente não estará na forma reduzida; porém, quando p = 0, estaremos
lidando com um caso suficientemente geral como para estarmos obrigados
a usar o método de Euler, mas com uma significativa simplificação, pois a
resolvente estará na forma reduzida: daremos exemplos só nesta situação.
Exemplos 2.3.2. ...exemplos onde a resolvente seja uma das dos exemplos
anteriores....
CAPÍTULO 2. EQUAÇÕES DE GRAU ≤ 4
44
2.4
Exercı́cios
2.4.1
Resolva as equações cúbicas seguintes: a) x3 +9x−6 = 0; b) x3 −18x−30 = 0;
c) x3 + 18x + 50 = 0; d) x3 − 2x + 1 = 0; e) y 3 − 9y 2 − 9y − 15 = 0; f)
y 3 − 3y 2 + 12y + 16 = 0.
2.4.2
Faça a discussão das equações cúbicas do exercı́cio 2.4.1.
2.4.3
Encontre a para que a equação x3 + ax + 1 = 0 possua soluções múltiplas.
2.4.4
Sejam t, s ∈ R números reais não nulos. Considere a equação cúbica
x3 + t2 x + s3 = 0.
Determine todos os valores de t e s que fazem com que a equação acima
tenha raı́zes múltiplas.
2.4.5
Mostre que a equação x3 − ax + 2 = 0 possui três raı́zes reais se e somente
se a ≥ 3.
2.4.6
Escreva as seguintes equaçãoes quárticas na forma reduzida e monte a resolvente correspondente a cada uma delas: a) x4 + x3 − 3x2 + 6x − 2 = 0; b)
y 4 + 2y 3 − y 2 + 2y − 1 = 0.
2.4.7
Escreva as equações quárticas na forma reduzida cuja resolvente é cada uma
das três primeiras equações cúbicas do exercı́cio 2.4.1.
2.4. EXERCÍCIOS
45
2.4.8
Determine as soluções das seguintes equaçãoes quárticas: a) x4 − 3x2 + 6x −
2 = 0; b) y 4 − y 2 + 2y − 1 = 0.
2.4.9
Encontre o quociente e o resto de dividir a(x) por b(x) onde o par (a(x), b(x))
é um dos seguintes:
3
3
a) (3x4 −x2 −2, x2 −1); b) (ıx3 +(4−2ı)x+1, x2 +1); c) (x5 +3x
√ , x +x+1);
n
4
6
d) (x − 1, x − 1), n ∈ N; e) (x + 1, x + ı); f)(x − 1, x − 1 − ı 3).
2.4.10
Mostre que para todo inteiro n ≥ 1 vale a seguinte igualdade:
y n+1 − z n+1 = (y − z)(y n + y n−1 z + y n−2 z 2 + · · · + yz n−1 + z n )
(sugestão: divida por z n+1 e introduza a nova variável x := y/z).
2.4.11
Para os polinômios abaixo analise a irredutibilidade e encontre os divisores
correspondentes em R[x] e C[x] respectivamente, quando isto fizer sentido:
a) 3x4 − x2 − 2; b) x2 + x + 1; c) x4 + x; d) x2 − ıx + 1; e) x3 − 6x − 9.
2.4.12
Considere o polinômio f (x) = 2x4 − 4x3 + 4x − 2. Sabendo que f (1) =
f (−1) = 0, encontre todos os divisores mônicos de f (x) em R[x].
2.4.13
Idem que no exercı́cio 2.4.12, mas em R[x] e também em C[x], para com o
polinômio g(x) = x4 + x3 − x − 1 sabendo que
√ !
√ !
3
3
−1
−1
+ı
−ı
=g
= 0.
g
2
2
2
2
46
CAPÍTULO 2. EQUAÇÕES DE GRAU ≤ 4
2.4.14
Encontre um polinômio de grau 5, a coeficientes reais, que possua as raı́zes
0, ı e 1 − ı. Quantos polinômios existem com esta propriedade ?
2.4.15
Sem fazer a divisão, mostre que o polinômio f (x) := x3 + 6x2 + 11x + 6 é
divisı́vel por x + 1, x + 2 e x + 3; deduza que f (x) é um produto de três
polinômios lineares.
2.4.16
Dê exemplos de:
a) polinômio irredutı́vel em R[x] de grau 2; b) polinômios irredutı́veis em
Q[x] de graus 2 e 3 que sejam redutı́veis em R[x].
2.4.17
Encontre o polinômio b(x) de grau 3 que satisfaz às condições seguintes:
b(0) = 0, b(1) = 0, b(−1) = 1, b(2) = −1.
2.4.18
Considere um polinômio mônico de grau n ≥ 1. Mostre que o termo independente é (−1)n vezes o produto das suas raı́zes e que o termo de grau n − 1
é o oposto da soma destas. Pode dizer alguma coisa sobre os outros termos
?
2.4.19
Pn
k
Seja f (x) =
k=0 ak x ∈ C[x] um polinômio mônico de grau n tal que
f (0) = 1; notemos α1 , . . . , αn ∈ C suas raı́zes. Mostre que
−a1 =
(sugestão: utilize o exercı́cio 2.4.18).
n
X
1
αi
i=1
2.4. EXERCÍCIOS
47
2.4.20
Utilizando a relação entre coeficientes e raı́zes de um polinômio, demonstre
a fórmula
n X
n n−i i
n
x a,
(x + a) =
i
i=0
n
onde i indica o número de combinações de n elementos tomados de i em
i, isto é
n!
n
=
,
i
(n − i)! i!
cenhecida como fórmula do Binômio de Newton.
48
CAPÍTULO 2. EQUAÇÕES DE GRAU ≤ 4
Capı́tulo 3
Polinômios
3.1
Introdução
Neste capı́tulo estudaremos de maneira mais abstrata as expressões que definem nossas equações algébricas. Mais precisamente analisaremos o vı́nculo
existente entre a natureza dos coeficientes encontrados numa tal expressão e
a natureza da expressão em si; afim de esclarecer, vejamos um exemplo.
2
Exemplo 3.1.1. Consideremos
a equação x√
− 3 = 0; como sabemos é possı́vel
√
√
escrever x2 −3 = (x− 3)(x− 3), onde ± 3 são as soluções da equacão. Observemos, por um lado, que os coeficientes envolvidos na equação de grau dois
sao números racionais enquanto as soluções desta são irracionais; por outro
lado, a existência das soluções nos permitiu fatorar a expressão quadrática
como produto de duas expressões lineares cujos coeficientes deixam de ser racionais. Não é dificil de se convencer que a equação quadrática original, não
pode ser fatorada como produto de duas expressões lineares com coeficientes
racionais (tente demonstrar isto).
3.2
O Anel de polinômios
Seja D um domı́nio de integridade (veja definição 1.6.1).
Definição 3.2.1. Um polinômio com coeficientes em D é uma expressão da
forma
f (x) = a0 + a1 x + · · · + an−1 xn−1 + an xn ,
49
50
CAPÍTULO 3. POLINÔMIOS
onde n é um inteiro não negativo e a0 , a1 , · · · , an−1 , an ∈ D; ai chama-se
o coeficiente i-ésimo de f (x), i = 0, . . . , n. Se an 6= 0 dizemos que an é o
coeficiente lı́der e que o inteiro n é o grau de f (x).
Dois polinômios
n
X
f (x) =
k
ak x , g(x) =
m
X
bj xj
j=0
k=0
são iguais se para todo inteiro não negativo i tal que ai 6= 0 ou bi 6= 0, temos
ai = b i ;
desta forma o polinômio f (x) é igual, por exemplo, ao polinômio
n
X
ak xk + 0xn+1 .
k=0
Definimos o Polinômio Nulo que denotaremos 0(x) ou, quando não houver motivo para ambigüidade, simplesmente 0 como sendo qualquer um dos
polinômios iguais cujos coeficientes são todos nulos; de maneira equivalente,
o polinômio nulo é qualquer polinômio que não possui coeficiente lı́der. De
maneira análoga, o Polinômio Unidade ou Polinômio Um é o polinômio de
grau 0 cujo coeficiente lı́der é
a0 = 1.
Denotaremos D[x] o conjunto de todos os polinômios com coeficientes em
D, isto é
n
X
D[x] := {
ak xk : n ≥ 0, a0 , . . . , an ∈ D}.
k=0
Por outro lado, os polinômios de grau 0 são aqueles cujo coeficiente lı́der
acompanha à potência x0 de x, isto é, aqueles polinômios que não possuem
indeterminada. Segundo nossa noção de igualdade acima, podemos considerar estes polinômios como sendo iguais a um único elemento do domı́nio D;
desta maneira, podemos considerar o domı́nio D como estando contido no
conjunto dos polinômios com coeficientes em D; simbolicamente, podemos
então escrever
D ⊂ D[x];
3.2. O ANEL DE POLINÔMIOS
51
em particular estamos identificando o zero e a unidade de D com o polinômio
nulo e o polinômio unidade respectivamente.
Aos efeitos do objetivo destas notas, podemos supor que o domı́nio D é
um dos seguintes:
Z, Q, R, C;
não obstante, e a tı́tulo informativo (e porque não, formativo), vamos ver alguns exemplos de polinômios com coeficientes em outros domı́nios e também
com coeficientes em um anel comutativo com unidade (veja definição 1.6.1)
que não é um domı́nio.
Comecemos lembrando os conjuntos de inteiros módulo um inteiro positivo. Formalmente, é o conjunto de classes de equivalência em Z associado
à relação de equivalência ser côngruo a. Mais precisamente, seja r ∈ N um
inteiro positivo; dados m, n ∈ Z, dizemos que m é côngruo a n (ou que m e
n são côngruos) módulo r, o que denotamos
m ≡ n (mod r) ,
se m − n é múltiplo de r. Pela teoria da divisibilidade de números inteiros,
é claro que dado um inteiro m arbitrário ele pode ser côngruo a apenas um
dos r inteiros
0, 1, . . . , r − 1.
Denotamos por i o conjunto de todos os inteiros côngruos a i ∈ {0, 1, . . . , r −
1}; podemos imaginar que aqueles inteiros que são côngruos a um mesmo
inteiro i possuem uma mesma cor, tendo cores diferentes aqueles não côngruos
a ele; desta forma existirão r cores diferentes de inteiros, onde cada cor
corresponde a uma única classe.
Denotamos
Zr := {0, 1, . . . , r − 1},
o conjunto de classes de congruência módulo r (ou cores diferentes). Usando
as propriedades da divisibilidade (como apreendidas nos cursos elementares
de aritmética) vê-se sem dificuldade que Zr é um anel comutativo com unidade. Além disso, Zr é um domı́nio se e somente se n é um número primo,
pois āb̄ = 0̄ se e somente se r divide ab: se r for primo, então n divide a
ou b; reciprocamente, se r não for primo então ele é produto de dois inteiros
positivos a, b ≤ n − 1.
Observação 3.2.2. De fato Zr é um corpo se e somente se r é um número
primo. Com efeito, é suficiente mostrar que todo elemento diferente de 0̄
52
CAPÍTULO 3. POLINÔMIOS
possui inverso se e só se p é um número primo; se a ∈ Z não é divisı́vel por
p então mdc(p, a) = 1. Portanto existem m, n ∈ Z tais que
am + pn = 1.
Então am ≡ 1 ( mod p) o que significa que m̄ é inverso de ā em Zr . Deixamos como exercı́cio para o leitor a verificar que a recı́proca desta afirmação
também é verdadeira.
Exemplo 3.2.3. Consideremos Z6 . Temos que 2̄ · 3̄ = 6̄ = 0̄ em Z6 . Como
2̄ 6= 0̄ e 3̄ 6= 0̄ concluı́mos que Z6 não é um domı́nio de integridade.
Vamos agora observar como as operações elementares em D “induzem”
operações elementares
P em D[x] compatı́veis
P comj a inclusão D ⊂ D[x].
Sejam f (x) = ni=0 ai xi e g(x) = m
j=0 bj x polinômios em D[x]. Sem
perda da generalidade suporemos n ≥ m. Podemos então escrever
g(x) =
n
X
bj xj
j=0
onde bm+1 = bm+2 = · · · = bn = 0.
Soma: A soma f (x) + g(x) de f (x) e g(x) é a expressão
f (x) + g(x) :=
n
X
(ak + bk )xk .
k=0
Como ak + bk = bk + ak ∈ D concluı́mos por ou lado que f (x) + g(x) ∈ D[x] e
por outro lado que f (x)+g(x) = g(x)+f (x), isto é, que a soma é comutativa;
o leitor podera verificar sem dificuldade que também é associativa.
É fácil verificar que o polinômio
nulo 0(x) é o neutro da soma (faça-o !).
P
Denotamos −f (x) := ni=0 (−ai )xi onde −ai é o simétrico do elemento
ai . Temos então f (x) + (−f (x) = 0(x) donde concluı́mos que −f (x) é o
simétrico de f (x).
Multiplicação O produto f (x) · g(x) de f (x) e g(x) é a expressão
f (x) · g(x) :=
n+m
X
c k xk ,
k=0
onde
ck :=
X
i+j=k
ai bj = (a0 bk + a1 bk−1 + · · · + ak b0 ), k = 0, . . . , n + m.
3.3. TEORIA DA DIVISIBILIDADE EM D[X]
53
Evidentemente f (x) · g(x) = g(x) · f (x) ∈ D[x]. O leitor pode verificar que
este produto ou multiplicação de polinômios é uma operação associativa.
Quando não houver lugar para confusão denotaremos f (x) · g(x) = f (x)g(x).
Da definição de produto concluı́mos que se f (x) e g(x) não são nulos, ou
seja an 6= 0 e bm 6= 0. Como D é um domı́nio de integridade an bm = cn+m 6= 0
o que implica que f (x)g(x) 6= 0 (propriedade (D) de domı́nio de integridade
(1.6.1)). Então
grau(f (x)g(x)) = grau f (x) + grau g(x) = n + m.
Como já vimos no caso de domı́nios de integridade, a propriedade (D)
equivale a dizer que f (x)g(x) = 0 implica f (x) = 0 ou g(x) = 0.
O polinômio unidade 1(x) é o neutro da multiplicação (demonstre isto !).
Analisemos agora a existência de inverso para a multiplicação. Suponhamos
que f (x) não é o polinômio nulo, isto é, an 6= 0. Suponhamos também que
f (x)g(x) = 1(x). Então f (x)g(x) tem grau 0, donde colcluı́mos que f (x) e
g(x) tem graus 0. Portanto a0 6= 0, b0 6= 0 e a0 = b0 = 1 e então os únicos
polinômios que possuem inverso são os polinômios constantes, onde as constantes correspondentes são invertı́veis em D; dito de outra forma, o conjunto
de poinômios invertı́veis em D[x] é o conjunto de elementos invertı́veis de D.
O seguinte teorema resume as propriedades estruturais de D[x] relativas
às operações de soma e multiplicação, cuja demonstração deixamos para o
leitor.
Teorema 3.2.4. A tripla (D[x], +, ·) é um domı́nio de integridade cujos invertı́veis são os invertı́veis de D.
3.3
Teoria da Divisibilidade em D[x]
Dado que D[x] não é um corpo, sabemos que não teremos uma divisão exata
em D[x], da mesma forma que ocorre com Z. Gostariamos então de ter um
argorı́tmo da divisão “não exata” análogo ao que temos no domı́nio Z de
forma a poder dividir um polinômio por outro obtendo um quociente e um
resto. Mais precisamente, consideremos polinômios f (x), g(x) ∈ D[x]; nos
perguntamos se existem polinômios q(x) e r(x), também em D[x], tais que
(i) f (x) = g(x)q(x) + r(x)
onde r(x) é “menor” que g(x) em algum sentido que não é muito claro
pois até o momento não temos definido uma relação de ordem no conjunto
D[x] dos polinômios.
54
CAPÍTULO 3. POLINÔMIOS
De acordo com as propriedades das potências, quando pegarmos f (x) =
x e g(x) = xm , nosso método deverı́a fornecer um quociente q(x) = xn−m e
um resto r(x) = 0 (o polinômio nulo); como xn−m é um polinômio só no caso
onde n ≥ m, deveriamos pedir grau(f ) ≥ grau(g).
Como inspiração, lembremos a divisão não exata de números inteiros
escritos na base dez. Sejam
n
a = an 10n + an−1 10n−1 + · · · + a1 10 + a0 ,
com 0 ≤ an , an−1 , . . . , a1 , a0 ≤ 9 inteiros, e b > 0 um inteiro ≤ a. O algorı́tmo
da divisão que apreendemos na escola é mais ou menos assim: calculamos o
número de vezes que b “cabe” dentro de an 10n (an é o número de unidades
quando n = 0, de dezenas quando n = 1, de centenas quando n = 2, etc)
digamos q1 , que seria um quociente parcial, e subtraı́mos bq1 de a obtendo
um resto parcial r1 ; se r1 é zero, a divisão acabou e dizemos que b divide
a. Se r1 6= 0, nos perguntamos se r1 é ≥ b; caso negativo, a divisão acabou
e escrevemos q = q1 e r = r1 . Caso afirmativo, o procedimento se repete
subtraı́ndo de r1 o número máximo q2 de vezes que b cabe em r1 ; obtemos
a − bq1 − bq2 = r2 ,
com r2 < r1 e q2 < q1 . E recomeçamos até obter um resto parcial que seja
0 ou menor que b. Como os restos parciais diminuem a cada passo, estamos
certos que o procedimento deve para. O último resto parcial e a soma dos
quocientes parciais são, respectivamente, o resto e o quociente da divisão.
Exercı́cio 3.3.1. Faça a divisão de 1235 = 103 + 2 · 102 + 3 · 10 + 5 por 4 do
jeito descrito acima.
Voltando aos polinômios, para generalizar o procedimento descrito acima
ao caso destes, podemos tratar as potências de x como as potências de 10
para os números; em particular isto nos sugere que o “tamanho”, que seria
a magnitude a fazer decrescer no processo de divisão do polinômio, será
entendido como sendo o grau deste. Além disto, o número de vezes que b
cabe em an 10n deve ser substituı́do pelo número de vezes que o termo de
maior grau de g(x) cabe dentro do termo de maior grau de f (x) e assim por
diante; em particular, no caso dos polinômios, um quociente parcial, deverá
forçosamente ter grau menor ou igual que o grau de f (x) e cada quociente
parcial terá grau menor que o anterior.
3.3. TEORIA DA DIVISIBILIDADE EM D[X]
55
Guiados pela disgressão precedente, estamos prontos agora para construir um algorı́tmo da divisão de polinômios de forma coerente com o que já
sabemos. Escrevamos
f (x) = an xn + fˆ(x), g(x) = bm xm + ĝ(x),
onde n ≥ m e fˆ(x), ĝ(x) são polinômios de graus menores que n e m respectivamente. Como xn−m ∈ D[x], podemos escrever
q1 (x) =
an n−m
x
, r1 (x) = f (x) − g(x)q1 (x) = fˆ(x) − ĝ(x)q1 (x);
bm
se r1 (x) = 0 a divisão acabou e temos q(x) = q1 (x). Se r1 (x) 6= 0, nos perguntamos se grau r1 (x) ≥ grau g(x). Se a resposta é negativa, a divisão também
acabou e temos r(x) = r1 (x) e q(x) = q1 (x). Caso afirmativo, recomeçamos
o procedimento, até obter um resto parcial que, ou é zero, ou possui grau menor que grau g(x). Como o grau dos restos parciais diminui a cada iteração
do procedimento, desde que não tenha se tornado nulo, concluı́mos que este
deve parar após um número finito de iterações; de fato, precisamos não mais
do que grau f (x) aplicações do procedimento.
Por outro lado, observemos que no procedimento empregado, precisamos
dividir por bm a cada passo. Se pretendermos que os resultados obtidos da
divisão sejam polinômios com coeficientes no domı́nio D onde f (x) e g(x)
tem os seus, devemos pedir que bm seja um invertı́vel em D. Por exemplo,
no caso onde D = Z, as únicas possibilidades são bm = 1 ou bm = −1. No
caso onde D for um corpo, a divisão será possı́vel para todo bm 6= 0.
De fato temos o seguinte teorema:
Teorema 3.3.1. Sejam f (x), g(x) ∈ D[x] polinômios de graus n e m respectivamente (em particular, ambos diferentes de zero). Se n ≥ m e o coeficiente lı́der de g(x) é invertı́vel em D, então existem únicos polinômios
q(x), r(x) ∈ D[x] tais que
(i) f (x) = g(x)q(x) + r(x),
(ii) r(x) = 0 ou grau(r) < grau(g).
Demonstração. A existência de q(x) e r(x) foi demonstrada de maneira mais
ou menos rigorosa acima. Para demonstrar a unicidade, suponhamos que
56
CAPÍTULO 3. POLINÔMIOS
temos q ′ (x), r′ (x) ∈ D[x] também satisfazendo (i) e (ii) e demonstremos que
então q(x) = q ′ (x) e r(x) = r′ (x).
De (i) obtemos
g(x)(q(x) − q ′ (x)) = r′ (x) − r(x).
(3.1)
Suponhamos por um momento que r′ (x) 6= r(x). Então r′ (x) − r(x) 6= 0,
donde q(x) − q ′ (x) 6= 0, pois g(x) 6= 0 e D[x] é um domı́nio de integridade.
Mas então o lado direito da equação (3.1) tem grau ≥ graug(x) enquanto o
lado esquerdo, graças à condição (ii), tem grau < graug(x): contradição !
Concluı́mos que nossa suposição, isto é, que r′ (x) 6= r(x) não está correta.
Logo r′ (x) = r(x), e então q(x) = q ′ (x), pela equação (3.1).
Observação 3.3.2. No caso onde f (x) = 0, a divisão por qualquer g(x) 6= 0
é evidentemente possı́vel obtendo q(x) = r(x) = 0. No caso onde f (x) e
g(x) forem polinômios em Z[x], o coeficiente lı́der de g(x) deve ser 1 ou
−1, pois são estes os únicos inverı́tiveis em Z; em particular, quando f (x) e
g(x) forem polinômios constantes em Z[x], isto é, números inteiros, a divisão
entre eles pensados como números inteiros não esta contemplada no teorema
precedente, salvo quando g(x) = ±1.
Definição 3.3.3. Sejam f (x), g(x) ∈ D[x], onde g(x) 6= 0. Dizemos que f (x)
é divisı́vel por g(x) em D[x], o que denotamos g(x)|f (x), quando podemos
dividir f (x) por g(x) obtendo resto 0.
Exemplos 3.3.4. (a) Se D é um domı́nio e g(x) = b0 é um polinômio constante
com b0 invertı́vel em D (isto é, existe a ∈ D tal que ab0 = 1), então
f (x) = b0 · (
1
f (x)).
b0
Pela unicidade do teorema, temos
q(x) =
1
f (x), r(x) = 0.
b0
(b) Se g(x) é um polinômio mônico, então a divisão como no teorema é
sempre possı́vel. É facil ver que neste caso o coeficiente lı́dr do quociente é o
mesmo que o coeficiente lı́der de f (x).
(c) Seja g(x) = x + a, a ∈ D. Pelo teorema,
f (x) = (x + a)q(x) + r(x)
(3.2)
3.3. TEORIA DA DIVISIBILIDADE EM D[X]
57
onde r(x) = 0 ou grau(r) < grau(g) = 1. Concluı́mos que r(x) é constante,
isto é, zero ou uma constante não nula r = r(x). Substituindo x por −a na
equação (3.2), obtemos o resto
r = f (−a).
(d) Consideremos f (x) = 3x4 − 5x3 + 2x2 − x + 6, g(x) = x2 − 3x + 1; pelo
teorema obteremos quociente e resto q(x), r(x) em Z[x]. Usando as notações
introduzidas anteriormente, obtemos
q1 (x) = 3x2 , r1 (x) = 4x3 − x2 − x + 6.
Como graur1 (x) ≥ graug(x) repetimos o procedimento, obtendo
q2 (x) = 4x, r2 (x) = 11x2 − 5x + 6;
repetindo mais uma vez
q3 (x) = 11, r3 (x) = 28x − 5.
Concluı́mos
q(x) = q1 (x) + q2 (x) + q3 (x) = 3x2 + 4x + 11, r(x) = r3 (x) = 28x − 5.
O exemplo (c) acima é conhecido como Teorema do Resto:
Teorema 3.3.5 (do Resto). O resto da divisão de f (x) ∈ D[x] por x + a é
f (−a).
Este teorema, que parece apenas uma simples observação é muito importante. De fato, é a chave para compreender o vı́nculo entre a teoria algébrica
que começamos a desenvolver neste capı́tulo e o nosso objetivo principal, a
saber, o de resolver equaçãoes polinomiais. Para precisar isto, começamos
com uma definição, onde estamos considerando a situação em que D é um
domı́nio qualquer contido dentro do corpo dos números complexos, como por
exemplo Z, Q, R ou mesmo o próprio C.
Definição 3.3.6. Sejam f (x) ∈ D[x] e α ∈ C. Dizemos que α é raiz de f (x)
se f (α) = 0.
58
CAPÍTULO 3. POLINÔMIOS
O teorema do resto nos dá imediatamente o seguite vı́nculo espetacular
que traduz esta noção em termos de divisibilidade, conhecido como Teorema
de Ruffini, e cuja demonstração é deixada para o leitor:
Corolário 3.3.7 (Teorema de Ruffini). Um número complexo α ∈ C é raiz
de um polinômio f (x) ∈ D[x] se e somente se f (x) é divisı́vel por x − α.
A sguir descrevemos o chamado esquema de Ruffini (veja figura abaixo)
para dividir um polinômio da forma
f (x) =
n
X
ai x i ,
i=0
por x − a. Como no algoritmo da divisão começamos dividindo por x, o
primeiro quociente parcial é q1 (x) = an xn−1 ; multiplicando por x − a e subtraı́ndo de f (x) obtemos
r1 (x) = (an a + an−1 )xn−1 + an−2 xn−2 + · · · + a1 x + a0 .
Repetindo o procedimento obteremos então
q2 (x) = (an−1 +aan )xn−2 , r2 (x) = (an a2 +an−1 a+an−2 )xn−2 +an−3 xn−3 +· · ·+a0 .
Não é difı́cil de se convencer que os coeficientes do quociente e o resto
r(x) podem ser obtidos da seguinte forma: escrevemos numa linha horizontal todos os coeficientes de f (x), da direita para a esquerda, começando pelo
lı́der e não esquecendo aqueles que são nulos. Os coeficientes do quociente
são, escritos na mesma ordem: o lı́der é o próprio an ; para o seguinte multiplicamos o anterior (isto é, o lı́der neste caso) por a e somamos o resultado
com o próximo coeficiente da linha horizontal, ou seja, com an−1 ; para obter
o terceiro coeficiente de q(x) repetimos o procedimento arterior, ou seja, multiplicamos o coeficiente obtido precedentemente por a e somamos o resultado
com o terceito da linha horizontal, isto é, com an−2 ; etc...O resto r(x) será o
último resultado obtido pelo procedimento anterior, que é precisamente
f (a) = an an + an−1 an−1 + · · · + a1 a + a0 ;
em particular redemonstramos o teorema do Resto 3.3.5.
Figura com esquema de Ruffini
3.3. TEORIA DA DIVISIBILIDADE EM D[X]
59
Exemplo 3.3.8. Consideremos o polinômio
f (x) = x4 + bx2 − cx + 4
com b, c ∈ R. Encontremos b, c para que o polinômio tenha raı́zes 1 e −1.
Aplicando o corolário 3.3.7 temos um sistema de equações
b − c = −5; b + c = −5.
Concluı́mos b = −5 e c = 0.
Exemplo 3.3.9. Consideremos o polinômio
f (x) = x2 + bx + c
com b, c ∈ R. Se quisermos encontrar b, c para que o polinômio tenha raiz
dupla igual a 1, o método utilizado no exemplo anterior não funciona pois
obteremos a mesma equação duas vezes (verifique isto !). Por outro lado, se o
fato de um polinômio possuir raiz 1 equivale a este polinômio ser divisı́vel por
(x − 1), é razoável pensar que ter raiz dupla 1 equivalha ao fato do polinômio
poder ser dividido duas vezes por (x − 1) (observe que talvez ainda não
tenhamos muito claro o quê significa um polinômio ter raiz dupla); como
veremos, a é esta a definição correta da noção de raiz dupla. Levando isto
em consideração, podemos dividir f (x) por (x − 1) e logo dividir o quociente
obtido também por (x − 1): ambos restos deverão ser nulos. Aplicando o
esquema de Ruffini o primeiro resto é 1 + b + c, o primeiro quociente tem
coeficientes 1 e b + 2 e e o segundo resto é b + 2. Concluı́mos que b = −2 e
c = 1.
Exercı́cio 3.3.2. Trabalhando como no exemplo precedente obtenha condições
para que o polinômio geral de grau 2 possua uma raiz dupla α; compare o
resultado obtido com o que já sabe da discussão da equação quadrática.
O teorema de Ruffini (corolário 3.3.7) pode ser generalizado; no momento
estamos em condições de generalizar apenas uma das implicações (para a
implicação recı́proca veja proposição 3.5.1):
Proposição 3.3.10. Sejam f (x), g(x) ∈ D[x]. Se g(x)|f (x), então toda raiz
de g(x) é raiz de f (x).
Demonstração. Temos f (x) = g(x)q(x) para certo q(x) ∈ D[x]. Se α ∈ C é
uma raiz de g(x), então
f (α) = g(α)q(α) = 0,
donde segue o resuntado.
60
CAPÍTULO 3. POLINÔMIOS
Quando estudamos aritmética em Z partimos do algorı́tmo da divisão
para logo definirmos o conceito de divisor de um número. Entre os divisores,
encontramos alguns muito especiais: por um lado, aqueles “triviais” que são
o próprio número ou seu oposto, e ±1. Por outro lado, encontramos certos
números que admitem apenas divisores trivias como estes; quando positivos,
chamamos esses números de números primos. Depois demonstramos o teorema fundamental da Aritmética que diz que todo número positivo fatora-se
como produto de números primos; se o número é negativo, multiplicamos por
−1 a fatoração do seu valor absoluto.
Agora que temos em D[x] um algorı́tmo de divisão, podemos nos perguntar sobre a fatoração de um polinômio como produto de fatores “primordiais”,
que não acietam mais fatoração que aquelas trivias; observe que fatores do
tipo x − α correspondem a raı́zes do polinômio em questão. Vamos então
definir os conceitos equivalentes, para polinômios, daqueles de número primo
e divisor trivial de um número inteiro.
A seguinte definição é bastante intuitiva e omitimos comentários (reflita
sobre ela; veja o exemplo (a) acima)
Definição 3.3.11. Seja f (x) ∈ D[x]. Os divisores triviais de f (x) são os
polinômios constantes d(x) = d ∈ D e os polinômios da forma df (x), onde d
é invertı́vel em D.
Depois de termos a noção de divisor trivial, o equivalente ao conceito de
número primo decorre imediatamente:
Definição 3.3.12. Seja f (x) ∈ D[x] um polinômio de grau ≥ 1. Dizemos
que f (x) é irredutı́vel, se seus únicos divisores em D[x] são os trivias. Caso
contrário dizemos que f (x) é redutı́vel.
Vejamos alguns exemplos para exclarecer esta noção.
Exemplos 3.3.13. (a) Seja f (x) = ax + b ∈ D[x]. Suponhamos primeiramente
que D = Z. Seja d = mdc(a, b) ∈ Z. Temos
f (x) = d(a′ x + b′ ),
onde mdc(a′ , b′ ) = 1. Se d > 1, então d é um divisor não trivial em D[x] pois
não é invertı́vel em D. Concluı́mos que, neste caso, f (x) é redutı́vel.
Se d = 1, suponhamos que f (x) possui um divisor g(x) ∈ Z; então
ax + b = g(x)q(x).
61
3.3. TEORIA DA DIVISIBILIDADE EM D[X]
Por causa do grau de f (x) ser um, concluı́mos que g(x) ou q(x) devem ser
constantes; digamos g(x) = a1 x + b1 e q(x) = c ∈ Z. Então
a = a1 c, b = b1 c,
donde c|mdc(a, b). Como mdc(a, b) = d = 1, que é invertı́vel, concluı́mos que
f (x) é irredutı́vel.
Finalmente, no caso onde D é um corpo, é evidente que f (x) = ax + b
será sempre irredutı́vel.
(b) Consideremos o polinômio
f (x) = x2 − 2 ∈ Z[x].
É claro que temos a fatoração
x2 − 2 = (x −
√
2)(x +
√
2),
o que mostra que f (x) é redutı́vel em R[x] e também em C[x]. Porém ele
é irredutı́vel em Q[x]: com efeito, soponhamos que f (x) possui um divisor
não trivial em Q[x]. Por causa do grau de f (x) ser 2, a única possibilidade
é termos
x2 − 2 = (ax + b)(a1 x + b1 ),
com a, b, a1 , b1 ∈ Q. Um cálculo fácil mostra que
aa1 = 1, ab1 + ba1 = 0, bb1 = −2.
Multiplicando por ab1 a igualdade do meio, obtemos
a2 b21 − 2 = 0,
que não possui solução em Q (observe que ab1 6= 0). Então a fatoração acima
não é possı́vel em Q[x].
Um cálculo ainda mais simples mostra que o polinômio x2 −2 é irredutı́vel
em Z[x]: com efeito, de aa1 = 1 obtemos a = ±1 e a1 = ±1; de bb1 = −2
obtemos b = ±1, b1 = ±(−2). Estes valores para a, a1 , b, b1 são incompatı́veis
com a equação do meio ab1 + ba1 = 0.
(c) Seja f (x) = 3x2 − 6. É redutı́vel em Z[x] pois fatora-se como
3(x2 − 2)
sendo 3 ∈ Z um divisor não trivial em Z[x]; trabalhando como no exemplo
(b) mostra-se que o polinômio é irredutı́vel em Q[x] e redutı́vel quando D = R
ou D = C.
62
CAPÍTULO 3. POLINÔMIOS
Quando estudamos aritmética em Z, um inteiro n e seu oposto −n possuem os mesmos divisores; isto deve-se ao fato de podermos passar de um
para o outro multiplicando por −1 que é um invertı́vel de Z. Temos um
fenômeno análogo em D[x], é o conteúdo da seguinte definição.
Definição 3.3.14. Dizemos que dois polinômios f (x), g(x) ∈ D[x] são associados em D[x] (ou sobre D), denotando f (x) ∼ g(x), se possuem os mesmos
divisores.
Se f (x) ∼ g(x) em D[x], como f (x)|g(x) e g(x)|f (x), temos
f (x) = g(x)q(x), g(x) = f (x)q ′ (x).
Então f (x) = q(x)q ′ (x)f (x), donde segue que, ou f (x) = g(x) = 0, ou, caso
contrário q(x) e q(x) são invertı́veis em D[x], isto é, são constantes invertı́veis
em D. Isto demonstra o seguinte resultado:
Proposição 3.3.15. Dois polinômios f (x), g(x) ∈ D[x] são associados em
D[x] se e somente se f (x) = ag(x) com a ∈ D invertı́vel; neste caso g(x) =
bf (x) com b ∈ D tal que ab = 1.
Exemplo 3.3.16. Os polinômios 3x2 − 6 e x2 − 2 não são associados em Z[x],
pois o primeiro é múltiplo do segundo via uma constante que não é invertı́vel
em Z.
A demonstração do seguinte corolário (da proposição precedente) é deixada como exercı́cio para o leitor.
Corolário 3.3.17. Se f (x), g(x) ∈ D[x] são polinômios associados, então
f (x) é irredutı́vel em D[x] se e somente se g(x) é irredutı́vel em D[x] .
P
Definição 3.3.18. Seja f (x) = ni=0 ai xi ∈ Z[x]. O conteúdo de f (x) é o
máximo divisor comum dos coeficientes
c(f ) := mdc(a0 , . . . , an ).
Exemplo 3.3.19. Se f (x) = 3x2 − 6, temos c(f ) = 3.
A seguinte proposição, cuja demonstração daremos mais adiante (veja a
demonstração antes do lema 3.6.2) explica o fenômeno aparentemente não
intuitivo que acontece com o polinômio 3x2 − 6 que é irrédutı́vel sobre Q mas
não sobre Z que é um domı́nio muito menor (e então com menos possibilidade
de escolha para os coeficientes).
3.3. TEORIA DA DIVISIBILIDADE EM D[X]
63
Proposição 3.3.20. Seja g(x) ∈ Z[x]. Suponhamos que g(x) é irredutı́vel
em Q[x]. Se c(g) = 1, então g(x) é irredutı́vel em Z[x].
Vamos agora introduzir os conceitos de máximo divisor comum e mı́nimo
múltiplo comum de dois ou mais polinômios. Comecemos pelo primeiro: é
importante observar as diferenças entre os casos onde D é Z e D é um corpo
(de fato arbitrário contendo Z, mas nos sempre pensaremos nos casos onde
o corpo é um dos dos três corpos Q, R e C).
Definição 3.3.21. Sejam f (x), g(x) ∈ D[x] polinômios não ambos nulos.
Seja d(x) ∈ D[x] um polinômio que, quando D for um corpo suporemos
mônico e quando D = Z suporemos de coeficiente lı́der positivo. Dizemos
que d(x) é o máximo divisor comum de f (x) e g(x) se satisfaz as seguintes
condições:
(i) d(x)|f (x) e d(x)|g(x).
(ii) se c(x)|f (x) e c(x)|g(x), então c(x)|d(x). Neste caso denotamos
mdc(f, g) := d(x)
Exemplo 3.3.22. Se f (x) = −3x2 + 6 e g(x) = 12x2 − 24 é mais ou menos
evidente que mdc(f, g) = 3x2 − 6 em Z[x] mas x2 − 2 em D[x] para D sendo
um corpo pois o máximo divisor comum é mônico por definição neste caso.
Vamos agora introduzir o Algoritmo de Euclides para calcular o mdc de
dois polinômios. Por simplicidade concentraremos nossa atenção no caso
onde D é um corpo; o leitor interessado, poderá tentar obter o mdc para
polinômios em Z[x] usando o algorı́tmo no caso de Q[x] com ligeiras modificações.
Precisamos do seguinte lemma cuja demonstração é deixada para o leitor.
Lema 3.3.23. Sejam f (x), g(x) ∈ D[x]. Se d(x) ∈ D[x] é um divisor commun de f (x) e g(x), então d(x) divide o polinômio
f (x)h(x) + g(x)k(x)
para todos h(x) ∈ D[x] e k(x) ∈ D[x].
Seja D um corpo que contém os números inteiros (o leitor pode pensar
no caso onde D é um dos três corpos numéricos). Sejam f (x), g(x) ∈ D[x]
64
CAPÍTULO 3. POLINÔMIOS
polinômios não nulos com grau(f ) ≥ grau(g). Pelo algorı́tmo da divisão,
existem únicos q(x) e r(x), polinômios em D[x], tais que
(i) f (x) = g(x)q(x) + r(x) e (ii) r(x) = 0 ou grau(r) < grau(g).
Por outro lado, do lema precedente segue facilmente que todo divisore
comum de f (x) e g(x) é divisor comum de g(x) e r(x): com efeito, se d(x)|f (x)
e d(x)|g(x), então o lema aplicado com h(x) = 1 e k(x) = −q(x) mostra que
d(x)|r(x), pois
r(x) = f (x) + g(x) (−q(x)) .
Reciprocamente, se d(x)|g(x) e d(x)|r(x), aplicamos o lema aos polinômios
g(x) e r(x) multiplicando o primeiro por h(x) = q(x) e o segundo por k(x) = 1
para concluir que d(x)|f (x).
Do raciocı́nio acima concluı́mos mais ou menos diretamente o seguinte
resultado, que é a clave para construir o algorı́tmo de Euclides.
Lema 3.3.24. Temos
mdc(f, g) = mdc(g, r)
Algorı́tmo Dados de entrada: f (x) e g(x) com g(x) 6= 0 e grau(f ) ≥
grau(g).
1. Primeiro passo: Dividimos f (x) por g(x), obtendo
f (x) = g(x)q(x) + r(x)
Usando o corolário, temos duas situações:
(1) r(x) = 0; neste caso, o mdc procurado é o g(x) multiplicado pelo
inverso de seu coeficiente lı́der (para “tornar” mônico o polinômio, de acordo
com a definição de mdc).
(2) r(x) 6= 0; neste caso grau(r) < grau(g). Então repetimos o feito no
primeiro passo:
2. Segundo passo: Dividimos g(x) por r(x), obtendo
g(x) = r(x)q1 (x) + r1 (x).
Novamente temos duas situações:
(1) r1 (x) = 0; neste caso o mdc procurado é r(x) multiplicado pelo inverso
de seu coeficiente lı́der.
(2) r1 (x) 6= 0; neste caso grau(r1 ) < grau(r). Pelo corolário teremos
mdc(f, g) = mdc(g, r) = mdc(r, r1 )
3.3. TEORIA DA DIVISIBILIDADE EM D[X]
65
Então recomeçamos, dividindo agora r(x) por r1 (x), e assim em diante.
Os restos r(x), r1 (x), r2 (x), etc, serão chamados de restos parciais.
É claro que o procedimento acima pára em algum momento: isto é, não
pode acontecer que toda vez que dividimos, a primeira situação não aconteça
(ou seja, o resto da divisão correspondente não seja zero), pois a cada repetição do procedimento o resto obtido, quando não nulo, tem grau menor
que o anterior. De fato, teremos no máximo, grau(g) passos a realizar. Concluı́mos desta forma, que o mdc(f, g) é o último resto parcial diferente de
zero, multiplicado pelo inverso de seu coeficiente lı́der.
Teorema 3.3.25. Sejam f (x), g(x) ∈ D[x] com D um corpo. Então existe
um único máximo comum divisor de f (x) e g(x).
Demonstração. A existência foi provada usando o algorı́tmo de Euclides. A
demonstração da unicidade é deixada para o leitor.
Numa primeira instância o mdc de dois polinômios depende do domı́nio
D[x] onde estamos trabalhando; não obstante, no caso onde D for um corpo,
segue do algorı́tmo de Euclides que mdc(f, g) independe de D, isto é, o polinômio achado pelo algorı́tmo é o mesmo independentemente do fato de
trabalharmos com Q, R ou C, quando isto fizer sentido (ou seja, quando os
polinômios f (x) e g(x) puderem ser considerados com coeficientes em um ou
outro corpo): é o conteúdo do seguinte corolário.
Corolário 3.3.26. Suponhamos que D é um corpo. Então mdc(f, g) independe de D.
Demonstração. Basta observa que os dois lemas utilizados para demonstrar
o algorı́tmo de Euclides independem de D.
Exemplo 3.3.27. Sejam
f (x) = x8 +5x7 −3x6 −42x5 −25x4 +92x3 −+78x2 −35x−15, g(x) = x5 +5x4 −27x2 −25x+10.
Dividindo f (x) por g(x) obtemos
q(x) = x3 − 3x, r(x) = x3 + 3x2 − 5x − 15;
dividindo g(x) por r(x) obtemos
q1 (x) = x2 + 2x − 1, r1 (x) = x2 − 5.
66
CAPÍTULO 3. POLINÔMIOS
Finalmente, ao dividir r(x) por r1 (x) obtemos
q2 (x) = x + 3, r2 (x) = 0.
Concluı́mos
mdc(f, g) = x2 − 5.
Em particular temos que mdc(f, g) = g(x) + r(x)(−q1 ); utilizando que
f (x) = g(x)q(x) + r(x) podemos eliminar r(x) para obter
mdc(f, g) = g(x) + (f (x) + g(x)(−q(x))(−q1 (x)),
donde
mdc(f, g) = (−q1 (x))f (x) + (1 + q(x)q1 (x))
o que mostra que mdc(f, g) é uma combinação linear de f (x) e g(x) com
coeficientes em D[x]; neste caso podemos supor D = Q.
O raciocı́nio feito no exemplo precedente pode ser generalizado, obtendo o
seguinte resultado (a demonstração pode ser omitida numa primeira leitura):
Teorema 3.3.28. Sejam f (x), g(x) ∈ D[x]. Existem polinômios h(x), k(x) ∈
D[x] tais que
mdc(f, g) = f (x)h(x) + g(x)k(x).
Demonstração. .....
Corolário 3.3.29. Sejam f (x), g(x) ∈ D[x] e α ∈ C. Então α é uma raiz
comum de f (x) e g(x) se e só se α é uma raiz de mdc(f, g).
Demonstração. Se α é raiz de f (x) e de g(x), pelo teorema α também é raiz
de mdc(f, g). Reciprocamente, seja α uma raiz de d(x) = mdc(f, g); como
d(x) é um divisor comum de f (x) e g(x) temos
f (x) = d(x)q1 (x), g(x) = d(x)q2 (x)
para certos q1 (x), q2 (x) ∈ D[x]. Então
f (α) = d(α)q1 (α) = 0, g(α) = d(α)q2 (α) = 0,
donde segue a afirmação.
3.3. TEORIA DA DIVISIBILIDADE EM D[X]
67
O corolário precedente mostra o vı́nculo existente entre o mdc é a resolução de sistemas de equações, como mostra o exemplo seguinte.
Exemplo 3.3.30. Vamos resolver o sistema de equaçãoes:
4
x + x3 + 3x − 2 = 0
x3 − 3x + 2 = 0.
Se f (x) = x4 + x3 + 3x − 2 e g(x) = x3 − 3x + 2, queremos encontrar as
raı́zes comuns de f (x) e g(X); denotemos d(x) = mdc(f, g). Pelo corolário,
isto corresponde a encontrar as raı́zes de d(x).
Utilizando o algorı́tmo de Euclides, obtemos
d(x) = x + 2,
donde concluı́mos que x = −2 é a única solução do sistema de equações.
Definição 3.3.31. Dois polinômios f (x), g(x) ∈ D[x] são primos entre si se
mdc(f, g) = 1.
Proposição 3.3.32. Suponhamos que existem k(x), h(x) ∈ D[x] tais que
1 = k(x)f (x) + h(x)g(x).
Então mdc(f, g) = 1.
Demonstração. Se d(x) é um divisor comum de f (x) e de g(x), então d(x)
divide 1 pelo lema 3.3.23. Então mdc(f, g) = 1
Corolário 3.3.33. Sejam f (x), g(x) ∈ D[x]. Se d(x) = mdc(f, g), então
f (x) = d(x)f1 (x), g(x) = d(x)g1 (x),
onde f1 (x) e g1 (x) polinômios em D[x] primos entre si.
Demonstração. Pelo teorema 3.3.28
d(x) = k(x)f (x) + h(x)g(x),
donde segue facilmente
1 = k(x)f1 (x) + h(x)g1 (x).
O corolário é entaõ conseqüência da proposição precedente.
68
CAPÍTULO 3. POLINÔMIOS
Teorema 3.3.34 (Teorema de Euclides). Sejam f (x), g(x), g1 (x) ∈ D[x]. Se
f (x)|g(x)g1 (x) e mdc(f, g) = 1, então f (x)|g1 (x).
Demonstração. Pelo teorema 3.3.28 existem h(x), k(x) ∈ D[x] tais que
1 = f (x)h(x) + g(x)k(x).
(3.3)
Por outro lado g(x)g1 (x) = f (x)q(x) para certo q(x) ∈ D[x].
Multiplicando a igualdade da equação (3.3) por g1 (x) obtemos então
g1 (x) = f (x)g1 (x)h(x) + g(x)g1 (x)k(x)
= f (x)g1 (x)h(x) + f (x)q(x)k(x)
= f (x) (g1 (x)h(x) + q(x)k(x))
demonstrando que f (x) divide g1 (x).
O seguinte corolário do teorema de Euclides é deixado como exercı́cio
para o leitor.
Corolário 3.3.35. Sejam f (x), g(x), h(x) ∈ D[x]. Se f (x) é irredutı́vel e
f (x)|g(x)h(x), então f (x)|g(x) ou f (x)|h(x).
Exercı́cio 3.3.3. Sejam f (x), f1 (x), . . . , fℓ (x) ∈ D[x]. Suponha que f (x)|f1 (x) · · · fℓ (x).
Demonstra por indução matemática no número ℓ de fatores que se f (x) é irredutı́vel, então existe j, 1 ≤ j ≤ ℓ tal que f (x)|fj (x).
A continuação introduzimos o conceito de Mı́nimo Múltiplo Comum.
Definição 3.3.36. Seja f (x) ∈ D[x]. Um múltiplo de f (x) em D[x] é um
polinômio da forma f (x)q(x), onde q(x) ∈ D[x].
Um polinômio m(x) é múltiplo de f (x) em D[x] se e somente se f (x)|m(x)
(demonstre isto !).
Definição 3.3.37. Sejam f (x), g(x) ∈ D[x]. Sejam a, b os coeficientes
lı́der de f (x) e g(x) quando D for um corpo e seus conteúdos quando D
for Z, respectivamente. O Mı́nimo comum múltiplo de f (x) e g(x) é o polinômio em D[x], que denotaremos mmc(f, g) quociente de dividir f (x)g(x)
por abmdc(f, g).
Com esta definição fica claro que mmc(f, g) está univocamente definido,
porém não é claro que seja um múltiplo comum de f (x) e g(x) nem que seja
o menor possı́vel.
3.3. TEORIA DA DIVISIBILIDADE EM D[X]
69
Teorema 3.3.38. Sejam f (x), g(x), m(x) ∈ D[x]. Então m(x) é o mı́nimo
múltiplo comum de f (x) e g(x) se e somente se satisfaz as seguintes condições:
(i) f (x)|m(x), g(x)|m(x).
(ii) Se h(x)|f (x) e h(x)|g(x), então m(x)|h(x).
(iii) m(x) é mônico quando D for um corpo e um inteiro positivo quando
D for Z.
Demonstração. Faremos a prova no caso onde D é um corpo; o caso onde
D = Z é deixado para o leitor interessado e pode ser demonstrado adaptando
a demonstração que faremos.
Denotemos d(x) = mdc(f, g). Temos f (x) = d(x)f1 (x) e g(x) = d(x)g1 (x)
com mdc(f1 , g1 ) = 1.
Suponhamos que m(x) = mmc(f, g) e demonstremos que m(x) satisfaz
as condições (i), (ii) e (iii). Observemos que a condição (i) segue diretamente
da definição; a condição (ii) é conseqüência do fato que d(x) é mônico.
Como f (x) e g(x) dividem h(x), temos
h(x) = d(x)f1 (x)q(x) = d(x)g1 (x)q ′ (x)
para certos q(x), q ′ (x) ∈ D[x]; em particular g1 (x)|d(x)f1 (x)q(x). Pelo teorema de Euclides, g1 (x)|d(x)q(x).
Finalmente, dado que m(x) = abd(x)f1 (x)g1 (x) concluı́mos que m(x)|h(x),
o que demonstra (ii).
Reciprocamente, suponhamos que m(x) satisfaz (i), (ii) e (iii). Temos
f (x)g(x) = abd2 (x)f1 (x)g1 (x).
A primeira parte da demonstração nos diz que o polinômio abd(x)f1 (x)g1 (x)
satisfaz (i), (ii) e (iii). Basta então mostrar que dois polinômios que satisfazem estas trêss condições são iguais.
Seja m′ (x) um polinômio satisfazendo (i), (ii), e (iii). Temos m′ (x)|m(x)
e m(x)|m′ (x). Então
m(x) = cm′ (x), m′ (x)c′ m(x),
com c, c′ ∈ D. Como ambos polinômios são mônicos eles devem coincidir.
Exemplo 3.3.39. Sejam f (x) = x8 + 5x7 − 3x6 − 42x5 − 25x4 + 92x3 − +78x2 −
35x − 15, g(x) = x5 + 5x4 − 27x2 − 25x + 10. Como vimos no exemplo 3.3.27
temos
mdc(f, g) = x2 − 5.
Basta dividir f (x)g(x) por x2 − 5 para obter mmc(f, g) (faça-o !).
70
CAPÍTULO 3. POLINÔMIOS
Terminamos este parágrafo generalizando o conceito de máximo comum
divisor e mı́nimo múltiplo comum para o caso de um número finito de
polynômios (o que pode ser omitido numa primeira leitura). Porém, não
demonstraremos só enunciaremos, sem demonstração, as principais propriedades destes.
Definição 3.3.40. Sejam f1 (x), . . . , fℓ (x) ∈ D[x]. O Máximo divisor comum
dos polinômios f1 (x), . . . , fℓ (x) é um polinômio d(x) ∈ D[x] tal que:
(i) d(x)|fi (x) para i = 1, . . . , ℓ.
(ii) Se c(x)|fi (x) para i = 1, . . . , ℓ, então c(x)|d(x).
(iii) d(X) é mônico se D for um corpo e com coeficiente lı́der positivo se
D = Z.
Denota-se d(x) = mdc(f1 , . . . , fℓ ).
De maneira análoga ao que acontece no caso ℓ = 2 pode-se demonstrar
que dois polinômios satisfazendo (i), (ii) e (iii) são necessariamente inguais,
o que prova que a definição está bem posta, isto é, que não pode haver dois
polinômios diferentes virificando a definição acima.
Por exemplo se ℓ = 3, não é difı́cil demonstrar que mdc(mdc(f1 , f2 ), f3 )
e mdc(f1 , mdc(f2 , f3 )) satisfazem as condições (i), (ii) e (iii), donde que eles
concidem (ambos) com o mdc dos três polinômios. O leitor pode imaginar como é que devemos proceder para obter o mdc de mais do que três
polinômios...
Analogamente, o mmc de ℓ polinômios f1 (x), . . . , fℓ (x) ∈ D[x], que denotase mmc(f1 , . . . , fℓ ), pode ser definido como satisfazendo
f1 (x) · · · fℓ (x) = a1 · · · aℓ mdc(f1 , . . . , fℓ ),
onde a1 , . . . , aℓ ∈ D os coeficientes lı́der dos respectivos polinômios.
3.4
Irredutibilidade e Fatoração Canônica
Agora vamos estudar o problema da fatoração de polinômios, com coeficientes
num corpo, como produto de polinômios irredutı́veis.
Comecemos analizando alguns casos particulares. Seja f (x) ∈ D[x] de
grau n ≥ 1.
1 Se n = 1, como sabemos pelo exemplo 3.3.13a), o polinômio é irredutı́vel
e nada temos a fatorar.
3.4. IRREDUTIBILIDADE E FATORAÇÃO CANÔNICA
71
2 Se n = 2, temos duas possibilidades mutuamente excluentes:
(i) f (x) é irredutı́vel em D[x], e nada temos para fatorar, como acontece
por exemplo com o polinômio x2 − 2 em Q[x] (ref. 3.3.13b)) ou x2 + 1 em
R[x].
√
√
(ii) f (x) é redutı́vel, como acontece com x2 − 2 = (x − 2)(x + 2) em
R[x] ou x2 + 1 = (x − ı)(x + ı) em C[x]. Neste caso podemos escrever
f (x) = f1 (x)f2 (x),
onde f1 (x) e f2 (x) são divisores não triviais de f (x); isto é, são polinômios de
grau 1. Concluı́mos, pelo visto no item (i) que f1 (x) e f2 (x) são irredutı́veis,
e então a fatoração acima é a fatoração procurada.
3 Se n = 3 temos novamente duas possibilidades mutuamente excluentes:
(i) f (x) é irredutı́vel (conhece algum exemplo ?).
(ii) f (x) é redutı́vel, então
f (x) = f1 (x)g(x),
com f1 (x) de grau 1 e g(x) de grau 2. Se g(x) for irredutı́vel, esta é a fatoração
procurada. Senão, aplicamos o feito no caso de polinômios de grau 2 acima e
obtemos uma fatoração para g(x) como g(x) = f2 (x)f3 (x) com f2 (x) e f3 (x)
de grau 1; neste caso
f (x) = f1 (x)f2 (x)f3 (x)
é uma fatoração de f (x) como produto de polinômios irredutı́veis.
Este raciocı́nio pode ser continuado agora para grau 4, utilizando o já
feito para grau 3, e asim por diante. Este procedimento é um caso particular
do que chama-se um procedimento “indutivo”, onde a “indução” acontece
no grau dos polinômios envolvidos. O caso geral, demonstra-se por indução
matemática, no grau n do polinômio f (x). Mais precisamente, temos:
Teorema 3.4.1 (Teorema de fatoração). Seja f (x) ∈ D[x] um polinômio de
grau n ≥ 1. Então
i) Existem polinômios irredutı́veis f1 (x), . . . , fℓ (x) ∈ D[x] tais que
f (x) = f1 (x) · · · fℓ (x).
ii) Se temos outra fatoração
f (x) = g1 (x) · · · gm (x)
onde g1 (x), . . . , gm (x) são irredutı́veis, então m = ℓ e cada gi (x) é associado
a algum fj (x).
72
CAPÍTULO 3. POLINÔMIOS
Demonstração. Existência. Vamos mostrar a parte (i) por indução matemática no grau n.
Se n = 1, o resultado é claro, pois todo polinômio de grau um com
coeficientes num corpo é irredutı́vel.
Suponhamos como hipótese de indução que o resultado é verdadeiro para
todo polinômio de grau menor que k. Vamos então demonstrar que o resultado também é verdadeiro para todo polinômio de grau k.
Seja f (x) um polinômio de grau k. Se f (x) é irredutı́vel, nada temos a
demonstrar. Se f (x) é redutı́vel, então
f (x) = g(x)h(x)
com g(x) e h(x) divisores não triviais de f (x); em particular o grau de g(x)
e de h(x) não pode ser nem 0 nem k.
Por hipótese de indução existem fatorações para g(x) e h(x) como produto
de polinômios irredutı́vis
g(x) = f1 (x) · · · fr (x), h(x) = fr+1 · · · fℓ (x).
Concluı́mos
f (x) = f1 (x) · · · fℓ (x),
como queriamos demonstrar.
Unicidade. Agora mostraremos a parte (ii). Suponhamos que
f (x) = g1 (x) · · · gm (x),
com g1 (x), . . . , gm (x) irredutı́veis em D[x]. Fixemos i ∈ {1, . . . , m} e denotemos g(x) = gi (x). Temos
g(x)|f1 (x) · · · fℓ (x).
Como g(x) é irredutı́vel, pelo exercı́cio 3.3.3 existe j tal que g(x) divide fj (x);
como gi (x) = g(x) e fj (x) são ambos irredutı́veis, eles são associados. Em
particular m ≤ ℓ.
Refazendo o argumento com fi (x) no lugar de gi (x) também obtemos que
cada fi (x) divide algum gj (x) e então ℓ ≤ m, o que completa a demonstração.
3.4. IRREDUTIBILIDADE E FATORAÇÃO CANÔNICA
73
Observação 3.4.2. a) Os polinômios irredutı́veis em (i) podem aparecer muitas vezes, como mostra o seguinte exemplo:
(3x2 − 6)2 (x2 + 1)3 (4x − 1)
que é uma fatoração em Q[x].
b) A parte (ii) do teorema significa que dadas duas fatorações, o número
de fatores irredutı́veis deve ser o mesmo em ambas, e, além disso, os polinômios que aparecem nestas ou são, a menos da ordem de aparição, os
mesmos, ou diferem pela multiplicação de uma constante. Por exemplo, a
fatoração dada acima, pode ser modificada como
1
1
(4x2 − 8)(3x2 − 6)(3x2 + 3)3 (x − ).
9
4
Observe que pondo em evidência os coeficientes lı́deres de cada fator irredutı́vel da fatoração e multiplicando-os entre si, devemos obter o coeficiente
lı́der de f (x). Isto, junto com a observação acima mostra o seguinte corolário:
Corolário 3.4.3. Seja f (x) ∈ D[x] um polinômio de grau n ≥ 1 com coeficiente lı́der an . Então Existem polinômios irredutı́veis e mônicos f1 (x), . . . , fk (x) ∈
D[x] tais que
f (x) = an f1n1 (x) · · · fknk (x).
Vamos chamar a fatoração de f (x) enunciada no corolário 3.4.3 da fatoração canônica de f (x) em D[x].
A continuação vamos analizar, separadamente, o que acontece quando D
é C, R ou Q. Começamos enunciando o famoso e mais imporante teorema
na teoria de polinômios com coeficientes complexos: o Teorema Fundamental
da Álgebra cujo enunciado é adjudicado ao matemático francés A. Girard e
cuja demonstração foi obtida por Gauss em 1799 na sua tese de doutorado.
Existem hoje em dia muitas demonstrações deste teorema, algumas delas
relativamente elementares, mas todas envolvendo conceitos qeu escapam do
escopo deste livro, motivo pelo qual será omitida.
Teorema 3.4.4 (Teorema Fundamental da Álgebra). Seja f (x) ∈ C[x] de
grau maior ou igual que 1. Existe α ∈ C tal que f (α) = 0.
74
CAPÍTULO 3. POLINÔMIOS
Como sabemos, todo polinômio de grau 1, em particular aqueles com
coeficientes complexos, é irredutı́vel. Se f (x) ∈ C[x] é de grau maior que
um, pelo teorema fundamental, existe uma raı́z α ∈ C; pelo corolário 3.3.7
temos então
f (x) = (x − α)q(x)
para certo q(x) ∈ C[x], com grau(q) > 0. Concluı́mos que f (x) é redutı́vel.
Ou seja:
Corolário 3.4.5. Os unicos polinômios irredutı́veis em C[x] são os polinômios
de grau um.
Como conseqüência se f (x) é um polinômio de grau n ≥ 1 com coeficiente
lı́der an , o corolário 3.4.3, no caso onde D = C, fica na forma seguinte
f (x) = an (x − α1 )n1 · · · (x − αk )nk ,
(3.4)
onde n = n1 + · · · + nk e α1 , . . . , αk são as raı́zes distintas de f (x).
Diremos que esta é a fatoração canônica complexa de f (x). O expoente
ni é a multiplicidade da raı́z αi , i = 1, . . . , k. Dizemos também que αi é uma
raiz simple quando ni = 1 e múltipla quando ni > 1, sendo este ni a ordem
ou multiplicidade. Se ni = 2, 3,etc. tabém diremos que a raiz é dupla, tripla
etc. No fim do parágrafo analisaremos mais detalhadamente a relação entre
a multiplicidade de uma raiz e a divisibilidade (ref. corolário do teorema do
resto 3.3.7).
Um corolário importante da fatoração de f (x) como produto de fatores
irredutı́veis mônicos de grau um é a relação entre coeficientes e raı́zes de
um polinômio, problema este que já tratamos no (ver §2 do capı́tulo 1) de
maneira menos sistemática do que o faremos agora; em particular o leitor
poderá verificar as relações obtidas surgiam como consequência de considerar
expressões que estavam fatoradas como produto de binômios de grau 1. Para
isso comecemos observando que
!
!
ℓ
X
X
Y
n
γi γj + · · · + (−1)n γ1 · · · γn .
γj +
(x − γi ) = x −
i=1
j
i<j
Esta expressão é então um polinômio mônico de grau n com coeficientes, fora
o lı́der que é um, certas funções cujas variáveis são precisamente as raı́zes
γ1 , . . . , γ n .
3.4. IRREDUTIBILIDADE E FATORAÇÃO CANÔNICA
75
Mais explicitamente, definimos as funções simétricas s1 , . . . , sℓ de γ1 , . . . , γn ,
como sendo
X
sj (γ1 , . . . , γn ) =
γi1 · γi2 · · · γij , j = 1, . . . , n.
i1 <...,ij
Por simplicidade, e quando não houver perigo de confusão, denotaremos
sj = sj (γ1 , . . . , γn ), j = 1, . . . , n;
sj é a j-ésima função simétrica de γ1 , . . . , γn .
A demonstração do seguinte corolário deveria ser um exercı́cio relativamente fácil para o leitor
Corolário 3.4.6. Seja g(x) ∈ C[x] um polinômio mônico de grau n; denotemos γ1 , . . . , γn as raı́zes (eventualmente repetidas) de g(x). Então
g(x) =
n
X
(−1)n sj xj ,
j=1
onde s0 = 1 e, para j ≥ 1, sj é a j-ésima função simétrica de γ1 , . . . , γn .
Para analisar a fatoração de polinômios com coeficientes reais, precisamos
de um resultado preliminar que é interessante em si mesmo.
Lema 3.4.7. Sejam f (x) ∈ R[x] e α ∈ C um número complexo imaginário.
Então f (α) = 0 se e só se f (α) = 0.
Demonstração. Escrevemos
f (x) =
n
X
i=0
ai xi , ai ∈ R, 0 ≤ i ≤ n.
Por hipótese
f (α) = 0 =
n
X
ai α i .
i=0
Comecemos observando que, por um lado αi = αi ; por outro lado ai = ai
para todo i = 0, . . . , n, pois ai ∈ R.
76
CAPÍTULO 3. POLINÔMIOS
Tendo em conta que o conjugado de uma soma de números é a soma dos
conjugados destes números, concluı́mos
0 = f (α)
n
X
ai α i
=
i=0
=
n
X
ai α i
i=0
= f (α)
o que termina a demonstração.
Exemplo 3.4.8. No lema precedente é essencial que os coeficientes do polinômio sejam reais. Por exemplo se
f (x) = x2 − ı,
as duas raı́zes de f (x) são as raı́zes quadradas da unidade imaginária ı, isto
é
√
√
√
√
2
2
2
2
+ı
e −
−ı
.
2
2
2
2
O seguinte é um exercı́cio fácil que deixamos para o leitor.
Exercı́cio 3.4.1. Seja f (x) ∈ R[x] um polinômio de grau 2. Mostre que f (x)
é irredutı́vel sobre R se e somente se ele possui uma raiz imaginária.
Seja f (x) ∈ R[x] um polinômio com coeficientes reais de grau n ≥ 1.
Suponhamos que suas raı́zes em C sejam
α1 , . . . , αr , α1 , . . . , αr , β1 , . . . , βs ,
onde αj é imaginária para todo j e βk é real para todo k. A fatoração de
f (x) em C[x] pode ser escrita na forma
f (x) = an (x−α1 )n1 (x−α1 )m1 · · · (x−αr )nk (x−αr )nk (x−β1 )m1 · · · (x−βs )ms .
Por outro lado, um cálculo direto mostra que se α é imaginário, então o
polinômio
(x − α)(x − α) = x2 − 2ℜ(α)x + |α|2 ,
3.4. IRREDUTIBILIDADE E FATORAÇÃO CANÔNICA
77
que é evidentemente um polinômio com coeficientes reais, é irredutı́vel (vide
exercı́cio 3.4.1); se α = a + ıb, o polinômio acima também escreve-se como
(x − a)2 + b2 ,
o que evidencia a existência de soluções imaginárias. Aplicando este cálculo
à fatoração de f (x) concluı́mos
n
nr
f (x) = an (x − a1 )2 + b21 1 · · · (x − ar )2 + b2r
(x − β1 )m1 · · · (x − βs )ms .
(3.5)
Diremos que esta é a fatoração canônica real de f (x)
Como vimos no exemplo 3.3.4, todos os fatores de grau 2 e 1 nesta fatoração são irredutı́veis em R[x]. Em particular, podemos enunciar o seguinte
corolário:
Corolário 3.4.9. Um polinômio com coeficientes reais é irredutı́vel se e somente se for de grau 1 ou de grau 2 com raı́zes imaginárias.
Exemplo 3.4.10. O polinômio
(x2 + 1)(x2 + 2)
possui todas suas raı́zes imaginárias, mas é redutı́vel.
Exemplo 3.4.11. Consideremos o polinômio
f (x) = x4 + x2 + 1.
Se ω é a raiz cúbica primitiva da unidade, é claro que ω e seu oposto −ω são
raı́zes de f (x); logo ω e −ω também o serão. Estas são quatro raı́zes de f (x).
Um cálculo direto mostra que a fatoração canônica real de f (x) é então
f (x) = (x2 + x + 1)(x2 − x + 1).
Agora nos resta compreender a fatoração canônica no caso racional; em
outras palavras, precisamos saber que polinômios com coeficientes racionais
podem aparecer como fatores irredutı́veis. Isto é um problema bem mais
delicado como iremos vendo aos poucos. Uma forma de obter a fatoração
canônica no caso racional de um polinômio Q[x], é de escrevermos primeiro
a fatoração canônica real de f (x); se os fatores que aparecem nesta forem
78
CAPÍTULO 3. POLINÔMIOS
polinômios com coeficientes racionais, pela unicidade da fatoração, esta será
a fatoração canônica racional de f (x): com efeito, todo polinômio irredutı́vel
em R[x] o será também em Q[x]. A fatoração canônica real do polinômio do
exemplo 3.4.11 é então a fatoração canônica racional.
Quais são os graus possı́veis de um polinômio irredutı́vel em Q[x] ? Analizaremos, para começar, alguns exemplos do que pode acontecer.
Exemplo 3.4.12. Seja f (x) = x3 − 5. As raı́zes de f (x) são precisamente as
três raı́zes cúbicas de 5, isto é,
√
√
√
3
3
3
5, ω 5, ω 2 5.
É então claro que
x3 − 5 = g(x)(x −
√
3
5),
√
√
onde g(x) é o polinômio mônico de grau 2 em R[x] cujas raı́zes são ω 3 5, ω 2 3 5
(como exercı́cio o leitor poderia escrever explicitamente g(x)). É conhecido
√
que 3 p é um número irracional sempre que p ∈ Z for um número primo (por
quê ?). Concluı́mos então que f (x) é irredutı́vel.
Outra forma de estudar o polinômio do exemplo 3.4.12 pode ser a partir
da própria definição de irredutibilidade. Mais geralmente, seja f (x) ∈ Q[x]
um polinômio de grau 3. Ele é redutı́vel se e somente se
f (x) = f1 (x)f2 (x),
com f1 (x) e f2 (x) polinômios com coeficientes racionais de graus 1 e 2 respectivamente. Em particular f1 (x) = ax + b para certos a, b ∈ Q, com a 6= 0.
Mas então α := −b/a, que é um número racional, será raiz de f (x), necessariamente. Então, um polinômio de grau 2 será irredutı́vel quando não possuir
raı́zes racionais. Em particular, isto mostra, de uma outra forma, que x3 − 5
é irredutı́vel; porém como sabemos, calcular as raı́zes de um polinômio de
grau 3, salvo casos particulares, não é tarefa fácil. Mas no nosso raciocı́nio,
precisamos apenas conhecer a natureza das raı́zes, isto é, não queremos calcular todas as raı́zes, mas apenas saber se há alguma racional: isto é muito
mais fácil, como observaremos a continuação.
Seja f (x) ∈ Z[x] um polinômio de grau n com coeficientes inteiros, ou
seja
n
X
f (x) =
ai xi , an , . . . , a0 ∈ Z.
i=0
3.4. IRREDUTIBILIDADE E FATORAÇÃO CANÔNICA
79
Suponhamos que α = p/q é uma raı́z racional de f (x) com p, q ∈ Z números
primos entre si. Então f (p/q) = 0, ou, de maneira equivalente
p
q n f ( ) = 0,
q
isto é
an pn + an−1 pn−1 q + an−2 pn−2 q 2 + · · · + a1 pq n−1 + a0 q n = 0.
Portanto p divide a0 q n e q divide an pn . Como p e q são primos entre si, tanto
p e q n como q e pn serão primos entre si; pelo teorema de Euclides no caso
dos números inteiros, concluı́mos que
p|a0 , q|an .
(3.6)
Estas relações de divisibilidade são conhecidas como condições necessárias
para existência de raiz racional.
No caso do polinômio x3 − 5, q só pode ser 1 ou −1 e p ∈ {1, −1, 5, −5}.
As únicas raı́zes racionais deste polinômio podem ser então 1, −1, 5, −5; é
facil de verificar que nenhum destes números anula o polinômio.
Observação 3.4.13. (a) Se a0 = an = 1 as únicas raı́zes racionais possı́veis
são 1 e −1. Isto mostra facilmente que o polinômio do exemplo 3.4.11 não
possui raı́zes racionais; observe não obstante que ele é redutı́vel em Q[x],
o que mostra que nosso método acima funciona apenas para polinômios de
grau 3 (evidentemente também para polinômios de graus 1 e 2).
(b) Se os coeficientes de f (x) forem números racionais da forma
ai =
bi
, i = 0, 1 . . . , n,
ci
com bi , ci ∈ Z para todo i = 0, 1 . . . , n, escolhemos um múltiplo comum m dos
denominadores (por exemplo o produto deles ou o mmc). É fácil constatar
que mf (x) é um polinômio com coeficientes inteiros. Como as raı́zes de f (x)
e de mf (x) são as mesmas, podemos aplicar o método acima a este último
para saber se f (x) possui ou não raı́zes racionais.
Resumindo, se f (x) for de grau 3, ou ainda menor, ele será irredutı́vel
em Q[x] só quando não tiver raı́zes racionais; na direção contrária, se um
polinômio, agora de qualquer grau maior que um, tiver uma raiz racional,
digamos α ∈ Q, então será divisı́vel por x − α em Q[x]. Logo, todo polinômio
de grau maior que um em Q[x] que possui raiz racional é redutı́vel.
Vejamos agora um exemplo um pouco mais complicado.
80
CAPÍTULO 3. POLINÔMIOS
Exemplo 3.4.14. Seja
f (x) = 2x4 − 20x + 2.
É f (x) irredutı́vel em Q[x] ? Encontrar todas as raı́zes de f (x) é ainda
mais difı́cil que nos casos anteriores; além disto, corremos o risco de obtê-las
de maneira aproximada, o que impederia de encontrar a fatoração canônica
real e em conseqüência a correspondente fatoração racional.
É fácil constatar que f (x) não posui raı́zes racionais, mas isto não implica
que o polinômio seja irredutı́vel. Com efeito, não possuir raı́zes racionais nos
diz apenas que f (x) não aceita fatores de grau um, como já sabemos (e
utilizamos, novamente, acima). Conseqüêntentente, f (x) será redutı́vel em
Q[x] só se pudermos escrever
f (x) = 2g(x)h(x)
com g(x) e h(x) polinômios mônicos de grau 2; ou seja, se existirem a, b, c, d ∈
Q tais que
x4 − 10x + 1 = (x2 + ax + b)(x2 + cx + d).
Neste caso, logo de desenvolver o produto de polinômios acima, deveremos
ter
c + a = 0, ac + b + d = 0, ad + bc = −10, bd = 1.
Substituı́ndo c = −a nas duas equações do meio, obtemos
b + d = a2 , a(d − b) = −10;
donde:
10
10
, 2d = a2 − .
a
a
Como bd = 1, multiplicando as duas equações temos
2b = a2 +
a6 − 4a2 − 100.
Ou seja que a2 é uma solução racional da equação com coeficientes inteiros
y 3 − 4y − 100 = 0.
Finalmente, é fácil constatar que esta equação não possui raı́zes racionais
(observe que toda raiz racional desta equação deve ser inteira, positiva e
menor que 10). Isto mostra que a suposição de termos uma fatoração de
f (x) como produto de polinômios de grau dois, nos leva a uma contradição,
demonstrando então que f (x) é efetivamente irredutı́vel.
3.5. MULTIPLICIDADE DE RAÍZES
81
Se considerarmos agora um polinômio de grau 5, as possı́veis fatorações
(não triviais) são como produto de dois poinômios de graus 1 e 4, ou 2 e 3;
não é difı́cil de imaginar que os argumentos utilizados no exemplo 3.4.14 possam ser adaptados, mas a complexidade dos cálculos cresce rezoavelmente.
De fato, na medida que o grau do polinômio é maior, tanto maior será a
complexidade dos cálculos. Isto torna inviável o tratamento da irredutibilidade nesta perspectiva, desde que o grau do polinômio é “sufucientemente
grande”. Como veremos mais adiante, existe um critério muito eficaz que
nos permite concluir que certo tipo de polinômios é irredutı́vel; infelizmente
não existe um critério geral. Mas postergaremos esta análise para o último
parágrafo do presente capı́tulo.
3.5
Multiplicidade de raı́zes
Quando obtivemos a fatoração canônica de um polinômio f (x) ∈ C[x] em
C[x], chamamos os expoentes de cada polinômio irredutı́vel (de grau 1) de
multiplicidade ou ordem da raiz, digamos α, correspondente. Neste parágrafo
analisaremos mais detalhadamente este conceito. De fato, caracterizaremos
o conceito de multiplicidade de três maneiras: a primeira, em termos de
de divisibilidade por potências do polinômio irredutı́vel (x − α); a segunda
em função da anulação do polinômio f (x) e de outros polinômios associados
a este, chamados de derivadas de f (x): é o critério das derivadas para a
multiplicidade de uma raiz. Ambas caracterizações podem ser interpretadas
como generalizações do teorema de Ruffini (corolário 3.3.7).
Finalmente, caracterizaremos a multiplicidade de uma raı́z de f (x) em
termos da multiplicidade com que aparece no mdc de f (x) e a sua primeira
derivada f ′ (x).
Proposição 3.5.1. Sejam f (x) ∈ D[x] e α ∈ C. Então α é uma raiz de
multiplicidade m de f (x) se e somente se m é o maior inteiro positivo tal
que (x − α)m divide f (x).
Demonstração. Seja m como no enunciado da proposição. Consideremos a
fatoração canônica complexa de f (x); nela f (x) escreve-se na forma
f (x) = a(x − α)n q(x),
onde a é o coeficiente lı́der de f (x) e q(x) é um produto de fatores da forma
(x − β) com β 6= α; em particular q(α) 6= 0. Temos de mostrar que m = n.
82
CAPÍTULO 3. POLINÔMIOS
Como (x − α)n |f (x), pela maximalidade de m temos diretamente que
m ≥ n.
Por outro lado observamos que d(x) := mdc(q(x), (x − α)m ) = 1: com
efeito, como d(x)|(x−α)m , a unica raiz possı́vel para d(x) é α; mas d(x)|q(x) e
α não é raiz de q(x). Como (x−α)m |f (X), do teorema de Euclides concluı́mos
que (x − α)m divide (x − α)n , donde n ≥ m.
Seja
f (x) =
n
X
i=0
ai xi ∈ D[x].
A Derivada de f (x) é o polinômio
f ′ (x) :=
X
iai xi−1 :
i=1
é um polinômio em D[x].
Por indução matemática definimos as derivadas superiores de f (x). A
derivada n-ésima f (n) (x) de f (x) é a derivada da derivada (n − 1)-ésima
f (n−1) (x). Também denotaremos f ′′ (x) para a derivada segunda, f ′′′ (x) a
terceira, f IV (x) para a quarta, etc.
Observação 3.5.2. A proposição acima generaliza o teorema de Ruffini (corolário 3.3.7).
Exemplo 3.5.3. Consideremos o polinômio
2
1
f (x) = x6 + x5 − x4 − 6x2 − 2.
3
7
Então
8
24
f ′ (x) = 2x5 + 5x4 − x3 − 12x, f ′′ (x) = 10x4 + 20x3 − x2 − 12.
7
7
O leitor pode calcular as restantes derivadas observando que a sexta sera
constante e igual a 6!/3 e da sétima em diante nulas.
Exercı́cio 3.5.1. Mostre que um polinômio tem grau n se e somente se f (n) (x)
é uma constante não nula.
O conceito de derivada pode ser definido para funções de uma variável
num contexto muito mais alplo, o que é feito nos cursos de cálculo. Considerando um polinômio como uma tal função, a derivada definida desta forma
83
3.5. MULTIPLICIDADE DE RAÍZES
coincide com nossa definição. O resultado na proposição abaixo é bem conhecido nos cursos de cáculo neste contexto mais geral; nos daremos uma
demonstração da proposição adaptada ao nosso contexto podendo a leitura
desta ser omitida sem comprometer a compreensão do conceito.
Proposição 3.5.4. Sejam f (x), g(x) ∈ D[x]. temos
(a) (f (x) + g(x))′ = f ′ (x) + g ′ (x).
(b) Fórmula de Leibnitz: (f (x)g(x))′ = f ′ (x)g(x) + f (x)g ′ (x).
Demonstração. A parte (a) é deixada para o leitor. Para demonstrar (b)
escrevemos
n
m
X
X
i
f (x) =
ai x , g(x) =
bj xj .
i=0
Então
′
f (x) =
n−1
X
j=0
i
′
iai x , g (x) =
i=0
m−1
X
jbj xj−1 .
j=0
Pela fórmula do produto de polinômios temos
f (x)g(x) =
n+m
X
c k xk
k=0
onde ck = a0 bk + · · · + ak b0 . Derivando f (x)g(x) escrito como acima, observamos que o coeficiente do termo de grau (k − 1)-ésimo é
kck = k(a0 bk + · · · + ak b0 ).
Por outro lado, pela mesma fórmula (do produto de polinômios) o coeficiente do termo de grau (k − 1) de f ′ (x)g(x) é
(k − 1)a1 bk−1 + 2(k − 2)a2 bk−2 + · · · + (k − 1)ak−1 b1 + kak b0 ;
analogamente o coeficiente do termo de grau (k − 1) de f (x)g ′ (x) é
(k − 1)a0 bk−1 + (k − 1)a1 bk−1 + · · · + ak−1 b1 .
Concluı́mos que o coeficiente do termo de grau (k − 1) de f ′ (x)g(x) +
f (x)g ′ (x) é k(a0 bk + · · · + ak b0 ), donde segue a afirmação.
84
CAPÍTULO 3. POLINÔMIOS
Exemplos 3.5.5. (a) Seja f (x) = (x − α)n . A derivada k-ésima de f (x) é
n(n1 ) · · · (n − k)(x − α)n−k .
(b) A derivada de um polinômio constante é evidentemente 0. Se h(x) =
ag(x) com a ∈ D, pela fórmula de Leibnitz (proposição 3.5.4, parte (b))
teremos então
h′ (x) = ag ′ (x).
Demonstramos então o seguinte corolário da proposição 3.5.1:
Corolário 3.5.6 (Critério da Derivada). Um número α ∈ C é raiz de um
polinômio f (x) ∈ D[x], de multiplicidade m se e somente se
f (α) = f ′ (α) = · · · = f (m−1) (α) = 0, f (m) (α) 6= 0.
Demonstração. É claro que se m = 0 nada temos a provar. Então suporemos
m > 0.
Se α é raiz de multiplicidade m, pela propisição 3.5.1
(x − α)m |f (x) e (x − α)m+1 6 |f (x).
Em particular
f (x) = (x − α)m q(x);
observe que então α nao é raiz de q(x) (veja a prova da proposição).
Pela fórmula de Leibnitz
f ′ (x) = m(x − α)m−1 q(x) + (x − α)m q ′ (x).
(3.7)
Então (x − α)m−1 divide f ′ (x) e (x − α)m não o divide: com efeito, caso
contrário (x − α) dividiria q(x), o que não é possı́vel por hipótese; em particular, se m = 1 o corolário está demonstrado. Para demonstrar o caso geral
procedemos por indução matemática em m.
Suponhamos que m > 1. Pela fórmula (3.7), (m − 1) é a maior potência
de (x − α) que divide h(x) := f ′ (x). Aplicando a hipótese de indução a h(x)
concluı́mos que
h(α) = h′ (α) = · · · = h(m−2) (α) = 0, h(m−1) (α) 6= 0.
85
3.5. MULTIPLICIDADE DE RAÍZES
Como h(i−1) (x) = f (i) (x) para i = 1, . . . , m, por definição de derivada, obtemos a tese de indução.
Reciprocamente, suponhamos que
f (α) = f ′ (α) = · · · = f (m−1) (α) = 0, f (m) (α) 6= 0.
Então α é uma raiz de multiplicidade, digamos, n: temos
f (x) = (x − α)n q(x)
onde, como já vimos, q(α) 6= 0. A primeira parte da prova nos mostra em
particular que [f (α) = f ′ (α) = · · · = f (m−1) (α) = 0, f (n) (α) 6= 0, donde
segue que m = n.
Exemplos 3.5.7. (a) Consideremos o polinômio
f (x) = ax2 + bx + c ∈ D[x], a 6= 0.
Uma raiz α ∈ C de f (x) é dupla se e somente se f (α) = f ′ (α) = 0, f ′′ (α) 6= 0.
Um cálculo fácil de derivadas mostra que
f ′ (x) = 2ax + b, f ′′ (x) = 2a;
observemos que f ′′ (x) é um polinômio constante não nulo e portanto a
condição f ′′ (α) 6= 0 é automáticamente satisfeita. Então a condição para
α ser raiz dupla é de ser uma raiz tal que 2aα + b = 0, isto é
α=−
b
;
2a
substituı́ndo este valor de α em f (x) = 0 obtemos
a
b2
b2
−
+c=0
4a2 4a
que equivale b2 − 4ac = 0, nossa conhecida condição de discriminante nulo
para a equação quadrática.
(b) Encontraremos as raı́zes de
f (x) = 2x4 + 5x3 + 3x2 − x − 1,
86
CAPÍTULO 3. POLINÔMIOS
sabendo que possui uma raı́z tripla α. A raiz tripla tem de ser também raiz
da derivada segunda, que é
f ′′ (x) = 24x2 + 30x + 1
cujas raı́zes são −1 e −4. Como −1 também é raiz da derivada primeira
f ′ (x) = 8x3 + 15x2 + 6x − 1
concluı́mos que α = −1. Então (x + 1)3 divide f (x); efetuando a divisão
obtemos
f (x) = (x + 1)3 (2x − 1),
e então 1/2 é a raiz diferente de α.
Exercı́cio 3.5.2. Trabalhando de maneira análoga a como fizemos no exemplo
(a) acima reobtenha a condição de discriminante nulo para a existência de
raiz de multiplicidade pelo menos 2 da equação cúbica na forma reduzida
x3 + ax + b = 0.
Do critério da derivada (corolário 3.5.6) concluı́mos imediatamente o seguinte corolário.
Corolário 3.5.8. α é raı́z de multiplicidade m de f (x) se e somente se α é
raiz de multiplicidade m − 1 de f ′ (x).
Observação 3.5.9. O corolário precedente pode ser generalizado da seguinte
forma: Sejam f (x) ∈ D[x] um polinômio de grau n e α ∈ C; fixemos um
inteiro k tal que 1 < k < n. Então α é raı́z de multiplicidade m de f (x) se e
somente se α é raiz de multiplicidade m − k da derivada k-ésima f (k) (x) de
f (x).
Exercı́cio 3.5.3. Demonstre a generalização do corolário 3.5.8 enunciada na
observação precedente.
Proposição 3.5.10. Sejam f (x) ∈ D[x] e α ∈ C; denotemos d(x) :=
mdc(f, f ′ ). Então α é raiz de multiplicidade m de f (x) se e somente se
ela é raiz de multiplicidade m − 1 de d(x).
3.5. MULTIPLICIDADE DE RAÍZES
87
Demonstração. Suponhamos que α seja raiz de multiplicidade m de f (x);
pelo corolário 3.5.8 α é raiz de multiplididade m − 1 de f ′ (x). Então (x − α)m
divide f (x) mas (x−α)m+1 não o divide e (x−α)m−1 divide f ′ (x) mas (x−α)m
não o divide; como caso particular temos que (x − α)m−1 divide f (x) e f ′ (x).
Por outro lado, pelo teorema 3.3.28 existem polinômios h(x), k(x) tais
que
d(x) = f (x)h(x) + f ′ (x)k(x).
Concluı́mos que (x − α)m−1 divide d(x), mas (x − α)m nao o faz, pois se
o dividisse, também dividiria f ′ (x). Então α é raiz de multiplicidade m − 1
de d(x).
Reciprocamente, suponhamos que α é raiz de multiplicidade m de d(x).
Como (x − α)m−1 divide d(x), também dividirá f (x) e f ′ (x) pela proposição 3.3.10; donde tiramos que a multiplicidade de f ′ (x) é pelo menos
m − 1 e então a de f (x) pelo menos m pelo corolário 3.5.8. Como (x − α)m
não divide d(x) então não pode dividir f (x) e f ′ (x) ao mesmo tempo, mas
já sabemos que divide f (x); portanto não divide f ′ (x) o que nos diz que α
é raiz de multiplicidade m − 1 de f ′ (x) e (exatamente) m de f (x), de novo
pelo corolário 3.5.8. Isto termina a demonstração.
A proposição 3.5.10 fornece uma outra abordagem para o cálculo das
raı́zes múltiplas de um polinômio. A tı́tulo de exemplo resolveremos, desde
esta nova ótica, o exercı́cio 3.5.2.
Exemplo 3.5.11. Consideremos o polinômio
f (x) = x3 + ax + b ∈ C[x].
Sua derivada é f ′ (x) = 3x2 + a. Executando o algorı́tmo de Euclides vemos
que o último resto parcial diferente de zero é de fato constante (isto é, que
não depende mais de x) e vale
27b2
+ a, ou b
4a2
dependendo que a 6= 0 ou a = 0. No caso onde a 6= 0, podemos escrever este
resto
D
− 2,
4a
onde D é o discriminante da equação f (x) = 0. Em qualquer caso, do corolário precedente concluı́mos então que f (x) possui raı́zes múltiplas se e
88
CAPÍTULO 3. POLINÔMIOS
somente se D = 0, o que demonstra novamente que a anulação do discriminante equivale à existência de soluções múltiplas de uma equação cúbica (na
forma reduzida).
O exemplo nos mostra um caminho para definir o discriminante de um
polinômio genérico (isto é pensando os coeficientes como “indeterminadas”)
da forma
f (x) = xn + an−1 xn−1 + · · · a1 x + a0 .
Como os coeficientes são genéricos, ao executar o algorı́tmo de Euclides, o
primeiro resto parcial é um polinômio onde aparece xn−2 , no segundo aparece xn−3 , e assim por diante, até chegarmos no caso em que o resto parcial
correspondente não mais depende de x; se dividirmos mais uma vez o resto
será necessariamente nulo. Este último resto não nulo é uma expressão polinomial nos coeficientes an−1 , . . . , a1 , a0 de f (x) com números racionais como
coeficientes (observe que já quando dividimos f (x) por f ′ (x) o coeficiente do
primeiro termo do quociente é 1/n). Extraı́ndo comum denominador nestes
coeficientes racionais escrevemos este resto parcial como um quociente cujo
numerador é uma expressão polinomial em a0 , a1 , . . . , an−1 , mas agora com
coeficientes inteiros; denotemos esta expressão
∆ = ∆(a0 , a1 , . . . , an−1 ).
Pela proposição 3.5.10 existem raı́zes múltiplas de f (x) se e somente se
f (x) e f ′ (x) não são primos entre si, isto é, se e somente se d(x) 6= 1. Mas
d(x) 6= 1 significa que no algorı́mo de Euclides o último resto parcial diferente
de zero tem que ser um polinômio de grau ≥ 1. Então este resto parcial não
pode ser independente de x; isto significa que nosso ∆ acima deve ser nulo.
Motivados pelo raciocı́nio que fizemos, podemos definir ∆ como o discriminant de f (x) pois a sua anulação equivale à existência de raı́zes múltiplas (o
sinal deste é irrelevante no que diz respeito a existência de soluções múltiplas);
observe em particular que o raciocı́nio independe da natureza dos coeficientes
a0 , a1 , . . . , an de f (x).
Exercı́cio 3.5.4. (a) Calcule o discriminante δ dos seguintes polinômios (no
caso da equação cúbica compare com o visto no capı́tulo 1.
f (x) = x3 + ax2 + bx + c, g(x) = x4 + px2 + qx + r.
(b) Modificando adequadamente o raciocı́nio feito acima, defina o discriminante ∆(a0 , . . . , an ) para um polinômio genérico de grau n que não seja
3.6. LEMA DE GAUSS E CRITÉRIO DE EINSENSTEIN
89
mômico; teste seu resultado com polinômios de graus 3 e 4, comparando com
a parte (a).
Terminamos o parágrafo com o seguinte corolário, cuja demonstração é
deixada como exercı́cio para o leitor.
Corolário 3.5.12. O polinômio
f (x)
mdc(f, f ′ )
é um polinômio cujas raı́zes são as raı́zes de f (x), todas de multiplicidade 1.
Exercı́cio 3.5.5. Considere o polinômio
f (x) = x5 − 13x4 + 68x3 − 176x2 + 220x − 100.
Encontre o polinômio mônico cujas raı́zes simples são as raı́zes de f (x), todas
com multiplicidade 1.
3.6
Lema de Gauss e Critério de Einsenstein
Agora retomamos o estudo da irredutibilidade em Q[x]. Seja f (x) ∈ Q[x],
isto é
pn
p1
p0
f (x) = xn + · · · + x + ,
qn
q1
q0
onde pi , qi ∈ Z saõ inteiros primos entre si. Se m := mmc(q0 , · · · , qn ) é o
mı́nimo múltiplo comum de todos os denominadores, então m é o menor
número positivo tal que mf (x) é um polinômio com coeficientes inteiros;
denotemos g(x) = mf (x). Evidentemente f (x) será irredutı́vel sobre Q se
e somente se g(x) o é, pois ambos polinômios diferem por uma constante
multiplicativa, que é um divisor trivial em Q[x]. Porém, o polinômio g(x)
tem uma vantagem de termos de trabalhar com números inteiros: observe
por exemplo que se quisermos implementar um algoritmo em computador
para decidir sobre a irredutibilidade de um determinado polinômio, é de se
esperar que isto só possa ser feito trabalhando com números inteiros, pois
um número racional é substituı́do pelo computador apenas por uma de suas
aproximações decimais. Por outro lado, não é claro por enquanto que isto
possa nos ajudar a decidir se g(x) é ou não é irredutı́vel sobre Q. Vejamos
não obstante um exemplo concreto onde decidimos sobreum polinômio g(x)
ser ou não irredutı́vel em Z[x], de forma a podermos “imaginar” um eventual
algorı́tmo.
90
CAPÍTULO 3. POLINÔMIOS
Exemplo 3.6.1. Consideremos o polinômio
g(x) = x4 − 5x + 2 ∈ Z[x]
Para começar, é claro que o conteúdo c(g) de g(x) é 1. É fácil observar que
g(x) não possui raı́zes racionais, logo o polinômio não pode ser fatorado como
produto de dois polinômios de graus 1 e 3 respectivamente. Suponhamos a
continuação que
g(x) = (αx2 + βx + γ)(α′ x2 + β ′ x + γ ′ ),
onde todos os coeficientes são inteiros. Como g(x) é mônico, αα′ = 1, e então
ou α = α′ = 1, ou α = α′ = −1. Multiplicando, quando no segundo caso,
por (−1)(−1) = 1, podemos finalmente escrever
g(x) = (x2 + ax + b)(x2 + cx + d), a, b, c, d ∈ Z.
Ou seja
x4 − 5x + 2 = x4 + (a + c)x3 + (b + d + ac)x2 + (ad + bc)x + bd;
Obtemos o seguinte sistema de equaçãoes diofantinas (isto é, com coeficientes
inteiros e cujas soluções são procuradas em Z)
a + c = 0, b + d + ac = 0, ad + bc = −5, bd = 1.
Da última equação deduzimos b = 1, d = 2 ou b = 2, d = 1 ou b = −1, d = −2
ou b = −2, d = −1. Substituı́ndo c = −a na terceira equação, vemos facilmente que nenhuma das quatro possibilidades para b e d podem efetivamente
acontecer. Concluı́mos então que g(x) é irredutı́vel sobre Z.
Qual é a relação entre a irredutibilidade em Z[x] e em Q[x] ? Se pudermos
responder a esta pergunta, de repente poderiamos nos auxiliar da maior
facilidade de lidar com números inteiros, para decidirmos se um polinômio é
ou não é irredutı́vel sobre Q. Começamos demonstrando a proposição 3.3.20,
que nos dá certa informação nesta direção.
Demonstração da Proposição 3.3.20 Suponhamos que g(x) ∈ Z[x] tem
conteúdo 1. Se g(x) for redutı́vel sobre Z, então
g(x) = h(x)k(x)
3.6. LEMA DE GAUSS E CRITÉRIO DE EINSENSTEIN
91
com h(x), k(x) ∈ Z[x] polinômios de grau maior que 0, já que c(g) = 1.
Esta fatoração também é válida em Q[x], mostrando que g(x) também será
redutı́vel em Q[x], donde segue a nossa proposição.
Mas o quê que acontece na direção contrária ? isto é, quando g(x) for
redutı́vel em Q, poderá ou não sê-lo em Z[x] ? Para responder a esta pergunta
começamos com um resultado técnico que é a chave para responder a estas
perguntas. Usualmente a demonstração deste faz parte da demonstração do
resultado principal (teorema 3.6.3 abaixo), ambos conhecidos na literatura
como Lemma de Gauss. Nos reservaremos esta denominação para o teorema.
Lema 3.6.2. Se g(x), h(x) ∈ Z[x] são polinômios com coeficientes interos,
então
c(gh) = c(g)c(h).
Demonstração. Faremos a demonstração em duas etapas:
1. Nesta primeira etapa mostraremos que c(g)c(h) e c(gh) possuem os
mesmos divisores primos.
Se
n
m
X
X
i
g(x) =
ai x , h(x) =
bj xj ,
i=0
j=0
como sabemos, o coeficiente k-ésimo de g(x)h(x), digamos ck , escreve-se na
forma
ck = a0 bk + a1 bk−1 + · · · + ak−1 b1 + ak b0 ,
onde evidentemente aℓ = 0 se ℓ > n e bℓ = 0 se ℓ > m.
Se p é um divisor primo de todos os coeficientes de g(x), isto é, se p é um
primo tal que p|c(g), é claro que p|ck para todo k = 0, 1, . . . , n + m, ou seja
p|c(gh); analogamente p|c(h) implica p|c(gh).
Reciprocamente, seja p um primo que divide c(gh). Suponhamos por
absurdo que p não divide o produto c(g)c(h), donde p não divide c(g) nem
c(h). Então g(x) e h(x) possuem coeficientes que não são múltiplos de p;
sejam k ∈ {0, 1, . . . , n} e ℓ ∈ {0, 1, . . . , m} sub-ı́ndices tais que
p|a0 , . . . , ak−1 , b0 , . . . , bℓ−1 , e p 6 |ak , p 6 |bℓ .
Por outro lado, o coeficiente (k + ℓ)−ésimo de g(x)h(x) é
ck+ℓ = a0 bk+ℓ + · · · + ak−1 bℓ+1 + ak bℓ + ak+1 bℓ−1 + · · · + ak+ℓ b0 .
92
CAPÍTULO 3. POLINÔMIOS
Como p|ck+ℓ concluı́mos que p|ak bℓ o que fornece uma contradição. Então
a primeira etapa da demonstração está completa.
2. Escrevendo
g(x) = c(g)g1 (x), h(x) = c(h)h1 (x),
obtemos g(x)h(x) = c(g)c(h)g1 (x)h1 (x); observemos que g1 (x) e h1 (x) são
polinômios de conteúdo 1. Pelo demonstrado na primeira etapa, c(g1 )c(h1 ) =
1 se e somente se c(g1 h1 ) = 1, donde segue que c(g)c(h) é o conteúdo de
g(x)h(x), terminando a demonstração.
Suponhamos agora que f (x) é um polinômio em Z[x] que é redutı́vel sobre
Q; então existem polinômios g0 (x), h0 (x) ∈ Q[x] não constantes, tais que
f (x) = g0 (x)h0 (x).
Sejam m1 e m2 os menores inteiros positivos tais que
g(x) := m1 g0 (x) ∈ Z[x], h(x) := m2 h0 (x) ∈ Z[x].
Utilizando o lema 3.6.2, obtemos
m1 m2 f (x) = g(x)h(x)
= c(g)c(h)g1 (x)h1 (x)
= c(gh)g1 (x)h1 (x),
onde, como na demonstração do lema precedente, g1 (x) e h1 (x) tem conteúdo
1.
Suponhamos que f (x) é irredutı́vel sobre Z; então c(f ) = 1. Portanto,
aplicando o lema 3.6.2 ao polinômio m1 m2 f (x), deduzimos que c(gh) =
m1 m2 . Então
f (x) = g1 (x)h1 (x),
o que contradiz a irredutiblidade de f (x) sobre Z. Isto demonstra o Lemma
de Gauss:
Teorema 3.6.3 (Lema de Gauss). Se f (x) ∈ Z[x] é irredutı́vel sobre Z,
então também o será sobre Q.
3.6. LEMA DE GAUSS E CRITÉRIO DE EINSENSTEIN
93
Exemplo 3.6.4. Consideremos o polinômio
1
2
k(x) = x4 − x + .
5
5
Pelo exemplo 3.6.1, o polinômio 5k(x) é irredutı́vel sobre Z; então k(x) é
irredutı́vel sobre Q, pois, pelo teorema, 5k(x) o é.
Para terminar este parágrafo enunciaremos sem demonstração o critério
de Eisenstein, que é um dos poucos critérios conhecidos para tratar a irredutibilidade sobre Z, que pelo lemma de Gauss (teorema) é essencialmente
equivalente à irredutibilidade sobre Q (de acordo à proposição 3.3.20 o polinômio em Z[x] considerado deve ter conteúdo 1). O leitor interessado em
estudar a demonstração deste belo teorema pode consultar [4, ...]; uma versão
mais geral do critério pode ser encontrada em [3, Teo. III.2.8]
Teorema 3.6.5 (Critério de Eisenstein). Seja f (x) = an xn + · · · + a1 xa0 ∈
Z[x]. Suponhamos que existe um número primo p tal que
(i) p 6 |an , (ii)p|a0 , a1 , . . . , an−1 , (iii)p2 6 |a0 .
Nestas condições, f (x) é irredutı́vel em Z[x]
Exemplos 3.6.6. (a) Consideremos os seguintes polinômios
f (x) = x3 +2x+10, g(x) = 2x7 +6x2 −18, h(x) = 5x6 +70x4 = 14x3 +98x−28.
p = 2 está nas hipóteses do teorema referente ao polinômio f (x). Então o
critério se aplica e f (x) é irredutı́vel sobre Z, logo sobre Q. Como 18 = 232 ,
no caso de g(x) o critério não se aplica, pois p = 2 divide o coeficiente lı́der
de g(x) e 32 divide o coeficiente do termo independente; ou seja que nada
podemos afirmar neste caso. Finalmente, h(x) também é irredutı́vel sobre
Q, pois o critério se aplica com p = 7; observe que não se aplica com p = 2.
(b) O critério se aplica com p = 2 ou p = 5 para o polinômio f (x) =
6
x + 10.
(c) O polinômio xn + 5 é irredutı́vel sobre Q para todo n ∈ N: basta
pegar p = 5; analogamente para xn + p, para todo primo p.
Como foi evidenciado nos exemplos, o Critério não pode ser aplicado para
cqualquer polinômio. Um momento de reflexão, nos convencerá do seguinte
fato que são raros os polinômios para os quais o Critério de Eisenstein é
aplicável, pois o primo p do enuneciado está sujeito a condições bastante
94
CAPÍTULO 3. POLINÔMIOS
restritivas. Porém, polinômios para os quais o critério náo se aplica podem
as vezes ser “modificados” de forma a poderemos aplicar o critério. Vejamos
do que estamos falando:
Se f (x) ∈ Z[x] e a ∈ Z, é facil ver que
f (x) = g(x)h(x) =⇒ f (x + a) = g(x + a)h(x + a),
pois basta substituir x por x + a na igauldade da esqueda para obtermos
aquela da direita e, reciprocamente. Como a ∈ Z, a expressão f1 (x) :=
f (x + a) é um polinômio em Z[x]; analogamente para g1 (x) := g(x + a)
e h1 (x) := h(x + a). Isto mostra que f (x) será irredutı́vel (sobre Z) se e
somente se f1 (x) o for.
Como aplicação do “truque” acima, vamos demonstrar, no exemplo abaixo,
a irredutibilidade de um polinômio muito especial. Como veremos no próximo
capı́tulo, este polinômio esta estreitamente vı́nculado à construtibilidade com
régua e compasso de polı́gonos regulares.
Exemplo 3.6.7. Seja n ∈ N. O Polinômio Ciclotômico (n+1)-ésimo, denotado
φn+1 (x), é o quociente de dividir xn+1 −1 por x−1: um cálculo direto mostra
que
φn+1 (x) = xn + xn−1 + · · · + x + 1.
Decidir sobre a irredutibilidade deste polinômio, para um certo valor de n, nos
permite, a posteriori, decidir sobre a construtibilidade com régua e compasso
de um polı́gono regular de (n + 1) lados (veja página ??). Evidentemente o
critério de Eisenstein não se aplica para este polinômio.
Consideremos, por simplicidade, o caso n = 4. Então
φ5 (x) = x4 + x3 + x2 + x + 1.
Com um pouco de paciência, podemos substituir x por x + 1 em φ5 (x) para
obtermos
φ5 (x + 1) = x4 + 5x3 + 10x2 + 10x + 5,
que é irredutı́vel pelo critério de Eisenstein aplicado com p = 5.
De fato, se n + 1 = p é um primo qualquer, mostra-se analogamente, o
que deixamos como exercı́cio para o leitor, que φp (x) é irredutı́vel (sugestão:
use o binômio de Newton para desenvolver (x + 1)ℓ para ℓ = p − 1, . . . , 2.
3.7. EXERCÍCIOS
3.7
95
Exercı́cios
3.7.1
Demonstre que se f (x), g(x) são polinômios associados, digamos em D[x],
então f (x) é irrédutı́vel se e somente se g(x) é irrédutı́vel. Dê exemplos de
pares de polinômios com coeficientes em Z que não são associados em Z[x]
mas sim em Q[x].
3.7.2
Sejam f (x), g(x) polinômios associados em Q[x]. Mostre que f (x) e g(x)
também são associados em R[x] e C[x].
3.7.3
Encontre mdc(f, g) onde f (x) e g(x) são os seguintes pares de polinômios
x4 + x3 + 2x2 + x + 1 e x3 + 4x2 + 4x + 3
4x5 + 7x3 + 2x2 + 1 e 3x3 + x + 1
x4 + x3 + 2x2 + 3x + 1 e x4 + x3 − 2x2 − x + 1
3.7.4
No exercı́cio precedente, encontre a(x), b(x) tais que mdc(f, g) = a(x)f (x) +
b(x)g(x).
3.7.5
Demonstre as seguintes afirmações onde a(x), b(x), c(x) ∈ D[x] são polinômios
e D é um corpo (sugestão: faça uma revisão das principais propriedades do
mdc que apreendeu no curso de aritmética)
a) Se a(x)|b(x) e mdc(b, c) = 1, então mdc(a, c) = 1.
b) Se a(x)|c(x), b(x)|c(x) e mdc(a, b) = 1, então a(x)b(x)|c(x).
c) Se d(x) = mdc(a, b), então a(x) = d(x)a′ (x) e b(x) = d(x)b′ (x) com
mdc(a′ , b′ ) = 1.
3.7.6
Calcule o mmc dos pares de polinômios do exercı́cio 3.7.3.
96
CAPÍTULO 3. POLINÔMIOS
3.7.7
Seria capaz de definir o máximo divisor comum e o mı́nimo múltiplo comum
de três ou mais polinômios ? Em caso afirmativo, dê uma definição, pelo
menos no caso de três polinômios; construa exemplos.
3.7.8
Obtenha a decomposição em fatores mônicos irredutı́veis em R[x] para os
seguintes polinômios:
a) x4 − 1, b) x4 + x2 + 1, c) x5 − 1, d) f (x) = x4 − 2x3 + 2x2 − 2x + 1;
observe que f (ı) = 0.
3.7.9
Considere o polinômio f (x) = x3 + αx + 1 com α ∈ R
a) Encontre α sabendo que 1/2 é raiz de f (x).
b) Encontre a decomposição de f (x) em fatores mônicos irredutı́veis em
R[x].
3.7.10
Indique quais dos seguintes polinômios são redutı́veis em R[x] e/ou em Q[x]
(justifique).√
a) x3 + 2x2 − x + 1, b) x2 + x − 2, c) x4 + 3x2 + 2.
3.7.11
Considere o polinômio f (x) = x6 − 1 (lembre a representação geométrica das
raı́zes de um número complexo).
a) Mostre que f (x) possui unicamente duas raı́zes reais; quais são estas
raı́zes ?
b) Deduza que f (x) é o produto de quatro fatores irredutı́veis em R[x]:
dois de grau um e dois de grau 2.
3.7.12
Encontre as raı́zes múltiplas, com as suas respectivas ordens, dos seguintes
polinômios:
97
3.7. EXERCÍCIOS
a) 31 x3 − x2 + x, b) x5 − 4x4 + 4x2 , c) f (x) = x4 − 2x3 + 2x2 − 2x + 1.
3.7.13
Considere o polinômio f (x) = x3 + αx2 + 3x + 1 com α ∈ C. Encontre α
para que f (x) possua uma raiz múltipla de ordem três; qual é a raiz ?
3.7.14
Faça o exercı́cio 3.7.12 utilizando o mdc.
3.7.15
Considere o polinômio f (x) = x4 + ax3 + (b + 1)x2 + ax + b, com a, b ∈ R.
a) Mostre que f (x) = (x2 + ax + b)(x2 + 1).
b) Encontre a e b para que x − 1 e x − 2 dividam f (x).
c) Idem que na parte b) mas para que x2 + 2 divida f (x).
3.7.16
Encontre o polinômio mônico de grau três que possui as raı́zes
4, 1 + 3ı, 1 − 3ı.
3.7.17
Construa polinômios mônicos com coeficientes reais, e de grau o menor
possı́vel, de forma que:
a) Contenha a raiz −3 dupla e 2 simples.
b) Idem que na parte a) mas com (2 + ı) dupla e 1 simples.
3.7.18
Achar o polinômio mônico cujas raı́zes tenham ordem 1 de forma que estas
também sejam raı́zes de
f (x) := x5 − 13x4 + 68x3 − 176x2 + 220x − 100.
Deduza a decomposição em fatores mônicos irredutı́veis de f (x).
98
CAPÍTULO 3. POLINÔMIOS
3.7.19
Considere um polinômio da forma
f (x) = x4 + ax2 + bx + 25, a, b ∈ R.
Sabendo que f (x) possui raı́zes da forma α, −α, β, −β, encontre a, b, α e β.
3.7.20
Encontre o menor inteiro positivo m tal que mf (x) ∈ Z[x], e logo calcule
c(mf ), para os seguintes polinômios f (x):
9
27
1
34
6 3 30
4
f (x) = x3 − x2 + x − ; f (x) = x4 +
x − x− .
8
4
30
45
110
49
13
3.7.21
Estude a irredutibilidade em Q[x] dos seguintes polinômios:
a) x4 + 2x3 + 2x2 + 2x + 2, b) 8x7 − 31, c) x6 + 15, d) x3 + 30x2 + 5x + 25,
e) 7x4 + 10x3 + 20x2 + 30x + 22, f) 2/3x6 − 1/2x + 1, g) x4 + x − 1, h)
6x10 − 9x + 18.
3.7.22
Sabendo que m é uma raiz inteira da equação x2 − 289 = 0, mostre que o
polinômio f (x) = x2n + mxn + 102 é irredutı́vel sobre Q para todo n ∈ N.
3.7.23
(a) Se f (x), g(x) ∈ Z[x], demonstre que o mdc dos conteúdos de f (x) e de
g(x) divide o conteúdo de f (x) + g(x), que denotamos c(f + g), ou seja:
mdc(c(f ), c(g))|c(f + g); com um exemplo mostre c(f + g) pode não dividir
mdc(c(f ), c(g)).
(b) Se m(x) ∈ Z[x] é um monômio, isto é, um polinômio com um único
termo, demonstre diretamente (sem utilizar o lema de Gauss) que c(mf ) =
c(m)c(f ), onde f (x) é como na parte (a).
99
3.7. EXERCÍCIOS
3.7.24
Seja g(x) = x4 + b onde b ∈ Z é um inteiro que possui pelo menos um divisor
primo p tal que p2 6 |b. Mostre que g(x) é irredutı́vel. É o polinômio xn + b
irredutı́vel para todo n ∈ N ?
3.7.25
Demonstre que o polinômio ciclotômico φ7 (x) é irredutı́vel sobre Q (fazendo
a mudança de variáveis x = y + 1) e que o polinômio ciclotômico φ6 (x) é
redutı́vel sobre Q.
3.7.26
Considere o polinômio
f (x) = 2x3 + 5x + 5p,
onde p é um número primo arbitrário. Analise a irredutibilidade de f (x) em
Q[x].
3.7.27
Idem que no exercı́cio precedente para os polinômios
(a) f (x) = x4 + 7x2 + 7p, onde p é um primo.
(b) g(x) = x3 + 3px2 + 5qx + pq, onde p, q são primos.
100
CAPÍTULO 3. POLINÔMIOS
Bibliografia
[1] G. Ávila, Variáveis Complexas e Aplicações, Livros Técnicos e Cientı́ficos Editoda, 1996.
[2] A. E. S. Berra, G. Fernández, Álgebra y Cálculo Nunmérico, Editorial
Capeluz, Buenos Aires, 1960.
[3] A. Garcia, Y. Lequain, Elementos de Álgebra, Projeto Euclides, Impa,
2001.
[4] A. Gonçalves, Introdução à Álgebra, Impa, quarta edição, 1999.
[5] M. Lemle, Conhecimento e biologia, Ciência Hoje, vol. 31, 132, 2002,
pags. 34-41.
[6] E. L. Lima, Curso de Análise, vol 1, Projeto Euclides, Impa, sexta
edição, 1989.
[7] E. L. Lima, Curso de Álgebra Linear, Matemática Universitária, Impa,
[8] E. Wagner, Construções Geométricas, SBM......
101
Download

Notas de Curso