DERIVADAS COMO NO TEMPO DE NEWTON E LEIBNIZ
Luana Lopes dos Santos Alves
Universidade Católica de Brasília
Curso de Matemática
Orientador: Prof. Sinval Braga de Freitas
RESUMO
O presente artigo trata de como se deu o desenvolvimento da história do cálculo diferencial, dando maior ênfase
aos trabalhos de Newton e Leibniz que, como se afirma hoje, são os “inventores” do cálculo. O principal
objetivo do trabalho é demonstrar como eram feitos os cálculos de derivadas de funções sem utilizar a noção de
limites, com exemplos que podem ser comparados com as técnicas modernas empregadas hoje.
Palavras-chave: indivisíveis, máximo, mínimo, tangente, derivada.
1. INTRODUÇÃO
É curioso que o desenvolvimento histórico do cálculo seguiu a ordem contrária à daquela dos
textos e cursos básicos atuais sobre o assunto: primeiro surgiu o cálculo integral e só muito
tempo depois o cálculo diferencial. A idéia de integração teve origem em processos
somatórios ligados ao cálculo de certas áreas, volumes e comprimentos. A diferenciação,
criada bem mais tarde, resultou de problemas sobre tangentes à curvas e de questões sobre
máximos e mínimos. Mais tarde ainda verificou-se que, salvo algumas restrições, a integração
e a diferenciação estão relacionadas entre si, sendo que cada uma delas é uma espécie de
operação “inversa” da outra.
O cálculo da derivada e o cálculo da integral são ambos baseados na noção de limite. A
questão é: “se o limite foi criado por último, como então eram feitos esses cálculos sem essa
noção de limite de funções?”. O interesse maior do trabalho é mostrar como se procedia para
executar o cálculo de derivadas sem a noção de limite, ocupando-se em mais detalhes, com os
trabalhos de Isaac Newton (1642-1727) e Gottfried Wilhelm Leibniz (1646-1716). Newton
estendeu e unificou os vários processos de cálculo e Leibniz ligou-os através de uma notação
eficaz e de um novo cálculo operacional.
2. HISTÓRICO
O século XVII foi extremamente produtivo para o desenvolvimento da matemática, graças,
em grande parte, às novas e vastas áreas de pesquisa que nela se abriram. Sem dúvida, porém
a realização matemática mais notável do período foi a “invenção” do cálculo, perto do final
do século, por Newton e Leibniz. Com essa invenção a matemática criativa passou a um plano
superior e a história da matemática elementar essencialmente terminou. Antes de aprofundar
nos escritos de Newton e Leibniz sobre o cálculo, é necessário fazer um breve relato sobre
suas origens e desenvolvimento. Esses conceitos têm tanto alcance e tantas implicações no
mundo moderno que talvez seja correto dizer que sem algum conhecimento deles dificilmente
hoje uma pessoa poderia considerar-se culta.
Embora a maior parte do trabalho se situe no século XVII é importante retornar à Grécia do
século III a.C..
1
2.1 O CÁLCULO NA GRÉCIA ANTIGA: NO COMEÇO FOI O CÁLCULO
INTEGRAL
2.1.1 Arquimedes de Siracusa (287-212 a.C.)
Os primeiros rascunhos com base sólida para o cálculo iniciaram-se com Arquimedes. Dos
tratados de Arquimedes que se ocupavam principalmente com o método de exaustão de
Eudoxo de Cinido (408-355 a.C.) (isto é, cálculo integral) o mais popular era a Quadratura da
parábola.
Quadrar uma figura, no sentido grego é, medir sua área comparando com figuras cujas áreas
são conhecidas. Por exemplo, podia-se indagar quantos quadrados cabiam dentro de certa área
que se queria conhecer. Mas quadrar também poderia ser comparar determinadas áreas
desconhecidas com áreas de outras figuras como o triângulo, como fez Arquimedes na
quadratura da parábola.
Arquimedes, utilizando o método de exaustão, provou rigorosamente que a área K de um
segmento parabólico APBQC (Figura 1) é quatro terços da área de um triângulo T tendo a
mesma base e mesma altura.
Figura 1
Arquimedes deu uma segunda prova diferente do mesmo teorema. Primeiro demonstrou que a
área do maior triângulo inscrito, ABC , sobre a base AC é quatro vezes a soma dos triângulos
correspondentes inscritos sobre cada um dos lados AB e BC como base. Continuando o
processo sugerido fica claro que a área K do segmento parabólico APBQC é dada pela soma
T T
T
4
da série infinita T + + 2 + ... + n + ... , que vale T (usamos T para representar, claro, a
4 4
3
4
área do triângulo). O valor exato foi calculado por Arquimedes mesmo sem a noção de
infinito que temos hoje. Em sua abordagem de áreas e volumes, Arquimedes chegou a
resultados equivalentes a muitas integrais definidas que hoje figuram nos textos elementares
de cálculo.
Arquimedes tem muitos outros trabalhos em que aplica métodos rudimentares de integração
como, por exemplo, no cálculo do volume da esfera feita no trabalho O Método e no cálculo
da área de um círculo feita no trabalho Sobre as medidas do círculo.
2
2.1.2 Apolônio de Perga (262 a 190 a.C.)
Em As cônicas, livro V, Apolônio trata de assuntos sobre retas máximas e mínimas a uma
cônica. Os matemáticos gregos não tinham uma definição satisfatória de tangente a uma
curva C num ponto P , pensando nela como uma reta L tal que nenhuma outra podia ser
traçada por P entre C e L . Talvez fosse insatisfação com essa definição, que levou
Apolônio a evitar definir uma normal a uma curva C por um ponto Q como uma reta por Q
que corta a curva C num ponto P e é perpendicular à tangente a C por P . Em vez disso,
usou o fato de ser a normal de Q a C uma reta tal que a distância de Q a C é um máximo ou
mínimo relativo.
Os teoremas de Apolônio sobre máximos e mínimos são na verdade teoremas sobre tangentes
e normais a seções cônicas. Para maiores detalhes consultar, por exemplo, (Boyer, 1996).
Claro que Apolônio não lançou bases para o cálculo diferencial, mas se ocupou de problemas
típicos desse assunto: máximos e mínimos, ou na verdade, tangentes e normais.
2.2 O CÁLCULO NA EUROPA MODERNA: AINDA O CÁLCULO INTEGRAL
2.2.1 Johann Kepler (1571-1630)
Kepler, astrônomo alemão, em sua Astronomia nova de 1609 anunciou suas duas primeiras
leis da astronomia (a terceira lei só foi publicada em 1619 em sua Harmonia do mundo):
1) os planetas descrevem órbitas elípticas em torno do Sol, com o Sol ocupando um dos focos;
2) o raio vetor que une um planeta ao Sol varre áreas iguais em tempos iguais.
3) o quadrado do tempo para que um planeta complete sua revolução orbital é diretamente
proporcional ao cubo do semi-eixo maior da órbita.
Ao tratar problemas de áreas como esse da segunda lei, Kepler pensava na área formada por
uma infinidade de pequenos triângulos com vértices no Sol (Figura 2) e os outros dois
vértices em pontos infinitamente próximos um do outro ao longo da órbita. Dessa forma ele
pôde usar uma forma grosseira de calcular integral.
Figura 2
3
A área do círculo, por exemplo, é encontrada desse modo, observando que as alturas dos
triângulos infinitamente finos (Figura 3(a)) são iguais ao raio. Se chamarmos
b1 , b2 , K , bn , K as bases infinitamente pequenas repousando ao longo da circunferência,
então a área A do círculo (a soma das áreas dos triângulos) será
A=
(
)
1
1
1
1
1
b1 r + b2 r + K + bn r + K = r b1 + b2 + K + bn + K = r C ,
2
2
2
2
2
'
onde C é o comprimento da circunferência que nada mais é que a soma dos bi s . Esse bem
conhecido teorema antigo fora provado por Arquimedes mais cuidadosamente.
Por raciocínio semelhante Kepler conhecia a área da elipse (um resultado de Arquimedes não
existente até então). A elipse pode ser obtida de um círculo de raio a por uma transformação
sob a qual a ordenada do círculo em cada ponto é diminuída segundo uma dada razão b : a .
Então, podemos pensar na área da elipse e na área do círculo como formadas de todas as
ordenadas de pontos sobre as curvas (Figura 3(b)); mas como as razões das componentes das
áreas são b : a as áreas elas próprias devem estar na mesma razão. Mas a área do círculo
sabe-se ser π a 2 ; portanto a área da elipse x 2 / a 2 + y 2 / b 2 = 1 deve ser π ab . Esse resultado
está correto; mas para o comprimento da elipse o melhor que Kepler pôde fazer foi dar a
fórmula aproximada π (a + b) . Os comprimentos das curvas em geral e da elipse em particular
estariam fora do alcance dos matemáticos ainda durante meio século.
(a)
(b)
Figura 3
Kepler ainda aplicou métodos grosseiros de integração para encontrar volumes de barris de
vinhos e outros sólidos de revolução.
Embora passíveis de objeções, sob o ponto de vista do rigor matemático, esses métodos
produzem resultados corretos de maneira bem mais simples. Mesmo no século XX e ainda
neste século esses métodos “atômicos” ainda são usados bastante regularmente por físicos e
engenheiros para armar um problema, ficando o tratamento rigoroso “por limites” para os
matemáticos profissionais.
2.2.2 Bonaventura Cavalieri (1598-1647)
Bonaventura Cavalieri, italiano com vasta obra em matemática, óptica e astronomia,
desenvolveu o método dos indivisíveis, presente no tratado Geometria indivisibilibus
4
publicada em sua versão final em 1635. Os indivisíveis de Cavalieri têm raízes em Demócrito
(c. 410 a.C.) e Arquimedes, mas talvez a motivação maior tenha sido encontrada nos métodos
de Kepler de calcular certas áreas (segunda lei) e volumes.
Cavalieri não definia em suas obras o que seriam os indivisíveis. Segundo ele, porém, uma
figura plana seria formada por uma infinidade de cordas paralelas entre si e uma figura sólida
por uma infinidade de secções planas paralelas entre si. A essas cordas e a essas secções ele
chamava de indivisíveis. Num de seus livros “explicava” que um sólido é formado de
indivisíveis, assim como um livro é composto de páginas. Do ponto de vista lógico essas
idéias envolviam uma dificuldade insuperável. Como uma figura de extensão finita poderia
ser formada de uma infinidade de indivisíveis e, ainda que estes não possuem espessura?
O princípio de Cavalieri pode ser assim enunciado (versão em duas e três dimensões):
1. Se duas porções planas são tais que toda reta secante a elas e
paralela a uma reta dada determina nas porções segmento de reta
cuja razão é constante, então a razão entre as áreas dessas porções é
a mesma constante.
2. Se dois sólidos são tais que todo plano secante a eles e paralelo
a um plano dado determina nos sólidos secções cuja razão é
constante, então a razão entre os volumes desses sólidos é a mesma
constante. (Eves, 2004).
Podemos ilustrar o uso do princípio de Cavalieri, no caso plano, determinando a área
compreendida por uma elipse de semi-eixos a e b .
Considere a elipse e a circunferência (Figura 4)
x2 y2
+
= 1,
a 2 b2
a > b e x2 + y2 = a2 ,
posicionadas no mesmo sistema de coordenadas retangulares. Escrevendo y em função de x
em cada uma dessas equações obtém-se, respectivamente, as partes positivas
y=
b 2
( a − x 2 )1 / 2 ,
a
y = (a 2 − x 2 )1 / 2 .
Figura 4
5
Observa-se então que, a razão entre duas ordenadas correspondentes quaisquer da elipse e da
circunferência é b / a . Portanto a razão entre duas cordas verticais correspondentes da elipse e
da circunferência é b / a . Pelo princípio de Cavalieri concluiu-se que
área da elipse =
b
(área do círculo)
a
ou
área da elipse =
b
(π a 2 ) = π ab.
a
O princípio de Cavalieri pode ser aplicado ainda, para determinar o volume de uma esfera de
raio r , cuja demonstração pode ser vista em Eves (2004, p.427).
Os princípios de Cavalieri representam ferramentas poderosas para o cálculo de áreas e
volumes, além disso, sua base intuitiva pode facilmente torna-se rigorosa com o cálculo
integral moderno. Ainda bastante usado no ensino da geometria métrica no espaço, facilita
bastante a aceitação da idéia de indivisível.
2.3 O CÁLCULO DIFERENCIAL
2.3.1 René Descartes (1596-1650)
René Descartes, filósofo e matemático francês, deu uma contribuição muito importante para a
idéia de derivadas com a geometria analítica. Um dos muitos escritos de Descartes que
merece destaque para o que se pretende desenvolver é o La géométrie (A geometria), famoso
apêndice terceiro do Discours de la Méthode pour Bien Conduire sa Raison et Chercher la
Vérité dans les Sciences (Discurso do Método para Bem Conduzir a Razão e Procurar a
Verdade nas Ciências) ou, mais resumidamente, Discurso do Método, publicado em 1637.
A segunda parte desse trabalho traz, entre outras coisas, uma classificação de curvas e um
método interessante de construir tangentes às curvas que em linhas gerais é o seguinte (Figura
5):
Figura 5
6
Seja f ( x, y ) = 0 (essa função pode ser construída a partir de y = f ( x) e daí
f ( x, y ) = f ( x) − y = 0 ) a equação da curva dada e ( x1 , y1 ) as coordenadas do ponto P da
curva pelo qual se deseja traçar a tangente. Seja Q um ponto do eixo x de coordenadas
( x 2 ,0) . Então a equação da circunferência de centro Q pelo ponto P é
( x − x 2 ) 2 + y 2 = ( x1 − x 2 ) 2 + y1 .
2
O método de Descartes consiste em encontrar essa circunferência de modo que ela seja
tangente à curva no ponto P . O raio da circunferência seria normal à reta tangente em P e,
assim, seria possível traçar essa tangente.
Para entender melhor o método de Descartes, é apresentado como exemplo a construção da
tangente à parábola y 2 = 4 x no ponto (1,2) . Aqui, f ( x, y ) = y 2 − 4 x e tem-se
( x − x 2 ) 2 + y 2 = (1 − x 2 ) 2 + 4 .
Substituindo-se y na equação, temos:
( x − x 2 ) 2 + 4 x = (1 − x 2 ) 2 + 4 .
Desenvolvendo os quadrados e escrevendo a equação na forma reduzida, temos:
x 2 + 2 x(2 − x 2 ) + (2 x 2 − 5) = 0 .
O objetivo é que essa circunferência tenha apenas um ponto em comum com a parábola, caso
contrário (dois pontos em comum), não poderá ser construída a circunferência tangente à
curva. Essa condição impõe que essa equação quadrática tenha duas raízes iguais, ou seja, que
seu discriminante seja nulo. Assim, deve-se ter
∆ = 2 2 (2 − x 2 ) 2 − 4.1.(2 x 2 − 5) = 0
Dividindo ambos os membros da igualdade por 4, temos
(2 − x 2 ) 2 − (2 x 2 − 5) = 0
Logo, x 2 = 3 .
Pode-se traçar então a circunferência de centro Q (3,0) passando pelo ponto P (1,2) da curva o
que propicia a construção da tangente desejada.
Obtém-se assim um processo geral que mostra exatamente o que fazer para resolver o
problema, mas nos casos mais complicados a álgebra necessária pode ser assustadora. É só
pensar que a condição de interseção da circunferência com a curva ser um único ponto nem
7
sempre é fácil de ser aplicado para funções y mais complexas. Obviamente há métodos
muito melhores do que o de Descartes para encontrar tangente à curvas.
2.3.2 Gilles Persone de Roberval (1602-1675)
Gilles Persone de Roberval tornou-se bastante conhecido por seu método de traçar tangentes e
por suas descobertas no campo das curvas planas superiores. Ele considerava uma curva como
sendo gerada por um ponto cujo movimento se compõe de dois movimentos conhecidos.
Então a resultante dos vetores velocidade dos dois movimentos conhecidos fornece a reta
tangente à curva.
Por exemplo, no caso de uma parábola, pode-se considerar os dois movimentos em sentido
oposto ao foco e em sentido oposto à diretriz. Como as distâncias do ponto em movimento ao
foco e à diretriz são sempre iguais, os vetores velocidades dos dois movimentos devem
também ter módulos iguais. Segue-se que a tangente a um ponto da parábola bissecciona o
ângulo entre o raio focal, pelo ponto, e a perpendicular por este à diretriz (Figura 6).
Figura 6
2.3.3 Evangelista Torricelli (1608-1647)
Evangelista Torricelli trabalhava com a mesma idéia de Roberval sobre tangente. Publicou a
construção da tangente à ciclóide1 num ponto genérico da curva. Para determinar a tangente,
tanto Roberval quanto Torricelli usavam o método da composição de movimentos, já
descritos, quando do traçado de uma tangente à parábola. No caso da ciclóide, pode-se
imaginar um ponto P da curva como sujeito a dois movimentos iguais, um de translação e
outro de rotação. Conforme o círculo gerador rola ao longo da reta AB numa base horizontal
(Figura 7), o ponto P é conduzido horizontalmente enquanto que, ao mesmo tempo, gira em
torno de O , o centro do círculo. Traça-se, portanto, a partir de P , um vetor horizontal PR
como componentes de translação e um vetor PS , tangente ao círculo gerador, como
componente de rotação. Ademais, como os dois vetores têm módulos iguais, a tangente
pretendida situa-se ao longo da bissetriz PT do ângulo RPS formado pelos dois vetores.
1
Curva descrita por um ponto da circunferência de um círculo, conforme este rola ao longo de uma reta sem
escorregar. (Eves, 2004, p.366).
8
Figura 7
2.3.4 Pierre de Fermat (1601-1665)
É possível que Pierre de Fermat desde 1629 estivesse de posse de sua geometria analítica,
pois por essa época ele fez duas descobertas significativas. A mais importante dessas foi
descrita alguns anos depois em um tratado, também não publicado durante sua vida, chamado
Método para achar máximos e mínimos. Ao descrever o seu método, Fermat associou-o a um
método que ele havia introduzido para determinar valores extremos (máximo ou mínimo) de
quantidades conhecidas.
Ele comparou o valor de y = f (x) num ponto com o valor f ( x + E ) num ponto vizinho. Em
geral esses valores serão bem diferentes, mas num máximo ou mínimo de uma curva suave a
variação será quase imperceptível, como já havia sugerido Kepler. Portanto para achar os
pontos de máximos e mínimos, Fermat igualava f (x) e f ( x + E ) , percebendo que os
valores, embora não exatamente iguais, são quase iguais. Quanto menor o intervalo E entre
os dois pontos mais perto chega a pseudo-equação de ser uma verdadeira equação; por isso
Fermat, depois de dividir tudo por E fazia E = 0 . Os resultados lhe davam as abscissas dos
pontos de máximo e mínimo de f (x) .
Aqui, em essência tem-se o processo hoje chamado de diferenciação, pois o método de
Fermat equivale a achar
f ( x + E ) − f ( x)
lim
E →0
E
e igualar a zero, pois sendo f ( x + E ) = f ( x) temos f ( x + E ) − f ( x) = 0 . Agora dividindo
f ( x + E ) − f ( x)
por E chegamos a
= 0 e, finalmente, fazendo E = 0 “equivale” a tomar o
E
limite com E tendendo a zero. Evidentemente Fermat não tinha o conceito de limite, mas por
outro lado seu método para achar máximos e mínimos se assemelha ao usado hoje no cálculo,
só que em geral usa-se o símbolo h ou ∆x em lugar do E de Fermat, e não se faz E tender a
zero, mas sim igual a zero.
Como exemplo disto, Fermat propõe dividir uma quantidade em duas partes tais que seu
produto seja máximo. Fermat usava consoantes maiúsculas que representavam constantes e as
vogais maiúsculas que representavam variáveis. Seguindo essa notação, seja B a quantidade
dada e denotemos as partes procuradas por A e B − A . Formando:
9
( A − E )[B − ( A − E )]
e igualando esse produto a A( B − A) , obtem-se
A( B − A) = ( A − E )( B − A + E )
ou
2 AE − BE − E 2 = 0.
Dividindo por E chega-se a
2 A − B − E = 0.
Fazendo então, E = 0 , conclui-se que 2 A = B , estabelecendo-se assim a divisão desejada, ou
seja, para resolver o problema a quantidade deve ser dividida ao meio.
Fermat considerou lugares dados (em notação moderna) por equações na forma y = x n . Por
isso elas são hoje freqüentemente chamadas “parábolas de Fermat” se n é positivo ou
“hipérboles de Fermat” se n é negativo. Aqui temos uma geometria analítica de curvas planas
de grau superior; mas Fermat foi além com o seu método acima descrito.
Fermat também descobriu um procedimento geral para determinar a tangente por um ponto de
uma curva cuja equação cartesiana é dada. Sua idéia consistia em achar a subtangente relativa
a esse ponto, isto é, o segmento de reta cujas extremidades são a projeção do ponto de
tangência sobre o eixo x e a intersecção da tangente com esse eixo. A idéia de tangente usada
pelo método é a de posição limite de uma secante quando os dois pontos de intersecção com a
curva tendem a coincidir.
Veja, em notação moderna, em que consiste o método. Seja f ( x, y ) = 0 a equação da curva
(Figura 8), encontre sua subtangente t relativa a ( x, y ) . Por semelhança dos triângulos ABP
e ACR , tem-se
y
Y
=
,
t t+e
resultando Y = y (1 + e / t ) , onde Y é ordenada do ponto R . Agora, supondo e muito pequeno,
teremos R , ponto da reta tangente, tão próximo da curva que podemos supor que ele está na
curva f ( x, y ) = 0 . Assim, facilmente se estabelece que as coordenadas de um ponto da
tangente, próximo do ponto de tangência, são ( x + e, y (1 + e / t ) ) . Tratando esse ponto como se
fosse da curva, obtém-se

f  x + e,

 e 
y 1 +   = 0
 t 
10
Figura 8
E, para que essa igualdade possa ser considerada correta, faz-se com que e assuma o valor
zero. Determina-se, então, a partir da equação resultante, a subtangente t em função das
coordenadas x e y do ponto de tangência. Isso, obviamente, equivale fazer
∂f
∂y
t = −y
,
∂f
∂x
uma fórmula que apareceu posteriormente num trabalho de Sluze.
Para melhor compreensão é apresentado um exemplo bem simples da construção da tangente
a uma curva. Seja a tangente à curva f ( x) = x 2 , ou x 2 − y = 0 , no ponto P(2,4) .

 e 
Fazendo f  x + e, y1 +  = 0 , obtém-se a subtangente t relativa a P(2,4) como segue:
 t 

 e
( x + e) 2 − y 1 +  = 0
 t
ye
x 2 + 2 xe + e 2 − y −
=0
t
Utilizando o fato de x 2 − y = 0 , dividindo toda a equação por e e fazendo e = 0 , chega-se a
2x =
y
y
, ou t =
t
2x
.
Substituindo o ponto P (2,4) , tem-se t = 1 . Assim é possível encontrar o ponto A(1,0) onde a
tangente corta o eixo x , pode-se então construir a tangente à curva que passa pelos pontos
P (2,4) e A(1,0) de equação y = 4 x − 4 (Figura 9).
11
Figura 9
À sua maneira, Fermat determinou tangentes às seguintes curvas: elipse, ciclóide, cissóide,
conchóide, quadratriz e folium de Descartes.
2.3.5 John Wallis (1616-1703)
John Wallis foi um dos primeiros a discutir as cônicas como curvas de segundo grau, em vez
de considerá-las como secções de um cone. Em 1655 apareceu sua Arithmetica infinitorum,
um livro que, apesar de algumas imperfeições lógicas, manteve-se como um tratado modelo
por muitos anos. Nesse livro, são sistematizados e estendidos os métodos de Descartes e
Cavalieri e induzidos muitos resultados notáveis a partir de casos particulares. Assim, há a
afirmação de que a fórmula que hoje escreveríamos como:
1
∫x
0
m
dx =
1
,
m +1
onde m é inteiro, também vale quando m é fracionário ou negativo mas diferente de − 1 , seja
invenção dele. Wallis foi o primeiro a explicar de maneira razoavelmente satisfatória o
significado dos expoentes zero, negativos e fracionários. Deve-se a ele também a introdução
do atual símbolo de infinito ( ∞ ), que é a curva Lemniscata.
Enquanto as principais contribuições de Wallis ao cálculo se situam na teoria da integração, as
mais importantes de Isaac Barrow talvez sejam aquelas ligadas à teoria da diferenciação.
2.3.6 Isaac Barrow (1630-1677)
Isaac Barrow explica um método de tangentes que é virtualmente idêntico ao usado no cálculo
diferencial. É muito semelhante ao de Fermat, mas usa duas quantidades, em vez da letra E
única de Fermat. Essas quantidades equivalem aos modernos ∆x e ∆y .
Barrow explica sua regra para tangentes essencialmente do seguinte modo (Figura 10): se M
é um ponto sobre uma curva dada (notação moderna) por uma polinomial f ( x, y ) = 0 e se T
12
é um ponto de intersecção da tangente desejada MT com eixo x , então Barrow marcava um
“arco infinitamente pequeno MN da curva”. Então traçava as ordenadas por M e N e por
M uma reta MR paralela ao eixo x . Então, designando por m a ordenada conhecida em
M , por t a subtangente desejada PT e por a e e os lados vertical e horizontal do triângulo
MRN (aqui ele supõe que o ponto N e S são tão próximos que se confundem, podendo
assumir a igualdade), o chamado triângulo diferencial, Barrow observava que a razão de a
para e é igual à razão de m para t .
Figura 10
Como poderia ser dito agora, a razão de a para e , para pontos infinitamente vizinhos, é a
inclinação da curva. Para achar essa razão, Barrow procedia de modo muito semelhante ao de
Fermat. Substituía x e y em f ( x, y ) = 0 por x + e e y + a , respectivamente, depois na
equação resultante ele desprezava os termos não contendo a ou e (pois esses juntos dão
zero) e todos os termos de grau maior que um em a e e , e finalmente substituía a por m e
por t . Daí a subtangente é obtida em termos de x e m , e se x e m são conhecidos, a
quantidade t está determinada.
O cálculo pode ser feito também assim:
RS PM
=
.
MR TP
Como OT = OP − TP , segue da relação acima que
OT = x −
e
e
PM = x − y .
a
a
Conhecida a medida OT , marca-se o ponto T e é possível traçar a tangente por T e M , já
que os valores x e y do ponto M são conhecidos. O trabalho então está em calcular o
quociente e / a .
Como ilustração, Barrow utilizou seu método para construir tangente à curva de Lamé
x 3 + y 3 = r 3 . Neste caso
13
( x + e) 3 + ( y + a ) 3 = r 3 ,
ou
x 3 + 3 x 2 e + 3 xe 2 + e 3 + y 3 +3 y 2 a + 3 ya 2 + a 3 = r 3 .
Desprezando os quadrados e as potências superiores de e e a e usando o fato de que
x 3 + y 3 = r 3 , obtém-se
3 x 2 e + 3 y 2 a = 0,
do que resulta
a
x2
=− 2.
e
y
De todos os matemáticos que anteciparam partes do cálculo diferencial e integral, nenhum
chegou mais perto da nova análise que Barrow. Ele parece ter reconhecido claramente a
relação inversa entre os problemas de tangentes e de quadraturas.
3. O CÁLCULO DIFERENCIAL DE NEWTON E LEIBNIZ
3.1 Isaac Newton (1642-1727)
Isaac Newton, sucessor de Barrow, nasceu na aldeia de Woolsthorpe em 1642. Pelo fim de
1664 Newton parece ter atingido as fronteiras do conhecimento matemático e estava pronto
para fazer contribuições próprias. Suas primeiras descobertas, datando dos primeiros meses de
1665, resultaram de saber exprimir funções em termos de séries infinitas. Newton também
começou a pensar, em 1665, na taxa de variação ou fluxo de quantidades variáveis
continuamente ou fluentes, tais como comprimentos, áreas, volumes, distâncias, temperaturas.
Newton ligou esses dois problemas, das séries infinitas e das taxas de variação como “meu
método”.
Newton fez uma descoberta muito importante, o método dos fluxos ou das fluxões, cuja
essência ele comunicou a Barrow em 1669. Seu Method of Fluxions, embora escrito em 1671
só foi publicado em 1736, anos depois de sua morte. Para Newton, nesse trabalho, uma curva
era gerada pelo movimento contínuo de um ponto no tempo. Feita essa suposição, a abscissa e
a ordenada de um ponto gerador passam a ser, em geral quantidades variáveis. A uma
quantidade variável ele dava o nome de fluente (uma quantidade que flui com o passar do
tempo) e à sua taxa de variação dava o nome de fluxo (ou fluxão) do fluente. Se um fluente,
como a ordenada do ponto gerador, era indicada por y , então o fluxo desse fluente era
denotado por y& . Em notação moderna esse fluxo equivale a dy / dt , onde t representa o
tempo.
A despeito dessa intromissão do tempo em geometria analítica, pode-se excluir a idéia de
tempo, admitindo-se que alguma quantidade, digamos, a abscissa do ponto móvel, cresça de
maneira constante. Essa taxa de crescimento constante de algum fluente é o que ele chamava
fluxo principal, podendo o fluxo de qualquer outro fluente ser comparado com esse fluxo
principal. Newton indicava o fluxo de y& por &y& e assim por diante. Por outro lado, denotava o
fluente de y pelo próprio y no interior de um pequeno quadrado. Newton introduziu também
14
um outro conceito, chamado por ele de momento de um fluente: trata-se do incremento
infinitamente pequeno sofrido por um fluente como x , por exemplo, num intervalo de tempo
infinitamente pequeno ο . Assim, o momento de um fluente x é dado por x&ο . Newton
salientou que podemos, em qualquer problema, desprezar os termos que aparecem
multiplicados por potências de ο maiores ou iguais a 2 e obter assim uma equação
envolvendo as coordenadas x e y do ponto gerador da curva e seus fluxos x& e y& .
Como exemplo, considere que dada a relação entre fluentes, encontrar a relação entre os
fluxos dos fluentes (ou seja, em linguagem moderna, achar o declive da reta tangente no ponto
P ). O exemplo ilustrativo é a curva cúbica x 3 − ax 2 + axy − y 3 = 0. Substituindo x por
x + x&ο e y por y + y&ο , obtém-se:
x 3 + 3 x 2 ( x&ο ) + 3 x( x&ο ) 2 + ( x&ο ) 3 − ax 2 − 2ax( x&ο ) − a ( x&ο ) 2
+ axy + ay ( x&ο ) + a ( x&ο )( y&ο ) + ax( y& ο )
− y 3 − 3 y 2 ( y&ο ) − 3 y ( y&ο ) 2 − ( y&ο ) 3 = 0
Usando agora o fato de que x 3 − ax 2 + axy − y 3 = 0 , dividindo por ο e desprezando todos os
ainda contendo ο (isto é o equivalente a desprezar todos os termos em que ο figura com
expoente igual ou superior a dois), chega-se a
3 x 2 x& − 2axx& + ayx& + axy& − 3 y 2 y& = 0 .
A
relação
3 x 2 x& − 2axx& + ayx& + axy& − 3 y 2 y& = 0
pode
ser
escrita
na
forma
3 x 2 − 2ax + ay dy
=
= − f x / f y , onde f x e f y são as derivadas parciais de f ( x, y )
dx
3 y 2 − ax
com respeito a x e y respectivamente. ( f x é a derivada de f ( x, y ) com y constante. Logo
y& / x& =
para
f ( x, y ) = x 3 − ax 2 + axy − y 3 temos
f x = 3 x 2 − 2ax + ay
e
fy =
ax − 3y 2
então
− f x / f y é a expressão dada.). Isto, de fato é fácil ver, pois sendo a diferencial de f ( x, y ) = 0
igual a df = f x dx + f y dy = 0 , segue o desejado.
Newton considerou dois tipos de problemas. No primeiro, dada uma relação ligando alguns
fluentes, pretende-se estabelecer uma relação envolvendo esses fluentes e seus fluxos, como
no exemplo anterior. Isso é equivalente, à diferenciação. No segundo, dada uma relação entre
alguns fluentes e seus fluxos, pretende-se achar uma relação envolvendo apenas os fluentes.
Trata-se do problema inverso, que equivale a resolver uma equação diferencial.
A idéia de desprezar termos em que ο aparece com expoente igual ou superior a dois foi
justificada mais tarde por Newton através de idéias primitivas sobre limites. Newton fez
numerosas e notáveis aplicações de seu método dos fluxos. Determinou máximos e mínimos,
tangentes a curvas, curvaturas de curvas, pontos de inflexão e convexidade e concavidade de
curvas; aplicou-o a muitas quadraturas e retificações de curvas. Também demonstrou
habilidade extraordinária na integração de equações diferenciais. Seu trabalho inclui também
15
um método (do qual uma variação é conhecida agora pelo nome de Newton) para
aproximação dos valores das raízes de uma equação numérica, algébrica ou transcendente2.
Ainda com Newton a idéia de que a diferenciação e a integração eram operações inversas foi
firmemente estabelecida.
3.2 Gottfried Wilhelm Leibniz (1646-1716)
Leibniz, por volta de 1676, tinha chegado à mesma conclusão a que Newton chegara vários
anos antes: que ele possuía um método que era altamente importante por causa da sua
generalidade. Quer uma função fosse racional ou irracional, algébrica ou transcendente
(palavra que Leibniz inventou), suas operações de achar somas e diferenças podiam sempre
ser aplicadas. Cabia, pois a ele desenvolver uma linguagem e notação adequada para o novo
assunto.
Para Leibniz, a diferencial de uma variável y é a diferença infinitamente pequena entre dois
valores consecutivos de y . Para uma curva traçada em relação a um eixo x e eixo y (Figura
11) Leibniz considera a seqüência das ordenadas y e a seqüência correspondente das
abscissas x . As ordenadas estão situadas infinitamente próximas; dy é a diferença
infinitamente pequena entre duas ordenadas y e dx é a diferença infinitamente pequena entre
duas abscissas x ; portanto, dx é a distância entre duas ordenadas y consecutivas.
τ
Figura 11
As diferenciais são “infinitamente pequenas”. Isso significa que podem ser comparadas entre
si (a razão dy : dx é finita). Mas com respeito às quantidades finitas ordinárias as diferenciais
podem ser desprezadas:
x + dx = x.
Produtos de diferenciais podem ser desprezados com respeito às próprias diferenciais:
2
Um número a é algébrico se ele é raiz de um polinômio com coeficientes inteiro. Se isso não ocorre, a é
chamado de transcendente.
16
adx + dydx = adx
Já que a + dy = a .
Para cada ponto ( x, y ) na curva podemos formar o “triângulo característico” dx, dy, ds ( ds é
a diferencial do comprimento do arco s ). Se o segmento de reta ds , infinitamente pequeno,
for prolongado, formará a tangente à curva em ( x, y ) e se obtém
dx : dy : ds = t : y : τ .
Portanto, para determinar as tangentes é suficiente determinar a razão dy : dx. A relação entre
y e x usualmente é dada em forma de uma equação (a equação da curva); a fim de calcular a
razão entre dy e dx é preciso diferenciar essa equação, ou seja, é preciso formar a equação
diferencial da curva. Para fazer isso se devem aplicar as regras de cálculo:
Se, por exemplo, as menores diferenças em x e y são dx e dy respectivamente, então dxy é
a menor diferença em xy e é ( x + dy )( y + dy ) − xy . Como dx e dy são infinitamente
pequenos o termo dxdy é infinitamente pequeno e pode ser desprezado, dando o resultado
dxy = xdy + ydx .
da = 0 , se a é constante ; d (u + v) = du + dv
 u  vdu − udv
d (uv) = udv + vdu ; d   =
v2
v
d (u n ) = nu n −1 du (também se n for uma fração ou negativo, porém não para
n = −1 ).
Essas regras seguem o fato de que as diferenciais podem ser desprezadas.
Assim, as regras acima são obtidas como segue:
1. da = a − a = 0 , se a é constante;
2. d (u + v) = ((u + du ) + (v + dv) ) − (u + v) = du + dv ;
3. d (uv) = (u + du )(v + dv) − uv = udv + vdu + dudv = udv + vdu ,
desprezando-se
o
produto das diferenciais dudv.
 u  u + du u vdu − udv vdu − udv
4. d   =
, já que v 2 é muito maior em relação ao
− = 2
=
2
v + vdv
v
 v  v + dv v
vdv .
n
5. d u n = (u + du ) − u n = u n + n u n −1 du + du 2 (soma de fatores ) − u n = n u n −1du , já que
potências maiores ou iguais a dois de du podem ser desprezadas.
( )
Como exemplo, considere a hipérbole de equação xy − a 2 = 0. Tomando a diferencial,
teremos
d ( xy − a 2 ) = d 0 = 0.
Aplicando
as
regras
descritas
acima,
segue
que
17
0 = d ( xy − a 2 ) = d ( xy ) − d (a 2 ) = xdy + ydx − 0 = xdy + ydx = 0 . Calculando
y
y : t = dy : dx = − . Daí t = − x, o que fornece a construção da tangente.
x
a
razão:
Leibniz sempre teve uma percepção aguda da importância de boas notações como ajuda ao
pensamento, e sua escolha no caso do cálculo foi particularmente feliz. Depois de algumas
tentativas ele se fixou em dx e dy para as diferenças menores possíveis (diferenciais) em x e
y , embora inicialmente usasse x / d e y / d para indicar o abaixamento de grau. A princípio
ele escrevia simplesmente omn. y (ou “todos os y ”) para a soma das ordenadas sob uma
curva, mas mais tarde ele usou o símbolo
∫y
e ainda mais tarde
∫ y dx , o sinal de integral
sendo uma letra s (para soma – summa, em latim) aumentada. Achar tangentes exigia o uso
do calculus differentialis e achar quadraturas o calculus summatorius ou calculus integralis,
frases de onde resultaram as expressões que usamos.
A primeira exposição do cálculo diferencial foi publicada por Leibniz em 1684 sob o longo,
mas significativo título de Nova methodus pro maximis et minimis, itemque tangentibus, qua
nec irrationales quantitates moratur (Um novo método para máximos e mínimos e também
para tangentes, que não é obstruído por quantidades irracionais). Aqui Leibniz deu as
fórmulas dxy = xdy + ydx , d ( x / y ) = ( ydx − xdy ) / y 2 e dx n = nx n −1dx para produtos,
quocientes e potências (ou raízes) juntamente com aplicações geométricas. Essas formas,
como já dissemos, eram obtidas desprezando infinitésimos de ordem superior.
3.3 Algo sobre Newton e Leibniz
Dois anos mais tarde, novamente em Acta Eruditorum, Leibniz publicou uma explicação do
cálculo integral em que mostra que as quadraturas são casos especiais do método inverso do
das tangentes. Aqui Leibniz deu ênfase à relação inversa entre a diferenciação e integração no
teorema fundamental do cálculo; observou que na integração das funções familiares “está
incluída a maior parte de toda a geometria transcendente”. Ao passo que a geometria de
Descartes tinha excluído todas as curvas não-algébricas, o cálculo de Newton e Leibniz
mostrava quanto é essencial o papel delas na nova análise. Se as funções anteriores fossem
excluídas da nova análise não haveria integrais para funções algébricas como 1 / x ou
1 /(1 + x 2 ) . Além disso, Leibniz parece ter visto, como Newton, que as operações da nova
análise podem ser aplicadas tanto a séries infinitas quanto a expressões algébricas finitas.
Nisso Leibniz era menos cauteloso que Newton, pois dizia que a série infinita
1 − 1 + 1 − 1 + 1 − K é igual a 1 2 . À luz do que se faz sobre séries divergentes não se pode
dizer que é necessariamente “errado” atribuir a soma 1 2 a essa série (uma série divergente
pode ter seus termos rearranjados para convergir para qualquer valor dado). Mas é claro que
Leibniz se deixou arrastar demais pelo sucesso de seu algoritmo e não hesitou perante a
incerteza dos conceitos. O raciocínio de Newton estava mais perto dos modernos fundamentos
do cálculo que o de Leibniz, mas a plausibilidade da atividade de Leibniz e a eficácia de sua
notação diferencial produziram uma maior aceitação das diferenciais que dos fluxos.
Newton e Leibniz desenvolveram sua nova análise rapidamente, de modo a incluir
diferenciais e fluxões de ordem superior, como no caso da fórmula para curvatura de uma
18
curva num ponto. Provavelmente foi por não ter idéias claras sobre ordens superiores de
infinitésimos que Leibniz foi levado à conclusão errônea de que um círculo osculador tem
quatro pontos “consecutivos” ou coincidentes de contato com uma curva, em vez dos três que
determinam o círculo de curvatura.
A fórmula para derivada n -ésima (para a linguagem moderna) de um produto,
(uv) ( n ) = u ( n ) v ( 0 ) + mu ( n −1) v (1) + K + nu (1) v ( n −1) + u ( 0) v ( n ) , semelhantes à expansão binomial de
(u + v) n tem o nome de Leibniz (no teorema de Leibniz os expoentes entre parênteses
indicam ordens de diferenciação em vez de potências). Também tem o nome de Leibniz a
regra, dada num artigo de 1692, para achar a envoltória de uma família a um parâmetro de
curvas planas f ( x, y, c) = 0 pela eliminação de c entre as equações simultâneas f = 0 e
f c = 0 onde f c é o resultado da diferenciação parcial de f com relação a c .
Newton conservou sua extraordinária capacidade matemática até o fim. Quando Leibniz em
1716 (o último ano de vida) desafiou Newton a encontrar as trajetórias ortogonais de uma
família a um parâmetro de curvas planas, Newton em poucas horas resolveu o problema e deu
o método para achar trajetórias em geral (antes, em 1696, Newton fora desafiado a encontrar a
braquistócrona3, e um dia depois de receber o problema deu a solução, mostrando que a curva
é uma ciclóide). O nome de Leibniz também é usualmente associado à série infinita
π / 4 = 1 / 1 − 1 / 3 + 1 / 5 − 1 / 7 + K uma de suas primeiras descobertas matemáticas. Essa série
surge de sua quadratura do círculo é um caso especial da expansão do arco tangente ( arctg ).
O fato de Leibniz ser virtualmente um autodidata em matemática explica em parte os casos
freqüentes de redescoberta que aparecem em sua obra.
Para a finalização do trabalho, é proposto um exemplo bem trivial do cálculo da derivada de
uma função, para se comparar com os métodos de Newton, de Leibniz e o método moderno:
calcular a derivada de f se f ( x) = 2 x 3 + 3 x − 1 .
Método de Newton: faça f ( x, y ) = f ( x) − y = 2 x 3 + 3 x − 1 − y = 0 . Trocando x por x + x&ο e
y por y + y&ο , teremos então 2( x + x&ο ) 3 + 3( x + x&ο ) − 1 − ( y + y&ο ) = 0 . Consequentemente,
2 x 3 + 6 x 2 x&ο + 6 x( x&ο ) 2 + 2( x&ο ) 3 + 3 x + 3 x&ο − 1 − y − y& ο = 0 .
De 2 x 3 + 3 x − 1 − y = 0 , desprezando os termos em que ο figura com expoente igual ou
superior a dois (ou então dividindo por ο e desprezando os termos que ainda têm ο ), chegase a
6 x 2 x& + 3 x& − y& = 0 .
Daí,
y&
= 6x2 + 3 .
x&
3
Curva de mais rápida descida.
19
Método de Leibniz: desenvolvendo sem utilizar as regras (que é o método de hoje, embora
seja de Leibniz). Assim,
(
)
d (2 x 3 + 3 x − 1) = 2( x + dx ) + 3( x + dx ) − 1 − 2 x 3 + 3 x − 1
3
(
)
= 2 x + 3 x dx + 3 x(dx ) + (dx ) + 3 x + 3dx − 1 − 2 x 3 − 3 x + 1
3
2
2
3
= 6 x 2 dx + 3 x(dx ) + (dx ) + 3dx
2
3
(
)
= 6 x 2 dx + 3dx = 6 x 2 + 3 dx ,
ou,
df
= 6x 2 + 3 .
dx
Método moderno: Pelo método moderno é possível calcular a derivada dessa função em
apenas uma linha utilizando os teoremas sobre derivação, e obtemos:
f ′( x) = 6 x 2 + 3 .
Claro que neste caso o método dito moderno é o de Leibniz quando se usa as regras de
derivação apontadas por ele.
4. O SÉCULO XVIII E A EXPLORAÇÃO DO CÁLCULO
A ampla e admirável aplicabilidade do cálculo, apoiado da geometria analítica foi o que atraiu
o gosto dos pesquisadores do século XVII, fazendo com que resultasse numa grande
quantidade de artigos pouco preocupados com os fundamentos do assunto. Os métodos
utilizados eram simplesmente justificados com o argumento de que eles funcionavam.
Perto do fim do século XVIII, sentiu-se a necessidade de fundamentar as bases do cálculo,
dando-lhe mais lógica e rigor, o que causou o uso descontrolado da intuição e do formalismo.
Assim, até o conceito de função teve de ser revisto e noções como as de limite, continuidade,
diferenciabilidade, e integrabilidade tiveram de ser cuidadosa e claramente definidas.
“O século XVIII foi gasto em grande parte na exploração dos novos
e poderosos métodos do cálculo, já o século XIX foi dedicado
grandemente à tarefa de construir uma fundamentação lógica sólida
para a enorme, porém débil, superestrutura construída no século
precedente. Uma das maiores ênfases do século XX e, porque não
dizer, do começo do século XXI, tem sido a de generalizar, tanto
quanto possível os progressos já alcançados, e que muitos
matemáticos da atualidade estão envolvidos com problemas de
fundamentos mais profundos ainda. Esse quadro geral complica-se
quando se consideram os vários fatores sociológicos que afetam o
desenvolvimento de qualquer ciência. Questões como a expansão dos
seguros de vida e construção de grandes navios no século XVIII, os
problemas econômicos e tecnológicos ocasionados no século XIX
pela industrialização da Europa Ocidental e dos Estados Unidos, o
clima de guerra mundial do século XX, o desenvolvimento da
20
computação eletrônica e a luta pela conquista do espaço exterior
levaram a muitos progressos no campo da matemática”. (Eves, 2004,
p.462).
5. CONCLUSÃO
O cálculo de Newton e de Leibniz utilizava variáveis, as quantidades variáveis ligadas a
curvas, tais como as ordenadas, as abscissas, subtangentes e áreas. O cálculo moderno utiliza
funções, aplicações de um conjunto (de números reais) em outro. O conceito de função surgiu
somente no século XVIII.
No cálculo moderno a operação de diferenciação associa uma função à sua derivada. Para
Newton, tomar fluxos de fluentes significava associar uma velocidade finita a uma variável.
Para Leibniz, a diferenciação associava uma diferencial (diferença) infinitamente pequena a
uma variável. Portanto, a concepção da operação fundamental nos cálculos de Newton e de
Leibniz era totalmente diferente do conceito da diferenciação que está em uso no cálculo
moderno. A herança das regras de Leibniz talvez seja o que há de comum.
Tanto no cálculo de Newton quanto no cálculo de Leibniz existiam problemas graves sobre a
consistência lógica dos conceitos fundamentais. No cálculo moderno essas dificuldades
quanto aos fundamentos são esclarecidas pelo uso do conceito bem definido de limite. Por
isso não encontramos no cálculo moderno (nas operações práticas) as quantidades
infinitamente pequenas.
Como qualquer progresso matemático de importância, a obra de Newton e Leibniz incentivou
intensos desenvolvimentos posteriores. O cálculo foi amplamente aplicado e depois de longas
discussões os seus fundamentos finalmente concretizados.
É admirável que no século XVII mentes tão visionárias tenham enxergado processos que só se
fundamentaram mais de cem anos depois. Eram processos que funcionavam, mas naquela
época não se sabia bem o porquê.
REFERÊNCIAS BIBLIOGRÁFICAS
BARON, Margaret E.; BOS, H. J. M. (Org.) Curso de história da matemática: origens e desenvolvimento do
cálculo. Tradução de José Raimundo Braga Coelho, Rudolf Maier e Maria José M. M. Mendes. Brasília:
Universidade de Brasília, 1985, c1974. v. 1,2,3.4.
BOYER, C. B. História da matemática. 2. ed. São Paulo: Edgard Blucher, 1996.
DOLCE, Osvaldo. Fundamentos de matemática elementar. 5. ed. São Paulo: Atual, 1993. v. 10.
EVES, Howard. Introdução à história da matemática. Campinas, SP: Unicamp, 2004.
LEITHOLD, L. O Cálculo com geometria analítica. 3. ed. São Paulo: Harba, 1994. v. 1.
Luana Lopes dos Santos Alves ([email protected])
Curso de Matemática, Universidade Católica de Brasília
EPCT – QS 07 – Lote 01 – Águas Claras – Taguatinga – CEP.: 72966-700
21
Download

Derivadas como no tempo de Newton e Leibniz