vers~ ao 28/03/2007 FCM 0101 – Fı́sica I Cálculo para quem quer velocidade Luiz Nunes de Oliveira Instituto de Fı́sica de São Carlos — Universidade de São Paulo O objetivo destas notas de aula é introduzir as ferramentas de Cálculo Diferencial e Integral mais empregadas na disciplina Fı́sica I. Nem tudo é demonstrado, e as demonstrações não têm a análise detalhada que você encontrará nas disciplinas de Cálculo. Mesmo assim, elas a ajudarão a ganhar familiaridade com a notação e as operações que constituirão parte da linguagem empregada em sala de aula ao longo do ano. I. POSIÇÃO Para descrever o movimento de uma partı́cula, precisamos saber onde ela está. Se conhecermos a trajetória da partı́cula, o procedimento simples mostrado na Fig. 1 associará um número x a sua posição: definido um sentido como positivo ao longo da trajetória, x á a distância a que o corpo está de um ponto de referência O, chamado de origem. Figura 1 A posição da partı́cula é a distância x a que ela está da origem. Se ela estivesse à esquerda de O, na contramão do eixo, sua posição seria negativa. O x A história do movimento é então uma relação entre a posição x e o tempo t, que pode ser apresentada de três formas, por meio de (i) uma função; (ii) uma tabela; ou (iii) um gráfico. Seja o movimento de uma pedra que cai a partir do repouso um exemplo. Como veremos mais adiante, escolhido o ponto de partida como origem e definido o sentido descendente como positivo, no sistema CGS, a equação horária para a pedra será x = αt2 , 2 (1) 2 onde α = 4, 90 × 10 cm/s . Se interessados apenas no intervalo de tempo 0 ≤ t ≤ 3 s, poderemos fornecer aproximadamente a mesma informação por meio da tabela ou do gráfico da Fig. 2. Isso entendido, podemos seguir adiante. II. VELOCIDADE Intuitivamente, temos a noção de que velocidade é o espaço percorrido por unidade de tempo. Mais especifi- Figura 2 Pedra que cai. O gráfico à direita representa os pontos da tabela por quadrados e a Eq. (1) por uma linha cheia. t( s) 0, 00 0, 25 0, 50 0, 75 1, 00 1, 25 1, 50 1, 75 2, 00 2, 25 2, 50 2, 75 3, 00 x( cm) 0, 00 30, 6 1, 22 × 102 2, 76 × 102 4, 90 × 102 7, 66 × 102 1, 10 × 103 1, 50 × 103 1, 96 × 103 2, 48 × 103 3, 06 × 103 3, 71 × 103 4, 41 × 103 camente, podemos considerar uma partı́cula que avance da posição x1 , no instante t1 , até a posição x2 , no instante t2 . A distância andada será ∆x = x2 − x1 , e o tempo gasto, ∆t = t2 − t1 . Poderı́amos então definir a velocidade como v= ∆x , ∆t (2) mas essa expressão não é satisfatória. Vejamos como exemplo o que acontece quando a aplicamos aos intervalos de tempo I1 = (0 : 1 s); I2 (1 s : 2 s); e I3 (2 s : 3 s) da tabela na Fig. 2. No primeiro, temos que vI1 = (4, 90 × 102 − 0)/1 = 4, 90 × 102 cm/s; no segundo, de forma análoga, vI2 = 1, 47×103 cm/s; e no terceiro, vI3 = 2, 45×103 cm/s. A velocidade aumenta, como seria de se esperar, mas cresce aos saltos, como mostra a Fig. 3. Com intervalos menores, tais como I1′ = (0 : 0, 5 s), I2′ = (0, 5 : 1 s), . . . , I6′ = (2, 5 : 3 s), no exemplo da Fig. 4, o resultado será diferente. A definição (2) não parece promissora e a alternativa de se tomar ∆t = 0 conduz ao resultado indefinido v = 0/0. Temos a impressão de ter entrado em uma rua sem saı́da. No entanto, com o tempo dividido em intervalos ainda menores, tais como os I1′′ = (0 : 0, 25 s),I2′′ = (0, 25 : ′′ 0, 5 s), . . . , I12 = (2, 75 : 3 s) da Fig. 5, embora o resultado seja novamente diferente, podemos perceber luz no final do 2 Figura 3 Velocidade média para o movimento descrito na Fig. 2, calculada em intervalos de um segundo, isto é, I1 = (0 : 1 s), I2 = (1 s : 2 s) e (2 s : 3 s). túnel: a seqüência de velocidades calculadas em intervalos de tempo progressivamente menores aponta agora para uma curva suave. III. VELOCIDADE INSTANTÂNEA Será que a seqüência de velocidades tende mesmo a uma função suave? Poderı́amos continuar com a sucessão de cálculos e gráficos como os das Figs. 3-5; em algum momento, os intervalos ∆t ficariam tão pequenos que, a olho nu, seria impossı́vel distinguir um gráfico do próximo e poderı́amos parar. Mais prático e mais convincente, porém, é apelar para o procedimento algébrico equivalente. Na prática, isso significa escolher dois instantes quaisquer, o instante inicial ti e o final tf . Segundo a Eq. (1), as posições nesses momentos são xi = αt2i e xf = αt2f , respectivamente. O deslocamento ∆x = xf − xi é portanto ∆x = α(t2f − t2i ), e a velocidade, v= α(t2f − t2i ) . tf − ti (3) Lembrando do produto notável t2f −t2i = (tf +ti )(tf −ti ), concluı́mos que v(ti : tf ) = α(ti + tf ). (4) É fácil verificar que esse resultado reproduz cada uma das velocidades que encontramos nos 18 intervalos que consideramos na Seç. II. Para o intervalo I1 = (0 : 1 s), por Figura 4 Velocidade média para o movimento descrito na Fig. 2, calculada em intervalos de 0, 5 s. Figura 5 Velocidade média para o movimento descrito na Fig. 2, calculada em intervalos de 0, 25 s. Examinado na seqüência das Figs. 3 e 4, isto é, na seqüência de ∆t’s decrescentes, este gráfico indica que as velocidades médias se aproximam de uma função independente do intervalo de tempo, representada pela reta pontilhada. 3 exemplo, a Eq. (4) dá v = α(0 + 1) = 4, 90 × 102 cm/s. E o que é mais importante, ela permite que tomemos intervalos arbitrariamente pequenos, isto é, que tomemos tf arbitrariamente próximo de ti . Nada impede que façamos tf = ti para obter v(ti ) = 2αti (tf = ti ). (5) O gráfico da Eq. (5) em função do tempo é a linha pontilhada na Fig. 5. Todo o procedimento que acabamos de descrever, que no esquema da Seç. II consiste em calcular a velocidade em intervalos de tempo que vão ficando sucessivamente menores até resultar uma função suave e que, no esquema desta Seção, consiste em (a) considerar o deslocamento ∆x = xf − xi entre dois instantes ti e tf , (b) simplificar algebricamente o cálculo de v = ∆x/∆t e (c) fazer tf = ti , é chamado de limite de ∆x/∆t quando ∆t tende a zero e denotado ∆x . t→0 ∆t v = lim (6) Quando for necessário distinguir esse procedimento da expressão simples para a velocidade definida na Seç. II, chamaremos o lado esquerdo da Eq. (6) de velocidade instantânea e o da Eq. (2) de velocidade média. A Fı́sica de hoje emprega extensivamente a noção de que uma aproximação controlável, isto é, uma aproximação que, dependendo do valor de um parâmetro [∆t, no caso da Eq. (6)], pode tornar-se tão precisa quanto desejável, é tão rigorosa quanto um resultado exato. A Eq. (6) pode ser vista como um procedimento que extrai de uma função x(t) outra função v(t). Por isso, a velocidade poderia ser chamada de função derivada de x(t); é mais fácil dizer que v(t) é a derivada de x em relação ao tempo. Para simplificar a notação, em lugar do elaborado lado direito da Eq. (6), adotamos a notação equivalente v= dx . dt (7) A expressão compacta v = ẋ(t) é também empregada, mas a notação da Eq. (7), introduzida por Leibnitz, é conceitualmente mais valiosa, porque nos faz lembrar que a Eq. (6) é uma versão refinada da Eq. (2). Quando calculamos v(t) a partir de x(t), dizemos que estamos derivando ou diferenciando a função x(t). O conceito de derivada, como veremos mais adiante, tem muitas outras aplicações além do cálculo de velocidades. Dada uma função f (x), onde x é uma variável qualquer, podemos calcular sua derivada df /dx em relação a x: ∆f df = lim . dx ∆t→0 ∆x (8) IV. DERIVADA A Eq. (6) é um caso particular da Eq. (8). Qualquer seja o movimento, o raciocı́nio que conduziu da Eq. (3) à Eq. (5) pode ser repetido. É importante notar que ele exige um cuidado e habilidade matemática. O cuidado necessário é simplificar a expressão ∆x/∆t antes de fazer tf = ti ; se a precipitação nos levar a fazer tf = ti antes da simplificação, iremos inevitavelmente cair em v = 0/0. E precisamos de alguma habilidade para proceder a essa simplificação e eliminar o intervalo ∆t do denominador. Assim, para simplificar a Eq. (3) e obter a Eq. (4), precisamos conhecer o produto notável a2 − b2 = (a + b)(a − b); em outras circunstâncias, outras identidades algébricas são exigidas. Conforme veremos, isso é quase sempre simples, e o limite à direita na Eq. (6) pode sempre ser tomado. É verdade que, se você se puser a imaginar expressões exóticas para x(t), não terá dificuldade em encontrar igualdades que inviabilizem o procedimento descrito acima, mas tais casos são só produto da imaginação humana. Os movimentos naturais são bem comportados. O procedimento resumido pela Eq. (6) apareceu na segunda metade do Século XVII, com Newton e Leibnitz. Antes deles, a noção de que a velocidade v = ∆x/∆t tinha de ser calculada para ∆t = 0 causava perplexidade. Para superar essa barreira, os dois grandes cientistas se apoiaram em uma linha de pensamento desconhecida na época: em lugar de fazer ∆t = 0 para calcular diretamente o quociente ∆x/∆t no instante t, eles propuseram considerar um intervalo de tempo perto de t para calcular uma aproximação para aquele quociente e mostrar que a aproximação se torna arbitrariamente precisa à medida em que ∆t tende a zero. V. REGRAS ELEMENTARES DE DERIVAÇÃO O movimento nem sempre é simples como o descrito por x(t) = t2 . A posição de um oscilador harmônico, por exemplo, pode ser x(t) = e−t ( cos(t)+sen(t)). Para calcular sua velocidade, poderı́amos aplicar a definição de derivada, isto é, computar xi = x(ti ), em seguida xf = x(tf ), efetuar a subtração, manipular o resultado até conseguir fatorar ∆t, dividir por ∆t e finalmente fazer ∆t → 0. Felizmente, existe uma alternativa muito mais prática: combinadas, as regras simples de derivação listadas na Tab. I permitem diferenciar qualquer função de nosso interesse. Para ser completa, a Tabela inclui uma relação (a última nas colunas da esquerda) que só discutiremos na Seç. VII. A relação mais freqüentemente usada, a regra do tombo, na primeira linha à direita, não é difı́cil de ser demonstrada para n inteiro: empregue a expansão de Newton para o binômio na definição de df /dx; a relação vale, no entanto, para qualquer n. A maioria das demais relações é facilmente obtida da definição de derivada, mas algumas merecem atenção especial: (1) a do produto, quarta linha à esquerda, também conhecida como regra de Leibnitz; (2) a função seno; (3) a função exponencial; e (4) a regra da cadeia, penúltima linha nas colunas da esquerda. Via de regra, a obtenção das derivadas exige que escrevamos ∆f como f˜∆x, onde f˜ é uma expressão matemática que assume um valor bem definido quando ∆x → 0. Assim, 4 Tabela I Regras elementares de derivação. Os sı́mbolos c e n denotam constantes que podem ser até números complexos. Nas colunas da esquerda, g e h são duas funções quaisquer de x, e g(h(x)) indica a função g da função h de x. A regra na última linha das colunas à esquerda só será discutida na Seç. VII. f (x) df /dx f (x) df /dx c 0 xn nxn−1 c g(x) c dg/dx sen(x) cos(x) g(x) + h(x) dg/dx + dh/dx cos(x) − sen(x) g(x) h(x) h dg/dx + g dh/dx tg(x) sec2 (x) 2 g(x)/h(x) (h dg/dx − g dh/dx)/h cotg(x) − cossec2 (x) g(h(x)) (dg/dh)(dh/dx) exp(t) exp(t) R g(x) dx g(x) ln(x) 1/x Tabela II Expressões matemáticas úteis para cálculo das derivadas na Tab. I. Em todos os casos, o erro é também indicado [termo O()], para mostrar que as relações se tornam mais precisas à medida em que ǫ → 0. Na última linha, n é um real qualquer. ǫ 2 2 e = 1 + ǫ + O(ǫ ) ln(1 + ǫ) = ǫ + O(ǫ ) sen(ǫ) = ǫ + O(ǫ3 ) cos(ǫ) = 1 − ǫ2 /2 + O(ǫ4 ) n 2 (1 + ǫ) = 1 + nǫ + O(ǫ ) para obter a derivada de x2 , temos de notar que x2f − x2i = (xf + xi )(xf − xi ), ou seja que x2f − x2i = (xf + xi )∆x, de forma que nesse caso f˜ = xf + xi , que tende a 2xi quando ∆x → 0. Em outros casos, o fatoramento necessário está longe de ser evidente e exige dedução. Para ajudar, a Tab. II mostra quatro resultados que se tornam progressivamente mais precisos quando ǫ → 0 e que simplificam a tarefa de se fatorar ∆x em quatro dos casos listados na Tab. II. A demonstração da primeira linha à direita será feita na Seç. XI.C; as das demais você verá na disciplina Cálculo I. Podemos agora fatorar h(xf ) nos dois primeiros termos do numerador e g(xi ) nos dois últimos: df (g(xf ) − g(xi ))h(xf ) + g(xi )(h(xf ) − h(xi )) . = dx xf − xi (11) Como, quando xf → xi , a fração (g(xf )−g(xi ))/(xf −xi ) se aproxima de dg/dx e a fração (h(xf ) − h(xi ))/(xf − xi ) se aproxima de dh/dx, a Eq. (11) é equivalente a dg dh df = h(x) + g(x) , dx dx dx onde, por simplicidade, escrevemos x em lugar de xi e de xf no limite em que xf → xi . Como exemplo de aplicação da regra de Leibnitz, podemos calcular a velocidade v que corresponde a x(t) = et sen(t): segundo a Tab. I, a derivada de et é et , e a derivada de sen(t) é cos(t). Assim, v(t) = et sen(t) + et cos(t), ou seja, v(t) = et ( sen(t) + cos(t)). B. A função seno Partimos da definição de derivada: d sen(x) sen(x + ∆x) − sen(x) ≈ , dx ∆x (13) e expandimos o seno da soma no numerador, à direita: sen(x) cos(∆x) + sen(∆x) cos(x) − sen(x) d sen(x) ≈ . dx ∆x (14) Para ∆x pequeno, a Tab. II nos diz que sen(∆x) ≈ ∆x, enquanto cos(∆x) ≈ 1 − (∆x)2 /2. Assim, a Eq. (14) pode ser escrita sen(x)(1 − (∆x)2 /2) + ∆x cos(x) − sen(x) d sen(x) ≈ , dx ∆x (15) expressão que pode ser simplificada: d sen(x) − sen(x)(∆x)2 /2 + ∆x cos(x) ≈ . dx ∆x (16) Efetuada a divisão por ∆x, teremos que d sen(x) ≈ cos(x) − sen(x)∆x/2. dx A. Regra de Leibnitz (12) (17) Partimos da definição de derivada. Tomamos dois x’s vizinhos, xi e xf , e calculamos Podemos finalmente deixar ∆x → 0, o que elimina o segundo termo à direita e transforma a aproximação na Eq. (17) em uma relação exata: g(xf )h(xf ) − g(xi )h(xi ) df , = dx xf − xi d sen(x) = cos(x). dx (9) com o propósito de fazer xf se aproximar de xi . Para contornar os zeros que aparecerão no numerador e no denominador, somamos e subtraı́mos g(xi )h(xf ) ao numerador: g(xf )h(xf ) − g(xi )h(xf ) + g(xi )h(xf ) − g(xi )h(xi ) df . = dx xf − xi (10) (18) C. A função exponencial Mais uma vez, partimos da definição: exp(x + ∆x) − exp(x) d exp(x) ≈ , dx ∆x (19) 5 e fatoramos o exp(x) que comparece nos dois termos do numerador: d exp(x) exp(x)( exp(∆x) − 1) ≈ . dx ∆x (20) Para pequenos ∆x’s, a Tab. II nos mostra que exp(∆x) − 1 ≈ ∆x. Assim, a Eq. (20) se converte em exp(x)∆x d exp(x) ≈ , dx ∆x Figura 6 Interpretação gráfica do quociente ∆f /∆x. A partir de dois pontos A e B sobre a curva, podemos construir o triângulo retângulo indicado, cuja base é ∆x = xB − xA e cuja altura é ∆f = f (xB ) − f (xA ); a tangente do ângulo α é então a razão entre o cateto oposto e o adjacente, isto é, tg α = ∆f /∆x. (21) e, dividido o numerador por ∆x, vemos que, para ∆x → 0, d exp(x) = exp(x). dx (22) D. A regra da cadeia A regra da cadeia segue imediatamente da identidade ∆f ∆g ∆f = ; ∆x ∆g ∆x (23) basta tomar o limite em que ∆x → 0, o que faz com que ∆g também se aproxime de zero. Na prática, para aplicar a regra, convém pensar na função g como se fosse uma nova variável, X [ou no caso em que da posição x(t) se pretende calcular a velocidade v(t), como se fosse uma nova variável, T ]. Como exemplo, considere a função f (x) = sen(2x). Convém escrever f (x) = sen(X), onde X = 2x. A regra da cadeia nos dá então que df df dX = . dx dX dx (24) Cada uma das duas derivadas à direita aparece na Tab. I: d sen(X)/dX = cos(X) e d(2x)/dx = 2. Assim, df = 2 cos(2x). dx (25) Note que o argumento do cosseno é X = 2x — e não x. Como outra ilustração, vamos obter a derivada da função logaritmo. Seja, pois, f (x) = ln(x). O logaritmo (neperiano) é o inverso da função exponencial. Assim, exp (f (x)) = x. (26) Vamos diferenciar os dois lados em relação a x. À esquerda, aplicamos a regra da cadeia e com isso temos que d exp(f ) df = 1. df dx (27) Assim vemos que df /dx = 1/ exp(f ), um resultado ainda insatisfatório, porque expressa a derivada em função de f ; nós queremos a derivada em função de x. Dada a Eq. (26), porém, podemos imediatamente escever df = 1/x, dx que é o resultado apresentado na Tab. I (28) VI. INTERPRETAÇÃO GRÁFICA DA DERIVADA Dada uma função f (x), podemos sempre mostrá-la em gráfico, como o da Fig. 2. Podemos também acompanhar graficamente os passos que, em um ponto x qualquer, definem a derivada. A Fig. 6 mostra a função f (x), que queremos diferenciar em x = xA . O ponto A, com abscissa xA e ordenada f (xA ), foi nela demarcado. Para obter um valor aproximado ∆f /∆x para a derivada df /dx, escolhemos um segundo ponto B e tomamos ∆x = xB − xA ; assim, ∆f = f (xB ) − f (xA ). A trigonometria do triângulo retângulo indicado mostra então que ∆f /∆x = tg α, onde α é o ângulo entre a reta que passa por A e B e a horizontal. O primeiro ponto mantido fixo, podemos agora aproximar B de A. O valor de ∆f /∆x e o ângulo α poderão mudar, mas a relação tg α = ∆f /∆x será preservada, como mostra a Fig. 7 Podemos portanto aproximar o ponto B de A sem prejudicar o procedimento gráfico. Para ∆x suficientemente pequeno, o triângulo retângulo indicado nas Figs. 6 e 7 se tornará microscópico; ainda assim, como mostra a Fig. 8, não teremos dificuldade em traçar a reta AB, que se aproxima da tangente à curva f (x) no ponto A. No limite em que ∆x → 0, portanto, α é o ângulo entre a reta tangente e a horizontal, e df /dx = tg α. Em particular, se f (x) for uma função linear, f (x) = ax + b, seu gráfico será uma reta. Nesse caso, a geometria analı́tica nos diz que o ângulo α será a inclinação da reta, 6 Figura 7 Repetição do procedimento gráfico da Fig. 6 para um valor menor de ∆x; o ângulo α é alterado, mas tg α ainda é igual a ∆f /∆x isto é, que tg α = a, valor que coincide com a derivada de f (x): se f (x) = ax + b, então df /dx = a. A interpretação geométrica da derivada mostra, assim, que df /dx nada mais é que uma extensão para funções não lineares do conceito de inclinação. Para uma função linear, a derivada é a inclinação da reta que a representa. Para outra função, a derivada em um dado ponto é a inclinação da reta que a tangencia naquele ponto. Se a tangente à curva for horizontal, df /dx será zero. A derivada nula, portanto, indica que a função está passando por um extremo, normalmente um máximo ou um mı́nimo. Assim, por exemplo, podemos facilmente identificar o extremo do trinômio y(x) = ax2 + bx + c: basta calcular dy/dx = 2ax + b e igualar a zero. Encontramos então que x = −b/2a, que como se sabe, é o extremo. Para distinguir um mı́nimo de um máximo, precisaremos analisar a segunda derivada. Veremos isso na Seç. XI.A, mas antes vamos conhecer a operação inversa da diferenciação. VII. INTEGRAÇÃO Figura 8 Repetição do procedimento das Figs. 6 e 7 para ∆x → 0. Com o ponto B muito próximo de A, o triângulo cuja hipotenusa é o segmento AB se torna invisı́vel na escala da figura, e a reta que passa por A e B se aproxima da tangente à curva f (x) no ponto A. A derivada df /dx é portanto a inclinação da reta tangente, isto é, df /dx = tg α, onde α é o ângulo que a tangente forma com a horizontal. Definimos algebricamente a derivada, na Seç. IV, e depois, na Seç. VI, encontramos sua interpretação geométrica. Para definir a integral de uma função, caminharemos no sentido inverso: começaremos pela ilustração na Fig. 9. A integral definida de uma função f (x) entre os pontos x = xA e x = xB é a área sombreada na Figura, expressa na unidade de f (x) multiplicada pela unidade de x. Assim, se f for expressa em kg e x em segundos, a integral será expressa em kg s. Se a função f (x) estiver abaixo do eixo, a área será computada como negativa. A. Cálculo da integral a partir da definição Duas funções particularmente simples permitem que computemos sua integral diretamente a partir da definição. A primeira é a função constante, f (x) = f0 . Nesse caso, como mostra a Fig. 10, a área sob a curva é f0 ∆x, onde ∆x = (xB − xA ). Em particular, convém lembrar o resultado para f0 = 1: Z xB dx = ∆x, (29) xA onde para abreviar a notação, seguimos a prática de não inscrever o valor unitário R xB R xB na integral, isto é, escrevemos dx em lugar de 1 dx. A Eq. (29) expressa a intexA xA gral que aparece com mais freqüência; interrompa a leitura, tome uma folha de papel e escreva-a quantas vezesRprecisar até que você se acostume com a suavidade do “ ” e a expressão lhe pareça familiar. Depois disso, continue com a leitura. A segunda função especial é a linear. A Fig. 11 mostra o gráfico de f (x) = x. Tanto a base do triângulo sombreado como sua altura valem X. A área é portanto Z X X2 x dx = . (30) 2 0 7 Figura 9R Interpretação geométrica da integral definida. A x integral x B f (x) dx é a área delimitada verticalmente pela A curva e pelo eixo x e horizontalmente pelas retas verticais que definem as coordenadas xA e xB . A área é medida em unidades de f × x, isto é, o produto da unidade de f (x) pela unidade de x. No caso, a curva está acima do eixo x; se uma parte dela estivesse abaixo, a contribuição dessa parcela para a integral seria negativa. Figura 11 Integral definida da função f (x) = x. A integral entre 0 e X é a área do triângulo sombreado (base×altura/2). B. Segmentação: aproximação por retângulos. Figura 10 Integral definida de uma constante f0 . A área sob a curva é igual f0 (xB − xA ). Assim, a integral definida vale f0 ∆x. Infelizmente, os exemplos das Figs. 10 e 11 representam parte substancial do conjunto de polı́gonos cuja área conhecemos. Somente em situações muito especiais conseguiremos efetuar integrações a partir de áreas previamente conhecidas. Precisamos, portanto, de procedimentos alternativos. Embora rudimentares (as disciplinas de Cálculo Numérico ensinam métodos muito mais eficientes), as duas abordagens de segmentação que discutiremos a seguir podem ser facilmente transformadas em códigos computacionais que, em um computador moderno, calcularão a integral de qualquer função de interesse prático. Aqui, porém, elas interessam porque ajudam a entender o que é uma integral. Começamos com a aproximação por retângulos. Dada uma função f (x) cuja integral definida desejamos calcular entre os pontos x0 e x1 , podemos sempre dividir o intervalo ∆x = (x1 − x0 ) em N intervalos menores δx = ∆x/N , onde N > 1 é um inteiro arbitrário. Quando N cresce, δx diminui. Se N for suficientemente grande, cada intervalo δx será tão pequeno que, dentro dele, a função f (x) poderá ser aproximada por uma constante. (Para visualizar, pense por exemplo em uma função do tempo f (t) que descreve o crescimento de seu cabelo. Considerada essa função em um intervalo de tempo de um mês, você percebe que ela não é constante. No intervalo de um dia, porém, é uma boa aproximação considerá-la constante, e no intervalo de uma hora, a aproximação se tornará excelente — salvo se você tiver passado essa hora em uma cadeira de barbeiro ou cabeleireiro.) Dado um N grande, como mostra a Fig. 12, a função 8 Figura 12 Cálculo da integral definida na aproximação por retângulos. O intervalo ∆x é dividido em N partes iguais δx = ∆x/N . Em cada pequeno intervalo δx, a função pode ser aproximada por uma constante, e a integral pode ser aproximada por uma soma de áreas de retângulos. Quando N cresce, a aproximação ganha precisão. pode, portanto, ser aproximada por uma seqüência de traços horizontais, e a área que define a integral é aproximadamente dada por uma soma de áreas de N retângulos: Z xB xA f (x) dx = N X f (xn )δx (31) n=1 Tipicamente, essa aproximação só se torna razoável para N bem acima 100, de forma que, com giz ou lápis, o procedimento se torna impraticável: ele só pode ser desenvolvido com auxı́lio de uma boa calculadora ou, melhor, de um computador. Apesar disso, duas circunstâncias tornam a Eq. (31) importante. Em primeiro lugar, não podemos deixar de notar a semelhança entre os dois membros. Não se trata de coincidência. A notação à esquerda foi introduzida, por Leibnitz, para fazer lembrar que a integral pode ser entendida como uma soma infinita das áreas de retângulos com bases estreitı́ssimas. A Eq. (31) assim dá uma noção concreta do significado da integral definida. Em segundo lugar, a Eq. (31) é instrutiva porque, em situações especiais, a soma à direita pode ser efetuada algebricamente para qualquer N ; em tais casos, podemos fazer N crescer arbitrariamente e portanto podemos reduzir o erro embutido na aproximação a um valor arbitrariamente pequeno — essencialmente transformar a aproximação em uma igualdade. O exemplo mais interessante é o da função exp(x). FiguraR 13 Integral definida da função exponencial. Para calX cular 0 exp(x) dx, dividimos o intervalo de integração em N pedaços iguais. Em cada um deles, a função pode ser aproximada pelo seu valor no inı́cio do intervalo, o que permite aproximar a área sob a curva pela área de um retângulo. O texto mostra que, ainda que grosseira para pequenos N ’s, essa aproximação se torna exata quando N cresce indefinidamente. C. A integral da função exponencial RX Seja, pois, f (x) = ex , e vamos calcular 0 f (x) dx. Seguindo a receita da Seç. VII.B, como mostra a Fig. 13, segmentamos o intervalo ∆x = X − 0 = X em N pedaços δx = X/N . O primeiro intervalo vai de 0 a δx, o segundo de δx a 2δx e assim por diante até o N -ésimo intervalo, que vai de (N − 1)δx a X. No primeiro intervalo, a função f (x) varia de f (0) = 1 a f (δx) = eδx . Vamos aproximá-la pelo seu valor no ponto inicial, f (x) ≈ 1. A área sob a curva no primeiro intervalo, isto é, a área do primeiro retângulo, será portanto δx (altura × base). No segundo intervalo, a função varia de f (δx) a f (2δx). De novo, vamos aproximá-la pelo seu valor no ponto inicial, f (x) ≈ eδx . A área do segundo retângulo será eδx δx. E assim continuamos até o último intervalo, no qual a função será aproximadamente e(N −1)δx e a área do retângulo, e(N −1)δx δx. Temos agora de somar todas áreas, isto é, trabalhar com a seguinte aproximação para a integral: Z 0 X ex dx ≈ δx + eδx δx + . . . e(N −1)δx δx. (32) O lado direito tem um fator comum: δx aparece em cada 9 termo da soma. Vemos portanto que Z X ex dx ≈ δx(1 + eδx + . . . e(N −1)δx ). (33) 0 À direita, o termo entre colchetes a soma dos N termos de uma progressão geométrica com razão eδx e termo inicial unitário. Segue portanto que N δx Z X e −1 ex dx ≈ δx . (34) eδx − 1 0 Figura 14 Cálculo da integral definida na aproximação por trapézios. Dividido o intervalo ∆X em N segmentos iguais, em cada segmento a função f (x) é aproximada por uma reta que vai do valor dela no começo do segmento até seu valor no final do segmento. A área sob a curva em cada intervalo é portanto representada pela área de um pequeno trapézio. Reencontramos aqui um problema conhecido: tanto o fator δx que multiplica os colchetes à direita como o denominador da fração entre colchetes são muito pequenos e se tornarão ainda menores quando N crescer. É verdade que nossa aproximação se torna progressivamente mais precisa quando N aumenta, mas para mostrar que ela tende a um valor fixo, precisamos eliminar esses dois termos que tendem a zero. Para isso, notamos que, quando N crescer desmedidamente, δx se tornará tão pequeno que eδx poderá ser aproximado por 1 + δx (ver Tab. II). Assim, o denominador da fração dentro dos colchetes à direita é aproximadamente igual a δx e temos que Z X ex dx ≈ eN δx − 1. (35) 0 Tendo eliminado os termos que tendiam a zero, podemos agora fazer δx → 0. Basta lembrar que N δx = X para chegarmos ao resultado exato Z X ex dx = eX − 1. (36) A integral é a soma das áreas, dada aproximadamente por 0 Z D. Segmentação: aproximação por trapézios xA A Fig. 14 mostra um procedimento mais preciso para cálculo de integrais que não podem ser efetuadas algebricamente. De novo, dividimos o intervalo ∆x em N intervalos menores, mas em lugar de aproximar a função f (x) por uma constante, nós a aproximamos por uma reta que acompanha a (pequena) variação de f (x) no intervalo. Quando N → ∞, esse procedimento equivale à aproximação por retângulos da Seç. VII.B; quando se faz um cálculo aproximado, baseado em número não tão grande de intervalos, porém, este procedimento resulta bem mais preciso do que aquele. Mais especificamente, o intervalo ∆x é dividido em N segmentos iguais. Sejam xn e xn+1 o extremo esquerdo e o extremo direito do n-ésimo segmento, respectivamente. Nesse intervalo, a função f (x) é aproximada por uma reta que vai do ponto com abscissa xn e ordenada f (xn ) ao ponto com abscissa xn+1 e ordenada f (xn+1 ). A área abaixo da curva nesse intervalo é assim aproximada pela área de um trapézio com bases f (xn ) e f (xn+1 ) e altura δx = xn+1 − xn . Em outras palavras, a área sob a curva nesse pequeno segmento é aproximada por ∆An = δx [f (xn ) + f (xn+1 )] /2. xB (37) f (x) dx ≈ N X ∆An , (38) n=1 um resultado que aproveitaremos na próxima Seção. VIII. A RELAÇÃO ENTRE A INTEGRAL E A DERIVADA Em Fı́sica, a integral definida tem inúmeras aplicações. Em poucas palavras, isso acontece porque, como sugerem as Eqs. (31) e (37), a integral equivale a uma soma de infinitos termos. Infelizmente, é muito difı́cil efetuar somas infinitas — infelizmente, porque tais somas pipocam em praticamente todos os ramos da Fı́sica. A integral oferece uma saı́da que, em muitos casos, conduz à solução do problema. Para isso, claro, precisamos encontrar um procedimento alternativo para calcular a integral definida, um procedimento independente de áreas e somas infinitas. É esse o objetivo desta Seção. A. A integral indefinida Começamos com uma definição. Chamamos de integral indefinida de f (x) a Rfunção que associa a uma variável x x a integral definida x0 f (X) dX. Aqui, x0 é um valor 10 qualquer de referência fixo em relação a x. Freqüentemente, escolhe-se x0 = 0, mas em muitos casos R a escolha é outra. A integral indefinida é denotada f (x)dx, sem especificação dos limites inferior ou superior. Uma vez que o ponto de referência é arbitrário, somar uma constante à integral indefinida nãoR tem efeito nenhum. Assim, tanto podemos dizer que cos(x) dx = sen(x) como R podemos dizer que cos(x) √ dx = sen(x) + π, ou que R cos(x) dx = sen(x) + 2 etc.. Se a primeira afirmação for correta, as demais também serão. Dos resultados da Seç. VII, podemos extrair três integrais indefinidas. A primeira provém da integral definida da função unitária, Eq. (29). Tomando o ponto de referência em x = 0, aquela igualdade se converte em Z dx = x. (39) Figura 15 Demonstração de que a derivada da integral indefinida de f (x) é a própria função f (x). Se, como na Eq. (42), denotarmos a integral indefinida por F (x), então F (x) será a área riscada sob a curva f (x), enquanto F (x + ∆x) é a soma daquela área com a treliçada. A diferença ∆F entre F (x+∆x) e F (x) é portanto a área treliçada, aproximadamente igual à do trapézio. No limite em que ∆x → 0, como o texto mostra, ∆F tende a f (x)∆x. Segue que dF (x)/dx = f (x). Da mesma forma, a integral definida da função linear, Eq. (30), nos dá Z x dx = x2 /2. (40) E finalmente, da integral R definida da exponencial, Eq. (36), podemos concluir que ex dx = ex −1. Como a constante à direita é irrelevante, preferimos a expressão mais compacta Z ex dx = ex . (41) B. A derivada da integral indefinida As Eqs. (39-41) trazem a Tab. I à lembrança. A derivada em relação a x da função f (x) = x é a unidade, a qual está implı́cita no integrando, isto é, na função a ser integrada, da Eq. (39). Da mesma forma, a derivada da função x2 /2, que aparece à direita na Eq. (40), é o integrando à esquerda. E na Eq. (41), a derivada da função exponencial à direita é também o integrando à esquerda. Cabe perguntar, portanto, se, a relação Z f (x) dx = F (x) (42) ser aproximada pela área do trapézio indicado na Figura, que é Atrapézio = Altura(Base menor + Base maior)/2, ou seja, Atrapézio = ∆x [f (x) + f (x + ∆x)] /2. dF (x) = f (x). dx (43) A resposta, veremos a seguir, é afirmativa. A Fig. 15 conduz a demonstração. Ela mostra uma função f (x), sua integral indefinida no ponto x, isto é, R F (x) = f (x) dx (a área sombreada com riscos ascendentes), e a integral indefinida no ponto x + ∆x, isto é, F (x + ∆x) (a área riscada mais a sombreada com uma treliça). A variação da integral indefinida, ∆F (x) = F (x + ∆x) − F (x), é portanto a área da treliça. Esta pode (45) Vemos assim que ∆F ≈ ∆x [f (x) + f (x + ∆x)] /2, (46) e portanto que ∆F ≈ [f (x) + f (x + ∆x)] /2. ∆x equivale a (44) (47) Essa aproximação se torna mais precisa à medida em que ∆x diminui, porque o segmento de reta no topo do trapézio descreve melhor a função f (x). Quando ∆ → 0, f (x + ∆x) → f (x), e assim a Eq. (47) se converte na expressão exata que buscávamos demonstrar: ∆F = f (x). ∆x (48) Vemos assim que a derivada da integral indefinida de f (x) é a própria função f (x). Isso é muito atraente. Ficamos 11 tentados a pensar que, para encontrar a integral F (x), basta encontrar, por advinhação, por exemplo, a função cuja derivada é f (x). Há um problema com esse raciocı́nio: pode ser que haja outras funções, G(x), H(x) etc., com derivada também igual a f (x). Nessa hipótese, nossa advinhação poderia conduzir a uma conclusão errônea. Se você receber um e-mail de uma pessoa desconhecida que pede para apanhá-la na rodoviária: “Chego no ônibus das 10:00”, não faria sentido convidar para entrar em seu carro a primeira pessoa que descesse do ônibus: você sabe que dez ou mais pessoas chegarão no ônibus das 10 h e que, portanto, a frase na mensagem eletrônica não especifica a pessoa que você quer encontrar. O mesmo problema pode estar ocorrendo com a Eq. (48). Mas vejamos o que acontece se duas funções, F (x) e G(x), tiverem derivada igual a f (x). Se for assim, teremos que dF dG = dx dx (49) dG dF − = 0, dx dx (50) Tabela III Regras práticas de integração. As integrais fornecidas são indefinidas — uma constante pode ser adicionada ao lado direito de cada igualdade. Como na Tab. I, c e n são constantes. Nas colunas da esquerda, u(x), g(x) e h(x) são funções quaisquer; G e H [abreviações de G(x) e H(x)] são as primitivas das duas últimas, respectivamente. f (x) cg(x) g(x) + h(x) G(x) h(x) g(x) R f (x) dx cG G+H R GH − g(x)H dx R g(u)(dx/du) du R n x dx = xn+1 /(n + 1) R sen x dx = − cos x R cos x dx = sen x R (cos x)−2 dx = tg x R (sen x)−2 dx = − cotg x R exp(x) dx = exp(x) R (1/x) dx = ln(x) R 1/(1 + x2 ) dx = arctg (x) R √ 1/ 1 − x2 dx = arcsen (x) e seguirá que ou que d(F − G) = 0. (51) dx Resulta, em outras palavras, que F − G independe de x: é igual a uma constante. Assim, se encontrarmos uma função cuja derivada é f (x), teremos encontrado a integral R indefinida a menos de uma constante aditiva. Como a f (x) dx é sempre definida a menos de uma constante, essa incerteza é irrelevante. Para encontrar a integral indefinida de f (x), podemos sempre tentar calcular a área sob a curva f (x), mas graças à Eq. (43), dispomos agora de uma alternativa atraente: encontrar uma função F (x) cuja derivada seja igual a f (x). Dizemos que F (x) é uma primitiva de f (x) [uma primitiva, e não a primitiva porque F (x) não é única]. C. A primitiva e a integral definida Rx Como indicado na Fig. 9, a integral definida xAB f (x) dx é a área R sob a função f (x) entre xA e xB . A integral indefinida f (x) dx, igual à área entre um ponto de referência e o ponto x, é a primitiva F (x). Assim como a distância de São Carlos a Limeira (88 km) é a diferença entre a distância de São Carlos a São Paulo (235 km) e a distância de Limeira a São Paulo (147 km), a integral definida é igual à diferença entre duas áreas sob a função, ambas medidas do ponto de referência: Z xB f (x) dx = F (xB ) − F (xA ). (52) xA A subtração à direita eliminará qualquer constante adicioR nada à primitiva. Por essa razão, f (x) dx pode ser definida a menos de uma constante. A Eq. (52) é tão importante que uma notação especial foi introduzida para representar o lado direito: Z xB f (x) dx = F |xxB . (53) A xA IX. REGRAS PRÁTICAS DE INTEGRAÇÃO A Eq. (52) reduz o problema de calcular uma integral definida ao de obter uma função primitiva do integrando f (x). Encontrar a primitiva — encontrar a função F (x) cuja derivada é f (x) — nem sempre é fácil, mas lida da direita para a esquerda, Tab. I atende à maioria de nossas necessidades. Para facilitar, copiamos na Tab. III os resultados que ajudam a encontrar primitivas. As duas últimas linhas à esquerda são conhecidas por designações especiais: a penúltima é chamada de integração por partes e a última mudança na variável de integração. O exercı́cio pleno dessas duas regras requer prática que só a disciplina Cálculo I poderá oferecer. Em um caso muito comum, porém, a mudança de variáveis é simples e conveniente. O seguinte exemplo serve como ilustração. RSuponhamos que precisemos calcular a integral indefinida e−x/L dx, onde L é uma constante (que tem a dimensão de x). Na Tabela, encontramos a integral da exponencial simples, mas não a exponencial de −x/L. Podemos, no entanto, transformar a integral que desejamos na que aparece à direita na sexta linha da Tabela por meio de uma mudança de variáveis: definimos a variável adimensional u = −x/L. Segue que x = −Lu e, portanto, dx/du = −L. De acordo com a última linha à esquerda na Tabela, Z Z −x/L e dx = eu (dx/du) du, (54) 12 o que, no caso, dá Z Z e−x/L dx = −L eu du, (55) Figura 16 Integral definida da função cosseno. No intervalo de x = 0 a x = π, metade da área entre a curva e o eixo está acima de x, enquanto a outra metade está abaixo. A integral nesse intervalo é, portanto, nula. pois a derivada dx/du é constante e pode sair da integral. A sexta linha à direita na Tab. III dá a integral indefinida à direita, e encontramos que Z e−x/L dx = −Le−x/L. (56) Note que tanto o lado esquerdo como o direito têm a dimensão de x, o da esquerda porque a integral é sobre x e o da direita porque L tem a dimensão de x. Como esse exemplo mostra, sempre que o argumento do integrando for uma constante multiplicada pela variável de integração [−(1/L)x, no caso], uma simples mudança na variável de integração eliminará a constante. Em alguns casos aparentemente complexos, a mudança de variáveis é√ainda peficaz. Como exemplo, considere a inR tegral [sen( x)/ (x)] dx, quepparece difı́cil tanto porque o argumento da função seno é (x) — e não x como na Tab. III — como porque o integrando é o quociente de duas funções. Acontece que, nesse caso, a mudança da variável √ x para u = √x resolve os dois problemas. Vejamos como. Com u = x, temos que x = u2 , e a regra do tombo nos diz que dx/du = 2u. Assim a mudança de variáveis tem a seguinte conseqüência: √ Z Z sen u sen( x) p dx = (2u) dx. (57) u (x) O fator (2u) no integrando à direita é o fator du/dx, o pedágio que temos de pagar para fazer uma mudança de variáveis. No caso, porém, temos um bônus disfarçado de pedágio, porque du/dx cancela a função u no denominador do integrando. Ficamos assim com √ Z Z sen( x) p dx = 2 sen u dx, (58) (x) e a segunda linha à direita na Tab. III nos conduz imediatamente a √ Z √ sen( x) p (59) dx = −2 cos( x). (x) Essa simplificação, porém, é fortuita, como você verificará ao tentar aplicar o mesmo procedimento à integral seR √ melhante sen( x)/x dx: aR mesma mudança de variáveis agora conduzirá à integral 2 sen u/u du, que não saberemos calcular. Em muitos casos, uma mudança de variáveis simplifica a integração; em outros ela conduz a integrais igualmente difı́ceis ou até mais difı́ceis de efetuar. A experiência que você adquirirá nas disciplinas de Cálculo desenvolverá uma intuição que permitirá distinguir os casos favoráveis dos desfavoráveis. Aqui, estamos interessados nas integrais relativamente simples que aparecem com freqüência em Fı́sica. Uma classe delas é a das funções trigonométricas elementares. Rπ Como exemplo, calculemos a integral definida 0 cos xdx, representada graficamente na Fig. 16. De acordo com a Tab. III, a primitiva daRfunção cosseno é o seno. A Eq. (52), π nesse caso, se escreve 0 cos xdx = sen(π) − sen(0), ou na notação padrão da Eq. (53), Z π π cos x dx = sen x|0 . (60) 0 Rπ De qualquer forma, 0 cos xdx = 0, já que tanto em x = 0 como em x = π, a primitiva se anula. Esse resultado é consistente com o gráfico da Fig. 16, o qual mostra que a integral envolve uma área que conta positivamente (a integral de 0 a π/2) e outra, igual, que conta negativamente (a integral de π/2 a π). Já se os limites de integração se estendessem de 0 a 3π/2, a integral seria Z 0 3π/2 3π/2 cos x dx = sen x|0 , (61) e o resultado seria sen(3π/2) = −1. Você deve certificar-se de que também esse número negativo é compatı́vel com a Fig. 16. Como segundo exemplo de integração, vamos considerar uma função que reencontraremos em nossa análise do oscilador harmônico, a função cos2 x, que não R 2πaparece na Tab. III. Mesmo assim, queremos calcular 0 cos2 x dx. Para isso, vamos empregar a identidade trigonométrica cos2 x = [1+cos(2x)]/2. Até quem desconhece essa relação 13 Figura 17 Integral de cos2 x. Essa função, igual a [1 + cos(2x)]/2, oscila entre zero e a unidade com perı́odo π e é simétrica em relação à linha pontilhada, cuja ordenada é 1/2. Assim, o valor médio da função é 1/2, e a integral ao longo de um número inteiro de perı́odos é igual a 1/2 vezes o intervalo de integração. Em particular, se o intervalo for de zero a 2π, a integral será igual a π. Tabela IV Integrais definidas que aparecem com freqüência. Na última linha, n é um inteiro não negativo 1/(1 + x2 ) dx=π R 2π sen2 x dx=π R02π cos2 x dx=π R0 ∞ sen x dx=1 R0∞ cos x dx=0 0 R∞ √ 2 exp(−x ) dx= π −∞ R∞ n x exp(−x) dx=n! 0 R∞ −∞ cálculo concorda com aquilo que a Fig. 17 sugere: Z 2π cos2 x dx = π, (65) 0 é capaz de reconhecê-la no gráfico da Fig. 17: uma função com perı́odo π, que oscila em torno de 1/2 com amplitude também igual a 1/2. Temos então que Z 2π 2 cos x dx = Z 2π 0 0 1 + cos(2x) dx, 2 X. VELOCIDADE E POSIÇÃO (62) ou seja, Z 2π 2 cos x dx = 0 Z 0 2π 1 dx + 2 Z 2π 0 cos(2x) dx. 2 (63) A primeira integral à direita, de uma constante, é simplesmente essa constante vezes o tamanho do intervalo, isto é, a primeira integral dá π. Na segunda, fazemos a mudança de variável u = 2x, do que resulta que x = u/2 e dx/du = 1/2. Assim, Z 0 2π 1 cos x dx = π + 2 2 Z 0 π cos u dx du. du uma expressão que vale a pena lembrar. Se a integral fosse, digamos, de 0 a 5π/3, seria mais difı́cil estimar seu valor, mas como 2π é múltiplo do perı́odo (π) da função cos2 x, a integral é simplesmente 2π vezes o seu valor médio, 1/2. A mesma conclusão se aplica à função sen2 x, cujo perı́odo também é π e cujo valor médio também tem de ser 1/2, já que cos2 x + sen2 x = 1. Temos aı́ duas funções cujas integrais definidas, em certos intervalos de integração, tomam valores particularmente fáceis de lembrar. Há outras funções que aparecem freqüentemente em problemas fı́sicos com integrais definidas que merecem ser recordadas. A Tab. IV coleciona exemplos importantes. (64) Para acompanhar a mudança na variável de integração, o limite superior da integral à direita mudou, de x = 2π para u = π. O inferior, por ser nulo, não se alterou. Na integral remanescente à direita, dx/du = 1/2 é uma constante que pode sair. O integrando e os limites são então idênticos aos da Eq. (60), e a integral é portanto nula. Assim, nosso Estabelecida a base matemática, voltaremos agora à cinemática. Aprendemos com a Eq. (7), v = dx/dt, que a velocidade é a derivada da posição. Isso equivale a dizer que a posição é uma primitiva da velocidade. A integral definida da velocidade, em outras palavras, é dada pela correspondente diferença entre as posições: Z tB x v(t) dt = x|xB = ∆x. (66) A tA Em particular, se o instante inicial for zero e o instante final for t, teremos que Z t v(t′ ) dt′ , (67) x(t) = x(0) + 0 onde, para evitar confusão com o instante t em que queremos achar a posição, chamamos a variável de integração de t′ . Dada a velocidade em função do tempo, e conhecida a posição inicial, a Eq. (67) reduz a uma integral o problema de se encontrar a posição em função do tempo. Um exemplo 14 particularmente simples é provém do movimento uniforme (M. U.), no qual a velocidade é constante, v(t) = v0 . Nesse caso, a Eq. (67) passa a ser Z x(t) − x(0) = isto é, Z v(t) = v(0) + t a(t′ ) dt′ . (73) 0 t v0 dt′ (M. U.) (68) 0 Como v0 é constante, sai da integral à direita. Resulta então a conhecida expressão x(t) = x(0) + v0 t (M. U.). (69) Conhecidas a aceleração e a velocidade inicial, a determinação da velocidade depende apenas do cálculo da integral à direita. A partir daı́, se também conhecermos a posição inicial, poderemos empregar a Eq. (66) para calcular a posição em função do tempo. Em resumo, dadas a aceleração em função do tempo, e a posição e a velocidade iniciais, duas integrações são suficientes para determinar a posição e a velocidade em função do tempo. XI. ACELERAÇÃO Definiremos agora a aceleração a de uma partı́cula. Assim como a velocidade mede a variação da posição com o tempo, a aceleração mede a variação da velocidade em função do tempo. Por analogia com a Eq. (7), escrevemos a= dv , dt (70) Z t dt′ . (74) 0 d2 x , dt2 (71) notação que designa a segunda derivada (derivada da derivada) da posição em relação ao temp. Enquanto a velocidade é medida em m/s (no Sistema MKS) ou em cm/s (CGS), a aceleração é expressa em m/s2 ou cm/s2 . Essas unidades significam que a velocidade está variando x m/s (ou x cm/s) em y s. A aceleração da gravidade, por exemplo, faz a velocidade de uma pedra aumentar de 0 a 10m/s em um segundo —um variação bem elevada, em pouco tempo. Campeões nesse quesito, alguns automóveis comerciais, de preço astronômico, conseguem de ir de 0 a 100 km/h em 2,6 s, o que equivale a uma aceleração (10,7 m/s2 ) ligeiramente superior à da gravidade. No mundo dos mortais, um modelo esportivo desses que se vêem na rua leva 8 s para chegar aos mesmos 100 km/h, aceleração inferior a 3,5 m/s2 . Uma pulga, quando salta, sofre uma aceleração mais de 100 vezes superior à aceleração g da gravidade. Um ser humano, no entanto, não resiste às acelerações substancialmente superiores a 10 g que podem ocorrer, por exemplo, em uma colisão automobilı́stica. Na Lua, a aceleração da gravidade é bem menor do que a nossa, inferior a 2 m/s2 . No maior planeta do Sistema Solar, Júpiter, ela chega a 26 m/s2. Em todos esses casos, a aceleração é dada pela Eq. (70). A velocidade, podemos alternativamente dizer, é uma primitiva da aceleração. Conseqüência imediata da Eq. (52), a integral definida da aceleração é a diferença entre as velocidades no final e no inı́cio do intervalo: Z t a(t′ ) dt′ = v(t) − v(0), (72) 0 Como exemplo, vejamos o movimento uniformemente variado (M. U. V.). Como a aceleração a é constante, podemos extraı́-la da integral à direita na Eq. (73). Temos então que v(t) = v(0) + a ou em termos da posição, a= A. Movimento Uniformemente Variado A integral é simples, velocidade: Rt 0 dt′ = t, e a Eq. (74) determina a v(t) = v0 + at (M. U. V.). (75) Na seqüência, conhecida a posição inicial, poderemos calcular a posição. Para isso, basta substituir essa expressão para v(t) no lado direito da Eq. (66). O resultado é x(t) = x(0) + Z t v0 + at′ dt′ , (76) 0 que podemos também escrever x(t) = x(0) + Z t ′ v0 dt + 0 Z t at′ dt′ . (77) 0 Rt Rt Efetuadas as duas integrais ( 0 dt′ = t e 0 t′ dt′ = t2 /2) a Eq. (77) deságua em uma expressão bem conhecida: 1 x(t) = x(0) + v0 t + at2 2 (M. U. V.). (78) As Eqs. (75) e (78) determinam a velocidade e a posição em função do tempo. Muita vez, no entanto, o tempo não é a variável de interesse. Se alguém quer saber com que velocidade chega ao solo uma pedra derrubada de uma altura de 20 m, por exemplo, precisa relacionar a velocidade com a distância percorrida. Ele pode, evidentemente, recorrer à Eq. (78) para encontrar o tempo de queda e substituir na Eq. (75) para determinar a velocidade, mas provavelmente preferirá empregrar a expressão de Torricelli, que expressa diretamente a velocidade em função de ∆x. 15 A Equação de Torricelli pode ser derivada das Eqs. (75) e (78): basta isolar o tempo na primeira e substituir na segunda. O Cálculo nos oferece, porém, uma alternativa menos trabalhosa e mais instrutiva: aplicamos a regra da cadeia à definição de aceleração, a = dv/dt, para escrever Significa que, como função da posição, a é uma primitiva de v 2 /2. Sua integral em relação a x é portanto igual à variação de v 2 /2: Z x 1 v a dx′ = v 2 v0 . (82) 2 x0 Particularmente importante, nessa expressão, é o sinal do lado direito. Se o eixo das posições apontar para a direita, o sinal indica que, para acelerações positivas, o ponto de retorno estará à esquerda da origem e que, para acelerações negativas, o ponto de retorno estará à direita da origem. Fisicamente, isso é fácil de se entender: como a velocidade é oposta à aceleração, esta ser positiva é sinal de que a partı́cula se deslocava para a esquerda ao passar pela origem no instante zero; assim, quando parar, ela estará forçosamente à esquerda da origem. Se, ao contrário, a aceleração for positiva, é sinal de que a partı́cula corria para direita no instante zero do tempo; freada pela aceleração, ela parará à direita da origem. Matematicamente, a Eq. (84) é muito útil. Vimos na Seç. VI que a derivada de uma função se anula nos pontos extremos, que tanto podem ser máximos como mı́nimos da função. A Eq. (85) permite distinguir um caso do outro. Ela nos diz que, se a derivada segunda de uma função (no caso, a = d2 x/dt2 ) for positiva no ponto onde a derivada primeira é nula (no caso, v = dx/dt = 0), o ponto é um mı́nimo da função. Se, ao contrário, a derivada segunda for negativa no ponto onde a derivada primeira é nula, o ponto é um máximo da função. Na hipótese de a derivada segunda ser também nula, será necessário examinar a derivada terceira, preocupação que deixaremos para as disciplinas de Cálculo. Uma vez que a é constante, R x a integral à esquerda pode ser imediatamente efetuada [ x0 dx′ = (x − x0 )], e chegamos à relação que querı́amos demonstrar: B. Movimento oscilatório a= dv dx . dx dt (79) Como dx/dt = v, isso equivale a dv . dx (80) 1 dv 2 . 2 dx (81) a=v Daı́ vemos que a= v 2 − v02 = 2a(x − x0 ). (83) Com ela, podemos facilmente calcular a velocidade com que chega ao solo a pedra que cai de 20 m: como ela parte do repouso, v0 = 0. Tomando o ponto de partida como origem (x0 = 0) e orientando o eixo x para baixo, de forma que a aceleração seja positiva (a = g = 10 m/ s2 ), temos que v 2 = 400( m/s)2 , ou seja, v = 20 m/s. Quando a velocidade inicial é oposta à aceleração, o movimento reflete uma competição entre a tendência inicial, de se mover em um determinado sentido, e a tendência imposta pela aceleração, que com o correr do tempo acabará subjugando a velocidade. Se a partı́cula cujo movimento é descrito pela Eq. (78) estiver inicialmente avançando, ela acabará recuando; se estiver inicialmente recuando, ela acabará avançando. Em qualquer um desses casos, ela terá de parar antes de inverter o sentido do movimento. O lugar onde ocorre a inversão é chamado de ponto de retorno. Para encontrar o ponto de retorno de um movimento uniformemente variado, empregamos a Equação de Torricelli. Admitindo que a posição inicial seja nula e lembrando que, no ponto de retorno (x = xret ), a partı́cula está parada (v = 0), podemos simplificar a Eq. (83): −v02 = 2axret . (84) Dessa igualdade obtemos a posição do ponto de retorno: xret = − v02 . 2a (85) Outro movimento importante, que desponta em inúmeras situações de interesse prático, é o provocado por uma aceleração oscilatória: a(t) = a0 cos(ωt), (86) onde a0 e ω são constantes, com dimensões de aceleração e de inverso de tempo, respectivamente. Em lugar do cosseno na Eq. (86), não poderı́amos ter um seno? Poderı́amos, mas a fı́sica seria praticamente a mesma: uma mudança na origem dos tempos definida pela variável t′ = t + π/(2ω) (de forma que ωt = ωt′ − π/2), transformaria a Eq. (86) em a(t′ ) = a0 cos(ωt′ − π/2), isto é, em a(t′ ) = a0 sen(ωt′ ). As funções seno e cosseno e qualquer mistura das duas diferem entre si apenas por uma mudança na origem dos tempos. Para prosseguir, além da aceleração, precisamos conhecer dois dados: a velocidade e a posição iniciais. Para simplificar, suporemos que ambas sejam nulas. É fácil ver, porém, que o procedimento a seguir independe de v(0) e x(0). Como a = dv/dt, a velocidade é uma primitiva de a. Logo, a Eq. 86) nos dá v(t) − v(0) = Z t a0 cos(ωt′ ) dt′ . (87) 0 Mais uma vez, para evitar confusão com o instante final t, empregamos t′ como variável de integração. À esquerda, v(0) = 0. À direita, a constante a0 sai da integral. Mudamos então a variável de integração: definimos u = ωt, 16 do que segue que t = u/ω e que dt/du = 1/ω. Temos portanto que Z ωt 1 v(t) = a0 cos(u) du. (88) ω 0 A constante 1/ω Rpode agora ser extraı́da, e a integral à direita, efetuada ( cos u du = sen u). O resultado é v(t) = a0 sen(ωt). ω Figura 18 Aceleração, velocidade e posição em função do tempo no movimento oscilatório. Variáveis adimensionais foram escolhidas para representar as ordenadas e a abscissa. A linha cheia representa a Eq. (86); a tracejada com segmentos curtos, a Eq. (89); e a tracejada com segmentos longos, a Eq. (93). O perı́odo T da oscilação é dado pela relação ωT = 2π. (89) Se desejarmos, é fácil verificar que esse resultado é correto: uma vez que sen 0 = 0, ele satisfaz à condição inicial v(0) = 0; derivados os dois lados em relação a t, recuperamos a Eq. (86). De forma análoga, podemos obter a posição em função do tempo. Como v = dx/dt, a posição é uma primitiva da velocidade. Segue que Z t a0 sen(ωt′ ) dt′ . (90) x(t) − x(0) = 0 ω À esquerda, a condição inicial é x(0) = 0. À direita, a constante a0 /ω sai da integral. Mudamos então a variável de integração de t′ para u = ωt′ . Resulta que Z a0 ωt 1 x(t) = (91) sen(u) du. ω 0 ω Extraı́da aR constante 1/ω, a integral pode ser facilmente efetuada ( sen u du = − cos u), e obtemos a0 cos(u)|ωt 0 , ω2 (92) a0 [1 − cos(ωt)]. ω2 (93) x(t) = − ou x(t) = A Fig. 18 mostra os gráficos das Eqs. (86), (89) e (93). Em cada caso, para não ter de mostrar unidades, o eixo das ordenadas apresenta uma variável adimensional: a/a0 para a Eq. (86), (ω/a0 )v para a (89) e (ω 2 /a0 )x para a Eq. (93). Também escolhemos uma variável adimensional, ωt, para rotular o eixo das abscissas. A linha cheia identifica o perı́odo da aceleração. Ela se repete a partir do momento em que ωt = 2π. Se chamarmos esse instante de T , teremos que T = 2π/ω. A constante ω é conhecida como a freqüência angular da oscilação. Ela (ou se você preferir, o perı́odo) define uma escala caracterı́stica de tempo para a vibração e por isso é a grandeza mais importante na Eq. (86). Se encararmos a oscilação como uma volta completa da aceleração, que vai desde ωt = 0 até ωt = 2π, a freqüência angular medirá o número de radianos avançados por segundo. Esse é um conceito com que estamos familiarizados, porque encontramos diferentes oscilações no dia-a-dia: balanços, redes, cadeiras de balanço, pêndulos, molas, cordas, peles ou palhetas de instrumentos musicais, cordas vocais, ciclos biológicos, o bater de asas de pássarso e insetos, o dia e a noite, as estações do ano etc.. Nessa lista de fenômenos cı́clicos, encontramos desde oscilações preguiçosas (pequeno ω) até frenéticas (grande ω). Como não poderia deixar de ser, a freqüência angular marca também a velocidade. O gráfico desta é semelhante ao da aceleração, mas está defasado da linha cheia. É fácil entender por quê: como a aceleração é a derivada da velocidade, quando a se anula, a velocidade atinge um extremo (máximo ou mı́nimo); assim, as duas funções devem estar deslocadas de π/2. Fisicamente, vemos que no inı́cio, quando a aceleração é máxima (igual a a0 ), a velocidade é nula. Com o correr do tempo, a velocidade cresce, enquanto a aceleração diminui. No instante t = T /4, quando ωt = π/2, a velocidade já alcançou um valor relativamente grande (a0 /ω); nesse momento, porém, a aceleração se anula, e a partir daı́, por um bom tempo, até o instante t = 3T /4 (ou ωt = 3π/2), ela se torna negativa. A velocidade, como conseqüência, diminui e depois se torna negativa, chegando a valer −a0 /ω no instante t = 3T /4. A partir daı́, a aceleração é positiva e a velocidade aumenta até se anular no instante t = T (ou ωt = 2π). Daı́ por diante, tudo se repete. A velocidade aumenta e diminui ao longo do ciclo, mas seu valor médio não se altera, porque a integral da aceleração ao longo do perı́odo é nula. Como o valor inicial era zero, mesmo depois de muitos ciclos, a velocidade estará oscilando em torno de zero, o que significa que a partı́cula 17 não deve sair muito de seu lugar. Se a velocidade inicial fosse, por exemplo 100 m/s, ao final de muitos ciclos a velocidade média seria ainda 100 m/s; nesse caso, ao final de muitos ciclos, a partı́cula estaria muito distante do ponto de partida [nesse caso, como seria o gráfico de (ω 2 /a0 )x em função de ωt?]. O gráfico da posição mostra que a partı́cula oscila em torno da posição x = a0 /ω 2 . Não deveria ela oscilar em torno de x = 0? Não, porque na primeira metade do movimento, de t = 0 a t = T /2 (ou de ωt = 0 a ωt = π), a velocidade é positiva. Como conseqüeência, a partı́cula avança até chegar à posição x = a0 /ω02 no instante t = T /2. Daı́ por diante, a velocidade será negativa; no entanto, como a partı́cula avançou demais na primeira fase, ela não terá tempo para recuar até posições negativas antes de a velocidade voltar a ser positiva. No final do perı́odo, ela voltará apenas à posição inicial e, na repetição dos ciclos, ficará presa entre as posições x = 0 e x = 2a0 /ω 2 , em média na posição x = a0 /ω 2 . Esse deslocamento de x = 0 para x = a0 /ω 2 ajuda a entender o misterioso resultado apresentado na quarta linha da Tab. IV. Pode parecer estranho que a integral do seno, função cujo valor médio é nulo, seja igual à unidade. Para esclarecer a dúvida, vale a pena escrever a Eq. (91) no limite em que t → ∞: Z a0 ∞ x(t → ∞) = 2 sen(u) du. (94) ω 0 De acordo com a Tab. IV, a integral à direita é unitária. Assim, x(t → ∞) = a0 /ω 2 , resultado cuja interpretação agora reconhecemos: não se trata da posição da partı́cula, a qual nunca tende a um valor fixo, mas sim da posição média em torno da qual ela oscila. De forma análoga, é fácil ver que a substituição da quinta linha da Tab. IV na Eq. (88) mostra que, t → ∞, a velocidade oscila em torno do valor médio v = 0. x(t) − x(0) = Z Esta Seção apresenta um último exemplo de movimento freqüentemente encontrado, o que deriva de uma velocidade que decai exponencialmente com o tempo: (95) O pré-fator v0 é a velocidade inicial. A constante τ tem dimensão de tempo. A Eq. (95) decorre, como veremos no mês de maio, da aplicação da Segunda Lei de Newton ao movimento de um barco que desliza na superfı́cie de um lago tranqüilo, sujeito apenas, na horizontal, ao atrito com o ar e com a água. A constante τ depende desse atrito, embora não seja igual ao coeficiente de atrito. Para prosseguir, precisamos da posição inicial, que suporemos ser igual a zero. Queremos, a partir dessas informações, encontrar x(t). Começamos lembrando mais uma vez que, como v = dx/dt, a posição é uma primitiva da velocidade. Aplicado t v0 exp(−t′ /τ ) dt′ . (96) 0 À esquerda, x(0) = 0. À direita, a constante v0 pode ser extraı́da da integral e u = −t′ /τ pode substituir a variável de integração. Como t′ = −τ u, temos que dt′ /du = −τ , e resulta que x(t) = v0 Z −t/τ exp(u)(−τ ) du, (97) 0 e extraı́da a constante −τ da integral à direita, x(t) = −v0 τ Z −t/τ exp(u) du, (98) 0 ou seja x(t) = v0 τ [1 − exp(−t/τ )] . (99) A Fig. 19 mostra a velocidade (linha cheia) e a posição (linha tracejada) em função do tempo. Quando o tempo cresce, enquanto a velocidade se aproxima de zero, a posição tende a um valor constante, v0 τ : ainda que nunca se anule, a velocidade se torna tão pequena que o avanço se torna insignificante. O parâmetro τ é tão importante aqui quanto a freqüência angular ω no movimento oscilatório da Seç. XI.B. Ele define a escala de tempo. Para tempos curtos, muito menores do que τ , a velocidade decai, aproximadamente, segundo a reta em traço mais leve na Figura. De fato, se t ≪ τ , o expoente à direita na Eq. (95) é muito pequeno, e a exponencial pode ser aproximada por exp(−t/τ ) = 1 − t/τ (veja o que diz a primeira linha à esquerda na Tab. II). Assim, a velocidade é aproximadamente dada por v(t) ≈ v0 (1 − C. Frenagem exponencial v(t) = v0 exp(−t/τ ). à Eq. (95), isso significa que t ) τ (t ≪ τ ), (100) expressão cuja representação gráfica é a reta pontilhada na Fig. 19. Essa relação representa, aproximadamente, um movimento uniformemente variado com aceleração −v0 /τ [compare a Eq. (100) com a Eq. (75)]. No limite oposto, para tempos muito superiores a τ , que apenas começam a aparecer no extremo direito da Fig. 19, a velocidade é muito pequena: a partı́cula está praticamente parada. A posição tem comportamento semelhante: para tempos muito pequenos, como mostra a curva tracejada em traço leve na Fig. 19, ela se aproxima de um movimento uniformemente desacelerado com aceleração a = −v0 /τ , isto é, x = v0 t − (v0 /τ )t2 /2. Para tempos muito grandes, quase parando, ela se aproxima da reta horizontal x = v0 τ . A identificação de uma escala caracterı́stica é sempre grande vantagem: como nosso exemplo mostra, ela permite decompor o problema em duas partes. No caso, se no inı́cio desta Seção tivéssemos identificado τ como escala 18 Figura 19 Velocidade e posição na frenagem exponencial. A linha cheia representa a velocidade [Eq. (95)] dividida pelo pré-fator v0 , e a tracejada, a posição [Eq. (99)] dividida pelo pré-fator v0 τ , de forma que as ordenadas são adimensionais, em função do tempo dividido por τ , de forma que as abscissas são também adimensionais. A reta contı́nua mostra o decaimento que a velocidade teria se mantivesse a taxa original de queda, isto é, se mantivesse a desaceleração inicial de −v0 /τ , hipótese em que ela se anularia no instante t = τ . A curva tracejada em traço leve mostra a posição que corresponderia a esse movimento uniformemente desacelerado. especiais: elas permitem identificar imediatamente as escalas caracterı́sticas nela embutidas. Encontrar uma delas em um problema de Fı́sica é como encontrar um oásis no deserto: sabemos que ela facilitará nossa vida. Vale a pena, por isso, gastar mais alguns minutos com a função exponencial. Como sabemos, ela está associada ao número e, base dos logaritmos neperianos, definido por um limite especial: e = lim (1 + 1 N ) . N (101) ex = lim (1 + 1 xN ) . N (102) N →∞ Daı́ temos que N →∞ Introduzindo agora a variável n = xN (de forma que 1/N = x/n), podemos escrever ex = lim (1 + n→∞ x n ) , n (103) já que seja qual for o valor de x, N/x crescerá desmedidamente quando N ficar enorma. Suponhamos, agora, que ao fazer n → ∞ escolhamos sempre números inteiros. O lado direito da Eq. (103) será então um binômio, que pode ser expandido pela expressão de Newton: n(n−1) n−2 2 a b 2 n(n−1)(n−2) n−3 3 + a b + .... 3! (a + b)n = an + nan−1 b + (104) Como n é muito grande, podemos fazer n−1 ≈ n, n−2 ≈ n etc.. Assim, a Eq. (104) pode ser escrita caracterı́stica de tempo, já poderı́amos esperar um comportamento para t ≪ τ e outro para t ≫ τ ; com um pouco mais de reflexão, poderı́amos ter chegado a descrever aproximadamente o movimento em cada um desses dois extremos sem precisar de recorrer a integrações ou derivações. Para entender melhor, convém pensar em um outro exemplo. A Terra é aproximadamente uma esfera com raio R = 6, 4 × 106 m. Esse raio define uma escala de distância. Para nós, que somos muito menores que R, é excelente aproximação pensar que a Terra é plana; praticamente todo o nosso quotidiano é plantado sobre essa aproximação. Já quem está muito longe da Terra, a uma distância muito maior que R, pode perfeitamente pensar no nosso planeta como um ponto, da mesma forma que nós visualizamos Vênus ou Júpiter como pontos luminosos no céu noturno. Somente quem tem de trabalhar com distâncias comparáveis com o raio da Terra precisa se preocupar com a noção de que ela é redonda: se um piloto de avião que vai de São Paulo a Lisboa quiser tratar a Terra como plana, provavelmente acabará fazendo um pouso de emergência no Oceano Atlântico, e se ele quiser tratar a Terra como um ponto, derrubará o aeroplano antes de chegar a Santos. Por isso, a função exponencial e as trigonométricas são (a + b)n = an + nan−1 b + n2 n−2 2 b 2 a 3 + n3! an−3 b3 + . . . , (105) um resultado aproximado que fica progressivamente mais preciso quando n aumenta. Substituı́do no lado direito da Eq. (103) (com a = 1 e b = x/n), ele nos dá ex = lim (1 + n n→∞ x n2 x 2 n3 x 3 + ( ) + ( ) + . . . ). (106) n 2 n 3! n Como a mesma potência de n aparece no numerador e no denominador em cada um dos termos da soma entre os colchetes à direita, podemos eliminar essas potências: ex = lim (1 + x + n→∞ x2 x3 + + . . . ). 2! 3! (107) Uma vez que o termo entre colchetes é independente de n, podemos tomar o limite n → ∞ sem qualquer preocupação. Conseguimos com isso expressar a exponencial como uma soma infinita: ex = 1 + x2 x3 x4 x + + + + .... 1! 2! 3! 4! (108) 19 Em particular, se x for muito pequeno, poderemos desprezar os termos proporcionais a x2 , x3 etc., do lado direito e recuperaremos a primeira linha à esquerda na Tab. II. Se x não for pequeno, precisaremos manter mais e mais termos à direita, até que o fatorial no denominador se torne tão grande que os termos subseqüentes possam ser desprezados. Nas disciplinas de Cálculo, voce verá que a Eq. (108) é um caso particular da expansão de Taylor, que permite escrever a maioria das funções como somas (normalmente infinitas) de potências.