Trabalhos de Graduação Volume ? – Departamento de Matemática - UnB UnB Departamento de Matemática UnB Trabalhos de Graduação em Matemática n.o 2/98 Realização • Aline G. da Silva Pinto • Carlos Eduardo Cunha • Cleida de Assis Coutinho • Daniela Amorim Amato • Edson da Costa Júnior • Josimar da Silva Rocha • Lucas Seco • Marcelo Santos Novais • Marcos Vinı́cius B. T. Lima • Marcus Vinı́cius T. Borba • Olı́mpio Ribeiro Gomes • Roberto dos Santos M. Oliveira • Santiago Prado P. Fortes • Solange Maria da C. Gonçalves • Thales Filipe D. de Souza • Wescley Well V. Bezerra Introdução ao Cálculo das Variações Orientação Celius Magalhães Revisão e Editoração: Mauro Patrão, Roberto Oliveira e Lucas Seco Capa: Lucas Seco Sumário Lista de Figuras iii Prefácio iv 1 Revisão de Otimização em Rd 1.1 Exercı́cios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Problemas Clássicos de Otimização 2.1 Problemas Geodésicos . . . . . . . . . 2.2 Problemas de Tempo de Trânsito — A 2.3 Problemas Isoperimétricos . . . . . . . 2.4 Problemas de Área de Superfı́cie . . . 3 Espaços Lineares e Variações de 3.1 Espaços Lineares Reais . . . . . 3.2 Fundamentos de Otimizaçao . . 3.3 Vı́nculos . . . . . . . . . . . . . 3.4 Variações de Gâteaux . . . . . 3.5 Funcionais Convexos . . . . . . 4 As 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 . . . . . . . . . Braquistócrona . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 7 11 13 16 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 18 20 21 24 27 Equações de Euler-Lagrange Primeira Equação: Funções Estacionárias . Casos Especiais da Primeira Equação . . . . Segunda Equação de Euler-Lagrange . . . . Condições Naturais de Contorno . . . . . . Multiplicadores de Lagrange . . . . . . . . . Funções Estacionárias com Valores Vetoriais Aplicação 1: O Problema de Dido . . . . . . Aplicação 2: Geodésicas em Superfı́cies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 30 31 34 35 35 36 37 38 Bibliografia Gâteaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 6 40 Lista de Figuras 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 2.10 2.11 Coordenadas Esféricas . . . . . . . . . . . . Um Caminho Ligando A e B na Esfera . . . Uma Geodésica no Cilindro . . . . . . . . . Uma Geodésica no Cone . . . . . . . . . . . Sistema de Coordenadas e a Braquistócrona Problema de Dido — Analogia Fı́sica. . . . Problema de Dido — Solução Geométrica A Problema de Dido — Solução Geométrica B Problema de Dido — Solução Geométrica C Problema de Dido — Solução Geométrica D Problema de Dido — Solução Geométrica E . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 9 10 11 12 14 15 15 15 15 15 3.1 Coluna de Fluido em Rotação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 Prefácio O objetivo inicial dessas notas, redigidas pelos participantes das atividades do PET durante o segundo perı́odo letivo de 1998, foi de favorecer a capacidade de produção de textos em matemática. Essa atividade, muitas vezes relegada a um segundo plano nos cursos de graduação, é de extrema importância no processo de aprendizagem, por permitir que o estudante alcance um conhecimento estruturado, sem a fragmentação que muitas vezes ocorre nos cursos tradicionais. Uma vez redigidas, esperamos que possam ser de utilidade aos estudantes interessados em um primeiro contato com essa importante área da Matemática. De fato, com origens que remontam a questões formuladas por Aristóteles e Zenodoro, o Cálculo das Variações teve seus princı́pios básicos formulados por Newton, os Bernoullis, Euler e Lagrange, entre outros, e ainda hoje é capaz de atrair a atenção de matemáticos como Ambrosseti, Brezis,Chang e Rabinowitz. Desejamos que essas notas possam sugerir ao leitor o fascı́nio que esta área da Matemática tem exercido sobre os melhores matemáticos. Com a intenção de sublinhar a semenhança com o Cálculo usual, o texto tem inı́cio com uma breve revisão de otimização em Rd , enfatizando as condições suficientes para a existência de máximos e de mı́nimos e o conceito de derivada direcional. Em seguida, são introduzidos os conceitos próprios do Cálculo das Variações, como espaços de funções, funcionais definidos em subconjuntos destes espaços, variações de Gâteaux e equações de Euler-Lagrange escalares e vetoriais. Foram incluı́dos vários exemplos, que tanto ajudam na compreensão destes conceitos como ilustram sua importância. A bibliografia básica utilizada foi o excelente texto de Troutman, Variational Calculus and Optimal Control [1], além de outros em que se procurou esclarecer alguns conceitos especı́ficos. Finalmente, gostaria de agradecer ao Departamento de Matemática pelo apoio dado ao PET em todas as suas atividades, e em particular na divulgação dessas notas. Celius A. Magalhães Tutor PET/MAT/UnB Capı́tulo 1 Revisão de Otimização em Rd Neste capı́tulo, apresentamos um breve resumo dos resultados básicos relacionados à caracterização de valores máximos e mı́nimos de uma função f definida num conjunto de Rd com valores em R. Para d = 1, 2, 3..., seja Rd o espaço Euclidiano d-dimensional. Neste espaço definem-se: i) a norma de um vetor X = (x1 , x2 , ..., xd ) por: d ¯ ¯ ³X ¯ ¯2 ´1/2 ¯X ¯ = ¯x j ¯ , que é positiva a menos que X seja o vetor nulo X = O = (0, 0, 0, ..., 0); j=1 def ii) a soma de dois vetores, X = (x1 , x2 , ..., xd ) e Y = (y1 , y2 , ..., yd ), por: X + Y = (x1 + y1 , x2 + y2 , ..., xd + yd ); def iii) a multiplicação por escalar como aX = (ax1 , ax2 , ..., axd ), ∀a ∈ R. ® def A norma de X pode ser expressa utilizando-se o produto interno, isto é, o produto X, Y = d X ¯ ¯ q ® xj yj . De fato, tem-se ¯X ¯ = X, X para todo X ∈ Rd . É possı́vel verificar que este produto j=1 tem as propriedades ® ® i) X, X > 0 , ∀X ∈ Rd e X, X = 0 ⇔ X = O; ® ® ii) X, Y = Y, X , ∀X, Y ∈ Rd ; ® ® ® iii) aX + Y, Z = a X, Z + Y, Z , ∀a ∈ R, ∀X, Y e Z ∈ Rd Usando-se estas propriedades, pode-se demonstrar a Desigualdade de Cauchy-Schwarz, como segue. ¯ ®¯ d ¯ ¯ ¯Lema ¯ ¯ ¯1.1 (Desigualdade de Cauchy-Schwarz). Para todo X, Y ∈ R , tem-se que X, Y 6 ¯X ¯ ¯Y ¯. Demonstração. ¯ ¯ ¯ ¯ Seja C o vetor dado por C = ¯Y ¯ X − ¯X ¯ Y . Então, ¯ ¯2 ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ® ¯ ¯2 ¯ ¯2 ¯ ¯¯ ¯ ® 0 6 ¯C ¯ = ¯Y ¯ X − ¯X ¯ Y , ¯Y ¯ X − ¯X ¯ Y = 2(¯X ¯ ¯Y ¯ − ¯X ¯¯Y ¯ Y, X ) de onde segue o resultado. ¥ ¯ ¯ A Desigualdade de Cauchy-Schwarz é usada para provar a Desigualdade Triangular: ¯X + Y ¯ 6 ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯X ¯ + ¯Y ¯, que também pode ser escrita na forma ¯|X| − |Y |¯ 6 ¯X − Y ¯, onde X − Y def = X + (−1)Y ¯ ¯ e ¯X − Y ¯ define a Distância Euclidiana entre X e Y . No que se segue, apresentamos algumas definições para subconjuntos de Rd e, a não ser que especificado diferentemente, usaremos “D”para indicar estes subconjuntos. d Definição 1.2 ¯ ¯ (Esfera aberta). Seja X0 ∈ R e δ > 0. Então o conjunto Sδ (X0 ) = {X0 ∈ d ¯ ¯ R ; X − X0 < δ} é chamado uma esfera aberta de centro X0 ou uma vizinhança aberta de X0 . Definição 1.3 (Ponto interior). X0 é dito um ponto interior de D se existe δ > 0, tal que Sδ (X0 ) ⊆ D. Definição 1.4 (Conjunto aberto). D é aberto quando consiste somente de pontos interiores. Capı́tulo 1. Revisão de Otimização em Rd 2 Definição 1.5 (Domı́nio). Se quaisquer dois pontos de D podem ser conectados por uma curva contı́nua inteiramente contida em D, então D é um domı́nio. Assim, por exemplo, cada esfera aberta é um domı́nio, assim como também o é cada “caixa”aberta, B = {X ∈ Rd ; aj < xj < bj , j = 1, 2, · · · , d}. Notar que a união de conjuntos abertos disjuntos não é um domı́nio, apesar de ser um conjunto aberto. Definição 1.6 (Ponto de fronteira). Um ponto que não é interior a D e não é interior ao complemento de D, denotado por Dc = Rd − D, é chamado um ponto de fronteira de D. O conjunto de todos estes pontos, denotado por ∂D, é chamado fronteira de D. Pode-se definir ∂D analiticamente por ∂D = {X ∈ Rd ; S² (X) ∩ Dc 6= ∅ e S² (X) ∩ D 6= ∅, ∀² > 0}. ¯ ¯ ¯ ¯ Desta maneira, se A = {X ∈ Rd ; ¯X ¯ 6 1}, então ∂A = {X ∈ Rd ; ¯X ¯ = 1}; também, se ∂A = B, então ∂B = B, isto é,∂(∂A) = ∂A. Definição 1.7 (Conjunto limitado). D é limitado se for subconjunto de alguma esfera. Definição 1.8 (Conjunto fechado). D é fechado se ∂D ⊆ D. Definição 1.9 (Conjunto compacto). Se D for limitado e fechado, então D é compacto. Se quisermos encontrar pontos extremos de uma função f definida num conjunto D ⊆ Rd , ou seja, se quisermos achar pontos em que a função assume valores máximos e mı́nimos, devemos notar que: • f não necessariamente terá valores extremos em D. Por exemplo, quando D = R, a função f (X) = x1 é ilimitada em ambas as direções de D. Além disso, se tomarmos D = (−1, 1) ⊆ R, esta mesma função, embora limitada, assume valores tão próximos de -1 e 1 quanto se queira, mas nunca assume os valores -1 e 1. Já no intervalo fechado D = [−1, 1], a função assume valores de máximo (1) e mı́nimo (−1). • f pode assumir somente um valor extremo em D. Por exemplo, se D = (−1, 1], f (X) = x1 assume um valor de máximo (1), mas não assume valor de mı́nimo. Já se D = (−1, 1), a função f (X) = x21 assume um valor de mı́nimo (0), mas não assume valores de máximo. • f pode assumir valores extremos em mais de um ponto. Se D = [−1, 1], f (X) = x21 assume valor de máximo (1) em x1 = ±1. Se D = R2 , f (X) = x21 assume valor de mı́nimo em cada ponto do eixo x2 . As condições suficientes para a existência de valores extremos de uma função estão contidas no Teorema a seguir, cuja demonstração pode ser encontrada em [6]. Teorema 1.10. Se D ⊆ Rd é compacto e f : D → R é contı́nua, então f assume valores de máximo e de mı́nimo em D. Uma função f ¯: D → R ¯é contı́nua em ¯ um ponto X0¯ ∈ D se, e somente se, ∀² > 0, ∃ δ > 0 tal que, se X ∈ D e ¯X − X0 ¯ < δ, então ¯f (X) − f (X0 )¯ < ². A função f é contı́nua em D se, e somente se, for contı́nua em cada ponto X0 ∈ D. Os exemplos anteriores mostram que o fato de D ser compacto ou f contı́nua, sozinhos, não asseguram a existência de valores extremos. É claro que o valor máximo de f é o valor mı́nimo de −f , e vice-versa. Desta forma, basta caracterizar os pontos de mı́nimo de f , aqueles X0 ∈ D para os quais f (X0 ) 6 f (X), ∀ X ∈ D. Capı́tulo 1. Revisão de Otimização em Rd 3 Lema 1.11. Se D contém uma vizinhana de um extremo X0 de f , na qual f possui derivadas parciais contı́nuas, então, para cada vetor unitário U ∈ Rd , a derivada direcional é tal que · ¸ ¯ ∂f f (X0 + εU ) − f (X0 ) ∂U f (X0 ) = lim = (X0 + εU )¯ε=0 = 0 ε→0 ε ∂ε Demonstração. A existência e continuidade das derivadas parciais na vizinhança de X0 garantem que o limite acima existe. Além disso, a expressão entre colchetes muda de sinal quando ε tende a zero pela direita e pela esquerda, logo deve ser nula. ¥ Como o vetor gradiente é definido como ∇f = (fx1 , fx2 , ..., fxd ), a derivada direcional pode ser ® expressa como ∂U f (X0 ) = ∇f (X0 ), U . Então, é fácil concluir que, num ponto extremo interior X0 , tem-se ∇f (X0 ) = 0. Definição 1.12. O ponto X0 , no qual ∇f (X0 ) = 0, é chamado ponto estacionário (ou ponto crı́tico) de f , independente de X0 ser ou não ponto de máximo ou de mı́nimo de f . Por exemplo, em D = [−1, 1] , a função f (X) = x31 tem seu único ponto crı́tico em x1 = 0, mas o máximo e o mı́nimo ocorrem em 1 e −1, respectivamente. Em D = R2 , a função f (X) = x22 − x21 tem seu único ponto crı́tico em X0 = (0, 0). Neste ponto, f tem seu comportamento de máximo na direção x2 = 0 e seu comportamento de mı́nimo na direção x1 = 0. Neste caso, X0 é denominado ponto de sela de f . Um ponto estacionário X0 pode ser apenas um extremo local, ou seja, f (X) > f (X0 ) ou f (X) 6 f (X0 ) para todo X ∈ D que esteja numa vizinhana de X0 . Por exemplo, o polinômio f (X) = x31 − 3x1 tem, em D = [−3, 3] , x1 = 1, −1 como pontos crı́ticos. O primeiro é um máximo local e o segundo, um mı́nimo. Definição 1.13. Uma função f definida em D ⊂ Rd é convexa em D se tiver derivadas parciais contı́nuas em D e, além disso, verificar a desigualdade ® f (X) > f (X0 ) + ∇f (X0 ), (X − X0 ) , ∀ X, X0 ∈ D. A função f é estritamente convexa se esta desigualdade é estrita para X 6= X0 . A desigualdade acima pode também ser escrita na forma ® f (X + V ) > f (X) + ∇f (X), V ∀ X, X + V ∈ D. Uma função não precisa ter ponto crı́tico mas, obviamente, quando X0 é ponto crı́tico de uma função convexa f , então ∇f (X0 ) = 0, e portanto f (X) > f (X0 ), isto é, X0 é ponto de mı́nimo de f . Isso demonstra a Proposição 1.14. Se f é uma função convexa em D, então ela assume um valor mı́nimo em cada ponto crı́tico de D. Exemplo. A função definida por f (X) = x21 + x22 tem como gradiente ∇f (X) = (2x1 , 2x2 ) e satisfaz, para cada V = (v1 , v2 ), f (X + V ) = (x1 +v1 )2 +(x2 +v2 )2 = x21 +x22 +2x1 v1 +2x2 v2 +v12 +v22 ® ¯ ¯2 ® = f (X) + ∇f (X), V + ¯V ¯ > f (X) + ∇f (X), V para todo X ∈ R2 , e portanto f é convexa nesse domı́nio. Lema 1.15. Se f é estritamente convexa en D, então f não pode ter mais de um ponto crı́tico, e portanto, mais de um mı́nimo interior em D. Capı́tulo 1. Revisão de Otimização em Rd 4 Demonstração. Se X0 é um ponto crı́tico de f , então f (X) > f (X0 ), para todo X ∈ D − X0 . Assim, f não assume mı́nimo em nenhum outro ponto. ¥ Exemplo. A função do exemplo anterior é estritamente convexa em cada conjunto D ⊂ R2 . Além disso, não é difı́cil verificar que, em R2 , a função definida por f (X) = x21 + x22 − 2x1 é estritamente convexa, a função f (X) = x1 − x2 é convexa, mas não estritamente, enquanto que f (X) = x1 x2 não é convexa. Definição 1.16. Uma função f é diferenciável em X0 se, para todo X em vizinhança de X0 , tem-se ¯ ® ¯ f (X) = f (X0 ) + ∇f (X), X − X0 + ¯X − X0 ¯ζ(X − X0 ) (1.1) em que lim ζ(X − X0 ) = 0. X→X0 d+1 Sendo f uma função diferenciável, o seu gráfico possui, no ponto® (X0 , f (X0 )) ∈ R , o hiperplano tangente definido por T (X) = f (X0 ) + ∇f (X0 ), (X − X0 ) . Para d = 1, esta é a reta tangente à curva que representa o gráfico de f em R2 . Para d = 2, este é o plano tangente à superfı́cie representada pelo gráfico de f em R3 . Se ∇f (X0 ) = 0, então o gráfico de f tem hiperplano tangente “horizontal” em X0 , isto é, um subconjunto d-dimensional paralelo à Rd . Para d = 2, uma bola de gude equilibrada em (X0 , f (X0 )) não deve rolar, mas permanecer “estacionária”. Da definição segue-se que uma função convexa diferenciável é aquela que está “acima”de seu hiperplano tangente. A respeito de outras propriedades de funções convexas, observamos ainda o seguinte: Proposição 1.17. A soma de duas funções f, g [estritamente] convexas em D ⊆ Rd é [estritamente] convexa em D. Além disso, dado um escalar c > 0, cf é também [estritamente] convexa. Demonstração. Com efeito, considere apenas o caso em que f, g são estritamente convexas, uma vez que o outro X ∈® D e X + V ∈ D. Então f (X + V ) > ® caso é semelhante, e sejam f (X) + ∇f (X), V e g(X + V ) > g(X) + ∇g(X), V . Logo, dados a, b escalares positivos, e definindo h(X) = af (X) + bg(X), tem-se que h(X + V ) = af (X + V ) + bg(X + V ) ® ® > af (X) + a ∇f (X), V + bg(X) + b ∇g(X), V ® ® = h(X) + [a∇f (X) + b∇g(X)], V = h(X) + ∇h(X), V onde foi usada a linearidade das derivadas parciais. Isso mostra que h é estritamente convexa. ¥ Observação. O produto de duas funções convexas não é necessariamente convexo. Por exemplo, as funções f (X) = x1 +x2 e g(X) = x1 −x2 são convexas, uma vez que são funções lineares. Contudo, f (X) g(X) = (x1 + x2 ) (x1 − x2 ) = x21 − x22 é a equação do parabolóide hiperbólico, o qual já se sabe que não é convexo. Outra importante propriedade das funções convexas é a Proposição a seguir, que ilustra a possibilidade de se caracterizar a convexidade sem supor diferenciabilidade. Proposição 1.18. Suponha que f : Rd → R seja diferenciável. Então f é convexa em Rd se, e só se, para todo X, X0 ∈ Rd , têm-se f (tX + (1 − t)X0 ) 6 tf (X) + (1 − t)f (X0 ), ∀ t ∈ (0, 1). Capı́tulo 1. Revisão de Otimização em Rd 5 Demonstração. De inı́cio, vamos assumir que f seja convexa. Dados X, X0 ∈ Rd , t ∈ (0, 1) e definindo Yt = tX + (1 − t)X0 , um cálculo simples mostra que X − Yt = (1 − t) (Yt − X0 ). t Usando agora a convexidade de f , isto é, ® f (X) > f (Yt ) + ∇f (Yt ), (X − Yt ) , (1.2) e a expressão de X − Yt acima, obtém-se que ® tf (Yt ) − tf (X) ∇f (Yt ), (X0 − Yt ) > . 1−t (1.3) Por outro lado, usando novamente a convexidade de f , isto é, ® (1.4) f (X0 ) > f (Yt ) + ∇f (Yt ), (X0 − Yt ) , obtém-se que ® ∇f (Yt ), (X0 − Yt ) 6 f (X0 ) − f (Yt ). (1.5) Combinando as equações (1.3) e (1.5) obtém-se ® tf (Yt ) − tf (X) 6 ∇f (Yt ), (X0 − Yt ) 6 f (X0 ) − f (Yt ), 1−t de onde segue o que buscamos, isto é, (1.6) f (Yt ) 6 tf (X) + (1 − t)f (X0 ). Reciprocamente, suponha f diferenciável satisfazendo (1.6) acima. Usando a diferenciabilidade de f em X0 e que Yt − X0 = t(X − X0 ), obtem-se ¯ ¯ f (Yt ) = f (X0 ) + t∇f (X0 )(X − X0 ) + t¯X − X0 ¯ζ(tX − tX0 ) em que ζ(tX − tX0 ) → O quando t → 0. Essa última igualdade, juntamente com (1.6), implica que f satisfaz ¯ ® ¯ t[ ∇f (X0 ), (X − X0 ) + ¯X − X0 ¯ζ(tX − tX0 )] 6 t[f (X) − f (X0 )], em que t 6= 0. Dividindo por t e usando as propriedades da função ζ obtém-se que f é convexa, isto é, ® ∇f (X0 ), (X − X0 ) 6 f (X) − f (X0 ) ∀X, X0 ∈ R2 , ∀t ∈ (0, 1) o que conclui a demostração. ¥ Observação. No estudo dos valores extremos de uma função f , a menos que D seja aberto, isto é, possui somente pontos interiores, então é também necessário considerar os valores extremos de f em ∂D, a fronteira de D. Por exemplo, a função f (X) = x22 − x21 em R2 possui um único ponto estacionário X0 =¯ O, ¯ que é um ponto de sela. Assim, o máximo e o mı́nimo de f em, ¯ ¯digamos, D = {X ∈ R2 ; ¯X ¯ 6 2}, pode ser encontrado apenas na fronteira de D, em que ¯X ¯ = 2. O próximo exemplo ilustra melhor este fato. Exemplo. Para encontrar os valores de máximo e de mı́nimo da função f (X) = x21 − x1 x2 + 16 x32 ¯ ¯ 2 ¯ ¯ em D = {X ∈ R ; xj 6 2, j = 1, 2}, notamos, de inı́cio, que ∇f (X) = (2 x1 − x2 , −x1 + 21 x22 ) e, ¡ ¢ portanto, os pontos crı́ticos de f em D são X0 = (0, 0), e X̃0 = 12 , 1 . Tem-se que X0 é ponto de 1 sela, enquanto que X̃0 é ponto de mı́nimo local, com f (X̃0 ) = − 12 . Comparando este valor com os ) é assumido no ponto (−2, 2) e valor mı́nimo (− 37 ), valores de f em ∂D, vemos que o máximo ( 28 3 no ponto (−1, −2), ambos na fonteira de D. 6 Capı́tulo 1. Exercı́cios Propostos 1.1 Exercı́cios Propostos 1. Considere a seguinte definição de diferenciabilidade: Definição 1.19. Uma função real f : U ⊆ Rp → R é diferenciável em X0 ∈ U se existe uma vizinhança de X0 em U tal que f (X0 + V ) = f (X0 ) + LX0 (V ) + r(V ) para todo X + V nesta vizinhança, onde LX0 : Rp → R é uma transformação linear e r é uma função que satisfaz r(V ) lim ¯ ¯ = 0 V →O ¯V ¯ (Esta definição diz intuitivamente que f é diferenciável num ponto X interior de seu domı́nio se f admite uma “boa aproximação linear” em vizinhança de X.) a) Prove que se f é diferenciável em X0 então a matriz da transformação linear LX0 na base canônica do Rp é precisamente ∇f (X0 ). b) Estenda a definição acima para funções que tomam valores em Rq e prove que, neste caso, a matriz de LX0 é a conhecida matriz Jacobiana no ponto X0 . (Sugestão: use a definição e o item anterior para cada função coordenada fi : Rp → R de F = (f1 , . . . , fp ), onde F : Rp → Rq .) 2. Supondo f diferenciável em X0 , prove que a derivada direcional de ® f na direção não nula V no ponto X0 é dada pelo produto interno ∂V f (X0 ) = ∇f (X0 ), V . 3. Supondo f de classe C 2 , prove que a segunda derivada direcional de f na direção não nula V ® no ponto X0 é dada por ∂V2 f (X0 ) = Hf (x0 )V, V , onde Hf (X0 ) é a matriz Hessiana de f no ponto X0 . (Sugestão: use o exercı́cio anterior.) Capı́tulo 2 Problemas Clássicos de Otimização “Qual o melhor método?” Tanto a matemática como as várias ciências clássicas têm feito esta mesma pergunta durante séculos, e sua resposta nem sempre é definitiva. Se for possı́vel medir o quão “melhor” é o método usando-se uma quantidade numérica, esta pergunta torna-se naturalmente um problema de otimização: maximizar tal quantidade numérica. Não se está interessado somente nos valores ótimos, sejam eles máximos ou mı́nimos, mas também nos métodos para obtê-los. Quando a pergunta vem das ciências clássicas, a quantidade a ser otimizada é algo como comprimento, área, volume, tempo, trabalho, energia, e também custo, eficiência, etc. Neste capı́tulo, serão examinados alguns problemas clássicos que foram essenciais para o desenvolvimento da teoria atual que responde as perguntas deste tipo. Muito embora aqui só se desenvolvam poucos destes problemas, eles servirão de motivação para os problemas que poderão ser encontrados mais adiante pelo leitor. 2.1 Problemas Geodésicos Seja por preguiça inerente ou por interesse na eficiência, o homem sempre esteve procurando qual, dentre os vários caminhos que ligam dois pontos fixos A e B, é o caminho mais curto, isto é, o de menor comprimento. No espaço euclideano Rd , uma reta que liga estes dois pontos fornece o caminho de menor comprimento. No entanto, ao serem considerados obstáculos no caminho, tornase necessário considerar o problema mais delicado de encontrar as geodésicas (caminhos de menor comprimento) ligando dois pontos numa superfı́cie qualquer. Serão caracterizadas aqui as geodésicas do espaço Rd . No R3 serão caracterizadas as geodésicas da esfera, do cilindro e do cone. 2.1.1 Geodésicas em Rd Seja Y0 (t) = (1 − t)A + tB, t ∈ [0, 1] a equação que determina o segmento de reta de A a B, em que Y00 (t) = B − A. Se existe uma curva de comprimento mı́nimo Lmin ligando A e B, então deve-se ter Z1 Z1 ¯ ¯ ¯ ¯ ¯ ¯ Lmin 6 ¯Y00 (t)¯dt = ¯B − A¯dt = ¯B − A¯, 0 Para mostrar que Lmin 0 ¯ ¯ = ¯B − A¯, basta mostrar que ¯ ¯ ¯B − A¯ 6 L(Y ) = Z1 ¯ 0 ¯ ¯Y (t)¯dt 0 qualquer que seja o caminho continuammente diferenciável Y (t) que liga A a B. Do Teorema R1 Fundamental do Cálculo, tem-se que B − A = Y (1) − Y (0) = 0 Y 0 (t)dt, de modo que ¯ ¯ ® ¯B − A¯2 = B − A, B − A = B − A, Z1 ® Y 0 (t)dt = 0 Z1 (2.1) = 0 ® B − A, Y 0 (t) dt 6 Z1 0 ¯ ¯¯ ¯ ¯B − A¯ ¯Y 0 (t)¯dt 8 Capı́tulo 2. Problemas Geodésicos ¯ ¯2 em que a última desigualdade decorre da Desigualdade de Cauchy-Schwarz. Portanto, ¯B − A¯ 6 ¯ ¯R ¯ ¯ ¯B − A¯ 1 ¯Y 0 (t)¯dt e consequentemente 0 ¯ ¯ ¯B − A¯ 6 Z1 ¯ 0 ¯ ¯Y (t)¯dt 0 para todo caminho Y (t) nas condições dadas. Demonstrou-se ¯ ¯assim que o comprimento mı́nimo Lmin de um caminho entre dois pontos A e B no Rd é ¯A − B ¯. Como o segmento de reta que liga A a B tem esse comprimento, ele é uma geodésica do Rd . No entanto, pode haver, a princı́pio, outros caminhos continuamente diferenciáveis com o mesmo comprimento Lmin . Este não é o caso, bastando, para isso, notar que a igualdade em (2.1) ocorre se, e somente se, os vetores Y 0 (t) e B − A forem linearmente dependentes para todo t, isto é, se, e somente se, Y (t) descrever um segmento de reta entre A e B. Isto mostra que as geodésicas do Rd são precisamente os segmentos de reta. 2.1.2 Geodésicas na Esfera Cada ponto Y na superfı́cie de uma esfera de raio R e centrada na origem pode ser dado pelas coordenadas esféricas de raio R, latitude θ e longitude ϕ por (2.2) Y = (R cos θ sen ϕ, R sen θ sen ϕ, R cos ϕ) para algum ϕ ∈ [0, π) e θ ∈ [−π, π). Figura 2.1. Coordenadas Esféricas Dados dois pontos distintos A e B na superfı́cie de tal esfera, pode-se escolher os eixos de modo que A seja o pólo norte (ϕ = 0), e que B 6= A tenha coordenadas (R, 0, ϕ1 ) para algum ϕ1 > 0. Nestas condições, um caminho suave ligando A e B na superfı́cie da esfera é determinado, usando-se (2.2), por um par de funções continuamente diferenciáveis θ(t) e ϕ(t), com t ∈ [0, 1] onde θ(0) = 0, ϕ(0) = 0, θ(1) = 0 e ϕ(1) = ϕ1 . Este caminho é dado por (ver figura 2.2) Y (t) = (R cos θ(t) sen ϕ(t), R sen θ(t) sen ϕ(t), R cos ϕ(t)) em que t ∈ [0, 1]. 9 Capı́tulo 2. Problemas Geodésicos Figura 2.2. Um Caminho Ligando A e B na Esfera ¯ ¯2 Para se calcular o comprimento deste caminho, verifica-se que ¯Y 0 (t)¯ = R2 (sen2 ϕ(t)θ0 (t)2 + ϕ0 (t)2 ) de modo que seu comprimento é dado pela integral Z1 L(Y ) = ¯ 0 ¯ ¯Y (t)¯dt = 0 Z1 R p sen2 ϕ(t)θ0 (t)2 + ϕ0 (t)2 dt 0 ¯ ¯ p Usando a desigualdade ϕ0 (t) 6 ¯ϕ0 (t)¯ 6 sen2 ϕ(t)θ0 (t)2 + ϕ0 (t)2 , obtem-se finalmente que Z1 L(Y ) > R ¯1 ϕ0 (t)dt = Rϕ(t)¯0 = Rϕ1 . 0 Daı́ conclui-se que, para qualquer caminho continuamente diferenciável Y (t) na esfera, seu comprimento é L(Y ) > Rϕ1 , e este último é exatamente o comprimento do menor grande arco1 que une A e B na esfera. Assim, pode-se afirmar que os grandes arcos são geodésicas da esfera. Para se mostrar que são eles precisamente as geodésicas, basta notar que a igualdade ocorre se, e somente se, sen2 ϕ(t)θ0 (t)2 ≡ 0 e ϕ0 (t) > 0, ou seja θ(t) ≡ 0, de onde se tem novamente um grande arco. 2.1.3 Geodésicas no Cilindro Os pontos Y de um cilindro de raio R com eixo central coincidente com o eixo z podem ser dados unicamente em coordenadas cilı́ndricas (θ, z) por meio de: Y = (R cos θ, R sen θ, z) onde −π 6 θ < π e z ∈ R. Dados dois pontos distintos A e B no cilindro, podemos considerar A = (0, 0) e B = (θ1 , z1 ) em coordenadas cilı́ndricas. Para encontrar a geodésica entre A e B nesse caso, primeiro notamos que, se B é da forma (0, z1 ), podemos ligar A e B com a reta (1 − t)A + tB que está no cilindro. Como o cilindro está em R3 , esta reta é a geodésica no cilindro, neste caso. Mais geralmente, tem-se de considerar o caminho continuamente diferenciável ligando os pontos A e B dado por um par de funções θ(t), z(t) com −π 6 θ(t) < π e z(t) ∈ R para t ∈ [0,1]. Além disso deve-se ter θ(0) = 0, z(0) = 0 e θ(1) = θ1 , z(1) = z1 . O caminho no cilindro é Y (t) = (R cos θ(t), R sen θ(t), z(t)), e devemos minimizar a integral Z1 L(Y ) = R 0 1 Arco ¯ 0 ¯ ¯Y (t)¯dt = R Z0 p θ0 2 + z 0 2 dt. 1 determinado pela circunferência de mesmo centro e raio da esfera que passa pelos pontos A e B. Como 2 pontos distintos determinam 2 arcos numa mesma circunferência, toma-se o menor deles, daı́ menor grande arco. 10 Capı́tulo 2. Problemas Geodésicos Esta integral, a menos da constante multiplicativa R, é a que fornece o comprimento da curva t 7→ (θ(t), z(t)) no plano zOθ, e portanto basta minimizar o comprimento desta curva. Pelo que foi visto em Rd , o comprimento mı́nimo é dado pela reta que une os pontos (0, 0) e (θ1 , z1 ), isto é, pela curva t 7→ (tθ1 , tz1 ) com 0 6 t 6 1. No cilindro, tem-se Ymin (t) = (R cos tθ1 , R sen tθ1 , tz1 ) que é uma hélice, como pode ser facilmente verificado. Isto mostra que as geodésicas no cilindro são os arcos de hélice. Figura 2.3. 2.1.4 Uma Geodésica no Cilindro Geodésicas no Cone Para encontrar as geodésicas do cone procede-se como no caso do cilindro: encontra-se uma parametrização especial que leva o plano ao cone preservando o comprimento de curvas. Para o cone C, sem o vértice e com ângulo de abertura 2φ0 , 0 < φ0 < π/2, essa parametrização pode ser construı́da como segue. Denotando a = senφ0 e b = cosφ0 , seja D ∈ R2 o domı́nio D = {(u, v) ∈ R2 ; u > 0 e − tan(aπ/2)u < v < tan(aπ/2)u}. Seja ainda g : D → D̃ a mudança de coordenadas p g(u, v) = (ρ, θ) = (2 u2 + v 2 , 2 arc tan(v/u)), em que D̃ = g(D) = {(ρ, θ) ∈ R2 ; ρ > 0 e − π < a−1 θ < π}. Usando coordenadas esféricas, com longitude fixa φ = φ0 , o cone C pode ser parametrizado por X̃ : D̃ → C, com X̃(ρ, θ) = (ρa cos(a−1 θ), ρa sen(a−1 θ), bρ). A parametrização em que estamos interessados é então dada por X : D → C, X = X̃ ◦ g. Apesar da mudança de coordenadas g parecer artificial, esta é de fato a mais apropriada. Para ver isso, sejam A e B dois pontos no cone com coordenadas, nas variáveis (u, v), dadas por A = (u0 , 0) e B = (u1 , v1 ). Um caminho suave Y (t) no cone ligando A e B é dado pelas funções continuamente diferenciáveis ρ(t) e θ(t), que variam em D̃, ou pelas correspondentes u(t) e v(t), que variam em D, 0 6 t 6 1. Usando a Regra da Cadeia, obtem-se que ρ0 = 2(uv 0 − vu0 ) −2(uu0 + vv 0 ) √ e ρθ0 = √ u2 + v 2 u2 + v 2 de onde segue que o comprimento L(Y ) deste caminho é dado por Z1 q ρ0 2 + (ρθ0 )2 dt = 2 L(Y ) = 0 Z1 p u0 2 + v 0 2 dt 0 Capı́tulo 2. Problemas de Tempo de Trânsito — A Braquistócrona 11 o qual, a menos de constante, é precisamente o comprimento de um caminho em D ligando os pontos (u0 , 0) e (u1 , v1 ). Como D é convexo, este comprimento é mı́nimo para a reta u(t) = u0 + t(u1 − u0 ), v(t) = tv1 , 0 6 t 6 1, que une estes dois pontos. Segue-se que a geodésica Ymin ligando os pontos A e B no cone é dada por Ymin (t) = X(u0 + t(u1 − u0 ), tv1 ), que é um arco de hélice no cone (figura 2.4). O fato das hélices aparecerem tanto como geodésicas do cilindro quanto do cone não é mera coincidência. De fato, verificamos que as curvas do plano quando levadas ao cilindro e ao cone por meio de uma parametrização apropriada mantêm o comprimento. Deste modo, as geodésicas do cone e do cilindro provém das geodésicas do plano — as retas — onde a imagem de uma reta é a hélice em cada uma destas superfı́cies. Assim, dizemos que o cone, o cilindro e o plano (num domı́nio apropriado) são isométricos (para uma definição mais precisa, veja [2]). Isto possibilita encontrar as geodésicas destas superfı́cies uma vez que sabemos quais são as geodésicas do plano. Figura 2.4. 2.1.5 Uma Geodésica no Cone Outras Geodésicas Para caracterizar geodésicas de superfı́cies do R3 é possı́vel utilizar sistemas de coordenadas especiais associados a elas, como se fez anteriormente para a esfera, o cilindro e o cone no R3 . O estudo das geodésicas de superfı́cies arbitrárias do R3 foi iniciado por Johann Bernoulli (1689), por seu pupilo Euler (1729), por Lagrange (1760) e quase que decisivamente abordado por Gauss (1827). Há de se notar que para superfı́cies arbitrárias do R3 o problema não é nada trivial. Curiosamente, o problema de achar as geodésicas de uma superfı́cie de revolução qualquer foi levantado quando se descobriu que a Terra não era perfeitamente esférica. No caso em que S for uma superfı́cie de nı́vel, por exemplo, S = {Y ∈ R3 : g(Y ) = 0}, então o problema de se achar as geodésicas de S torna-se o problema de minimizar uma integral L(Y ) = ¯ R1¯ ¯Y (t)¯dt, como anteriormente, mas agora sujeita à restrição g(Y ) ≡ 0. Este problema constitui 0 um ramo da geometria diferencial, e o leitor interessado pode consultar novamente [2]. 2.2 Problemas de Tempo de Trânsito — A Braquistócrona Se uma partı́cula desloca-se com velocidade constante entre dois pontos dados, então a curva de menor distância entre esses pontos é também a de menor tempo de trânsito. Isto por que, se a velocidade é constante, então a velocidade em qualquer ponto da trajetória é igual a V = ∆S/∆T . Portanto, ∆T = ∆S/V e, para minimizar o tempo de trânsito ∆T , devemos minimizar o deslocamento ∆S, já que V é constante. Deste modo, a curva que minimiza a distância percorrida também minimiza o tempo de trânsito. Entretanto, se a velocidade não for constante e, em particular, se Capı́tulo 2. Problemas de Tempo de Trânsito — A Braquistócrona Figura 2.5. 12 Sistema de Coordenadas e a Braquistócrona depende do caminho percorrido, então as trajetórias que ligam estes pontos não são necessariamente coincidentes. Em 1696, Johann Bernoulli desafiou os matemáticos a encontrarem a braquistócrona, isto é, a curva plana que forneceria o menor tempo de trânsito. A solução de Bernoulli foi derivada de uma analogia com a ótica, e outras soluções foram dadas por seu irmão Jakob, por Newton, por Euler , e por Leibniz. Embora todas essas soluções tenham alcançado a mesma conclusão, isto é, que a braquistócrona não é um arco circular como se imaginava, mas uma ciclóide, nenhuma delas é inteiramente satisfatória. Contudo, a de Bernoulli admitiu refinamentos e uma generalização: o Cálculo Variacional. Para o estudo do problema da braquistócrona, considere que uma partı́cula M percorra uma trajetória ligando os pontos A e B, como ilustrado na Figura 2.5, em que o ponto A = O é a origem e a parte do eixo y que aponta para baixo é tomada como positiva. Consideramos apenas as curvas ligando os pontos A e B = (x1 , y1 ), em que x1 e y1 são positivos, que podem ser representadas pelo gráfico de uma função contı́nua y = y(x), x ∈ [0, x1 ], com y(0) = 0 e y(x1 ) = y1 . Assumimos que a partı́cula M está sob a ação de apenas duas forças: a força gravitacional, que é conservativa, e a força normal, que, sendo perpendicular ao deslocamento infinitesimal ds da partı́cula, não realiza trabalho sobre ela, e portanto não contribui para o aumento de sua velocidade. Desprezamos quaisquer forças dissipativas que possam atuar sobre o sistema, como forças de atrito. Nestas condições, a velocidade da partı́cula é função de sua altura y e, portanto, da curva que ela percorrer. Assumindo diferenciabilidade suficiente, o tempo T , necessário para uma partı́cula percorrer a distância l ao longo da curva y(x), é dado por Zl T = T (y) = 0 ds v Rxp Para x ∈ [0, x1 ], s(x) = 0 1 + [y 0 (x)]2 dx é o comprimento de arco até o ponto (x, y(x)). Considerando v = v(x) e substituindo s e v na equação acima, tem-se que Zx1 p T (y) = 0 1 + [y 0 (x)]2 dx v(x) 13 Capı́tulo 2. Problemas Isoperimétricos Considerando que não há forças dissipativas, a energia mecânica E se conserva. Segue então que a variação da energia potencial é igual à variação da energia cinética, isto é, m g y(x) = m v 2 (x)/2, onde m é a massa da p partı́cula e g a constante de acelaração gravitacional da Terra. Desta igualdade, segue que v(x) = 2gy(x) e, portanto, 1 T (y) = √ 2g Zx1 s 0 1 + [y 0 (x)]2 dx y(x) Do ponto de vista matemático, o problema é procurar a(s) função(ções) y(x) que minimiza(m) o funcional acima entre todas as funções contı́nuas no intervalo fechado [0, x1 ], satisfazendo y(0) = 0 e y(x1 ) = y1 , de maneira que a integral exista. Para a existência, deve-se observar que a integral é imprópria, devido à presença de um denominador que pode se anular. Além disso, é suficiente requerer que y 0 seja integrável em [0, x1 ] e que y seja positiva em (0, x1 ]. Pode parecer redundante exigir que as funções y(x), que compõem o domı́nio do funcional T (y), sejam contı́nuas em [0, x1 ] e que suas derivadas sejam integráveis em [0, x1 ], pois se uma função real é derivável num ponto, então ela é contı́nua neste ponto. O que ocorre aqui, porém, é que o critério de integrabilidade utilizado requer apenas que y 0 esteja definida em [0, x1 ] a menos de um conjunto de medida zero 2 . Assim, por exemplo, pode acontecer de y 0 não estar definida em infinitos pontos de [0, x1 ] e, desta maneira, a integrabilidade de y 0 não é suficiente para garantir que y seja contı́nua nestes pontos. De qualquer maneira, com ou sem motivação fı́sica, não há resposta óbvia, embora possa ser verificada a hipótese feita por Galileu de que um arco de circunferência é superior a uma linha reta. Variações do problema da braquistócrona logo se seguiram. Por exemplo, em 1698 Jakob Bernoulli desafiou os matemáticos da época a encontrar a braquistócrona ligando um ponto e uma reta fixos no plano. Mais tarde, investigou-se o problema de encontrar a braquistócrona entre duas curvas arbitrárias fixas no espaço, e Newton considerou o problema de encontrar a braquistócrona conectando dois pontos fixos na Terra passando-se através dela. 2.3 Problemas Isoperimétricos Os problemas isoperimétricos tratam de questões geométricas nas quais a única condição é a de que o perı́metro seja constante — a chamada condição isoperimétrica. Nesta categoria, o mais antigo é o Problema de Dido , que pode ser enunciado assim: Dada uma curva de perı́metro fixo, achar a forma que abriga a maior área. Um outro exemplo deste tipo de problema, frequentemente atribuı́do a Euler, é: Dado um fio de comprimento fixo, fino e inextensı́vel, encontrar a forma que assume quando suas extremidades se encontram penduradas em dois pontos separados por uma dada distância horizontal. Com relação ao Problema de Dido, pode-se fazer a seguinte analogia fı́sica: considere uma curva fechada de formato qualquer e construa a partir dela um cilindro reto, com paredes flexı́veis, inextensı́veis e impermeáveis. Fixe este cilindro num plano horizontal de modo que não ocorra vazamento na base deste cilindro. Preenchendo o interior com água (ver Figura 2.6) verificam-se dois fatos: 2 Diz-se que um conjunto A ⊆ R tem medida zero se, dado ² > 0, existir uma cobertura de A, digamos I1 , I2 , I3 , . . ., ∞ X composta por quantidade enumerável (ou finita) de intervalos abertos tais que m[Ik ] < ², onde m[Ik ] é a medida do intervalo Ik . Notar que os intervalos escolhidos podem ser ou não disjuntos. 1 14 Capı́tulo 2. Problemas Isoperimétricos Figura 2.6. Problema de Dido — Analogia Fı́sica. 1. Em um mesmo nı́vel, a pressão da água em cada ponto da parede do cilindro é a mesma , devido às leis da hidrostática. Assim, em cada altura atuarão forças iguais e ortogonais às paredes. E, como estas paredes são flexı́veis, elas irão se movimentar até que estas forças possam ser vetorialmente canceladas, ocasionando uma equalização da pressão entre a parede e a água. A única forma que possibilita essa equalização é certamente o cı́rculo. 2. Pela ação da gravidade, que é também a causadora das forças hidrostáticas do item anterior, sabe-se que a água procura as regiões de menor altura possı́vel. E, como o volume de um cilindro é dado pelo produto da área da base pela altura, então, para um volume constante, tem-se que maximizar a área da base de modo a minimizar a altura. Essas considerações fı́sicas indicam que a solução do Problema de Dido é dada pelo cı́rculo. O Problema de Dido admite, ainda, uma solução geométrica, como segue. Teorema 2.1. Dentre todas as curvas fechadas de perı́metro dado, o cı́rculo é aquela que engloba a maior área. Demonstração. Suponha que C seja a curva procurada com comprimento l e área máxima. Afirmamos então o seguinte: i) C é convexa. De fato, suponha que C não seja convexa. Então ela deve conter dois pontos A e A0 tal que os arcos ABA0 e AB 0 A0 , que ligam tais pontos, devem estar do mesmo lado da linha AA0 , conforme a Figura 2.7. No entanto, ao se substituir qualquer um desses arcos por sua imagem na reflexão em torno da reta AA0 , obtem-se uma nova curva de mesmo comprimento da anterior, mas que contém maior área, uma contradição. ii) Se dois pontos A e B dividem a curva C em arcos de mesmo comprimento, então a linha AB divide a área no interior de C em duas partes iguais. Para demonstrar essa afirmação, suponha que A e B dividam a curva C em dois arcos de mesmo comprimento mas a linha AB não divida a área de C em regiões de mesma área, conforme ilustrado na Figura 2.8. Neste caso, o lado de maior área poderia ser refletido em torno do segmento AB e, assim, obtem-se uma nova curva de mesmo comprimento, mas que engloba maior área que a anterior, novamente uma contadição. Agora o problema se reduz a determinar o arco de comprimento l/2 com pontos extremos A e B em um segmento de reta tal que a área entre esse arco e o segmento AB seja máxima. Neste sentido afirmamos 15 Capı́tulo 2. Problemas Isoperimétricos Figura 2.7. Figura 2.8. iii) Suponha que os pontos A e B dividam a curva C ao meio. Se D é qualquer ponto na curva, então o ângulo ADB é um ângulo reto. Novamente por contradição, suponha que D é um ponto tal que o ângulo ADB não é reto. A área delimitada pelo arco ADB e o segmento AB é dividida em três partes: as áreas A1 e A2 limitadas pela curva e os segmentos AD e DB, respectivamente, e a área A3 limitada pelo triângulo ADB, conforme ilustrado na figura 2.9 Figura 2.9. Agora suponha que fosse possı́vel movimentar tais segmentos de modo a obter um ângulo reto em D, conforme Figura 2.10. Neste caso, as áreas A1 e A2 seriam mantidas inalteradas, enquanto que a área A3 variaria. Assim, a área delimitada pelo arco ADB 0 aumentaria, uma vez que, entre todos os triângulos com dois lados congruentes, o que possui área máxima é o triângulo retângulo 3 , conforme ilustra a Figura 2.11. Figura 2.10. Figura 2.11. θ considerar a expressão ab sen , que fornece a área de um triângulo de lados a, b e c, com θ sendo o 2 ângulo entre os lados a e b (θ ∈ [0, π]). Daı́, quando sen θ = 1, teremos o maior valor para a área, isto é, quando θ = arc sen 1 = π = 90o . 3 Basta 16 Capı́tulo 2. Problemas de Área de Superfı́cie Portanto, a figura “máxima”consiste de todos os pontos D a partir dos quais uma corda que divide o comprimento desta curva em duas partes iguais é vista sob um ângulo reto, isto é, a curva em questão é um cı́rculo. ¥ Para uma formulação do Problema de Dido no contexto do cálculo das variações, usaremos o Teorema de Green enunciado a seguir, onde a integral de linha é orientada no sentido anti-horário. Para uma demostração desse Teorema, ver, por exemplo, [4]. Teorema 2.2 (de Green). Sejam M e N funções de duas variáveis x e y, que tenham derivadas parciais primeiras contı́nuas em um disco aberto B em R2 . Se C for uma curva fechada simples seccionalmente suave, contida inteiramente em B, e se R for a região limitada por C, então ¶ I ZZ µ ∂N ∂M M (x, y) dx + N (x, y) dy = − dA. ∂x ∂y C R Vamos supor que uma curva C, fechada, simples e suave, de comprimento l, seja parametrizada por Y (t) = (x(t), y(t)), t ∈ [0, 1]. De acordo com o Teorema acima, com N (x, y) ≡ x e M (x, y) ≡ 0, a área A(Y ) do domı́nio R limitada pela curva é ZZ A(Y ) = Z dx dy = R Z1 x(t)y 0 (t) dt. x dy = 0 C onde supomos que Y (t) é uma parametrização orientada no sentido positivo. O problema é então maximizar A(Y ) sobre todas as funções Y (t) de componentes continuamente diferenciáveis em [0, 1], com a condição de que Y (0) = Y (1) e que satisfaçam a condição isoperimétrica Z1 ¯ ¯ L(Y ) = ¯y 0 (t)¯dt = l 0 para um l dado. Voltaremos ao estudo deste problema no Capı́tulo 4. 2.4 Problemas de Área de Superfı́cie Em dimensões maiores, um análogo dos problemas geodésicos discutidos anteriormente pode ser formulado da seguinte forma: Encontrar a superfı́cie de área mı́nima que une duas curvas fixas e fechadas em R3 . 2.4.1 Superfı́cie Mı́nima de Revolução Por exemplo, quando as curvas consistem em um par de cı́rculos paralelos “concêntricos”, então pode-se procurar a superfı́cie de revolução que as une e tem área mı́nima ou, de forma equivalente, tentar encontrar a forma de sua curva de contorno. Este problema foi abordado primeiramente por Euler (1744), que empregou o então recente desenvolvimento teórico do Cálculo das Variações em sua solução. Em um sistema de coordenadas apropriado, a área da superfı́cie de revolução que une esses dois cı́rculos é dada por Zb S(y) = 2π Zb y(x) ds(x) = 2π a y(x) a p 1 + y 0 (x)2 dx Capı́tulo 2. Problemas de Área de Superfı́cie 17 em que y(x) é não-negativa, continuamente diferenciável em [a, b], e tal que y(a) = a1 , e y(b) = b1 . Aqui a1 e b1 representam os raios dos cı́rculos de fronteira, um dos quais pode ser degenerado a um ponto. O problema é então obter y(x), com essas propriedades, e que minimiza o funcional S(y). Quando a1 e b1 são comparáveis a b − a, é razoável esperar obter uma curva y(x) com estas propriedades. Entretanto, quando b − a excede em muito a1 e b1 , então a área da superfı́cie pode ser feita tão próxima da área dos dois discos de fronteira quanto desejado — e que essa área provavelmente representa a menor área — mas a curva y(x) associada não é da forma admitida. 2.4.2 Problema de Área Mı́nima Considere o seguinte problema: “dada uma curva γ em R3 , determinar a superfı́cie de menor área que tem γ como fronteira”. Supondo que as superfı́cies admissı́veis possam ser representadas como gráficos de funções u = u(x, y) definidas em um domı́nio comum D ⊂ R2 , então a área de uma dessas superfı́cie é dada por ZZ q S(u) = 1 + u2x + u2y dx dy, D Aqui, admitimos que a fronteira ∂D é “bem-comportada”o suficiente para que a Integral de Riemann de funções contı́nuas esteja definida sobre D, D e sobre ∂D. Com esta notação, o problema é determinar o mı́nimo do funcional S(u) sobre todas as funções u que sejam contı́nuas em¯ D = D ∪ ∂D, continuamente diferenciáveis em D e que tenham valores de fronteira pré-fixados u¯∂D = γ, onde γ é uma função contı́nua. Para este problema, que não tem necessariamente solução, é possı́vel obter alguns resultados parciais sobre a hipótese de que D é um Domı́nio de Green. 2.4.3 O Problema de Plateau Um novo impulso foi dado a esta classe de problemas em 1873, quando o fı́sico-matemático belga Joseph Plateau notou que arames na forma de curvas fechadas, quando mergulhados em solução de sabão e água, poderiam suportar uma fina membrana, a qual, para minimizar a tensão superficial, deveria assumir uma forma associada à superfı́cie de área mı́nima. Estes experimentos têm sido realizados até os dias de hoje e mostram que, para algumas configurações, mais do que um tipo de solução é possı́vel, e em alguns casos as soluções podem mudar de forma à medida que a geometria da curva é alterada. Por exemplo, da discussão sobre superfı́cie de revolução mı́nima acima, esperase que a membrana de sabão que une um par de anéis, inicialmente na forma cilı́ndrica, pode se transformar em um par de discos à medida que os anéis são afastados um do outro. Não vamos abordar matematicamente este problema, já que são necessários conceitos matemáticos que estão fora do alcance deste trabalho. Capı́tulo 3 Espaços Lineares e Variações de Gâteaux Os problemas considerados previamente se reduziam a otimizar (geralmente minimizar) uma função J, de valor real, definida em um subconjunto D de um espaço linear Y. Neste capı́tulo serão estudados problemas neste contexto e serão introduzidas as derivadas direcionais (Varições de Gâteaux), que serão necessárias posteriormente. Inicialmente serão vistos alguns exemplos de espaços lineares pressupondo alguma familiariedade com os conceitos de espaço vetorial real, de continuidade e de diferenciabilidade em Rd . 3.1 Espaços Lineares Reais Todas as funções consideradas neste texto assumem valores reais ou valores vetoriais reais. A principal propriedade de um espaço linear (ou vetorial) de funções reais é conter a soma e a multiplicação por escalar dessas funções. Observamos que a coleção de funções com valores reais f , g definidas em um conjunto D (não vazio) forma um espaço linear real com respeito as operações de adição (f + g)(x) = f (x) + g(x), x ∈ D, e multiplicação por escalar (cf )(x) = cf (x), x ∈ D e c ∈ R. Similarmente, para cada d = 2, 3, · · · , a coleção de todas as funções de valores em Rd definidas no conjunto D forma um espaço linear com respeito às operações de adição e multiplicação por escalar, análogas vetoriais das operações acima. Segue-se que cada subespaço destes espaços, isto é, cada subconjunto que é fechado em relação às operações de adição e multiplicação por escalar, é ele mesmo um espaço linear. Em particular, se a continuidade esta definida em D, então C(D) (= C 0 (D)), definido como o conjunto das funções contı́nuas de valores reais em D, é um espaço linear, pois a soma de funções contı́nuas ou a multiplicação de uma função contı́nua por um escalar é de novo uma função contı́nua. Do mesmo modo, se D é um subconjunto aberto do espaço euclidiano e m = 1, 2, · · · , então C m (D), definido como o conjunto de funções em D com derivadas parciais contı́nuas de ordem 6 m, é um espaço linear real, pois a lei da diferenciação garante que a soma ou a multiplicação por escalar de tais funções é ainda uma funcão desse tipo. Se D é limitado com fronteira ∂D, e D = D ∪ ∂D, então C m (D), definido como o subconjunto de C m (D) ∩ C(D) das funções cujas derivadas parciais de ordem 6 m admitem extensões contı́nuas em D, é um espaço linear real. Por exemplo, se a < b, então (a, b) = [a, b] é um intervalo fechado e limitado. Uma função y, que é contı́nua em [a, b], pertence a C 1 [a, b] se for continuamente diferenciável em (a, b) e sua derivada y 0 possuir limites finitos à direita de a e à esquerda de b. Denotamos por y 0 (a) e y 0 (b), respectivamente, esses valores. Observe que y0 (x) = x3/2 define uma função de C 1 [1, 0], enquanto y1 (x) = x1/2 , não. Finalmente, para d = 1, 2, · · · , [C(D)]d , [C m (D)]d e [C m (D)]d , os conjuntos d-dimensionais de funções vetoriais reais cujas componentes estão em C(D), C m (D) e C m (D), respectivamente, também formam espaços lineares reais. Sabemos que subconjuntos D destes espaços proporcionam domı́nios naturais para otimização das funções apresentadas anteriormente. Porém, em geral, estes subconjuntos não são espaços lineares. Por exemplo, D = {y ∈ C[a, b] ; y(a) = 0, y(b) = 1} não é um espaço linear, pois se y ∈ D então 2y ∈ / D. Por outro lado, D0 = {y ∈ C[a, b] ; y(a) = y(b) = 0} é um espaço linear. Finalmente, lembramos que, em um espaço linear Y, as operações de adição e multiplicação por escalar satisfazem às leis comutativa, associativa e ditributiva. Em particular, há um único vetor O tal que c O = 0 y = O, ∀y ∈ Y, c ∈ R; também adotaremos as abreviações padrões de que 1 y = y e −1 y = −y, ∀y ∈ Y. 19 Capı́tulo 3. Espaços Lineares Reais Exemplo. O funcional do problema da braquistócrona Zx1 p 1 + y 0 (x)2 1 p T (y) = √ dx 2g y(x) 0 p não está definido no conjunto Y = C 1 [0, x1 ] devido do termo y(x) no integrando. Mas, R x1 à presença se restringirmos as funções y(x) de forma que 0 y(x)−1/2 dx seja finito, então a integral acima é finita. De fato, neste caso tem-se que Zx1 p Zx1 1 + y 0 (x)2 1 p p dx 6 M dx < ∞ y(x) y(x) 0 onde M é o valor máximo da função 0 p 1 + y 0 (x)2 em [0, x1 ]. Assim, T (y) está definido no conjunto Zx1 D = {y ∈ Y ; y > 0 y(x)−1/2 dx < ∞}. e 0 Notamos que D não é um subespaço linear de Y, uma vez que a condição y(x) > 0 não é preservada na operação de multiplicação por escalar. Exemplo. Suponha que f ∈ C([a, b] × R2 ). Então, o funcional F (y) dado por Zb f (x, y(x), y 0 (x)) dx F (y) = a 1 está bem definido em Y = C [a, b], tendo em vista que, para cada vetor y ∈ Y, a composta f [y(x)] = f (x, y(x), y 0 (x)) é uma função contı́nua. Entretanto, se f ∈ C([a, b] × D), onde D é um domı́nio de R2 , devemos ter que (y(x), y 0 (x)) ∈ D ∀x ∈ [a, b]. Então, F (y) está bem definido no subconjunto D = {y ∈ C 1 [a, b] ; (y(x), y 0 (x)) ∈ D ∀x ∈ [a, b]}. Exemplo. Para cada d = 1, 2, · · · considere a função de evaluação L(Y ) = Y (a) definida em ¡ ¢d Y= C[a, b] . Esta função, que avalia Y (x) no extremo do intervalo [a, b], é linear, pois, para todo c, c̃ ∈ R e todo Y, Ỹ ∈ Y, tem-se que L(cY + c̃Ỹ ) = (cY + c̃Ỹ )(a) = cY (a) + c̃Ỹ (a) = cL(Y ) + c̃L(Ỹ ) Usando a linearidade da derivada, obtem-se que o funcional L1 (Y ) = Y 0 ( a+b 2 ), definido em ¡ 1 ¢d C [a, b] , é também linear, uma vez que, ∀c, c̃ ∈ R e ∀ Y, Ỹ ∈ Y, L1 (cY + c̃Ỹ ) = (cY + c̃Ỹ )0 ( a+b 2 ) 0 a+b = cY 0 ( a+b 2 ) + c̃Ỹ ( 2 ) = cL1 (Y ) + c̃L1 (Ỹ ) Finalmente, em virtude da linearidade da integral, conclui-se que o funcional L(y) = com y ∈ Y = C[a, b], é também linear, pois, ∀ c, c̃ ∈ R e ∀ Y, Ỹ ∈ Y, Zb L(cy + c̃ỹ) = Zb 3x[cy + c̃ỹ](x) dx = c a a 3xy(x) dx, Zb 3xy(x) dx + c̃ a Rb 3xỹ(x) dx a = cL(y) + c̃L(ỹ) Exemplo. Se J e J˜ são funções de valores reais definidas no subconjunto D de algum espaço linear ˜ eJ e sen J estão também definidos em Y, então, para todo √ c, c̃ ∈ R, tem-se que cJ, cJ + c̃J˜ , J J, −1 D. Entretanto J , J e tan J podem não estar definidos em todo o subconjunto D. 20 Capı́tulo 3. Fundamentos de Otimizaçao 3.2 Fundamentos de Otimizaçao Os extremos de uma função real J, definida em um subconjunto D de um espaço linear Y, são os pontos y0 ∈ D nos quais J assume um mı́nimo, isto é, J(y0 ) 6 J(y) ∀ y ∈ D, ou os pontos de máximo, isto é, J(y0 ) > J(y) ∀ y ∈ D. Como os pontos de máximo de J são os pontos de mı́nimo de −J, basta estudar os pontos de mı́nimo de uma função. Em muitos problemas, além da existência, é de importância a unicidade de pontos extremos. Dizemos que um ponto y0 ∈ D minimiza J unicamente em D se y0 satisfaz J(y0 ) 6 J(y), ∀ y ∈ D e, além disso, a igualdade ocorre R 1 se, e somente se, y = y0 . Por exemplo, para J(y) = 0 y(x)2 dx definido em D = C[0, 1], é claro que y0 (x) = 0 é o único ponto de mı́nimo de J. Lema 3.1. Um ponto y0 ∈ D minimiza J em D se, e somente se, J(y0 + v) − J(y0 ) > 0 para todo y0 + v ∈ D. Além disso, y0 é o único ponto de mı́nimo se a igualdade ocorre apenas para v = O Demonstração. Basta observar que, se y ∈ D, então y = y0 + v com v = y − y0 . Além disso, y = y0 se, e somente se, v = O. ¥ Rb 0 2 Exemplo. Para o funcional J(y) = a y (x) dx, definido no conjunto D = {y ∈ C 1 [a, b] : y(a) = 0, y(b) = 1}, é claro que J(y) > 0. Se existe algum y1 ∈ D tal que J(y1 ) = 0, então y10 = 0, e portanto y1 = c = constante, de onde segue que y1 6∈ D. Assim, J(y) > 0 ∀ y ∈ D. Para determinar o ponto de mı́nimo nesse caso, usando a formulação do lema anterior, para y0 e y0 + v ∈ D, tem-se que Zb [(y00 (x) + v 0 (x))2 − y00 (x)2 ] dx J(y0 + v) − J(y0 ) = a Zb Zb 2 y00 (x) v 0 (x) = a Zb 0 dx + 2 y00 (x) v 0 (x) dx v (x) dx > 2 a a Notar que 0 = y0 (a) = (y0 + v)(a) = v(a), e da mesma forma v(b) = 0. Desta observação, da desigualdade acima e considerando y00 = c, com c constante, tem-se Zb J(y0 + v) − J(y0 ) > 2 c ¯b v 0 (x)dx = c v(x)¯a = 0. a Além disso, para y0 (x) = (x − a)/(b − a), tem-se y00 = c e y0 ∈ D. Pelo lema anterior, y0 minimiza J em D. Além disso, y0 é único, uma vez que, se temos a igualdade J(y0 + v) − J(y0 ) = 0, então, Rb necessariamente a v 0 (x)2 dx = 0, e portanto v 0 (x) = 0, ou seja, v(x) = k, onde k é uma constante. Como v(a) = 0, segue que v = O é o vetor nulo. Proposição 3.2. Um ponto y0 minimiza J em D [unicamente] se,e somente se, para constantes c0 e c 6= 0, y0 minimiza c2 J + c0 em D [unicamente]. Demonstração. Se o ponto y0 minimiza J em D, então, para todo y ∈ D, J(y0 ) 6 J(y), e portanto (c2 J + c0 )(y0 ) 6 (c2 J + c0 )(y), isto é, y0 minimiza c2 J + c0 em D. Reciprocamente, se y0 minimiza c2 J + c0 , então, para y ∈ D, (c2 J + c0 )(y0 ) 6 (c2 J + c0 )(y), de onde segue que J(y0 ) 6 J(y), isto é, y0 minimiza J em D. ¥ Assim, pelo exemplo anterior, y0 (x) = (x − a)/(b − a) também minimiza unicamente o funcional Rb J1 (y) = 3 a (y 0 (x)2 + sen3 (x)) dx = 3J(y) + c0 no mesmo domı́nio D. 21 Capı́tulo 3. Vı́nculos 3.3 Vı́nculos Proposição 3.3. Se o ponto y0 minimiza [unicamente] o funcional J˜ = J + N X λi Gi em i=1 D , onde λ1 , λ2 , . . . , λN são constantes e J, G1 , G2 , . . . , GN são funções definidas em D, então y0 minimiza [unicamente] J restrito ao conjunto D ∩ Gy0 , em que Gy0 = {y ∈ D ; Gi (y) = Gi (y0 ), i = 1, 2, . . . , N }. Demonstração. (3.1) Como y0 minimiza J˜ em D, para cada y ∈ D tem-se ˜ = J(y) + J(y) N X ˜ 0 ) = J(y0 ) + λi Gi (y) > J(y i=1 N X λi Gi (y0 ). i=1 Mas, se y ∈ Gy0 , então J(y) > J(y0 ), já que os termos envolvendo as funções Gi terão os mesmos valores em cada lado da inequação. Logo y0 minimiza J em D quando restrito a Gy0 . ¥ De fato, y0 minimiza J automaticamente em um conjunto muito maior, segundo o corolário a seguir. Corolário 3.4. Nas condições da proposição anterior, y0 minimiza [unicamente] J restrito ao conjunto em D ∩ G∗y0 , em que G∗y0 = {y ∈ D ; λi Gi (y0 ) > λi Gi (y), Demonstração. (3.2) i = 1, 2, . . . , N }. Para y ∈ G∗y0 , a desigualdade (3.1) nos dá J(y) − J(y0 ) > N X [λi Gi (y0 ) − λi Gi (y)] > 0. i=1 Além disso, se y0 minimiza unicamente J˜ em D e y ∈ G∗y0 é tal que J(y) = J(y0 ), então λj Gj (y0 ) = ˜ = J(y ˜ 0 ), de onde segue que y = y0 . λj Gj (y), j = 1, 2, · · · , N , e portanto J(y) ¥ Este resultado ilustra um importante princı́pio, o de que a solução de um problema de minimização pode também nos dar uma solução para outros problemas. Exemplo (Coluna de fluido em rotação). Suponha que um cilindro circular de raio l contenha um certo volume de água em rotação em torno de seu eixo vertical com um velocidade angular constante ω. A figura a seguir ilustra esta situação. A água está sobre a ação da força gravitacional, direcionada verticalmente para baixo, e da força centrı́peta, que tem direção radial. Nessas condições, a superfı́cie da água assume uma forma diferente da inicial, que lembra o interior de um ciclone, sendo que esse movimento preserva o volume e minimiza a diferença entre a energia potencial e a energia cinética do lı́quido (ação). Intuitivamente, pode-se supor que a superfı́cie da água transforma-se em uma superfı́cie de revolução em torno do eixo vertical do cilindro. Introduzindo o sistema de coordenadas como na figura, a secção dessa superfı́cie pelo plano y0x define a curva y0 (x), para x no intervalo [0, l]. A curva y0 (x) é aquela que minimiza o funcional da ação, deduzido a seguir: Particionamos o domı́nio dividindo o seguimento [0, l] em n pedaços. Supondo, por aproximação, que a casca cilı́ndrica correspondente ao pedaço [xi−1 , xi ] possui uma altura constante igual a i hi = y(xi ), onde xi = xi +x , podemos calcular sua energia potencial gravitacional Fi e sua energia 2 cinética Ki . 22 Capı́tulo 3. Vı́nculos Figura 3.1. Coluna de Fluido em Rotação A massa da casca pode ser calculada por: mi = ρVi = ρAi hi , onde Ai = π(x2i − x2i−1 ) = π(xi + xi−1 )(xi − xi−1 ) = 2πxi (xi − xi−1 ) = 2πxi ∆xi é a área do anel, e ρ é a densidade da água. Portanto, denotando por g a aceleração da gravidade, a energia potencial gravitacional será hi = ρπy 2 (xi )xi ∆xi g 2 e a energia cinética, admitindo que a coluna de água se comporte como um corpo rı́gido em rotação, é dada por (vi )2 (ωxi )2 Ki = m i = mi = ρπω 2 x2i y(xi )xi ∆xi . 2 2 Então, na casca Ji = Fi − Ki = πρ[gy 2 (xi ) − ω 2 x2i y(xi )]xi ∆xi , Fi = mi g e, portanto, temos que a ação aproximada de toda coluna será Jn = n X Ji , i=1 que é a soma de Riemman da função f (x) = πρ[gy 2 (x) − ω 2 x2 y(x)]x . Então, quando n → ∞, obtém-se que a ação total do lı́quido é dada por: Zl [gy 2 (x) − ω 2 x2 y(x)]x dx, J(y) = lim Jn = πρ n→∞ 0 cujo domı́nio é o conjunto D = {y ∈ C[0, l] : y(x) > 0}. Por outro lado, o volume do lı́quido é dado por Zl G(y) = 2π xy(x) dx, 0 23 Capı́tulo 3. Vı́nculos uma vez que é o volume de um sólido de rotação. Pela Proposição 3.3, a curva que minimiza o funcional J e preserva o volume G é a mesma que ˜ ˜ minimiza o funcional J(y) = J(y) + λG(y), definido em D. Sabemos que y0 minimiza J(y) se, e ˜ 0 + v) − J(y ˜ 0 ) > 0, ∀y0 + v ∈ D. Portanto, trocando λ por ρλ/2, simplificando e somente se, J(y ˜ 0 + v) − J(y ˜ 0 ), obtém-se usando a abreviação ∆J˜ = J(y Zl ∆J˜ = πρ {g[(y0 + v)2 (x) − y02 (x)] + (λ − ω 2 x2 )v(x)}x dx 0 Zl {gv 2 (x) + [2gy0 (x) + (λ − ω 2 x2 )]v(x)}x dx = πρ 0 Zl [2gy0 (x) + (λ − ω 2 x2 )]v(x)x dx. > πρ 0 e a última integral se anula para todo y0 + v ∈ D se o termo entre colchetes for identicamente nulo, Rl ω 2 x2 − λ ou seja, se y0 (x) = . Além disso, a igualdade ocorre se, e somente se, 0 v 2 (x)x dx = 0, 2g o que implica v(x) ≡ 0. Segue-se que y0 minimiza unicamente J˜ em D. Portanto, a superfı́cie é um parabolóide de revolução. Agora, devemos determinar a constante λ para que o vínculo seja satisfeito: Zl π πl2 ω 2 l2 λ G(y0 ) = (ω 2 x2 − λ)x dx = [ − ] = Gy0 g g 4 2 0 e, então, λ= ω 2 l2 2gGy0 − . 2 πl2 Portanto, ω 2 (2x2 − l2 ) Gy0 + 2. 4g πl Observe que a forma que minimiza a ação depende, como se esperaria, de ω, possuindo altura constante para ω = 0 (tambor parado). Mas, é independente da densidade ρ, e seria a mesma para outro fluido (perfeito) à mesma velocidade angular. y0 (x) = Proposição 3.5. Suponha que f e g sejam contı́nuas em [a, b] × R2 . Suponha ainda que, para alguRb ma função λ ∈ C[a, b], tem-se que y0 minimiza F̃ (y) = a f˜[y(x)]dx em D ⊆ C 1 [a, b] [unicamente], Rb onde f˜ = f + λg. Então y0 minimiza F (y) = a f [y(x)]dx em D [unicamente] sujeito ao vı́nculo (3.3) Demonstração. λ(x) g[y(x)] 6 λ(x) g[y0 (x)] ∀x ∈ [a, b]. Se y ∈ D, então F̃ (y) > F̃ (y0 ), isto é, Zb F (y) + Zb λ(x) g[y(x)] dx > F (y0 ) + a λ(x) g[y0 (x)] dx. a Logo, se y satisfaz 3.3, Zb F (y) − F (y0 ) > λ(x) (g[y0 (x)] − g[y(x)]) dx > 0 a 24 Capı́tulo 3. Variações de Gâteaux Rb Além disso, se F (y) = F (y0 ) com a condição (3.3) acima, então a λ(x) (g[y0 (x)] − g[y(x)]) dx = 0, e F̃ (y) = F̃ (y0 ). Assim, se y0 minimiza F̃ unicamente, então y0 também minimiza F unicamente. ¥ Lamentavelmente este resultado, embora sugestivo, não pode ser implementado rapidamente, já que ele não provê um método para a determinação de uma função λ conveniente. No entanto, o resultado pode ser utilizado a partir de uma solução conhecida de outro problema. Por exemplo, Rb da análise utilizada na aplicação anterior, obtém-se que y0 = x2 − 1 minimiza F̃ (y) = 0 [y 2 (x) + (2 − 2x2 ) y(x)]x dx unicamente em D = C[0, b]. Tomando λ(x) = x na Proposição 3.5, segue que y0 Rb também minimiza F (y) = 0 2x y(x) dx em D unicamente, se sujeito ao vı́nculo Lagrangeano g[y(x)] = y 2 (x) − 2x2 y(x) 6 g[y0 (x)] = 1 − x4 , def onde usamos o fato de λ(x) = x > 0 em [0, b]. 3.4 Variações de Gâteaux No estudo da otimização de funções escalares definidas em subconjuntos de Rd , o conceito de derivada parcial — ou mais geralmente de derivada direcional — desempenha um papel decisivo. Da mesma forma, quando J é um funcional definido num subconjunto de um espaço linear Y qualquer, por exemplo, se Y é o conjunto de todas as funções reais contı́nuas num intervalo [a, b], define-se a chamada variação de Gâteaux, que é uma generalização direta do conceito de derivada direcional. Definição 3.6. Seja J um funcional definido em um subconjunto D de¯ um ¯ espaço linear Y. Assuma que, para y ∈ D e v ∈ Y, existe σ > 0 tal que y + ²v ∈ D para todo ¯²¯ < σ. Então, caso exista, o limite J(y + ²v) − J(y) δJ(y; v) = lim ²→0 ² é chamado Variação de Gâteaux de J em y na direção de v. ∂ É interessante notar que a definição acima coincide com a “derivada ordiária” ∂² J(y + v²) da função ² 7→ J(y + ²v) no ponto ² = 0, isto é, δJ(y; v) = ¯ ∂ J(y + v²)¯²=0 , ∂² caso essa derivada exista. Como era de se esperar, por comparação com a derivada direcional de uma função escalar, a variação de Gâteaux tem as seguintes propriedades: i) Se δI(y; v), δJ(y; v) existem e a, b são números reais, então δ(aI + bJ)(y; v) também existe, e δ(aI + bJ)(y; v) = aδI(y; v) + bδJ(y; v). ii) Se δJ(y; v) existe, então δJ(y; cv) também existe para todo c ∈ R, e tem-se δJ(y; cv) = cδJ(y; v). Esta propriedade garante que, se δJ(y; v) = 0, então δJ(y; cv) = 0 para todo c ∈ Rd . A variação de Gâteaux, assim como a derivada, depende somente do comportamento local do funcional, e pode acontecer de não existir em qualquer direção v 6= 0, ou de existir em algumas direções, mas não em outras. Exemplo. Se J ∈ C 1 (Rd ) e Y, V ∈ Rd , então δJ(Y ; V ) = lim ²→0 J(Y + ²V ) − J(Y ) , ² 25 Capı́tulo 3. Variações de Gâteaux é exatamente a derivada direcional de J no ponto Y e na direção V , em que a direção é geralmente um vetor unitário. Portanto, temos que ® δJ(Y ; V ) = ∇J(Y ), V e isso vale para todo V ∈ Y. Rb Exemplo. O funcional J(y) = a [sen3 x + y 2 (x)] dx está definido em Y = C[a, b]. Assim, para y, v ∈ Y fixas e ² 6= 0, tem-se que y + ²v ∈ Y, já que Y é um espaço linear. Segue-se que J(y + ²v) está definido e, além disso, Zb 1 J(y + ²v) − J(y) = ² ² [(y + ²v)2 (x) − y 2 (x)] dx a Zb =2 Zb v 2 (x) dx. y(x) v(x) dx + ² a a Tomando o limite com ² → 0, concluı́mos que Zb δJ(y; v) = 2 y(x) v(x) dx, ∀ y, v ∈ Y. a Alternativamente, poderı́amos ter obtido esse resultado usando o fato de que δJ(y; v) = ¯ ²v)¯²=0 . Neste caso, ∂ ∂² J(y + Zb [sen3 x + (y + ²v)2 (x)] dx J(y + ²v) = a Zb Zb 2 = J(y) + 2² a ∂ de onde segue que J(y + ²v) = 2 ∂² v 2 (x) dx, y(x) v(x) dx + ² Zb a Zb v 2 (x) dx, e obtemos o mesmo resultado y(x) v(x) dx + 2² a anterior calculando essa derivada no ponto ² = 0. a Em geral, é mais fácil tecnicamente usar o segundo método para calcular δJ em casos concretos porque estamos mais familiarizados com as técnicas de derivar funções reais simples. Zb Exemplo. O funcional J(y) = ¡ ¢ sen y(x) dx + y 2 (b), para o qual a Zb J(y + ²v) = ¡ ¢ sen y(x) + ²v(x) dx + (y + ²v)2 (b), a está definido em Y = C[a, b], e tem, em cada y ∈ Y e em cada direção v ∈ Y, a variação de Gâteaux Zb δJ(y; v) = a ¡ ¢ cos y(x) v(x) dx + 2 y(b) v(b). 26 Capı́tulo 3. Variações de Gâteaux Zπ p Exemplo. O funcional J(y) = 1 − y(x)2 dx não está definido em Y = C[0, π], mas no sub0 ° ° ¯ ¯ ° ° conjunto D = {y ∈ Y ; °y °M 6 1}, onde °y °M = max{¯y(x)¯ ; x ∈ [0, π]}. Assim, se y1 (x) = sen x e y2 (x) = x, ∀ x ∈ [0, π], conclui-se que y1 (x) ∈ D, enquanto que y2 (x) ¯ ¯ 6∈ D. Além disso, para um dado y ∈ Y, somente aquelas direções v para as quais ¯y(x) + ²v(x)¯ 6 1, com ² suficientemente pequeno, devem ser consideradas. Por exemplo, y(x) ≡ 1 ∈ D, entretanto, a única direção possı́vel para y é v(x) ≡ 0. Aplicando então o segundo método ao cálculo da variação de Gâteaux de J(y), assumindo que y + ²v ∈ D, para algum y ∈ D e v ∈ Y, tem-se: ∂ ∂ J(y + εv) = ∂ε ∂ε Zπ p 1 − (y + εv)2 (x) dx 0 0 Zπ =− 0 Zπ p ∂ = 1 − (y + εv)2 (x) dx ∂ε (y + εv)(x) v(x) p dx, 1 − (y + εv)2 (x) Zπ e, para ε = 0, obtem-se que δJ(y, v) = − 0 y(x) v(x) p dx. 1 − y 2 (x) Z1 x(t) y 0 (t) dt está definido em Y = (C 1 [0, 1])2 . Além Exemplo. O funcional da área A(Y ) = 0 disso, se V = (u, v) ∈ Y, então Y + εV também pertence a Y , pois este é um espaço vetorial. Segue que A(Y + εV ) está definido e, usando a abreviação Ã(ε) = A(Y + εV ), Z1 Ã(ε) = ¡ ¢¡ ¢0 x(t) + εu(t) y(t) + εv(t) dt 0 Z1 = ¡ ¢ x(t) y 0 (t) + ε x(t) v 0 (t) + u(t) y 0 (t) + ε2 u(t) v 0 (t) dt. 0 Dessa igualdade segue que ∂ A(Y + εV ) = ∂ε Z1 ¡ ¢ x(t) v 0 (t) + u(t) y 0 (t) + 2ε u(t) v 0 (t) dt 0 e portanto A(Y ) possui, em cada Y ∈ Y e em cada direção V ∈ Y, a variação de Gâteaux ¯ ∂ δA(Y ; V ) = A(Y + εV )¯ε=0 = ∂ε Z1 ¡ ¢ x(t) v 0 (t) + u(t) y 0 (t) dt 0 Exemplo. Para f ∈ C 1 ([a, b] × R2d ), d = 1, 2, 3, . . ., o funcional Zb F (Y ) = a ¡ ¢ f x, Y (x), Y 0 (x) dx = Zb a £ ¤ f Y (x) dx 27 Capı́tulo 3. Funcionais Convexos ¡ ¢d está definido em Y = C 1 [a, b] . Calculando a variação de Gâteaux pelo segundo método, com V ∈ Y, tem-se Zb ¡ ¢ F (Y + ²V ) = f x, (Y + ²V )(x), (Y + ²V )0 (x) dx a e portanto, derivando sob o sinal de integral e usando a Regra da Cadeia, Zb δF (Y ; V ) = ® ® fY [Y (x)], V (x) + fZ [Y (x)], V 0 (x) dx a £ ¤ £ ¤ onde, denotando-se as variáveis por (x, y1 , · · · , yd , z1 , · · · , zd ) ∈ [a, b] × R2d , fY Y (x) e fZ Y (x) são as funções de valores vetoriais de componentes dadas, respectivamente, por £ ¤ ¡ ¢ fyj Y (x) = fyj x, Y (x), Y 0 (x) £ ¤ ¡ ¢ fzj Y (x) = fzj x, Y (x), Y 0 (x) j = 1, 2, . . . , d. 3.5 Funcionais Convexos Recordemos que uma função f , de classe C 1 em Rd , é convexa se satisfaz ® f (Y + V ) − f (Y ) > ∇f (Y ), V ∀ Y, V ∈ Rd , e é estritamente convexa quando a igualdade ocorre se, e somente se, V = O. Recordemos, ainda, ® que a derivada direcional de f é precisamente a sua variação de Gâteaux, isto é, ∇f (Y ), V = δf (Y ; V ). Por analogia, e generalizando este resultado para funcionais, introduzimos a seguinte Definição 3.7. Um funcional real J, definido em um conjunto D de um espaço linear Y, é convexo em D se, para todo y, y + v ∈ D, existe a variação de Gâteaux δJ(y; v) e, além disso, J satisfaz J(y + v) − J(y) > δJ(y; v). O funcional J é estritamente convexo se a igualdade ocorre apenas para v = O. Propriedades análogas às das funções convexas também são válidas para os funcionais convexos, como ilustram as proposições a seguir. Proposição 3.8. Se J e F são funcionais convexos em um subconjunto D de um espaço linear Y, então, para qualquer c ∈ R, c2 J e J + F também são convexos. Além disso, c2 J e J + F são estritamente convexos se J o for. Demonstração. Basta notar que, se y, y + v ∈ D, então ¡ 2 ¢ ¡ ¢ ¡ ¢ c J + F (y + v) − c2 J + F (y) > c2 δJ(y; v) + δF (y; v) = δ c2 J + F (y; v). Logo, se c2 = 1, tem-se a convexidade de J + F , e se F = 0, tem-se a convexidade de c2 J. ¥ Proposição 3.9. Se o funcional J é convexo em D e y0 ∈ D é tal que δJ(y0 ; v) = 0 ∀ y0 + v ∈ D, então y0 minimiza J em D. Se, além disso, J é estritamente convexo, então y0 é o único ponto de mı́nimo de J. Demonstração. Se y ∈ D, definindo v = y − y0 , obtém-se J(y) − J(y0 ) = J(y0 + v) − J(y0 ) > δJ(y0 ; v) = 0, isto é, y0 minimiza J em D. Se J é estritamente convexo, obtém-se que J(y) − J(y0 ) > 0 e portanto y0 é o único ponto de mı́nimo de J em D. ∀ y 6= y0 , ¥ 28 Capı́tulo 3. Funcionais Convexos Zb Exemplo. δJ(y; v) = 2 que Para Rb a o funcional [sen3 x + y 2 (x)] dx J(y) = tem-se a y(x) v(x) dx ∀ y, v ∈ Y = C[a, b]. Logo, J é estritamente convexo em Y, já Zb (y + v)2 (x) − y 2 (x) dx J(y + v) − J(y) = a Zb =2 Zb a Zb v 2 (x) dx > 2 y(x) v(x) dx + a y(x) v(x) dx = δJ(y; v). a Rb e a igualdade ocorre se, e somente se, a v 2 (x) dx = 0, que só é possı́vel se a função contı́nua v 2 (x) for nula. Logo, como y0 = O ∈ Y é tal que δJ(y0 , v) = 0 ∀ v ∈ Y, então y0 minimiza J em Y unicamente. Por outro lado, com o objetivo de minimizar o funcional J em D = {y ∈ C[a, b] ; y(a) = a1 , y(b) = b1 }, devemos obter δJ(y; v) = 0, mas somente para aqueles y, y + v ∈ D, isto é, somente para os v ∈ D0 = {v ∈ C[a, b] ; v(a) = v(b) = 0}. Novamente, y0 = O faria com que δJ(y0 ; v) = 0, mas agora y0 6∈ D, a menos que a1 = b1 = 0. Zb y 0 (x)2 dx , definido no conjunto Y = C 1 [a, b], é tal que Exemplo. O funcional F (y) = δF (y; v) = 2 Rb a a y 0 (x) v 0 (x) dx ∀ y, v ∈ Y. Logo, é também convexo, já que Zb Zb 0 F (y + v) − F (y) = 2 y 0 (x)2 dx (y + v) (x) dx − a a Zb Zb 0 =2 0 y (x) v (x) dx + a Mas agora a igualdade só ocorre se não é estritamente convexo em Y. a 2 y 0 (x) v 0 (x) dx = δF (y; v). v (x) dx > 2 a Rb Zb 0 a v 0 (x)2 dx = 0, isto é, se v(x) = c, onde c ∈ R, e, portanto F Capı́tulo 4 As Equações de Euler-Lagrange A solução de Jakob Bernoulli, em 1696, para o problema da braquistócrona, proposto por seu irmão Johann Bernoulli, marcou o inı́cio das considerações variacionais. Contudo, somente com os trabalhos de Euler e Lagrange é que surgiu a teoria sistemática conhecida hoje. No princı́pio, esta teoria estava restrita apenas à busca de condições necessárias para que a integral Zb Zb ¡ ¢ £ ¤ 0 f x, y(x), y (x) dx = f y(x) dx a a possuı́sse um extremo local no conjunto D ⊆ {y ∈ C 1 [a, b] ; y(a) = a1 e y(b) = b1 }, em que a1 e b1 são valores dados, sendo este, portanto, um problema de extremos fixos. Entretanto, já interessava a Jakob Bernoulli procurar um extremo num conjunto mais amplo, a saber Db ⊆ {y ∈ C 1 [a, b] ; y(a) = a1 }, o qual descreve uma braquistócrona modificada, na qual se deseja saber o tempo mı́nimo de percurso descendente a partir de um ponto fixo até uma barra vertical, porém sem especificar nenhum ponto em particular nessa barra. Este é conhecido como o problema de um extremo livre. Há, também, problemas com as duas extremidades livres, em subconjuntos arbitrários de C 1 [a, b]. Um problema relacionado com o de extremos livres é o de unir curvas fixas, denominadas transversais, no qual poderia ser necessário minimizar a integral de limites variáveis Zx2 F (y, x1 , x2 ) = 0 ¢ Zx2 f x, y(x), y (x) dx = x1 no conjunto ¡ £ ¤ f y(x) dx x1 ¡ ¢ Dτ ⊆ {y ∈ C 1 [x1 , x2 ] ; τ xj , y(xj ) = 0 , j = 1, 2}, onde [x1 , x2 ] ⊆ R, e τj são funções dadas. Todos esses problemas admitem uma formulação variacional comum: se y0 ∈ C 1 [a, b] é, digamos, uma função minimizante local para um desses problemas, então, com uma seleção apropriada de a1 , b1 e D, podemos supor que D ⊆ Db ou D ⊆ Dτ , de acordo com o problema. Em cada caso, y0 é uma função minimizante local para F em D, o problema de extremos fixos considerado inicialmente. Consequentemente, δF (y0 ; v) = 0, para toda direção v ∈ D0 = {v ∈ C 1 [a, b] ; v(a) = v(b) = 0}, tal que δJ(y0 ; v) esteja definida. Quando f é suficientemente diferenciável, há muitas dessas direções para inferir que, em (a, b), y0 é uma solução da Primeira e da Segunda equações de Euler-Lagrange. Estas equações, cujas soluções C 1 são, por definição, as funções estacionárias de f , serão tratadas nas Seções 4.1 e 4.3 a seguir. A liberdade adicional de trabalhar em Db ou em Dτ permite variações em outras direções especificamente relacionadas à liberdade dos pontos extremos, e isto dá origem às correspondentes condições naturais de fronteira que a função extremo deve satisfazer. Problemas envolvendo vı́culos isoperimétricos serão considerados por meio do método dos Multiplicadores de Lagrange, e esta formulação é extendida para solucionar problemas com vı́nculos de Lagrange de uma forma simples. Neste capı́tulo, usaremos em C 1 [a, b] a norma do máximo ° ° ¯ ¯ ¯ ¯ °y ° = max{¯y(x)¯ + ¯y 0 (x)¯ ; x ∈ [a, b]}. M 30 Capı́tulo 4. Primeira Equação: Funções Estacionárias 4.1 Primeira Equação: Funções Estacionárias Suponha inicialmente que a função f = f (x, y, z), juntamente com suas derivadas fy e fz , sejam contı́nuas em [a, b] × R2 . Então, o funcional Zb F (y) = ¡ ¢ f x, y(x), y (x) dx = Zb 0 a £ ¤ f y(x) dx a está definido em Y = C 1 [a, b], e tem, em cada direção v ∈ Y, a variação de Gâteaux Zb δF (y; v) = £ ¤ £ ¤ fy y(x) v(x) + fz y(x) v 0 (x) dx, a £ ¤ £ ¤ onde a notação abreviada f y(x) = f (x, y(x), y 0 (x)), analogamente para fy y(x) e £ usamos ¤ fz y(x) . Para melhor compreender estas variações, usaremos os resultados abaixo. Zb Lema 4.1. Se h ∈ C[a, b] h(x) v 0 (x) dx = 0 e para todo v pertencente a a D0 = {v ∈ C 1 [a, b] ; v(a) = v(b) = 0}, então h é constante em [a, b]. ¢ Rx¡ Demonstração. Para uma constante dada c, tem-se que a função v(x) = a h(t) − c dt pertence a C 1 [a, b], com derivada v 0 (x) = h(x) − c em (a, b) e satisfaz à condição de que v(a) = 0. ¢ Rb¡ Além disso, v(x) pertence a D0 se v(b) = 0, para o que devemos ter a h(t) − c dt = 0, isto é, Rb 1 c = b−a h(t) dt, que é a média de h em [a, b]. Com esta escolha de v e c tem-se, por hipótese, que a Zb Zb Zb ¯b ¡ ¢2 ¡ ¢ 0 0 6 h(x) − c dx = h(x) − c v (x) dx = h(x) v 0 (x) dx − c v(x)¯a = 0. a a a ¡ ¢2 Como o integrando é contı́nuo, concluı́mos que h(x) − c ≡ 0, isto é, h(x) = c em [a, b]. ¥ Zb Proposição 4.2. Se g, h ∈ C[a, b] g(x) v(x) + h(x) v 0 (x) dx = 0 e para todo a v ∈ D0 = {v ∈ C 1 [a, b] ; v(a) = v(b) = 0} então h ∈ C 1 [a, b] e h0 = g. Rx Demonstração. Seja a função G(x) = a g(t) dt para x ∈ [a, b]. Então G ∈ C 1 [a, b] e G0 = g. Integrando por partes e usando a hipótese, obtém-se que, ∀ v ∈ D0 , Zb Zb ¯b ¡ ¢ 0 ¯ 0 = g(x) v(x) + h(x) v (x) dx = G(x) v(x) a + h(x) − G(x) v 0 (x) dx a a Zb = ¡ ¢ h(x) − G(x) v 0 (x) dx a e, pelo Lema 4.1 visto anteriormente, h − G = c é constante em [a, b]. h = G + c ∈ C 1 [a, b] e h0 = G0 = g. Mas então ¥ 31 Capı́tulo 4. Casos Especiais da Primeira Equação Tomando h ≡ 0 na proposição acima, obtém-se o seguinte Zb Corolário 4.3. Se g ∈ C[a, b] e g(x) v(x) dx = 0 para todo v pertencente a Proposição 4.4. Se y ∈ Y é tal£ que¤ δF (y; v) = 0, para todo v pertencente D0 = {v ∈ Y ; v(a) = v(b) = 0}, então fz y(x) ∈ C 1 e, além disso, satisfaz a equação a a D0 = {v ∈ C 1 [a, b] ; v(a) = v(b) = 0}, então g ≡ 0 em [a, b]. Destes resultados obtém-se a ¤ £ ¤ d £ fz y(x) = fy y(x) dx ¯b £ ¤ de onde segue que δF (y; v) = fz y(x) v(x)¯a ∀v ∈ Y. (4.1) x ∈ (a, b), Demonstração. Lembrando que a variação de Gâteaux de F é dada por ¤ £ ¤ 0 Rb £ δF (y; v) =£ a f¤y y(x) v(x) + £fz y(x) usando a¤ Proposição 4.2 acima, com ¤ v (x) dx, £ g(x) = fy y(x) e h(x) = fz y(x) , obtem-se que fz y(x) ∈ C 1 e satisfaz à equação 4.1. Substituindo esta equação na variação de Gâteaux de F , obtem-se Zb δF (y; v) = a ´ ¯b ¤ £ ¤ d ³ £ fz y(x) v(x) dx = fz y(x) v(x)¯a dx ∀v ∈ Y. ¥ Definição 4.5. A equação (4.1) acima é dita Primeira Equação de Euler-Lagrange de f , e as soluções y ∈ C 1 dessa equação em algum intervalo são ditas Funções Estacionárias para f . 4.2 Casos Especiais da Primeira Equação Apesar de toda função y em C 1 ser estacionária para f (x, y, z) = z ou f (x, y, z) = y z, geralmente é difı́cil encontrar soluções para a Primeira Equação de Euler-Lagrange. Contudo, quando uma ou mais variáveis não estão explı́citas, pode-se pelo menos obter uma primeira integral desta equação, como indicado nos três casos que seguem. 4.2.1 Caso em que f = f (z) £ ¤ d Neste caso, f = 0, e a Primeira Equação de Euler-Lagrange reduz-se a ( )f y(x) = 0, ou seja, y z dx £ ¤ fz y(x) = constante. Assim, as funções estacionárias têm derivadas que estão sobre os conjuntos de nı́veis de fz . Em particular, as funções lineares, para as quais y 0 = c, são funções estacionárias. Exemplo. Na caracterização das geodésicas do cilindro circular reto com raio unitário, chegaRθ p se ao problema de minimizar o seguinte funcional L(y) = 0 2 1 + [y 0 (θ)]2 dθ no conjunto D = {y ∈ C 1 [0, θ2 ] ; y(0) = y1 e y(θ2 ) = y2 }. Para esse funcional, tem-se p z , f = f (z) = 1 + z 2 e fz (z) = √ 1 + z2 e portanto, uma condição necessária para que um dado y ∈ D minimize L em D é que y seja y0 estacionário, isto é, p = c, de forma que y 0 = constante. Neste caso, as únicas funções 1 + y0 2 estacionárias são as lineares y(θ) = c1 θ + c2 , que correspondem às hélices circulares do cilindro. Capı́tulo 4. Casos Especiais da Primeira Equação 4.2.2 32 Caso em que f = f (x, z) £ ¤ Neste, fy (x, z) = 0 e a Primeira Equação de Euler-Lagrange reduz-se mais uma vez a fz y(x) = constante. Exemplo. Para a caracterização das geodésicas suaves em uma esfera de raio R, que podem ser parametrizadas, em coordenadas esféricas, por funções θ = y(φ), devemos minimizar o funcional Rφ p L(y) = R 0 1 1 + [y 0 (φ) sen φ]2 dφ, no conjunto D1 = {y ∈ C 1 [0, φ1 ] ; y(φ1 ) = 0}. p 2 Neste£ caso, ¤ f (φ, z) = R 1 + [z sen φ] , e portanto as funções estacionárias são aquelas para as quais fz y(φ) = constante, isto é, £ ¤ R y 0 (φ) sen2 φ fz y(φ) = p = constante 1 + [y 0 (φ) sen φ]2 £ ¤ Em particular, se φ = 0, esta expressão se anula, e portanto fz y(φ) = 0 para todo φ, o que implica em y 0 (φ) = 0. Assim, as funções estacionárias no domı́nio D1 são aquelas que satisfazem y 0 (φ) = 0. 4.2.3 Caso em que f = f (y, z) Para este caso, com as abreviações anteriores, segue da Regra da Cadeia que, se y ∈ C 2 , então ¤ ¢ £ ¤ £ ¤ d ¡ d £ f y(x) = f y(x), y 0 (x) = fy y(x) y 0 (x) + fz y(x) y 00 (x). dx dx Com substituições e cancelamentos vemos que ¤ £ ¤i ¤ £ ¤ d h £ d £ f y(x) − y 0 (x) fz y(x) = f y(x) − y 00 (x) fz y(x) dx dx · ¸ ¤ ¤ £ ¤ d £ d £ 0 0 − y (x) fz y(x) = −y (x) fz y(x) − fy y(x) , dx dx em que o lado esquerdo se anula para as funções estacionárias. Então, em cada intervalo de estacionariedade de y, tem-se f [y(x)] − y 0 (x)fz [y(x)] = constante Reciprocamente, se a equação acima vale em um intevalo em que y 0 não se anula, então y é estacionária. Exemplo. Para a função f (y, z) = y 2 (1 − z)2 , onde a derivada£fz (y, z) = 2 ¤y 2 (z − 1), as funções estacionárias y ∈ C 2 são as soluções da equação y 2 (1 − y 0 )2 − y 0 2 y 2 (y 0 − 1) = constante, a qual, simplificada, resulta em ¡ 2¢ (4.2) y2 1 − y0 = c Fazendo a substituição u = y 2 , de forma que u0 = 2 y y 0 , e substituindo em (4.2) obtem-se que u 2 satisfaz u0 = 4 (u − c), que possui a solução singular ũ0 ≡ c. Para u > c tem-se √ ¡√ ¢0 1 2 u−c u−c = √ u0 = ± √ = ±1 2 u−c 2 u−c √ e integrando esta igualdade obtem-se u − c = x + c1 . Segue-se que a solução geral de (4.2) é dada por (4.3) y 2 (x) = u = (x + c1 )2 + c As constantes c e c1 podem ser encontradas de forma que y satisfaça as condições de fronteira. Por exemplo, as condições y(−1) = 0 e y(1) = 1 conduzem a c1 = 1/4 e c = −(3/4)2 . 33 Capı́tulo 4. Casos Especiais da Primeira Equação p Substituindo estas constantes em (4.3) obtem-se que y0 (x) = (x + 1) (x − 1/2), √ que é de classe C 2 apenas se x > 1/2 ou x < −1. Além disso, a solução singular y0 (x) ≡ c não satisfaz estas condições de fronteira. Por isto, para esta função, não existem funções estacionárias em D = {y ∈ C 2 [−1, 1] ; y(−1) = 0 e y(1) = 1}. Por outro lado, y0 é estacionária para a função f no conjunto √ D1 = {y ∈ C1 [1, 2] ; y(1) = 1 e y(2) = 3/ 2}. Exemplo. Para o problema da braquistócrona, formulado anteriormente, devemos minimizar o funcional Zx1 p 1 + y 0 (x)2 1 p T (y) = √ dx 2g y(x) 0 no conjunto Zx1 D = {0 6 y ∈ Y ; y(0) = 0, y(x1 ) = y1 y(x)−1/2 dx < ∞}. e 0 onde Y = C 1 [0, x1 ]. Neste caso, a menos de um fator constante, √ 1 + z2 z f (y, z) = √ e fz (y, z) = p , y y(1 + z 2 ) e £ as funções estacionárias, de classe C 2 , que satisfazem, pelo caso anterior, a equação ¤ £ ¤ 0 f y(x) − y (x) fz y(x) = constante são as soluções de p ³ ´ 1 + y0 2 y0 1 − y0 q =q = constante √ y 2 y(1 + y 0 ) y(1 + y 0 2 ) 2 Escolhendo a constante como c−1 , obtem-se y (1 + y 0 ) = c2 ou, equivalentemente, r y (4.4) y 0 = 1. c2 − y Para resolver essa equação, introduzimos a variável dependente ¡ ¢ y = c2 sen2 (θ/2) = (c2 /2) 1 − cos(θ) ,para 0 6 θ 6 2π, obtendo c2 − y = c2 cos2 (θ/2) e θ = θ(x) tal que y 0 = c2 sen(θ/2) cos(θ/2) θ0 . Substituindo estas expressões em (4.4), a equação correspondente na variável θ é dada por ¡ ¢ c2 sen2 (θ/2) θ0 = 1, ou ainda, (c2 /2) 1 − cos(θ) θ0 = 1. ¡ ¢ a qual, integrada, resulta em (c2 /2) θ − sen(θ) = x − c1 , para alguma constante c1 . Trocando c2 /2 por c2 , obtem-se as equações paramétricas ½ x = c2 (θ − senθ) + c1 , (4.5) 0 6 θ 6 θ1 y = c2 (1 − cos(θ)). e vemos que as funções estacionárias são aquelas que determinam as curvas ciclóides. Para que y ∈ D, necessitamos que y(0) = x(0) = 0, de onde segue que c1 = 0. As constantes c2 e θ1 < 2π podem ser determinadas de forma que a ciclóide , além de passar pela origem, passe também pelo ponto (x1 , y1 ). Sobre a introdução da variável dependente θ = θ(x), notamos que, como x0 (θ) = c2 (1 − cosθ) > 0 em (0, 2π), então a equação em x pode ser resolvida (implicita¡ ¢ mente) por θ = θ(x) com tantas derivadas quantas forem necessárias. A composta y(x) = y θ(x) é pelo menos C 2 em (0, 2π) e, com exceção do ponto inferior da cicóide, y 0 (x) 6= 0. Destas¡observações ¢ segue que esta função y(x) é estacionária para o problema. Entretanto, na origem, y 0 θ(0) = ∞, e portanto esta função não está em D. Assim, apesar dos resultados obtidos, ainda não resolvemos o problema dentro do contexto a que nos propusemos. 34 Capı́tulo 4. Segunda Equação de Euler-Lagrange 4.3 Segunda Equação de Euler-Lagrange ¡ ¢ Suponha f ∈ C 1 [a, b] × R2 e que y ∈ C 1 [a, b] seja uma solução da Primeira Equação de EulerLagrange em [a, b], isto é, £ ¤ ¤ d £ fz y(x) = fy y(x) . dx (4.6) Usando esta equação e supondo, além disso, y ∈ C 2 , obtém-se que £ £ £ ¤ ¤ ¤ d f [y(x)] = fx y(x) + fy y(x) y 0 (x) + fz y(x) y 00 (x) dx £ ¤ £ ¤i d h 0 = fx y(x) + y (x) fz y(x) dx Da igualdade acima segue que y satisfaz ¤ £ ¤i £ ¤ d h £ f y(x) − y 0 (x) fz y(x) = fx y(x) dx que, integrada, resulta em (4.7) £ ¤ £ ¤ f y(x) − y 0 (x) fz y(x) = Zx £ ¤ fx y(t) dt + c a para alguma constante c. Esta última equação é chamada de Segunda Equação de Euler-Lagrange e, para obtê-la, foi necessário supor y de classe C 2 , embora o termo y 00 não esteja explı́cito em (4.7). De fato, para o ¤ Rb £ funcional F (y) = a f y(x) dx definido em D = {y ∈ C 1 [a, b] ; y(a) = a1 e y(b) = b1 }, mostra-se (ver página 154 de [1]) a seguinte ¡ ¢ Proposição 4.6. Se f ∈ C 1 [a, b] × R2 e y0 ∈ D é um extremo local do funcional F em D então y0 satisfaz a Segunda Equação de Euler-Lagrange £ ¤ £ ¤ f y(x) − y 0 (x) fz y(x) = Zx £ ¤ fx y(t) dt + c a em [a, b], para alguma constante c. Em particular, se f = f (y, z), obtém-se o resultado do 3o caso considerado anteriormente (subseção 4.2.3, página 32), sem a hipótese adicional de que y seja de classe C 2 . Exemplo. Para o funcional J, que D = {u ∈ C 1 [a, b] ; u(a) = a1 e u(b) = b1 }, onde Zb · J(u) = a está definido no conjunto ¸ 1 0 2 u (t) − cos u(t) dt, 2 a função f é dada por f (x, y, z) = (1/2)z 2 − cos(y), e portanto fx ≡ 0, fy = sen(y) e fz = z. Logo, de acordo com o resultado acima, um extremo local u de J em D satisfaz à equação ¡ ¢ ¡ ¢ 1 1 0 2 u (x) − cos u(x) − u0 (x)2 = − u0 (x)2 − cos u(x) = c, 2 2 2 que é uma forma integrada da conhecida equação do pêndulo. £ 00 De fato,¡supondo ¢¤ u de classe C e 0 não constante, derivando essa equação obtém-se que −u (x) u (x) − sen u(x) = 0, de onde segue que ¡ ¢ u00 (x) − sen u(x) = 0, que é a forma usual da equação que rege o movimento pendular. 35 Capı́tulo 4. Condições Naturais de Contorno 4.4 Condições Naturais de Contorno No estudo dos pontos crı́ticos de uma função real J sobre D ⊂ Y, em que Y é¯ um espaço linear normado, é natural considerarmos, para cada y ∈ D, as direções v ∈ Y nas quais J ¯D admite variação em y, isto é, as direções v tais que y + εv ∈ D para todo ε suficientemente pequeno e δJ(y; v) existe. Tais direções serão chamadas D-admissı́veis em y (para J). Nosso objetivo agora é apresentar condições necessárias para minimizar o funcional Zb F (y) = ¡ ¢ f x, y(x), y 0 (x) dx a restrito ao domı́nio Da = {y ∈ C 1 [a, b] ; y(b) = b1 }, no qual o valor de y no ponto a não está especificado. Sabemos que, se y é um extremo local para F , então δF (y; v) = 0 para todo v Da –admissı́vel em y. Se f , fy e fz são funções contı́nuas em [a, b] × R2 , então todo v ∈ D0a = {v ∈ C 1 [a, b] ; v(b) = 0} é Da –admissı́vel, e, da Proposição 4.4, segue que ¯b £ ¤ £ ¤ 0 = δF (y; v) = fz y(x) v(x)¯a = −fz y(a) v(a) ∀ v ∈ D0a . Uma vez que v(x) = b − x é um elemento de D0a para o qual v(a) 6= 0, concluı́mos que, se y é £um ponto extremo para F em Da , então y deve satisfazer à condição natural de contorno ¤ fz y(a) = 0.£ Analogamente, se y minimiza F em Db = {v ∈ C 1 [a, b] ; y(a) = a1 }, então y deve ¤ satisfazer fz y(b) = 0. Naturalmente, se y minimiza F em Y = C 1 [a, b], então as duas condições acima são satisfeitas. Podemos fazer uma aplicação interessante dos comentários anteriores ao problema da braquistócrona com um dos extremos livre. Considere então o problema de minimizar o funcional s Zx1 1 + y 0 2 (x) 1 T (y) = √ dx. y(x) 2g 0 ¢−1/2 R x1 ¡ em D1 = {0 6 y ∈ C 1 [0, x1 ] ; y(0) = 0 e y(x) dx < ∞}. Conforme as observações 0 anteriores, um mı́nimo y de T deve satisfazer a condição natural de contorno , isto é, £ ¤ 0 = fz y(x1 ) = q y 0 (x1 ) £ ¤. y(x1 ) 1 + y 0 2 (x1 ) de onde segue que y 0 (x1 ) = 0, isto é, o gráfico de y deve interceptar a reta x = x1 ortogonalmente. 4.5 Multiplicadores de Lagrange Como observado anteriormente, vı́culos nos pontos de fronteira não afetam a estacionariedade dos ¢ Rb ¡ possı́veis extremos para funcionais como F (y) = a f x, y(x), y 0 (x) dx, mas controlam as condições de fronteira que os extremos devem satisfazer. Entretanto, frequentemente, são encontrados vı́culos que operam sobre todo o intervalo [a, b]. Quando esses vı́nculos podem ser expressos na forma de uma integral, digamos, exigindo que ¢ Rb ¡ 0 G(y) = a g x, y(x), y (x) dx assuma um valor prescrito, então o método dos Multiplicadores de Lagrange pode ser empregado, como ilustra o resultado a seguir, onde usamos a notação acima e cuja demonstração pode ser encontrada na página 161 de [1]. Teorema 4.7. Suponha que f = f (x, y, z) e g = g(x, y, z), juntamente com suas derivadas parciais nas variáveis y e z, sejam contı́nuas em [a, b] × R2 . Seja y0 um extremo local para F (y) no domı́nio D = {y ∈ C 1 [a, b] ; y(a) = a1 e y(b) = b1 }, restrito ainda ao vı́nculo Gy0 = {y ∈ C 1 [a, b] ; G(y) = G(y0 )}. 36 Capı́tulo 4. Funções Estacionárias com Valores Vetoriais Então, se a variação de Gâteaux δG(y0 ; v) não se anula identicamente em D0 = {v ∈ C 1 [a, b] ; v(a) = v(b) = 0}, existe λ ∈ R tal que y0 é estacionária para a função modificada f˜ = f + λg, isto é, y0 é a solução da equação ¤ £ ¤ d ˜£ fz y(x) = f˜y y(x) dx 4.6 x ∈ (a, b). Funções Estacionárias com Valores Vetoriais Para examinar se uma curva, não necessariamente gráfico de uma função, pode representar matematicamente a braquistócrona, ou para procurar geodésicas sobre uma superfı́cie em geral, devemos utilizar integrais dependentes de funções vetoriais. É também o caso para o Problema de Dido, que agora estamos interessados em estudar do ponto de vista do Cálculo das Variações. ¡ ¢d Como exemplo, considere o espaço linear Y = C 1 [a, b] , de elementos 0 0 0 0 Y = (y , y , . . . , y ), tendo derivadas contı́nuas Y = (y , y , . . . , y ) com norma dada por 1 2 d 1 2 ° ° ¯ ¯ ¯ ©¯ ª ¡d ¢ °Y ° = max ¯Y (x)¯ + ¯Y 0 (x)¯ ; x ∈ [a, b] . Neste caso, dados f ∈ C 1 [a, b] × R2d e A, B ∈ Rd , a fim de caracterizar as funções Y0 ∈ Y que são extremos locais do funcional Zb F (Y ) = ¡ ¢ f x, Y (x), Y 0 (x) dx = a Zb £ ¤ f Y (x) dx a ¡ ¢d no domı́nio D = {Y ∈ C 1 [a, b] ; Y (a) = A e Y (b) = B}, devemos considerar as direções vetori¡ ¢d ais em D0 = {V ∈ C 1 [a, b] ; V (a) = V (b) = O}, de maneira inteiramente análoga ao caso já considerado anteriormente. Além disso, devemos verificar se ε = 0 é ponto crı́tico das funções reais ε 7→ F (Y0 + εV ) para V ∈ D0 e ε ∈ R suficientemente pequeno, isto é, se Y0 satisfaz δF (Y0 ; V ) = 0 ∀V ∈ D0 . Com a notação f (x, Y, Z) = f (x, y1 , . . . , yd , z1 , . . . , zd ), e usando a regra de Leibniz para diferenciação sob a integral, de forma inteiramente análoga à anterior obtém-se que ¯ ∂ F (Y + εV )¯ε=0 ∂ε Zb £ ¤ ® £ ¤ ® = fY Y (x) , V (x) + fZ Y (x) , V 0 (x) dx, δF (Y ; V ) = a onde fY e fZ são as funções de valores vetoriais com componentes fyj e fzj , respectivamente, j = 1, . . . , d. Com esta notação, tem-se o ¡ ¢ ¡ ¢d Teorema 4.8. Se f = f (x, Y, Z) ∈ C 1 [a, b] × D para um domı́nio D ⊂ R2d e Y0 ∈ Y = C 1 [a, b] é um extremo local do funcional F (Y ) no domı́nio ¡ ¢ D = {y ∈ Y ; Y (a) = Y0 (a), Y (b) = Y0 (b) e Y (x), Y 0 (x) ∈ D}, então Y0 satisfaz ao sistema de equações (4.8) £ ¤ £ ¤ d fZ Y (x) = fY Y (x) em (a, b), isto é, dx £ ¤ £ ¤ d fz Y (x) = fyj Y (x) dx j j = 1, 2, . . . , d Demonstração. Para D = R2d , o resultado é uma generalização imediata dos argumentos apresentados na demonstração da Proposição 4.4. Aqueles argumentos também se aplicam ao caso que estamos considerando se todas as direções V ∈ D0 = {V ∈ Y ; V (a) = V (b) = 0} são D-admissı́veis em Y0 . Mas isto é verdade para todo domı́nio aberto D ⊂ R2d , devido à compacidade ¡ do intervalo¢ [a, b], e faremos apenas um esquema desse argumento: para cada x ∈ [a, b], o ponto Y0 (x), Y00 (x) 37 Capı́tulo 4. Aplicação 1: O Problema de Dido é o centro de uma vizinhança esférica ⊆ D, de raio positivo maximal r(x) 6 1. Além disso, a continuidade de Y0 e Y00 em [a, b] garante que r ∈ C[a, b]; segue que r(x) assume um mı́nimo ° valor ° em algum x0 , isto é, r(x) > r(x0 ) = r0 > 0. Portanto, se ε < r0 e V ∈ D0 , com °V ° 6 1, então Y0 + εV ∈ D, e concluı́mos que todas estas direções são D-admissı́veis em Y0 . ¥ Definição 4.9. A equação (4.8) é dita de Euler-Lagrange com valores vetoriais, e suas soluções de classe C 1 são chamadas funções estacionárias para a função f . Mostramos acima que, se δF (Y : V ) = 0 ∀ V ∈ D0 , então Y é estacionária para f em (a, b). Reciprocamente, supondo Y estacionária para f em (a, b) e V ∈ D0 , de (4.8) segue que Zb δF (Y ; V ) = £ ¤ ® £ ¤ ® fY Y (x) , V (x) + fZ Y (x) , V 0 (x) ] dx a Zb = a ¤ ® £ ¤ ®¯¯b d £ fZ Y (x) , V (x) dx = fZ Y (x) , V (x) ¯ ≡ 0. dx a Assim, Y é estacionária para f em no intervalo (a, b) se, e somente se, δF (Y : V ) = 0 ∀ V ∈ D0 . Para considerar condições de fronteiras mais gerais (ou restrições da forma G(Y ) = constante), podemos empregar o método dos Multiplicadores de Lagrange. Em vista do Teorema 4.7, esperamos ¯ caracterizar cada extremo local Y0 de F ¯D , quando restrito a GY0 , por um λ ∈ R para o qual δ(F + λG)(Y0 ; V ) = 0 ∀ V ∈ D0 . Em particular, se a restrição da função G é definida por uma integral na forma G(Y ) = Zb ¡ ¢ g x, Y (x), Y 0 (x) dx, então Y0 é estacionária para a função modificada f + λg, e portanto satisfaz a a correspondente equação de Euler-Lagrange £ ¤ £ ¤ d (f + λg)Z Y (x) = (f + λg)Y Y (x) . dx Segundo ainda o Teorema 4.7, esses resultados são válidos desde que a variação de Gâteaux de G exista para Y ∈ D e, no ponto estacionário Y0 , δG(Y0 , V ) não se anule identicamente para V ∈ D0 . Estas observações serão usadas no estudo do Problema de Dido, a seguir. 4.7 Aplicação 1: O Problema de Dido Segundo o problema isoperimétrico de Dido, apresentado no Capı́tulo 2 (página 13), devemos maximizar o funcional da área Z1 A(Y ) = £ ¤ f Y (t) dt = Z1 0 x(t) y 0 (t) dt 0 sujeito ao vı́nculo isoperimétrico Z1 L(Y ) = 0 £ ¤ g Y (t) dt = Z1 ¯ 0 ¯ ¯Y (t)¯ dt = l 0 onde l é um número real fixo. Por conveniência, estamos agora usando “t”como variável independente, e não “x”, como anteriormente. Usamos ainda notações ligeiramente diferentes da Seção p anterior, a saber: f = f (t, x, y, x0 , y 0 ) = x y 0 e g = g(t, x, y, x0 , y 0 ) = x0 2 + y 0 2 . 38 Capı́tulo 4. Aplicação 2: Geodésicas em Superfı́cies ¡ ¢ As curvas Y (t) = x(t), y(t) consideradas são de classe C 1 em [0, 1] e fechadas, isto é, Y (0) = Y (1), e, sem perda de generalidade, podemos supor que as curvas iniciem e terminem na origem O. Assim, o domı́nio natural do funcional A é o conjunto D = {Y ∈ Y ; Y (0) = Y (1) = O} ¡ ¢2 em que Y = C 1 [0, 1] . Já vimos que Z1 x(t) v 0 (t) + y 0 (t) u(t) dt, δA(Y ; V ) = 0 Z1 e não é dificil verificar que δL(Y ; V ) = 0 ¯ 0¯ Y 0 (t) ® 0 ¯ ¯ ¯ ¯ ¯Y 0 (t)¯ , V (t) dt, para as curvas que satisfazem Y 6= 0 em [0, 1]. Desta forma, como a função g não é de classe C 1 em vizinhança da origem, não podemos aplicar o método dos Multiplicadores de Lagrange como enunciado anteriormente. Entretanto, pode-se mostrar (conf. [1]) que o método pode ser aplicado se restrito ao domı́nio ¯ ¯ D∗ = {Y ∈ D ; ¯Y 0 (t)¯ 6= 0 ∀ t ∈ [0, 1]}. Este domı́nio é de fato apropriado, uma vez que, se Y ∈ D∗ for tal¯ que ¯ δL(Y ; V ) = 0 ∀ V ∈ D0 , então, por um argumento análogo ao do Lema (4.1), obtem-se Y 0 /¯Y 0 ¯ = constante em [a, b]. Mas isto, juntamente com a condição Y (0) = Y (1), implica Y ≡ 0 6∈ D∗ . Desta maneira, para Y ∈ D∗ , δL(Y ; V ) não se anula identicamente, e podemos aplicar o método dos Multiplicadores de Lagrange. Assim, se Y0 maximiza o funcional A localmente no domı́nio D∗ , quando restrito ao vı́nculo L(Y ) = l, então existe λ ∈ R tal que ¯ ¯δ(A + λL)(Y0 ; V ) = 0 ∀ V ∈ D0 e, portanto, Y0 é estacionário para a função f + λg = x y 0 + λ¯Y 0 ¯, isto é, satisfaz as equações de Euler-Lagrange associadas: à à ! ! λ y0 d λ x0 d 0 ¯ ¯ =y x + ¯¯ 0 ¯¯ = 0. e dt ¯Y 0 ¯ dt Y ¯ ¯¢ ¯ ¯¢ ¡ ¡ Segue-se que y − λx0 /¯Y 0 ¯ = c2 e x + λy 0 /¯Y 0 ¯ = c1 , para c1 e c2 constantes. Assim, c2 y 0 + c1 x0 = y y 0 + x x0 ou, após integrar e avaliar em t = 0, x2 + y 2 − 2c1 x − 2c2 y = constante = 0. Completando os quadrados na equação acima, isso resulta em (x − a)2 + (y − c)2 = c21 + c22 . Percebe-se, assim, que a curva representada por Y0 está contida em um cı́rculo de raio r, com r2 = c21 + c22 e, devido ao comprimento l, deve-se ter r = l/2π. Como a curva é fechada, o cı́rculo tem que ser contornado ao menos uma vez, sendo que a maximização de A para um comprimento l dado, requer que o cı́rculo seja contornado somente uma vez. Além disso, A não pode assumir um mı́nimo em D∗ (ou em D). Assim, obtivemos fortes evidências, mas ainda não demonstramos inteiramente, que o cı́rculo é a curva que maximiza a área, afirmação também conhecida como Conjectura de Pappus. 4.8 Aplicação 2: Geodésicas em Superfı́cies Para o estudo de geodésicas em superfı́cies, usaremos o Teorema a seguir a respeito dos vı́nculos de Lagrange, cuja demonstração pode ser encontrada em [1]. ¡ ¢ Teorema 4.10. Sejam f e fzj ∈ C 1 [a, b] × R2d , j = 1, 2, . . . , d e suponha que Y0 é C 2 e mı́nimo Zb ¡ ¢ ¡ ¢d local de F (Y ) = f x, Y (x), Y 0 (x) dx em D = {Y ∈ C 1 [a, b] ; Y (a) = Y0 (a) e Y (b) = Y0 (b)}, a sujeito ainda ao vı́nculo ¡ ¢ g Y (x) ≡ 0 ∀ x ∈ [a, b], Capı́tulo 4. Aplicação 2: Geodésicas em Superfı́cies 39 ¡ ¢ em que g = g(Y ) é uma função C 2 para a qual ∇g Y0 (x) 6= O ∀ x ∈ [a, b]. Então existe uma função λ ∈ C[a, b] tal que Y0 é estacionária para a função modificada f + λg. Em geral, o conjunto S = {Y ∈ R3 ; g(Y ) = O} descreve uma superfı́cie em R3 , que é regular se ∇g(Y ) 6= O para todo Y ∈ S. Supondo g de classe C 2 , o teorema acima pode ser usado para ¯ ¡ ¢3 Rb¯ minimizar o funcional comprimento de arco L(Y ) = a ¯Y 0 (t)¯ dt sobre as curvas Y ∈ C 1 [a, b] que estão em S e, além disso, ligue dois pontos fixos, digamos A, B ∈ S. Assim, se Y0 , de classe C 2 , minimiza L sobre todas as curvas nestas condições, então, pelo teorema, existe uma função λ ∈ C[a, b] para a qual Y0¯ é¯ estacionária para a função modificada f + λg, onde, no caso do funcional L, f (t, Y, Z) = ¯Z ¯. Segue-se que Y0 satisfaz à equação £ ¤i £ ¤ dh de Euler-Lagrange vetorial (f + λg)Z Y (t) = (f + λg)Y Y (t) , que, neste caso, se reduz a dt ¤¢ £ ¤ d¡ £ fZ Y (t) = (λgY ) Y (t) , uma vez que fY ≡ gZ ≡ 0. Calculando, obtém-se que a equação é dt ! à ¡ ¢ d Y0 ¯ ¯ (t) = λ(t) ∇g Y (t) . 0 ¯ ¯ dt Y ¯ ¯ Ao longo de Y0 , podemos usar o comprimento de arco s como parâmetro. Então ¯Y00 (s)¯ ≡ 1, e, ¡ ¢ para um novo valor de λ, a equação acima se torna Y000 (s) = λ(s) ∇g Y0 (s) , o que mostra que, em geral, a normal principal a uma geodésica sobre uma superfı́cie está na direção do vetor gradiente (não-nulo) e, portanto, é normal à superfı́cie em cada ponto. Observe que não estabelecemos a existência de geodésicas para superfı́cies em geral, mas obtivemos uma valiosa compreensão do modo como as geodésicas devem estar sobre a superfı́cie. Bibliografia [1] John L. Troutman — Variational Calculus and Optimal Control. Second Edition, Springer-Verlag, New York, 1996. iv, 34, 35, 38 [2] Keti Tenenblat — Introdução a Geometria Diferencial. Editora UnB, Brası́lia, 1990. 11 [3] V. M. Tikhomirov — Stories about Maxima and Minima. Mathematical World - Volume 1, AMS, 1990. [4] J. E. Marsden, A. J.Tromba — Vector Calculus. W.H. Freeman and Company, N.Y, 1996. 16 [5] E. L. LIMA — Topologia do Espaços Métricos. IMPA, Rio de Janeiro, 1977. [6] E. L. LIMA — Curso de Análise Vol. 1. IMPA, Rio de Janeiro, 1977. 2 [7] E. L. LIMA — Curso de Análise Vol. 2. IMPA, Rio de Janeiro, 1977. Índice Remissivo 2a equação de Euler-Lagrange definição 34 Aristóteles, iv bola de gude, 4 ciclóide, 33 Euler, 12, 29 estudo das geodésicas, 11 estudo das superfı́cies mı́nimas, 16 problema isoperimétrico, 13 Euler-Lagrange 1a equação, 31, 32, 34 1a equação — definição, 31 2a equação, 34 equação vetorial, 39 equação vetorial — definição, 37 funções estacionárias definição, 31 Gauss, 11 integral de Riemann, 17 Jakob Bernoulli, 12, 13, 29 Johann Bernoulli, 11, 12, 29 Lagrange, 29 estudo das geodésicas, 11 Leibniz, 12, 36 multiplicadores de Lagrange, 29, 35, 37, 38 Newton, 12, 13 Pappus conjectura de, 38 problema de área mı́nima, 17 problema de Dido, 13, 14, 16, 36, 37 problema de Plateau, 17 problema isoperimétrico de Euler, 13 solução de sabão, 17 vı́nculos de Lagrange, 29, 38 variação de Gâteaux definição, 24