Trabalhos de Graduação
Volume ? – Departamento de Matemática - UnB
UnB
Departamento de Matemática
UnB
Trabalhos de Graduação em Matemática n.o 2/98
Realização
• Aline G. da Silva Pinto • Carlos Eduardo Cunha • Cleida de
Assis Coutinho • Daniela Amorim Amato • Edson da Costa Júnior
• Josimar da Silva Rocha • Lucas Seco • Marcelo Santos Novais • Marcos Vinı́cius B. T. Lima • Marcus Vinı́cius T. Borba • Olı́mpio Ribeiro
Gomes • Roberto dos Santos M. Oliveira • Santiago Prado P. Fortes •
Solange Maria da C. Gonçalves • Thales Filipe D. de Souza • Wescley
Well V. Bezerra
Introdução ao
Cálculo das Variações
Orientação
Celius Magalhães
Revisão e Editoração: Mauro Patrão, Roberto Oliveira e Lucas Seco
Capa: Lucas Seco
Sumário
Lista de Figuras
iii
Prefácio
iv
1 Revisão de Otimização em Rd
1.1 Exercı́cios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2 Problemas Clássicos de Otimização
2.1 Problemas Geodésicos . . . . . . . . .
2.2 Problemas de Tempo de Trânsito — A
2.3 Problemas Isoperimétricos . . . . . . .
2.4 Problemas de Área de Superfı́cie . . .
3 Espaços Lineares e Variações de
3.1 Espaços Lineares Reais . . . . .
3.2 Fundamentos de Otimizaçao . .
3.3 Vı́nculos . . . . . . . . . . . . .
3.4 Variações de Gâteaux . . . . .
3.5 Funcionais Convexos . . . . . .
4 As
4.1
4.2
4.3
4.4
4.5
4.6
4.7
4.8
. . . . . . . . .
Braquistócrona
. . . . . . . . .
. . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7
7
11
13
16
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
18
18
20
21
24
27
Equações de Euler-Lagrange
Primeira Equação: Funções Estacionárias .
Casos Especiais da Primeira Equação . . . .
Segunda Equação de Euler-Lagrange . . . .
Condições Naturais de Contorno . . . . . .
Multiplicadores de Lagrange . . . . . . . . .
Funções Estacionárias com Valores Vetoriais
Aplicação 1: O Problema de Dido . . . . . .
Aplicação 2: Geodésicas em Superfı́cies . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
29
30
31
34
35
35
36
37
38
Bibliografia
Gâteaux
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
1
6
40
Lista de Figuras
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
2.10
2.11
Coordenadas Esféricas . . . . . . . . . . . .
Um Caminho Ligando A e B na Esfera . . .
Uma Geodésica no Cilindro . . . . . . . . .
Uma Geodésica no Cone . . . . . . . . . . .
Sistema de Coordenadas e a Braquistócrona
Problema de Dido — Analogia Fı́sica. . . .
Problema de Dido — Solução Geométrica A
Problema de Dido — Solução Geométrica B
Problema de Dido — Solução Geométrica C
Problema de Dido — Solução Geométrica D
Problema de Dido — Solução Geométrica E
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
8
9
10
11
12
14
15
15
15
15
15
3.1
Coluna de Fluido em Rotação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
Prefácio
O objetivo inicial dessas notas, redigidas pelos participantes das atividades do PET durante o
segundo perı́odo letivo de 1998, foi de favorecer a capacidade de produção de textos em matemática.
Essa atividade, muitas vezes relegada a um segundo plano nos cursos de graduação, é de extrema
importância no processo de aprendizagem, por permitir que o estudante alcance um conhecimento
estruturado, sem a fragmentação que muitas vezes ocorre nos cursos tradicionais.
Uma vez redigidas, esperamos que possam ser de utilidade aos estudantes interessados em um
primeiro contato com essa importante área da Matemática. De fato, com origens que remontam
a questões formuladas por Aristóteles e Zenodoro, o Cálculo das Variações teve seus princı́pios
básicos formulados por Newton, os Bernoullis, Euler e Lagrange, entre outros, e ainda hoje é capaz
de atrair a atenção de matemáticos como Ambrosseti, Brezis,Chang e Rabinowitz. Desejamos que
essas notas possam sugerir ao leitor o fascı́nio que esta área da Matemática tem exercido sobre os
melhores matemáticos.
Com a intenção de sublinhar a semenhança com o Cálculo usual, o texto tem inı́cio com uma
breve revisão de otimização em Rd , enfatizando as condições suficientes para a existência de máximos
e de mı́nimos e o conceito de derivada direcional. Em seguida, são introduzidos os conceitos próprios
do Cálculo das Variações, como espaços de funções, funcionais definidos em subconjuntos destes
espaços, variações de Gâteaux e equações de Euler-Lagrange escalares e vetoriais. Foram incluı́dos
vários exemplos, que tanto ajudam na compreensão destes conceitos como ilustram sua importância.
A bibliografia básica utilizada foi o excelente texto de Troutman, Variational Calculus and Optimal
Control [1], além de outros em que se procurou esclarecer alguns conceitos especı́ficos.
Finalmente, gostaria de agradecer ao Departamento de Matemática pelo apoio dado ao PET
em todas as suas atividades, e em particular na divulgação dessas notas.
Celius A. Magalhães
Tutor PET/MAT/UnB
Capı́tulo 1
Revisão de Otimização em Rd
Neste capı́tulo, apresentamos um breve resumo dos resultados básicos relacionados à caracterização
de valores máximos e mı́nimos de uma função f definida num conjunto de Rd com valores em R.
Para d = 1, 2, 3..., seja Rd o espaço Euclidiano d-dimensional. Neste espaço definem-se:
i) a norma de um vetor X = (x1 , x2 , ..., xd ) por:
d
¯ ¯ ³X
¯ ¯2 ´1/2
¯X ¯ =
¯x j ¯
, que é positiva a menos que X seja o vetor nulo X = O = (0, 0, 0, ..., 0);
j=1
def
ii) a soma de dois vetores, X = (x1 , x2 , ..., xd ) e Y = (y1 , y2 , ..., yd ), por: X + Y = (x1 + y1 , x2 +
y2 , ..., xd + yd );
def
iii) a multiplicação por escalar como aX = (ax1 , ax2 , ..., axd ), ∀a ∈ R.
­
® def
A norma de X pode ser expressa utilizando-se o produto interno, isto é, o produto X, Y =
d
X
¯ ¯ q­
®
xj yj . De fato, tem-se ¯X ¯ =
X, X para todo X ∈ Rd . É possı́vel verificar que este produto
j=1
tem as propriedades
­
®
­
®
i) X, X > 0 , ∀X ∈ Rd e X, X = 0 ⇔ X = O;
­
® ­
®
ii) X, Y = Y, X , ∀X, Y ∈ Rd ;
­
®
­
® ­
®
iii) aX + Y, Z = a X, Z + Y, Z , ∀a ∈ R, ∀X, Y e Z ∈ Rd
Usando-se estas propriedades, pode-se demonstrar a Desigualdade de Cauchy-Schwarz, como
segue.
¯­
®¯
d
¯
¯
¯Lema
¯ ¯ ¯1.1 (Desigualdade de Cauchy-Schwarz). Para todo X, Y ∈ R , tem-se que X, Y 6
¯X ¯ ¯Y ¯.
Demonstração.
¯ ¯
¯ ¯
Seja C o vetor dado por C = ¯Y ¯ X − ¯X ¯ Y . Então,
¯ ¯2 ­¯ ¯
¯ ¯
¯ ¯
¯ ¯ ®
¯ ¯2 ¯ ¯2 ¯ ¯¯ ¯­
®
0 6 ¯C ¯ = ¯Y ¯ X − ¯X ¯ Y , ¯Y ¯ X − ¯X ¯ Y = 2(¯X ¯ ¯Y ¯ − ¯X ¯¯Y ¯ Y, X )
de onde segue o resultado.
¥
¯
¯
A Desigualdade de Cauchy-Schwarz é usada para provar a Desigualdade Triangular: ¯X + Y ¯ 6
¯ ¯ ¯ ¯
¯
¯ ¯
¯
¯X ¯ + ¯Y ¯, que também pode ser escrita na forma ¯|X| − |Y |¯ 6 ¯X − Y ¯, onde X − Y def
= X + (−1)Y
¯
¯
e ¯X − Y ¯ define a Distância Euclidiana entre X e Y .
No que se segue, apresentamos algumas definições para subconjuntos de Rd e, a não ser que
especificado diferentemente, usaremos “D”para indicar estes subconjuntos.
d
Definição
1.2
¯
¯ (Esfera aberta). Seja X0 ∈ R e δ > 0. Então o conjunto Sδ (X0 ) = {X0 ∈
d ¯
¯
R ; X − X0 < δ} é chamado uma esfera aberta de centro X0 ou uma vizinhança aberta de X0 .
Definição 1.3 (Ponto interior). X0 é dito um ponto interior de D se existe δ > 0, tal que
Sδ (X0 ) ⊆ D.
Definição 1.4 (Conjunto aberto). D é aberto quando consiste somente de pontos interiores.
Capı́tulo 1. Revisão de Otimização em
Rd
2
Definição 1.5 (Domı́nio). Se quaisquer dois pontos de D podem ser conectados por uma curva
contı́nua inteiramente contida em D, então D é um domı́nio.
Assim, por exemplo, cada esfera aberta é um domı́nio, assim como também o é cada
“caixa”aberta,
B = {X ∈ Rd ; aj < xj < bj , j = 1, 2, · · · , d}.
Notar que a união de conjuntos abertos disjuntos não é um domı́nio, apesar de ser um conjunto
aberto.
Definição 1.6 (Ponto de fronteira). Um ponto que não é interior a D e não é interior ao
complemento de D, denotado por Dc = Rd − D, é chamado um ponto de fronteira de D. O
conjunto de todos estes pontos, denotado por ∂D, é chamado fronteira de D. Pode-se definir ∂D
analiticamente por
∂D = {X ∈ Rd ; S² (X) ∩ Dc 6= ∅ e S² (X) ∩ D 6= ∅, ∀² > 0}.
¯ ¯
¯ ¯
Desta maneira, se A = {X ∈ Rd ; ¯X ¯ 6 1}, então ∂A = {X ∈ Rd ; ¯X ¯ = 1}; também, se
∂A = B, então ∂B = B, isto é,∂(∂A) = ∂A.
Definição 1.7 (Conjunto limitado). D é limitado se for subconjunto de alguma esfera.
Definição 1.8 (Conjunto fechado). D é fechado se ∂D ⊆ D.
Definição 1.9 (Conjunto compacto). Se D for limitado e fechado, então D é compacto.
Se quisermos encontrar pontos extremos de uma função f definida num conjunto D ⊆ Rd , ou
seja, se quisermos achar pontos em que a função assume valores máximos e mı́nimos, devemos notar
que:
• f não necessariamente terá valores extremos em D.
Por exemplo, quando D = R, a função f (X) = x1 é ilimitada em ambas as direções de D. Além
disso, se tomarmos D = (−1, 1) ⊆ R, esta mesma função, embora limitada, assume valores tão
próximos de -1 e 1 quanto se queira, mas nunca assume os valores -1 e 1. Já no intervalo fechado
D = [−1, 1], a função assume valores de máximo (1) e mı́nimo (−1).
• f pode assumir somente um valor extremo em D.
Por exemplo, se D = (−1, 1], f (X) = x1 assume um valor de máximo (1), mas não assume valor
de mı́nimo. Já se D = (−1, 1), a função f (X) = x21 assume um valor de mı́nimo (0), mas não
assume valores de máximo.
• f pode assumir valores extremos em mais de um ponto.
Se D = [−1, 1], f (X) = x21 assume valor de máximo (1) em x1 = ±1. Se D = R2 , f (X) = x21
assume valor de mı́nimo em cada ponto do eixo x2 .
As condições suficientes para a existência de valores extremos de uma função estão contidas no
Teorema a seguir, cuja demonstração pode ser encontrada em [6].
Teorema 1.10. Se D ⊆ Rd é compacto e f : D → R é contı́nua, então f assume valores de
máximo e de mı́nimo em D.
Uma função f ¯: D → R ¯é contı́nua em
¯ um ponto X0¯ ∈ D se, e somente se, ∀² > 0, ∃ δ > 0 tal
que, se X ∈ D e ¯X − X0 ¯ < δ, então ¯f (X) − f (X0 )¯ < ². A função f é contı́nua em D se, e
somente se, for contı́nua em cada ponto X0 ∈ D.
Os exemplos anteriores mostram que o fato de D ser compacto ou f contı́nua, sozinhos, não
asseguram a existência de valores extremos.
É claro que o valor máximo de f é o valor mı́nimo de −f , e vice-versa. Desta forma, basta
caracterizar os pontos de mı́nimo de f , aqueles X0 ∈ D para os quais f (X0 ) 6 f (X), ∀ X ∈ D.
Capı́tulo 1. Revisão de Otimização em
Rd
3
Lema 1.11. Se D contém uma vizinhana de um extremo X0 de f , na qual f possui derivadas
parciais contı́nuas, então, para cada vetor unitário U ∈ Rd , a derivada direcional é tal que
·
¸
¯
∂f
f (X0 + εU ) − f (X0 )
∂U f (X0 ) = lim
=
(X0 + εU )¯ε=0 = 0
ε→0
ε
∂ε
Demonstração.
A existência e continuidade das derivadas parciais na vizinhança de X0 garantem que o limite acima existe. Além disso, a expressão entre colchetes muda de sinal quando ε
tende a zero pela direita e pela esquerda, logo deve ser nula.
¥
Como o vetor gradiente ­é definido como
∇f = (fx1 , fx2 , ..., fxd ), a derivada direcional pode ser
®
expressa como ∂U f (X0 ) = ∇f (X0 ), U . Então, é fácil concluir que, num ponto extremo interior
X0 , tem-se ∇f (X0 ) = 0.
Definição 1.12. O ponto X0 , no qual ∇f (X0 ) = 0, é chamado ponto estacionário (ou ponto
crı́tico) de f , independente de X0 ser ou não ponto de máximo ou de mı́nimo de f .
Por exemplo, em D = [−1, 1] , a função f (X) = x31 tem seu único ponto crı́tico em x1 = 0, mas
o máximo e o mı́nimo ocorrem em 1 e −1, respectivamente.
Em D = R2 , a função f (X) = x22 − x21 tem seu único ponto crı́tico em X0 = (0, 0). Neste
ponto, f tem seu comportamento de máximo na direção x2 = 0 e seu comportamento de mı́nimo
na direção x1 = 0. Neste caso, X0 é denominado ponto de sela de f .
Um ponto estacionário X0 pode ser apenas um extremo local, ou seja, f (X) > f (X0 ) ou f (X) 6
f (X0 ) para todo X ∈ D que esteja numa vizinhana de X0 . Por exemplo, o polinômio f (X) =
x31 − 3x1 tem, em D = [−3, 3] , x1 = 1, −1 como pontos crı́ticos. O primeiro é um máximo local e
o segundo, um mı́nimo.
Definição 1.13. Uma função f definida em D ⊂ Rd é convexa em D se tiver derivadas parciais
contı́nuas em D e, além disso, verificar a desigualdade
­
®
f (X) > f (X0 ) + ∇f (X0 ), (X − X0 ) , ∀ X, X0 ∈ D.
A função f é estritamente convexa se esta desigualdade é estrita para X 6= X0 .
A desigualdade acima pode também ser escrita na forma
­
®
f (X + V ) > f (X) + ∇f (X), V
∀ X, X + V ∈ D.
Uma função não precisa ter ponto crı́tico mas, obviamente, quando X0 é ponto crı́tico de uma
função convexa f , então ∇f (X0 ) = 0, e portanto f (X) > f (X0 ), isto é, X0 é ponto de mı́nimo de
f . Isso demonstra a
Proposição 1.14. Se f é uma função convexa em D, então ela assume um valor mı́nimo em cada
ponto crı́tico de D.
Exemplo. A função definida por f (X) = x21 + x22 tem como gradiente ∇f (X) = (2x1 , 2x2 ) e
satisfaz, para cada V = (v1 , v2 ),
f (X + V ) = (x1 +v1 )2 +(x2 +v2 )2 = x21 +x22 +2x1 v1 +2x2 v2 +v12 +v22
­
® ¯ ¯2
­
®
= f (X) + ∇f (X), V + ¯V ¯ > f (X) + ∇f (X), V
para todo X ∈ R2 , e portanto f é convexa nesse domı́nio.
Lema 1.15. Se f é estritamente convexa en D, então f não pode ter mais de um ponto crı́tico, e
portanto, mais de um mı́nimo interior em D.
Capı́tulo 1. Revisão de Otimização em
Rd
4
Demonstração.
Se X0 é um ponto crı́tico de f , então f (X) > f (X0 ), para todo X ∈ D − X0 .
Assim, f não assume mı́nimo em nenhum outro ponto.
¥
Exemplo. A função do exemplo anterior é estritamente convexa em cada conjunto D ⊂ R2 . Além
disso, não é difı́cil verificar que, em R2 , a função definida por f (X) = x21 + x22 − 2x1 é estritamente
convexa, a função f (X) = x1 − x2 é convexa, mas não estritamente, enquanto que f (X) = x1 x2
não é convexa.
Definição 1.16. Uma função f é diferenciável em X0 se, para todo X em vizinhança de X0 , tem-se
¯
­
® ¯
f (X) = f (X0 ) + ∇f (X), X − X0 + ¯X − X0 ¯ζ(X − X0 )
(1.1)
em que lim ζ(X − X0 ) = 0.
X→X0
d+1
Sendo f uma função diferenciável, o seu gráfico
­ possui, no ponto® (X0 , f (X0 )) ∈ R , o hiperplano tangente definido por T (X) = f (X0 ) + ∇f (X0 ), (X − X0 ) . Para d = 1, esta é a reta
tangente à curva que representa o gráfico de f em R2 . Para d = 2, este é o plano tangente à
superfı́cie representada pelo gráfico de f em R3 .
Se ∇f (X0 ) = 0, então o gráfico de f tem hiperplano tangente “horizontal” em X0 , isto é, um
subconjunto d-dimensional paralelo à Rd . Para d = 2, uma bola de gude equilibrada em (X0 , f (X0 ))
não deve rolar, mas permanecer “estacionária”. Da definição segue-se que uma função convexa
diferenciável é aquela que está “acima”de seu hiperplano tangente.
A respeito de outras propriedades de funções convexas, observamos ainda o seguinte:
Proposição 1.17. A soma de duas funções f, g [estritamente] convexas em D ⊆ Rd é [estritamente]
convexa em D. Além disso, dado um escalar c > 0, cf é também [estritamente] convexa.
Demonstração.
Com efeito, considere apenas o caso em que f, g são estritamente convexas,
uma vez­ que o outro
X ∈® D e X + V ∈ D. Então f (X + V ) >
® caso é semelhante, e sejam
­
f (X) + ∇f (X), V e g(X + V ) > g(X) + ∇g(X), V . Logo, dados a, b escalares positivos, e
definindo h(X) = af (X) + bg(X), tem-se que
h(X + V ) = af (X + V ) + bg(X + V )
­
®
­
®
> af (X) + a ∇f (X), V + bg(X) + b ∇g(X), V
­
®
­
®
= h(X) + [a∇f (X) + b∇g(X)], V = h(X) + ∇h(X), V
onde foi usada a linearidade das derivadas parciais. Isso mostra que h é estritamente convexa.
¥
Observação. O produto de duas funções convexas não é necessariamente convexo.
Por exemplo, as funções f (X) = x1 +x2 e g(X) = x1 −x2 são convexas, uma vez que são funções
lineares. Contudo,
f (X) g(X) = (x1 + x2 ) (x1 − x2 ) = x21 − x22
é a equação do parabolóide hiperbólico, o qual já se sabe que não é convexo.
Outra importante propriedade das funções convexas é a Proposição a seguir, que ilustra a possibilidade de se caracterizar a convexidade sem supor diferenciabilidade.
Proposição 1.18. Suponha que f : Rd → R seja diferenciável. Então f é convexa em Rd se, e só
se, para todo X, X0 ∈ Rd , têm-se
f (tX + (1 − t)X0 ) 6 tf (X) + (1 − t)f (X0 ), ∀ t ∈ (0, 1).
Capı́tulo 1. Revisão de Otimização em
Rd
5
Demonstração.
De inı́cio, vamos assumir que f seja convexa. Dados X, X0 ∈ Rd , t ∈ (0, 1) e
definindo Yt = tX + (1 − t)X0 , um cálculo simples mostra que
X − Yt =
(1 − t)
(Yt − X0 ).
t
Usando agora a convexidade de f , isto é,
­
®
f (X) > f (Yt ) + ∇f (Yt ), (X − Yt ) ,
(1.2)
e a expressão de X − Yt acima, obtém-se que
­
® tf (Yt ) − tf (X)
∇f (Yt ), (X0 − Yt ) >
.
1−t
(1.3)
Por outro lado, usando novamente a convexidade de f , isto é,
­
®
(1.4)
f (X0 ) > f (Yt ) + ∇f (Yt ), (X0 − Yt ) ,
obtém-se que
­
®
∇f (Yt ), (X0 − Yt ) 6 f (X0 ) − f (Yt ).
(1.5)
Combinando as equações (1.3) e (1.5) obtém-se
®
tf (Yt ) − tf (X) ­
6 ∇f (Yt ), (X0 − Yt ) 6 f (X0 ) − f (Yt ),
1−t
de onde segue o que buscamos, isto é,
(1.6)
f (Yt ) 6 tf (X) + (1 − t)f (X0 ).
Reciprocamente, suponha f diferenciável satisfazendo (1.6) acima. Usando a diferenciabilidade
de f em X0 e que Yt − X0 = t(X − X0 ), obtem-se
¯
¯
f (Yt ) = f (X0 ) + t∇f (X0 )(X − X0 ) + t¯X − X0 ¯ζ(tX − tX0 )
em que ζ(tX − tX0 ) → O quando t → 0. Essa última igualdade, juntamente com (1.6), implica que
f satisfaz
¯
­
® ¯
t[ ∇f (X0 ), (X − X0 ) + ¯X − X0 ¯ζ(tX − tX0 )] 6 t[f (X) − f (X0 )],
em que t 6= 0. Dividindo por t e usando as propriedades da função ζ obtém-se que f é convexa, isto
é,
­
®
∇f (X0 ), (X − X0 ) 6 f (X) − f (X0 ) ∀X, X0 ∈ R2 , ∀t ∈ (0, 1)
o que conclui a demostração.
¥
Observação. No estudo dos valores extremos de uma função f , a menos que D seja aberto, isto
é, possui somente pontos interiores, então é também necessário considerar os valores extremos de
f em ∂D, a fronteira de D. Por exemplo, a função f (X) = x22 − x21 em R2 possui um único ponto
estacionário X0 =¯ O,
¯ que é um ponto de sela. Assim, o máximo e o mı́nimo de f em,
¯ ¯digamos,
D = {X ∈ R2 ; ¯X ¯ 6 2}, pode ser encontrado apenas na fronteira de D, em que ¯X ¯ = 2. O
próximo exemplo ilustra melhor este fato.
Exemplo. Para encontrar
os valores de máximo e de mı́nimo da função f (X) = x21 − x1 x2 + 16 x32
¯ ¯
2 ¯ ¯
em D = {X ∈ R ; xj 6 2, j = 1, 2}, notamos, de inı́cio, que ∇f (X) = (2 x1 − x2 , −x1 + 21 x22 ) e,
¡
¢
portanto, os pontos crı́ticos de f em D são X0 = (0, 0), e X̃0 = 12 , 1 . Tem-se que X0 é ponto de
1
sela, enquanto que X̃0 é ponto de mı́nimo local, com f (X̃0 ) = − 12
. Comparando este valor com os
)
é
assumido
no
ponto
(−2, 2) e valor mı́nimo (− 37 ),
valores de f em ∂D, vemos que o máximo ( 28
3
no ponto (−1, −2), ambos na fonteira de D.
6
Capı́tulo 1. Exercı́cios Propostos
1.1
Exercı́cios Propostos
1. Considere a seguinte definição de diferenciabilidade:
Definição 1.19. Uma função real f : U ⊆ Rp → R é diferenciável em X0 ∈ U se existe uma
vizinhança de X0 em U tal que
f (X0 + V ) = f (X0 ) + LX0 (V ) + r(V )
para todo X + V nesta vizinhança, onde LX0 : Rp → R é uma transformação linear e r é uma
função que satisfaz
r(V )
lim ¯ ¯ = 0
V →O ¯V ¯
(Esta definição diz intuitivamente que f é diferenciável num ponto X interior de seu domı́nio
se f admite uma “boa aproximação linear” em vizinhança de X.)
a) Prove que se f é diferenciável em X0 então a matriz da transformação linear LX0 na
base canônica do Rp é precisamente ∇f (X0 ).
b) Estenda a definição acima para funções que tomam valores em Rq e prove que, neste
caso, a matriz de LX0 é a conhecida matriz Jacobiana no ponto X0 . (Sugestão: use a
definição e o item anterior para cada função coordenada fi : Rp → R de F = (f1 , . . . , fp ),
onde F : Rp → Rq .)
2. Supondo f diferenciável em X0 , prove que a derivada ­direcional de
® f na direção não nula V
no ponto X0 é dada pelo produto interno ∂V f (X0 ) = ∇f (X0 ), V .
3. Supondo f de classe C 2 , prove que a segunda
derivada
direcional de f na direção não nula V
­
®
no ponto X0 é dada por ∂V2 f (X0 ) = Hf (x0 )V, V , onde Hf (X0 ) é a matriz Hessiana de f
no ponto X0 . (Sugestão: use o exercı́cio anterior.)
Capı́tulo 2
Problemas Clássicos de Otimização
“Qual o melhor método?” Tanto a matemática como as várias ciências clássicas têm feito esta mesma
pergunta durante séculos, e sua resposta nem sempre é definitiva. Se for possı́vel medir o quão
“melhor” é o método usando-se uma quantidade numérica, esta pergunta torna-se naturalmente
um problema de otimização: maximizar tal quantidade numérica. Não se está interessado somente
nos valores ótimos, sejam eles máximos ou mı́nimos, mas também nos métodos para obtê-los.
Quando a pergunta vem das ciências clássicas, a quantidade a ser otimizada é algo como comprimento, área, volume, tempo, trabalho, energia, e também custo, eficiência, etc. Neste capı́tulo,
serão examinados alguns problemas clássicos que foram essenciais para o desenvolvimento da teoria
atual que responde as perguntas deste tipo. Muito embora aqui só se desenvolvam poucos destes
problemas, eles servirão de motivação para os problemas que poderão ser encontrados mais adiante
pelo leitor.
2.1
Problemas Geodésicos
Seja por preguiça inerente ou por interesse na eficiência, o homem sempre esteve procurando qual,
dentre os vários caminhos que ligam dois pontos fixos A e B, é o caminho mais curto, isto é, o
de menor comprimento. No espaço euclideano Rd , uma reta que liga estes dois pontos fornece o
caminho de menor comprimento. No entanto, ao serem considerados obstáculos no caminho, tornase necessário considerar o problema mais delicado de encontrar as geodésicas (caminhos de menor
comprimento) ligando dois pontos numa superfı́cie qualquer.
Serão caracterizadas aqui as geodésicas do espaço Rd . No R3 serão caracterizadas as geodésicas
da esfera, do cilindro e do cone.
2.1.1
Geodésicas em Rd
Seja Y0 (t) = (1 − t)A + tB, t ∈ [0, 1] a equação que determina o segmento de reta de A a B, em que
Y00 (t) = B − A. Se existe uma curva de comprimento mı́nimo Lmin ligando A e B, então deve-se
ter
Z1
Z1
¯
¯
¯
¯
¯
¯
Lmin 6 ¯Y00 (t)¯dt = ¯B − A¯dt = ¯B − A¯,
0
Para mostrar que Lmin
0
¯
¯
= ¯B − A¯, basta mostrar que
¯
¯
¯B − A¯ 6 L(Y ) =
Z1
¯ 0 ¯
¯Y (t)¯dt
0
qualquer que seja o caminho continuammente diferenciável Y (t) que liga A a B. Do Teorema
R1
Fundamental do Cálculo, tem-se que B − A = Y (1) − Y (0) = 0 Y 0 (t)dt, de modo que
¯
¯
­
® ­
¯B − A¯2 = B − A, B − A = B − A,
Z1
®
Y 0 (t)dt =
0
Z1
(2.1)
=
0
­
®
B − A, Y 0 (t) dt 6
Z1
0
¯
¯¯
¯
¯B − A¯ ¯Y 0 (t)¯dt
8
Capı́tulo 2. Problemas Geodésicos
¯
¯2
em que a última desigualdade decorre da Desigualdade de Cauchy-Schwarz. Portanto, ¯B − A¯ 6
¯
¯R ¯
¯
¯B − A¯ 1 ¯Y 0 (t)¯dt e consequentemente
0
¯
¯
¯B − A¯ 6
Z1
¯ 0 ¯
¯Y (t)¯dt
0
para todo caminho Y (t) nas condições dadas.
Demonstrou-se
¯
¯assim que o comprimento mı́nimo Lmin de um caminho entre dois pontos A e
B no Rd é ¯A − B ¯. Como o segmento de reta que liga A a B tem esse comprimento, ele é uma
geodésica do Rd . No entanto, pode haver, a princı́pio, outros caminhos continuamente diferenciáveis
com o mesmo comprimento Lmin . Este não é o caso, bastando, para isso, notar que a igualdade em
(2.1) ocorre se, e somente se, os vetores Y 0 (t) e B − A forem linearmente dependentes para todo
t, isto é, se, e somente se, Y (t) descrever um segmento de reta entre A e B. Isto mostra que as
geodésicas do Rd são precisamente os segmentos de reta.
2.1.2
Geodésicas na Esfera
Cada ponto Y na superfı́cie de uma esfera de raio R e centrada na origem pode ser dado pelas
coordenadas esféricas de raio R, latitude θ e longitude ϕ por
(2.2)
Y = (R cos θ sen ϕ, R sen θ sen ϕ, R cos ϕ)
para algum ϕ ∈ [0, π) e θ ∈ [−π, π).
Figura 2.1.
Coordenadas Esféricas
Dados dois pontos distintos A e B na superfı́cie de tal esfera, pode-se escolher os eixos de modo
que A seja o pólo norte (ϕ = 0), e que B 6= A tenha coordenadas (R, 0, ϕ1 ) para algum ϕ1 > 0.
Nestas condições, um caminho suave ligando A e B na superfı́cie da esfera é determinado, usando-se
(2.2), por um par de funções continuamente diferenciáveis θ(t) e ϕ(t), com t ∈ [0, 1] onde θ(0) = 0,
ϕ(0) = 0, θ(1) = 0 e ϕ(1) = ϕ1 . Este caminho é dado por (ver figura 2.2)
Y (t) = (R cos θ(t) sen ϕ(t), R sen θ(t) sen ϕ(t), R cos ϕ(t))
em que t ∈ [0, 1].
9
Capı́tulo 2. Problemas Geodésicos
Figura 2.2.
Um Caminho Ligando A e B na Esfera
¯
¯2
Para se calcular o comprimento deste caminho, verifica-se que ¯Y 0 (t)¯ = R2 (sen2 ϕ(t)θ0 (t)2 +
ϕ0 (t)2 ) de modo que seu comprimento é dado pela integral
Z1
L(Y ) =
¯ 0 ¯
¯Y (t)¯dt =
0
Z1
R
p
sen2 ϕ(t)θ0 (t)2 + ϕ0 (t)2 dt
0
¯
¯ p
Usando a desigualdade ϕ0 (t) 6 ¯ϕ0 (t)¯ 6 sen2 ϕ(t)θ0 (t)2 + ϕ0 (t)2 , obtem-se finalmente que
Z1
L(Y ) > R
¯1
ϕ0 (t)dt = Rϕ(t)¯0 = Rϕ1 .
0
Daı́ conclui-se que, para qualquer caminho continuamente diferenciável Y (t) na esfera, seu comprimento é L(Y ) > Rϕ1 , e este último é exatamente o comprimento do menor grande arco1 que une
A e B na esfera.
Assim, pode-se afirmar que os grandes arcos são geodésicas da esfera. Para se mostrar que são
eles precisamente as geodésicas, basta notar que a igualdade ocorre se, e somente se, sen2 ϕ(t)θ0 (t)2 ≡
0 e ϕ0 (t) > 0, ou seja θ(t) ≡ 0, de onde se tem novamente um grande arco.
2.1.3
Geodésicas no Cilindro
Os pontos Y de um cilindro de raio R com eixo central coincidente com o eixo z podem ser dados
unicamente em coordenadas cilı́ndricas (θ, z) por meio de:
Y = (R cos θ, R sen θ, z)
onde −π 6 θ < π e z ∈ R. Dados dois pontos distintos A e B no cilindro, podemos considerar
A = (0, 0) e B = (θ1 , z1 ) em coordenadas cilı́ndricas.
Para encontrar a geodésica entre A e B nesse caso, primeiro notamos que, se B é da forma
(0, z1 ), podemos ligar A e B com a reta (1 − t)A + tB que está no cilindro. Como o cilindro está
em R3 , esta reta é a geodésica no cilindro, neste caso.
Mais geralmente, tem-se de considerar o caminho continuamente diferenciável ligando os pontos
A e B dado por um par de funções θ(t), z(t) com −π 6 θ(t) < π e z(t) ∈ R para t ∈ [0,1].
Além disso deve-se ter θ(0) = 0, z(0) = 0 e θ(1) = θ1 , z(1) = z1 . O caminho no cilindro é
Y (t) = (R cos θ(t), R sen θ(t), z(t)), e devemos minimizar a integral
Z1
L(Y ) = R
0
1 Arco
¯ 0 ¯
¯Y (t)¯dt = R
Z0 p
θ0 2 + z 0 2 dt.
1
determinado pela circunferência de mesmo centro e raio da esfera que passa pelos pontos A e B. Como 2
pontos distintos determinam 2 arcos numa mesma circunferência, toma-se o menor deles, daı́ menor grande arco.
10
Capı́tulo 2. Problemas Geodésicos
Esta integral, a menos da constante multiplicativa R, é a que fornece o comprimento da curva
t 7→ (θ(t), z(t)) no plano zOθ, e portanto basta minimizar o comprimento desta curva. Pelo que foi
visto em Rd , o comprimento mı́nimo é dado pela reta que une os pontos (0, 0) e (θ1 , z1 ), isto é, pela
curva t 7→ (tθ1 , tz1 ) com 0 6 t 6 1. No cilindro, tem-se
Ymin (t) = (R cos tθ1 , R sen tθ1 , tz1 )
que é uma hélice, como pode ser facilmente verificado. Isto mostra que as geodésicas no cilindro
são os arcos de hélice.
Figura 2.3.
2.1.4
Uma Geodésica no Cilindro
Geodésicas no Cone
Para encontrar as geodésicas do cone procede-se como no caso do cilindro: encontra-se uma
parametrização especial que leva o plano ao cone preservando o comprimento de curvas. Para
o cone C, sem o vértice e com ângulo de abertura 2φ0 , 0 < φ0 < π/2, essa parametrização
pode ser construı́da como segue. Denotando a = senφ0 e b = cosφ0 , seja D ∈ R2 o domı́nio
D = {(u, v) ∈ R2 ; u > 0 e − tan(aπ/2)u < v < tan(aπ/2)u}. Seja ainda g : D → D̃ a mudança
de coordenadas
p
g(u, v) = (ρ, θ) = (2 u2 + v 2 , 2 arc tan(v/u)),
em que D̃ = g(D) = {(ρ, θ) ∈ R2 ; ρ > 0 e − π < a−1 θ < π}. Usando coordenadas esféricas, com
longitude fixa φ = φ0 , o cone C pode ser parametrizado por X̃ : D̃ → C, com
X̃(ρ, θ) = (ρa cos(a−1 θ), ρa sen(a−1 θ), bρ).
A parametrização em que estamos interessados é então dada por X : D → C, X = X̃ ◦ g. Apesar
da mudança de coordenadas g parecer artificial, esta é de fato a mais apropriada. Para ver isso,
sejam A e B dois pontos no cone com coordenadas, nas variáveis (u, v), dadas por A = (u0 , 0) e
B = (u1 , v1 ). Um caminho suave Y (t) no cone ligando A e B é dado pelas funções continuamente
diferenciáveis ρ(t) e θ(t), que variam em D̃, ou pelas correspondentes u(t) e v(t), que variam em D,
0 6 t 6 1. Usando a Regra da Cadeia, obtem-se que
ρ0 =
2(uv 0 − vu0 )
−2(uu0 + vv 0 )
√
e ρθ0 = √
u2 + v 2
u2 + v 2
de onde segue que o comprimento L(Y ) deste caminho é dado por
Z1 q
ρ0 2 + (ρθ0 )2 dt = 2
L(Y ) =
0
Z1 p
u0 2 + v 0 2 dt
0
Capı́tulo 2. Problemas de Tempo de Trânsito — A Braquistócrona
11
o qual, a menos de constante, é precisamente o comprimento de um caminho em D ligando os pontos
(u0 , 0) e (u1 , v1 ). Como D é convexo, este comprimento é mı́nimo para a reta u(t) = u0 + t(u1 − u0 ),
v(t) = tv1 , 0 6 t 6 1, que une estes dois pontos. Segue-se que a geodésica Ymin ligando os pontos A
e B no cone é dada por Ymin (t) = X(u0 + t(u1 − u0 ), tv1 ), que é um arco de hélice no cone (figura
2.4).
O fato das hélices aparecerem tanto como geodésicas do cilindro quanto do cone não é mera
coincidência. De fato, verificamos que as curvas do plano quando levadas ao cilindro e ao cone por
meio de uma parametrização apropriada mantêm o comprimento. Deste modo, as geodésicas do
cone e do cilindro provém das geodésicas do plano — as retas — onde a imagem de uma reta é
a hélice em cada uma destas superfı́cies. Assim, dizemos que o cone, o cilindro e o plano (num
domı́nio apropriado) são isométricos (para uma definição mais precisa, veja [2]). Isto possibilita
encontrar as geodésicas destas superfı́cies uma vez que sabemos quais são as geodésicas do plano.
Figura 2.4.
2.1.5
Uma Geodésica no Cone
Outras Geodésicas
Para caracterizar geodésicas de superfı́cies do R3 é possı́vel utilizar sistemas de coordenadas especiais
associados a elas, como se fez anteriormente para a esfera, o cilindro e o cone no R3 . O estudo das
geodésicas de superfı́cies arbitrárias do R3 foi iniciado por Johann Bernoulli (1689), por seu pupilo
Euler (1729), por Lagrange (1760) e quase que decisivamente abordado por Gauss (1827). Há de
se notar que para superfı́cies arbitrárias do R3 o problema não é nada trivial. Curiosamente, o
problema de achar as geodésicas de uma superfı́cie de revolução qualquer foi levantado quando se
descobriu que a Terra não era perfeitamente esférica.
No caso em que S for uma superfı́cie de nı́vel, por exemplo, S = {Y ∈ R3 : g(Y ) = 0}, então o
problema de se achar as geodésicas de S torna-se o problema de minimizar uma integral L(Y ) =
¯
R1¯
¯Y (t)¯dt, como anteriormente, mas agora sujeita à restrição g(Y ) ≡ 0. Este problema constitui
0
um ramo da geometria diferencial, e o leitor interessado pode consultar novamente [2].
2.2
Problemas de Tempo de Trânsito — A Braquistócrona
Se uma partı́cula desloca-se com velocidade constante entre dois pontos dados, então a curva
de menor distância entre esses pontos é também a de menor tempo de trânsito. Isto por que, se a
velocidade é constante, então a velocidade em qualquer ponto da trajetória é igual a V = ∆S/∆T .
Portanto, ∆T = ∆S/V e, para minimizar o tempo de trânsito ∆T , devemos minimizar o deslocamento ∆S, já que V é constante. Deste modo, a curva que minimiza a distância percorrida também
minimiza o tempo de trânsito. Entretanto, se a velocidade não for constante e, em particular, se
Capı́tulo 2. Problemas de Tempo de Trânsito — A Braquistócrona
Figura 2.5.
12
Sistema de Coordenadas e a Braquistócrona
depende do caminho percorrido, então as trajetórias que ligam estes pontos não são necessariamente
coincidentes.
Em 1696, Johann Bernoulli desafiou os matemáticos a encontrarem a braquistócrona, isto é,
a curva plana que forneceria o menor tempo de trânsito. A solução de Bernoulli foi derivada de
uma analogia com a ótica, e outras soluções foram dadas por seu irmão Jakob, por Newton, por
Euler , e por Leibniz. Embora todas essas soluções tenham alcançado a mesma conclusão, isto é,
que a braquistócrona não é um arco circular como se imaginava, mas uma ciclóide, nenhuma delas
é inteiramente satisfatória. Contudo, a de Bernoulli admitiu refinamentos e uma generalização: o
Cálculo Variacional.
Para o estudo do problema da braquistócrona, considere que uma partı́cula M percorra uma
trajetória ligando os pontos A e B, como ilustrado na Figura 2.5, em que o ponto A = O é a origem
e a parte do eixo y que aponta para baixo é tomada como positiva. Consideramos apenas as curvas
ligando os pontos A e B = (x1 , y1 ), em que x1 e y1 são positivos, que podem ser representadas pelo
gráfico de uma função contı́nua y = y(x), x ∈ [0, x1 ], com y(0) = 0 e y(x1 ) = y1 .
Assumimos que a partı́cula M está sob a ação de apenas duas forças: a força gravitacional,
que é conservativa, e a força normal, que, sendo perpendicular ao deslocamento infinitesimal ds da
partı́cula, não realiza trabalho sobre ela, e portanto não contribui para o aumento de sua velocidade.
Desprezamos quaisquer forças dissipativas que possam atuar sobre o sistema, como forças de atrito.
Nestas condições, a velocidade da partı́cula é função de sua altura y e, portanto, da curva que ela
percorrer.
Assumindo diferenciabilidade suficiente, o tempo T , necessário para uma partı́cula percorrer a
distância l ao longo da curva y(x), é dado por
Zl
T = T (y) =
0
ds
v
Rxp
Para x ∈ [0, x1 ], s(x) = 0 1 + [y 0 (x)]2 dx é o comprimento de arco até o ponto (x, y(x)). Considerando v = v(x) e substituindo s e v na equação acima, tem-se que
Zx1 p
T (y) =
0
1 + [y 0 (x)]2
dx
v(x)
13
Capı́tulo 2. Problemas Isoperimétricos
Considerando que não há forças dissipativas, a energia mecânica E se conserva. Segue então que
a variação da energia potencial é igual à variação da energia cinética, isto é, m g y(x) = m v 2 (x)/2,
onde m é a massa da
p partı́cula e g a constante de acelaração gravitacional da Terra. Desta igualdade,
segue que v(x) = 2gy(x) e, portanto,
1
T (y) = √
2g
Zx1 s
0
1 + [y 0 (x)]2
dx
y(x)
Do ponto de vista matemático, o problema é procurar a(s) função(ções) y(x) que minimiza(m) o
funcional acima entre todas as funções contı́nuas no intervalo fechado [0, x1 ], satisfazendo y(0) = 0
e y(x1 ) = y1 , de maneira que a integral exista. Para a existência, deve-se observar que a integral
é imprópria, devido à presença de um denominador que pode se anular. Além disso, é suficiente
requerer que y 0 seja integrável em [0, x1 ] e que y seja positiva em (0, x1 ].
Pode parecer redundante exigir que as funções y(x), que compõem o domı́nio do funcional T (y),
sejam contı́nuas em [0, x1 ] e que suas derivadas sejam integráveis em [0, x1 ], pois se uma função real
é derivável num ponto, então ela é contı́nua neste ponto. O que ocorre aqui, porém, é que o critério
de integrabilidade utilizado requer apenas que y 0 esteja definida em [0, x1 ] a menos de um conjunto
de medida zero 2 . Assim, por exemplo, pode acontecer de y 0 não estar definida em infinitos pontos
de [0, x1 ] e, desta maneira, a integrabilidade de y 0 não é suficiente para garantir que y seja contı́nua
nestes pontos.
De qualquer maneira, com ou sem motivação fı́sica, não há resposta óbvia, embora possa ser
verificada a hipótese feita por Galileu de que um arco de circunferência é superior a uma linha reta.
Variações do problema da braquistócrona logo se seguiram. Por exemplo, em 1698 Jakob
Bernoulli desafiou os matemáticos da época a encontrar a braquistócrona ligando um ponto e uma
reta fixos no plano. Mais tarde, investigou-se o problema de encontrar a braquistócrona entre duas
curvas arbitrárias fixas no espaço, e Newton considerou o problema de encontrar a braquistócrona
conectando dois pontos fixos na Terra passando-se através dela.
2.3
Problemas Isoperimétricos
Os problemas isoperimétricos tratam de questões geométricas nas quais a única condição é a de que
o perı́metro seja constante — a chamada condição isoperimétrica. Nesta categoria, o mais antigo é
o Problema de Dido , que pode ser enunciado assim:
Dada uma curva de perı́metro fixo, achar a forma que abriga a maior área.
Um outro exemplo deste tipo de problema, frequentemente atribuı́do a Euler, é:
Dado um fio de comprimento fixo, fino e inextensı́vel, encontrar a forma que assume
quando suas extremidades se encontram penduradas em dois pontos separados por uma
dada distância horizontal.
Com relação ao Problema de Dido, pode-se fazer a seguinte analogia fı́sica: considere uma
curva fechada de formato qualquer e construa a partir dela um cilindro reto, com paredes flexı́veis,
inextensı́veis e impermeáveis. Fixe este cilindro num plano horizontal de modo que não ocorra
vazamento na base deste cilindro. Preenchendo o interior com água (ver Figura 2.6) verificam-se
dois fatos:
2 Diz-se
que um conjunto A ⊆ R tem medida zero se, dado ² > 0, existir uma cobertura de A, digamos I1 , I2 , I3 , . . .,
∞
X
composta por quantidade enumerável (ou finita) de intervalos abertos tais que
m[Ik ] < ², onde m[Ik ] é a medida
do intervalo Ik . Notar que os intervalos escolhidos podem ser ou não disjuntos.
1
14
Capı́tulo 2. Problemas Isoperimétricos
Figura 2.6.
Problema de Dido — Analogia Fı́sica.
1. Em um mesmo nı́vel, a pressão da água em cada ponto da parede do cilindro é a mesma ,
devido às leis da hidrostática. Assim, em cada altura atuarão forças iguais e ortogonais às
paredes. E, como estas paredes são flexı́veis, elas irão se movimentar até que estas forças
possam ser vetorialmente canceladas, ocasionando uma equalização da pressão entre a parede
e a água. A única forma que possibilita essa equalização é certamente o cı́rculo.
2. Pela ação da gravidade, que é também a causadora das forças hidrostáticas do item anterior,
sabe-se que a água procura as regiões de menor altura possı́vel. E, como o volume de um
cilindro é dado pelo produto da área da base pela altura, então, para um volume constante,
tem-se que maximizar a área da base de modo a minimizar a altura.
Essas considerações fı́sicas indicam que a solução do Problema de Dido é dada pelo cı́rculo. O
Problema de Dido admite, ainda, uma solução geométrica, como segue.
Teorema 2.1. Dentre todas as curvas fechadas de perı́metro dado, o cı́rculo é aquela que engloba
a maior área.
Demonstração.
Suponha que C seja a curva procurada com comprimento l e área máxima.
Afirmamos então o seguinte:
i) C é convexa.
De fato, suponha que C não seja convexa. Então ela deve conter dois pontos A e A0 tal
que os arcos ABA0 e AB 0 A0 , que ligam tais pontos, devem estar do mesmo lado da linha
AA0 , conforme a Figura 2.7. No entanto, ao se substituir qualquer um desses arcos por sua
imagem na reflexão em torno da reta AA0 , obtem-se uma nova curva de mesmo comprimento
da anterior, mas que contém maior área, uma contradição.
ii) Se dois pontos A e B dividem a curva C em arcos de mesmo comprimento, então a linha AB
divide a área no interior de C em duas partes iguais.
Para demonstrar essa afirmação, suponha que A e B dividam a curva C em dois arcos de
mesmo comprimento mas a linha AB não divida a área de C em regiões de mesma área,
conforme ilustrado na Figura 2.8. Neste caso, o lado de maior área poderia ser refletido em
torno do segmento AB e, assim, obtem-se uma nova curva de mesmo comprimento, mas que
engloba maior área que a anterior, novamente uma contadição.
Agora o problema se reduz a determinar o arco de comprimento l/2 com pontos extremos A
e B em um segmento de reta tal que a área entre esse arco e o segmento AB seja máxima.
Neste sentido afirmamos
15
Capı́tulo 2. Problemas Isoperimétricos
Figura 2.7.
Figura 2.8.
iii) Suponha que os pontos A e B dividam a curva C ao meio. Se D é qualquer ponto na curva,
então o ângulo ADB é um ângulo reto.
Novamente por contradição, suponha que D é um ponto tal que o ângulo ADB não é reto.
A área delimitada pelo arco ADB e o segmento AB é dividida em três partes: as áreas A1
e A2 limitadas pela curva e os segmentos AD e DB, respectivamente, e a área A3 limitada
pelo triângulo ADB, conforme ilustrado na figura 2.9
Figura 2.9.
Agora suponha que fosse possı́vel movimentar tais segmentos de modo a obter um ângulo
reto em D, conforme Figura 2.10. Neste caso, as áreas A1 e A2 seriam mantidas inalteradas,
enquanto que a área A3 variaria.
Assim, a área delimitada pelo arco ADB 0 aumentaria, uma vez que, entre todos os triângulos
com dois lados congruentes, o que possui área máxima é o triângulo retângulo 3 , conforme
ilustra a Figura 2.11.
Figura 2.10.
Figura 2.11.
θ
considerar a expressão ab sen
, que fornece a área de um triângulo de lados a, b e c, com θ sendo o
2
ângulo entre os lados a e b (θ ∈ [0, π]). Daı́, quando sen θ = 1, teremos o maior valor para a área, isto é, quando
θ = arc sen 1 = π = 90o .
3 Basta
16
Capı́tulo 2. Problemas de Área de Superfı́cie
Portanto, a figura “máxima”consiste de todos os pontos D a partir dos quais uma corda que
divide o comprimento desta curva em duas partes iguais é vista sob um ângulo reto, isto é, a
curva em questão é um cı́rculo.
¥
Para uma formulação do Problema de Dido no contexto do cálculo das variações, usaremos o
Teorema de Green enunciado a seguir, onde a integral de linha é orientada no sentido anti-horário.
Para uma demostração desse Teorema, ver, por exemplo, [4].
Teorema 2.2 (de Green). Sejam M e N funções de duas variáveis x e y, que tenham derivadas
parciais primeiras contı́nuas em um disco aberto B em R2 . Se C for uma curva fechada simples
seccionalmente suave, contida inteiramente em B, e se R for a região limitada por C, então
¶
I
ZZ µ
∂N
∂M
M (x, y) dx + N (x, y) dy =
−
dA.
∂x
∂y
C
R
Vamos supor que uma curva C, fechada, simples e suave, de comprimento l, seja parametrizada
por Y (t) = (x(t), y(t)), t ∈ [0, 1]. De acordo com o Teorema acima, com N (x, y) ≡ x e M (x, y) ≡ 0,
a área A(Y ) do domı́nio R limitada pela curva é
ZZ
A(Y ) =
Z
dx dy =
R
Z1
x(t)y 0 (t) dt.
x dy =
0
C
onde supomos que Y (t) é uma parametrização orientada no sentido positivo.
O problema é então maximizar A(Y ) sobre todas as funções Y (t) de componentes continuamente diferenciáveis em [0, 1], com a condição de que Y (0) = Y (1) e que satisfaçam a condição
isoperimétrica
Z1
¯
¯
L(Y ) = ¯y 0 (t)¯dt = l
0
para um l dado. Voltaremos ao estudo deste problema no Capı́tulo 4.
2.4
Problemas de Área de Superfı́cie
Em dimensões maiores, um análogo dos problemas geodésicos discutidos anteriormente pode ser
formulado da seguinte forma:
Encontrar a superfı́cie de área mı́nima que une duas curvas fixas e fechadas em R3 .
2.4.1
Superfı́cie Mı́nima de Revolução
Por exemplo, quando as curvas consistem em um par de cı́rculos paralelos “concêntricos”, então
pode-se procurar a superfı́cie de revolução que as une e tem área mı́nima ou, de forma equivalente,
tentar encontrar a forma de sua curva de contorno. Este problema foi abordado primeiramente por
Euler (1744), que empregou o então recente desenvolvimento teórico do Cálculo das Variações em
sua solução.
Em um sistema de coordenadas apropriado, a área da superfı́cie de revolução que une esses dois
cı́rculos é dada por
Zb
S(y) = 2π
Zb
y(x) ds(x) = 2π
a
y(x)
a
p
1 + y 0 (x)2 dx
Capı́tulo 2. Problemas de Área de Superfı́cie
17
em que y(x) é não-negativa, continuamente diferenciável em [a, b], e tal que y(a) = a1 , e y(b) = b1 .
Aqui a1 e b1 representam os raios dos cı́rculos de fronteira, um dos quais pode ser degenerado a
um ponto. O problema é então obter y(x), com essas propriedades, e que minimiza o funcional
S(y). Quando a1 e b1 são comparáveis a b − a, é razoável esperar obter uma curva y(x) com
estas propriedades. Entretanto, quando b − a excede em muito a1 e b1 , então a área da superfı́cie
pode ser feita tão próxima da área dos dois discos de fronteira quanto desejado — e que essa área
provavelmente representa a menor área — mas a curva y(x) associada não é da forma admitida.
2.4.2
Problema de Área Mı́nima
Considere o seguinte problema: “dada uma curva γ em R3 , determinar a superfı́cie de menor área
que tem γ como fronteira”. Supondo que as superfı́cies admissı́veis possam ser representadas como
gráficos de funções u = u(x, y) definidas em um domı́nio comum D ⊂ R2 , então a área de uma
dessas superfı́cie é dada por
ZZ q
S(u) =
1 + u2x + u2y dx dy,
D
Aqui, admitimos que a fronteira ∂D é “bem-comportada”o suficiente para que a Integral de Riemann
de funções contı́nuas esteja definida sobre D, D e sobre ∂D.
Com esta notação, o problema é determinar o mı́nimo do funcional S(u) sobre todas as funções
u que sejam contı́nuas em¯ D = D ∪ ∂D, continuamente diferenciáveis em D e que tenham valores
de fronteira pré-fixados u¯∂D = γ, onde γ é uma função contı́nua.
Para este problema, que não tem necessariamente solução, é possı́vel obter alguns resultados
parciais sobre a hipótese de que D é um Domı́nio de Green.
2.4.3
O Problema de Plateau
Um novo impulso foi dado a esta classe de problemas em 1873, quando o fı́sico-matemático belga
Joseph Plateau notou que arames na forma de curvas fechadas, quando mergulhados em solução de
sabão e água, poderiam suportar uma fina membrana, a qual, para minimizar a tensão superficial,
deveria assumir uma forma associada à superfı́cie de área mı́nima. Estes experimentos têm sido
realizados até os dias de hoje e mostram que, para algumas configurações, mais do que um tipo de
solução é possı́vel, e em alguns casos as soluções podem mudar de forma à medida que a geometria
da curva é alterada. Por exemplo, da discussão sobre superfı́cie de revolução mı́nima acima, esperase que a membrana de sabão que une um par de anéis, inicialmente na forma cilı́ndrica, pode se
transformar em um par de discos à medida que os anéis são afastados um do outro.
Não vamos abordar matematicamente este problema, já que são necessários conceitos
matemáticos que estão fora do alcance deste trabalho.
Capı́tulo 3
Espaços Lineares e Variações de
Gâteaux
Os problemas considerados previamente se reduziam a otimizar (geralmente minimizar) uma função
J, de valor real, definida em um subconjunto D de um espaço linear Y. Neste capı́tulo serão estudados problemas neste contexto e serão introduzidas as derivadas direcionais (Varições de Gâteaux),
que serão necessárias posteriormente. Inicialmente serão vistos alguns exemplos de espaços lineares
pressupondo alguma familiariedade com os conceitos de espaço vetorial real, de continuidade e de
diferenciabilidade em Rd .
3.1
Espaços Lineares Reais
Todas as funções consideradas neste texto assumem valores reais ou valores vetoriais reais. A principal propriedade de um espaço linear (ou vetorial) de funções reais é conter a soma e a multiplicação
por escalar dessas funções. Observamos que a coleção de funções com valores reais f , g definidas
em um conjunto D (não vazio) forma um espaço linear real com respeito as operações de adição
(f + g)(x) = f (x) + g(x), x ∈ D, e multiplicação por escalar (cf )(x) = cf (x), x ∈ D e c ∈ R.
Similarmente, para cada d = 2, 3, · · · , a coleção de todas as funções de valores em Rd definidas
no conjunto D forma um espaço linear com respeito às operações de adição e multiplicação por
escalar, análogas vetoriais das operações acima.
Segue-se que cada subespaço destes espaços, isto é, cada subconjunto que é fechado em relação
às operações de adição e multiplicação por escalar, é ele mesmo um espaço linear.
Em particular, se a continuidade esta definida em D, então C(D) (= C 0 (D)), definido como o
conjunto das funções contı́nuas de valores reais em D, é um espaço linear, pois a soma de funções
contı́nuas ou a multiplicação de uma função contı́nua por um escalar é de novo uma função contı́nua.
Do mesmo modo, se D é um subconjunto aberto do espaço euclidiano e m = 1, 2, · · · , então C m (D),
definido como o conjunto de funções em D com derivadas parciais contı́nuas de ordem 6 m, é um
espaço linear real, pois a lei da diferenciação garante que a soma ou a multiplicação por escalar de
tais funções é ainda uma funcão desse tipo. Se D é limitado com fronteira ∂D, e D = D ∪ ∂D,
então C m (D), definido como o subconjunto de C m (D) ∩ C(D) das funções cujas derivadas parciais
de ordem 6 m admitem extensões contı́nuas em D, é um espaço linear real.
Por exemplo, se a < b, então (a, b) = [a, b] é um intervalo fechado e limitado. Uma função
y, que é contı́nua em [a, b], pertence a C 1 [a, b] se for continuamente diferenciável em (a, b) e sua
derivada y 0 possuir limites finitos à direita de a e à esquerda de b. Denotamos por y 0 (a) e y 0 (b),
respectivamente, esses valores. Observe que y0 (x) = x3/2 define uma função de C 1 [1, 0], enquanto
y1 (x) = x1/2 , não.
Finalmente, para d = 1, 2, · · · , [C(D)]d , [C m (D)]d e [C m (D)]d , os conjuntos d-dimensionais
de funções vetoriais reais cujas componentes estão em C(D), C m (D) e C m (D), respectivamente,
também formam espaços lineares reais.
Sabemos que subconjuntos D destes espaços proporcionam domı́nios naturais para otimização
das funções apresentadas anteriormente. Porém, em geral, estes subconjuntos não são espaços
lineares. Por exemplo, D = {y ∈ C[a, b] ; y(a) = 0, y(b) = 1} não é um espaço linear, pois se y ∈ D
então 2y ∈
/ D. Por outro lado, D0 = {y ∈ C[a, b] ; y(a) = y(b) = 0} é um espaço linear.
Finalmente, lembramos que, em um espaço linear Y, as operações de adição e multiplicação por
escalar satisfazem às leis comutativa, associativa e ditributiva. Em particular, há um único vetor O
tal que c O = 0 y = O, ∀y ∈ Y, c ∈ R; também adotaremos as abreviações padrões de que 1 y = y
e −1 y = −y, ∀y ∈ Y.
19
Capı́tulo 3. Espaços Lineares Reais
Exemplo. O funcional do problema da braquistócrona
Zx1 p
1 + y 0 (x)2
1
p
T (y) = √
dx
2g
y(x)
0
p
não está definido no conjunto Y = C 1 [0, x1 ] devido
do termo y(x) no integrando. Mas,
R x1 à presença
se restringirmos as funções y(x) de forma que 0 y(x)−1/2 dx seja finito, então a integral acima é
finita. De fato, neste caso tem-se que
Zx1 p
Zx1
1 + y 0 (x)2
1
p
p
dx 6 M
dx < ∞
y(x)
y(x)
0
onde M é o valor máximo da função
0
p
1 + y 0 (x)2 em [0, x1 ]. Assim, T (y) está definido no conjunto
Zx1
D = {y ∈ Y ; y > 0
y(x)−1/2 dx < ∞}.
e
0
Notamos que D não é um subespaço linear de Y, uma vez que a condição y(x) > 0 não é preservada
na operação de multiplicação por escalar.
Exemplo. Suponha que f ∈ C([a, b] × R2 ). Então, o funcional F (y) dado por
Zb
f (x, y(x), y 0 (x)) dx
F (y) =
a
1
está bem definido em Y = C [a, b], tendo em vista que, para cada vetor y ∈ Y, a composta
f [y(x)] = f (x, y(x), y 0 (x)) é uma função contı́nua. Entretanto, se f ∈ C([a, b] × D), onde D é um
domı́nio de R2 , devemos ter que (y(x), y 0 (x)) ∈ D ∀x ∈ [a, b]. Então, F (y) está bem definido no
subconjunto D = {y ∈ C 1 [a, b] ; (y(x), y 0 (x)) ∈ D ∀x ∈ [a, b]}.
Exemplo. Para cada d = 1, 2, · · · considere a função de evaluação L(Y ) = Y (a) definida em
¡
¢d
Y= C[a, b] . Esta função, que avalia Y (x) no extremo do intervalo [a, b], é linear, pois, para todo
c, c̃ ∈ R e todo Y, Ỹ ∈ Y, tem-se que
L(cY + c̃Ỹ ) = (cY + c̃Ỹ )(a) = cY (a) + c̃Ỹ (a) = cL(Y ) + c̃L(Ỹ )
Usando a linearidade da derivada, obtem-se que o funcional L1 (Y ) = Y 0 ( a+b
2 ), definido em
¡ 1
¢d
C [a, b] , é também linear, uma vez que, ∀c, c̃ ∈ R e ∀ Y, Ỹ ∈ Y,
L1 (cY + c̃Ỹ )
=
(cY + c̃Ỹ )0 ( a+b
2 )
0 a+b
= cY 0 ( a+b
2 ) + c̃Ỹ ( 2 ) = cL1 (Y ) + c̃L1 (Ỹ )
Finalmente, em virtude da linearidade da integral, conclui-se que o funcional L(y) =
com y ∈ Y = C[a, b], é também linear, pois, ∀ c, c̃ ∈ R e ∀ Y, Ỹ ∈ Y,
Zb
L(cy + c̃ỹ) =
Zb
3x[cy + c̃ỹ](x) dx = c
a
a
3xy(x) dx,
Zb
3xy(x) dx + c̃
a
Rb
3xỹ(x) dx
a
= cL(y) + c̃L(ỹ)
Exemplo. Se J e J˜ são funções de valores reais definidas no subconjunto D de algum espaço linear
˜ eJ e sen J estão também definidos em
Y, então, para todo √
c, c̃ ∈ R, tem-se que cJ, cJ + c̃J˜ , J J,
−1
D. Entretanto J , J e tan J podem não estar definidos em todo o subconjunto D.
20
Capı́tulo 3. Fundamentos de Otimizaçao
3.2
Fundamentos de Otimizaçao
Os extremos de uma função real J, definida em um subconjunto D de um espaço linear Y, são os
pontos y0 ∈ D nos quais J assume um mı́nimo, isto é, J(y0 ) 6 J(y) ∀ y ∈ D, ou os pontos de
máximo, isto é, J(y0 ) > J(y) ∀ y ∈ D. Como os pontos de máximo de J são os pontos de mı́nimo
de −J, basta estudar os pontos de mı́nimo de uma função.
Em muitos problemas, além da existência, é de importância a unicidade de pontos extremos.
Dizemos que um ponto y0 ∈ D minimiza J unicamente em D se y0 satisfaz J(y0 ) 6 J(y), ∀ y ∈ D
e, além disso, a igualdade ocorre
R 1 se, e somente se, y = y0 .
Por exemplo, para J(y) = 0 y(x)2 dx definido em D = C[0, 1], é claro que y0 (x) = 0 é o único
ponto de mı́nimo de J.
Lema 3.1. Um ponto y0 ∈ D minimiza J em D se, e somente se, J(y0 + v) − J(y0 ) > 0 para todo
y0 + v ∈ D. Além disso, y0 é o único ponto de mı́nimo se a igualdade ocorre apenas para v = O
Demonstração.
Basta observar que, se y ∈ D, então y = y0 + v com v = y − y0 . Além disso,
y = y0 se, e somente se, v = O.
¥
Rb 0 2
Exemplo. Para o funcional J(y) = a y (x) dx, definido no conjunto D = {y ∈ C 1 [a, b] : y(a) =
0, y(b) = 1}, é claro que J(y) > 0. Se existe algum y1 ∈ D tal que J(y1 ) = 0, então y10 = 0, e
portanto y1 = c = constante, de onde segue que y1 6∈ D. Assim, J(y) > 0 ∀ y ∈ D. Para determinar
o ponto de mı́nimo nesse caso, usando a formulação do lema anterior, para y0 e y0 + v ∈ D, tem-se
que
Zb
[(y00 (x) + v 0 (x))2 − y00 (x)2 ] dx
J(y0 + v) − J(y0 ) =
a
Zb
Zb
2 y00 (x) v 0 (x)
=
a
Zb
0
dx +
2
y00 (x) v 0 (x) dx
v (x) dx > 2
a
a
Notar que 0 = y0 (a) = (y0 + v)(a) = v(a), e da mesma forma v(b) = 0. Desta observação, da
desigualdade acima e considerando y00 = c, com c constante, tem-se
Zb
J(y0 + v) − J(y0 ) > 2 c
¯b
v 0 (x)dx = c v(x)¯a = 0.
a
Além disso, para y0 (x) = (x − a)/(b − a), tem-se y00 = c e y0 ∈ D. Pelo lema anterior, y0 minimiza
J em D. Além disso, y0 é único, uma vez que, se temos a igualdade J(y0 + v) − J(y0 ) = 0, então,
Rb
necessariamente a v 0 (x)2 dx = 0, e portanto v 0 (x) = 0, ou seja, v(x) = k, onde k é uma constante.
Como v(a) = 0, segue que v = O é o vetor nulo.
Proposição 3.2. Um ponto y0 minimiza J em D [unicamente] se,e somente se, para constantes
c0 e c 6= 0, y0 minimiza c2 J + c0 em D [unicamente].
Demonstração.
Se o ponto y0 minimiza J em D, então, para todo y ∈ D, J(y0 ) 6 J(y), e
portanto (c2 J + c0 )(y0 ) 6 (c2 J + c0 )(y), isto é, y0 minimiza c2 J + c0 em D. Reciprocamente,
se y0 minimiza c2 J + c0 , então, para y ∈ D, (c2 J + c0 )(y0 ) 6 (c2 J + c0 )(y), de onde segue que
J(y0 ) 6 J(y), isto é, y0 minimiza J em D.
¥
Assim, pelo exemplo anterior, y0 (x) = (x − a)/(b − a) também minimiza unicamente o funcional
Rb
J1 (y) = 3 a (y 0 (x)2 + sen3 (x)) dx = 3J(y) + c0 no mesmo domı́nio D.
21
Capı́tulo 3. Vı́nculos
3.3
Vı́nculos
Proposição 3.3. Se o ponto y0
minimiza [unicamente] o funcional J˜ = J +
N
X
λi Gi em
i=1
D , onde λ1 , λ2 , . . . , λN são constantes e J, G1 , G2 , . . . , GN são funções definidas
em D, então y0 minimiza [unicamente] J restrito ao conjunto D ∩ Gy0 , em que
Gy0 = {y ∈ D ; Gi (y) = Gi (y0 ), i = 1, 2, . . . , N }.
Demonstração.
(3.1)
Como y0 minimiza J˜ em D, para cada y ∈ D tem-se
˜ = J(y) +
J(y)
N
X
˜ 0 ) = J(y0 ) +
λi Gi (y) > J(y
i=1
N
X
λi Gi (y0 ).
i=1
Mas, se y ∈ Gy0 , então J(y) > J(y0 ), já que os termos envolvendo as funções Gi terão os mesmos
valores em cada lado da inequação. Logo y0 minimiza J em D quando restrito a Gy0 .
¥
De fato, y0 minimiza J automaticamente em um conjunto muito maior, segundo o corolário a
seguir.
Corolário 3.4. Nas condições da proposição anterior, y0 minimiza [unicamente] J restrito ao
conjunto em D ∩ G∗y0 , em que
G∗y0 = {y ∈ D ; λi Gi (y0 ) > λi Gi (y),
Demonstração.
(3.2)
i = 1, 2, . . . , N }.
Para y ∈ G∗y0 , a desigualdade (3.1) nos dá
J(y) − J(y0 ) >
N
X
[λi Gi (y0 ) − λi Gi (y)] > 0.
i=1
Além disso, se y0 minimiza unicamente J˜ em D e y ∈ G∗y0 é tal que J(y) = J(y0 ), então λj Gj (y0 ) =
˜ = J(y
˜ 0 ), de onde segue que y = y0 .
λj Gj (y), j = 1, 2, · · · , N , e portanto J(y)
¥
Este resultado ilustra um importante princı́pio, o de que a solução de um problema de minimização pode também nos dar uma solução para outros problemas.
Exemplo (Coluna de fluido em rotação). Suponha que um cilindro circular de raio l contenha
um certo volume de água em rotação em torno de seu eixo vertical com um velocidade angular
constante ω. A figura a seguir ilustra esta situação.
A água está sobre a ação da força gravitacional, direcionada verticalmente para baixo, e da
força centrı́peta, que tem direção radial. Nessas condições, a superfı́cie da água assume uma forma
diferente da inicial, que lembra o interior de um ciclone, sendo que esse movimento preserva o
volume e minimiza a diferença entre a energia potencial e a energia cinética do lı́quido (ação).
Intuitivamente, pode-se supor que a superfı́cie da água transforma-se em uma superfı́cie de revolução
em torno do eixo vertical do cilindro. Introduzindo o sistema de coordenadas como na figura, a
secção dessa superfı́cie pelo plano y0x define a curva y0 (x), para x no intervalo [0, l]. A curva y0 (x)
é aquela que minimiza o funcional da ação, deduzido a seguir:
Particionamos o domı́nio dividindo o seguimento [0, l] em n pedaços. Supondo, por aproximação,
que a casca cilı́ndrica correspondente ao pedaço [xi−1 , xi ] possui uma altura constante igual a
i
hi = y(xi ), onde xi = xi +x
, podemos calcular sua energia potencial gravitacional Fi e sua energia
2
cinética Ki .
22
Capı́tulo 3. Vı́nculos
Figura 3.1.
Coluna de Fluido em Rotação
A massa da casca pode ser calculada por:
mi = ρVi = ρAi hi ,
onde Ai = π(x2i − x2i−1 ) = π(xi + xi−1 )(xi − xi−1 ) = 2πxi (xi − xi−1 ) = 2πxi ∆xi é a área do anel,
e ρ é a densidade da água.
Portanto, denotando por g a aceleração da gravidade, a energia potencial gravitacional será
hi
= ρπy 2 (xi )xi ∆xi g
2
e a energia cinética, admitindo que a coluna de água se comporte como um corpo rı́gido em rotação,
é dada por
(vi )2
(ωxi )2
Ki = m i
= mi
= ρπω 2 x2i y(xi )xi ∆xi .
2
2
Então, na casca
Ji = Fi − Ki = πρ[gy 2 (xi ) − ω 2 x2i y(xi )]xi ∆xi ,
Fi = mi g
e, portanto, temos que a ação aproximada de toda coluna será
Jn =
n
X
Ji ,
i=1
que é a soma de Riemman da função f (x) = πρ[gy 2 (x) − ω 2 x2 y(x)]x . Então, quando n → ∞,
obtém-se que a ação total do lı́quido é dada por:
Zl
[gy 2 (x) − ω 2 x2 y(x)]x dx,
J(y) = lim Jn = πρ
n→∞
0
cujo domı́nio é o conjunto D = {y ∈ C[0, l] : y(x) > 0}. Por outro lado, o volume do lı́quido é dado
por
Zl
G(y) = 2π xy(x) dx,
0
23
Capı́tulo 3. Vı́nculos
uma vez que é o volume de um sólido de rotação.
Pela Proposição 3.3, a curva que minimiza o funcional J e preserva o volume G é a mesma que
˜
˜
minimiza o funcional J(y)
= J(y) + λG(y), definido em D. Sabemos que y0 minimiza J(y)
se, e
˜ 0 + v) − J(y
˜ 0 ) > 0, ∀y0 + v ∈ D. Portanto, trocando λ por ρλ/2, simplificando e
somente se, J(y
˜ 0 + v) − J(y
˜ 0 ), obtém-se
usando a abreviação ∆J˜ = J(y
Zl
∆J˜ = πρ
{g[(y0 + v)2 (x) − y02 (x)] + (λ − ω 2 x2 )v(x)}x dx
0
Zl
{gv 2 (x) + [2gy0 (x) + (λ − ω 2 x2 )]v(x)}x dx
= πρ
0
Zl
[2gy0 (x) + (λ − ω 2 x2 )]v(x)x dx.
> πρ
0
e a última integral se anula para todo y0 + v ∈ D se o termo entre colchetes for identicamente nulo,
Rl
ω 2 x2 − λ
ou seja, se y0 (x) =
. Além disso, a igualdade ocorre se, e somente se, 0 v 2 (x)x dx = 0,
2g
o que implica v(x) ≡ 0. Segue-se que y0 minimiza unicamente J˜ em D. Portanto, a superfı́cie é
um parabolóide de revolução. Agora, devemos determinar a constante λ para que o vínculo seja
satisfeito:
Zl
π
πl2 ω 2 l2
λ
G(y0 ) =
(ω 2 x2 − λ)x dx =
[
− ] = Gy0
g
g
4
2
0
e, então,
λ=
ω 2 l2
2gGy0
−
.
2
πl2
Portanto,
ω 2 (2x2 − l2 ) Gy0
+ 2.
4g
πl
Observe que a forma que minimiza a ação depende, como se esperaria, de ω, possuindo altura
constante para ω = 0 (tambor parado). Mas, é independente da densidade ρ, e seria a mesma para
outro fluido (perfeito) à mesma velocidade angular.
y0 (x) =
Proposição 3.5. Suponha que f e g sejam contı́nuas em [a, b] × R2 . Suponha ainda que, para alguRb
ma função λ ∈ C[a, b], tem-se que y0 minimiza F̃ (y) = a f˜[y(x)]dx em D ⊆ C 1 [a, b] [unicamente],
Rb
onde f˜ = f + λg. Então y0 minimiza F (y) = a f [y(x)]dx em D [unicamente] sujeito ao vı́nculo
(3.3)
Demonstração.
λ(x) g[y(x)] 6 λ(x) g[y0 (x)]
∀x ∈ [a, b].
Se y ∈ D, então F̃ (y) > F̃ (y0 ), isto é,
Zb
F (y) +
Zb
λ(x) g[y(x)] dx > F (y0 ) +
a
λ(x) g[y0 (x)] dx.
a
Logo, se y satisfaz 3.3,
Zb
F (y) − F (y0 ) >
λ(x) (g[y0 (x)] − g[y(x)]) dx > 0
a
24
Capı́tulo 3. Variações de Gâteaux
Rb
Além disso, se F (y) = F (y0 ) com a condição (3.3) acima, então a λ(x) (g[y0 (x)] − g[y(x)]) dx = 0,
e F̃ (y) = F̃ (y0 ). Assim, se y0 minimiza F̃ unicamente, então y0 também minimiza F unicamente.
¥
Lamentavelmente este resultado, embora sugestivo, não pode ser implementado rapidamente, já
que ele não provê um método para a determinação de uma função λ conveniente. No entanto, o
resultado pode ser utilizado a partir de uma solução conhecida de outro problema. Por exemplo,
Rb
da análise utilizada na aplicação anterior, obtém-se que y0 = x2 − 1 minimiza F̃ (y) = 0 [y 2 (x) +
(2 − 2x2 ) y(x)]x dx unicamente em D = C[0, b]. Tomando λ(x) = x na Proposição 3.5, segue que y0
Rb
também minimiza F (y) = 0 2x y(x) dx em D unicamente, se sujeito ao vı́nculo Lagrangeano
g[y(x)] = y 2 (x) − 2x2 y(x) 6 g[y0 (x)] = 1 − x4 ,
def
onde usamos o fato de λ(x) = x > 0 em [0, b].
3.4
Variações de Gâteaux
No estudo da otimização de funções escalares definidas em subconjuntos de Rd , o conceito de
derivada parcial — ou mais geralmente de derivada direcional — desempenha um papel decisivo.
Da mesma forma, quando J é um funcional definido num subconjunto de um espaço linear Y
qualquer, por exemplo, se Y é o conjunto de todas as funções reais contı́nuas num intervalo [a, b],
define-se a chamada variação de Gâteaux, que é uma generalização direta do conceito de derivada
direcional.
Definição 3.6. Seja J um funcional definido em um subconjunto D de¯ um
¯ espaço linear Y. Assuma
que, para y ∈ D e v ∈ Y, existe σ > 0 tal que y + ²v ∈ D para todo ¯²¯ < σ. Então, caso exista, o
limite
J(y + ²v) − J(y)
δJ(y; v) = lim
²→0
²
é chamado Variação de Gâteaux de J em y na direção de v.
∂
É interessante notar que a definição acima coincide com a “derivada ordiária” ∂²
J(y + v²) da
função ² 7→ J(y + ²v) no ponto ² = 0, isto é,
δJ(y; v) =
¯
∂
J(y + v²)¯²=0 ,
∂²
caso essa derivada exista.
Como era de se esperar, por comparação com a derivada direcional de uma função escalar, a
variação de Gâteaux tem as seguintes propriedades:
i) Se δI(y; v), δJ(y; v) existem e a, b são números reais, então δ(aI + bJ)(y; v) também existe,
e δ(aI + bJ)(y; v) = aδI(y; v) + bδJ(y; v).
ii) Se δJ(y; v) existe, então δJ(y; cv) também existe para todo c ∈ R, e tem-se δJ(y; cv) =
cδJ(y; v). Esta propriedade garante que, se δJ(y; v) = 0, então δJ(y; cv) = 0 para todo
c ∈ Rd .
A variação de Gâteaux, assim como a derivada, depende somente do comportamento local do
funcional, e pode acontecer de não existir em qualquer direção v 6= 0, ou de existir em algumas
direções, mas não em outras.
Exemplo. Se J ∈ C 1 (Rd ) e Y, V ∈ Rd , então
δJ(Y ; V ) = lim
²→0
J(Y + ²V ) − J(Y )
,
²
25
Capı́tulo 3. Variações de Gâteaux
é exatamente a derivada direcional de J no ponto Y e na direção V , em que a direção é geralmente
um vetor unitário. Portanto, temos que
­
®
δJ(Y ; V ) = ∇J(Y ), V
e isso vale para todo V ∈ Y.
Rb
Exemplo. O funcional J(y) = a [sen3 x + y 2 (x)] dx está definido em Y = C[a, b]. Assim, para
y, v ∈ Y fixas e ² 6= 0, tem-se que y + ²v ∈ Y, já que Y é um espaço linear. Segue-se que J(y + ²v)
está definido e, além disso,
Zb
1
J(y + ²v) − J(y)
=
²
²
[(y + ²v)2 (x) − y 2 (x)] dx
a
Zb
=2
Zb
v 2 (x) dx.
y(x) v(x) dx + ²
a
a
Tomando o limite com ² → 0, concluı́mos que
Zb
δJ(y; v) = 2
y(x) v(x) dx,
∀ y, v ∈ Y.
a
Alternativamente,
poderı́amos ter obtido esse resultado usando o fato de que δJ(y; v) =
¯
²v)¯²=0 . Neste caso,
∂
∂² J(y
+
Zb
[sen3 x + (y + ²v)2 (x)] dx
J(y + ²v) =
a
Zb
Zb
2
= J(y) + 2²
a
∂
de onde segue que
J(y + ²v) = 2
∂²
v 2 (x) dx,
y(x) v(x) dx + ²
Zb
a
Zb
v 2 (x) dx, e obtemos o mesmo resultado
y(x) v(x) dx + 2²
a
anterior calculando essa derivada no ponto ² = 0.
a
Em geral, é mais fácil tecnicamente usar o segundo método para calcular δJ em casos concretos
porque estamos mais familiarizados com as técnicas de derivar funções reais simples.
Zb
Exemplo. O funcional J(y) =
¡
¢
sen y(x) dx + y 2 (b), para o qual
a
Zb
J(y + ²v) =
¡
¢
sen y(x) + ²v(x) dx + (y + ²v)2 (b),
a
está definido em Y = C[a, b], e tem, em cada y ∈ Y e em cada direção v ∈ Y, a variação de Gâteaux
Zb
δJ(y; v) =
a
¡
¢
cos y(x) v(x) dx + 2 y(b) v(b).
26
Capı́tulo 3. Variações de Gâteaux
Zπ p
Exemplo. O funcional J(y) =
1 − y(x)2 dx não está definido em Y = C[0, π], mas no sub0
° °
¯
¯
° °
conjunto D = {y ∈ Y ; °y °M 6 1}, onde °y °M = max{¯y(x)¯ ; x ∈ [0, π]}. Assim, se y1 (x) = sen x
e y2 (x) = x, ∀ x ∈ [0, π], conclui-se que y1 (x) ∈ D, enquanto
que y2 (x)
¯
¯ 6∈ D. Além disso, para um
dado y ∈ Y, somente aquelas direções v para as quais ¯y(x) + ²v(x)¯ 6 1, com ² suficientemente
pequeno, devem ser consideradas. Por exemplo, y(x) ≡ 1 ∈ D, entretanto, a única direção possı́vel
para y é v(x) ≡ 0.
Aplicando então o segundo método ao cálculo da variação de Gâteaux de J(y), assumindo que
y + ²v ∈ D, para algum y ∈ D e v ∈ Y, tem-se:
∂
∂
J(y + εv) =
∂ε
∂ε
Zπ p
1 − (y +
εv)2 (x) dx
0
0
Zπ
=−
0
Zπ p
∂
=
1 − (y + εv)2 (x) dx
∂ε
(y + εv)(x) v(x)
p
dx,
1 − (y + εv)2 (x)
Zπ
e, para ε = 0, obtem-se que δJ(y, v) = −
0
y(x) v(x)
p
dx.
1 − y 2 (x)
Z1
x(t) y 0 (t) dt está definido em Y = (C 1 [0, 1])2 . Além
Exemplo. O funcional da área A(Y ) =
0
disso, se V = (u, v) ∈ Y, então Y + εV também pertence a Y , pois este é um espaço vetorial.
Segue que A(Y + εV ) está definido e, usando a abreviação Ã(ε) = A(Y + εV ),
Z1
Ã(ε) =
¡
¢¡
¢0
x(t) + εu(t) y(t) + εv(t) dt
0
Z1
=
¡
¢
x(t) y 0 (t) + ε x(t) v 0 (t) + u(t) y 0 (t) + ε2 u(t) v 0 (t) dt.
0
Dessa igualdade segue que
∂
A(Y + εV ) =
∂ε
Z1
¡
¢
x(t) v 0 (t) + u(t) y 0 (t) + 2ε u(t) v 0 (t) dt
0
e portanto A(Y ) possui, em cada Y ∈ Y e em cada direção V ∈ Y, a variação de Gâteaux
¯
∂
δA(Y ; V ) =
A(Y + εV )¯ε=0 =
∂ε
Z1
¡
¢
x(t) v 0 (t) + u(t) y 0 (t) dt
0
Exemplo. Para f ∈ C 1 ([a, b] × R2d ), d = 1, 2, 3, . . ., o funcional
Zb
F (Y ) =
a
¡
¢
f x, Y (x), Y 0 (x) dx =
Zb
a
£
¤
f Y (x) dx
27
Capı́tulo 3. Funcionais Convexos
¡
¢d
está definido em Y = C 1 [a, b] . Calculando a variação de Gâteaux pelo segundo método, com
V ∈ Y, tem-se
Zb
¡
¢
F (Y + ²V ) = f x, (Y + ²V )(x), (Y + ²V )0 (x) dx
a
e portanto, derivando sob o sinal de integral e usando a Regra da Cadeia,
Zb
δF (Y ; V ) =
­
® ­
®
fY [Y (x)], V (x) + fZ [Y (x)], V 0 (x) dx
a
£
¤
£
¤
onde, denotando-se as variáveis por (x, y1 , · · · , yd , z1 , · · · , zd ) ∈ [a, b] × R2d , fY Y (x) e fZ Y (x)
são as funções de valores vetoriais de componentes dadas, respectivamente, por
£
¤
¡
¢
fyj Y (x) = fyj x, Y (x), Y 0 (x)
£
¤
¡
¢
fzj Y (x) = fzj x, Y (x), Y 0 (x)
j = 1, 2, . . . , d.
3.5
Funcionais Convexos
Recordemos que uma função f , de classe C 1 em Rd , é convexa se satisfaz
­
®
f (Y + V ) − f (Y ) > ∇f (Y ), V
∀ Y, V ∈ Rd ,
e é estritamente convexa quando a igualdade ocorre se, e somente se, V = O. Recordemos,
ainda,
­
®
que a derivada direcional de f é precisamente a sua variação de Gâteaux, isto é, ∇f (Y ), V =
δf (Y ; V ). Por analogia, e generalizando este resultado para funcionais, introduzimos a seguinte
Definição 3.7. Um funcional real J, definido em um conjunto D de um espaço linear Y, é convexo
em D se, para todo y, y + v ∈ D, existe a variação de Gâteaux δJ(y; v) e, além disso, J satisfaz
J(y + v) − J(y) > δJ(y; v).
O funcional J é estritamente convexo se a igualdade ocorre apenas para v = O.
Propriedades análogas às das funções convexas também são válidas para os funcionais convexos,
como ilustram as proposições a seguir.
Proposição 3.8. Se J e F são funcionais convexos em um subconjunto D de um espaço linear
Y, então, para qualquer c ∈ R, c2 J e J + F também são convexos. Além disso, c2 J e J + F são
estritamente convexos se J o for.
Demonstração.
Basta notar que, se y, y + v ∈ D, então
¡ 2
¢
¡
¢
¡
¢
c J + F (y + v) − c2 J + F (y) > c2 δJ(y; v) + δF (y; v) = δ c2 J + F (y; v).
Logo, se c2 = 1, tem-se a convexidade de J + F , e se F = 0, tem-se a convexidade de c2 J.
¥
Proposição 3.9. Se o funcional J é convexo em D e y0 ∈ D é tal que δJ(y0 ; v) = 0 ∀ y0 + v ∈ D,
então y0 minimiza J em D. Se, além disso, J é estritamente convexo, então y0 é o único ponto de
mı́nimo de J.
Demonstração.
Se y ∈ D, definindo v = y − y0 , obtém-se
J(y) − J(y0 ) = J(y0 + v) − J(y0 ) > δJ(y0 ; v) = 0,
isto é, y0 minimiza J em D. Se J é estritamente convexo, obtém-se que J(y) − J(y0 ) > 0
e portanto y0 é o único ponto de mı́nimo de J em D.
∀ y 6= y0 ,
¥
28
Capı́tulo 3. Funcionais Convexos
Zb
Exemplo.
δJ(y; v) = 2
que
Para
Rb
a
o
funcional
[sen3 x + y 2 (x)] dx
J(y) =
tem-se
a
y(x) v(x) dx ∀ y, v ∈ Y = C[a, b].
Logo, J é estritamente convexo em Y, já
Zb
(y + v)2 (x) − y 2 (x) dx
J(y + v) − J(y) =
a
Zb
=2
Zb
a
Zb
v 2 (x) dx > 2
y(x) v(x) dx +
a
y(x) v(x) dx = δJ(y; v).
a
Rb
e a igualdade ocorre se, e somente se, a v 2 (x) dx = 0, que só é possı́vel se a função contı́nua v 2 (x)
for nula. Logo, como y0 = O ∈ Y é tal que δJ(y0 , v) = 0 ∀ v ∈ Y, então y0 minimiza J em Y
unicamente.
Por
outro
lado,
com
o
objetivo
de
minimizar
o
funcional
J
em
D = {y ∈ C[a, b] ; y(a) = a1 , y(b) = b1 }, devemos obter δJ(y; v) = 0, mas somente para aqueles y, y + v ∈ D, isto é, somente para os v ∈ D0 = {v ∈ C[a, b] ; v(a) = v(b) = 0}. Novamente,
y0 = O faria com que δJ(y0 ; v) = 0, mas agora y0 6∈ D, a menos que a1 = b1 = 0.
Zb
y 0 (x)2 dx , definido no conjunto Y = C 1 [a, b], é tal que
Exemplo. O funcional F (y) =
δF (y; v) = 2
Rb
a
a
y 0 (x) v 0 (x) dx
∀ y, v ∈ Y. Logo, é também convexo, já que
Zb
Zb
0
F (y + v) − F (y) =
2
y 0 (x)2 dx
(y + v) (x) dx −
a
a
Zb
Zb
0
=2
0
y (x) v (x) dx +
a
Mas agora a igualdade só ocorre se
não é estritamente convexo em Y.
a
2
y 0 (x) v 0 (x) dx = δF (y; v).
v (x) dx > 2
a
Rb
Zb
0
a
v 0 (x)2 dx = 0, isto é, se v(x) = c, onde c ∈ R, e, portanto F
Capı́tulo 4
As Equações de Euler-Lagrange
A solução de Jakob Bernoulli, em 1696, para o problema da braquistócrona, proposto por seu
irmão Johann Bernoulli, marcou o inı́cio das considerações variacionais. Contudo, somente com os
trabalhos de Euler e Lagrange é que surgiu a teoria sistemática conhecida hoje.
No princı́pio, esta teoria estava restrita apenas à busca de condições necessárias para que a
integral
Zb
Zb
¡
¢
£
¤
0
f x, y(x), y (x) dx = f y(x) dx
a
a
possuı́sse um extremo local no conjunto
D ⊆ {y ∈ C 1 [a, b] ; y(a) = a1
e y(b) = b1 },
em que a1 e b1 são valores dados, sendo este, portanto, um problema de extremos fixos. Entretanto,
já interessava a Jakob Bernoulli procurar um extremo num conjunto mais amplo, a saber
Db ⊆ {y ∈ C 1 [a, b] ; y(a) = a1 },
o qual descreve uma braquistócrona modificada, na qual se deseja saber o tempo mı́nimo de percurso
descendente a partir de um ponto fixo até uma barra vertical, porém sem especificar nenhum ponto
em particular nessa barra. Este é conhecido como o problema de um extremo livre.
Há, também, problemas com as duas extremidades livres, em subconjuntos arbitrários de
C 1 [a, b].
Um problema relacionado com o de extremos livres é o de unir curvas fixas, denominadas
transversais, no qual poderia ser necessário minimizar a integral de limites variáveis
Zx2
F (y, x1 , x2 ) =
0
¢
Zx2
f x, y(x), y (x) dx =
x1
no conjunto
¡
£
¤
f y(x) dx
x1
¡
¢
Dτ ⊆ {y ∈ C 1 [x1 , x2 ] ; τ xj , y(xj ) = 0 , j = 1, 2},
onde [x1 , x2 ] ⊆ R, e τj são funções dadas.
Todos esses problemas admitem uma formulação variacional comum: se y0 ∈ C 1 [a, b] é, digamos,
uma função minimizante local para um desses problemas, então, com uma seleção apropriada de
a1 , b1 e D, podemos supor que D ⊆ Db ou D ⊆ Dτ , de acordo com o problema. Em cada caso, y0 é
uma função minimizante local para F em D, o problema de extremos fixos considerado inicialmente.
Consequentemente, δF (y0 ; v) = 0, para toda direção v ∈ D0 = {v ∈ C 1 [a, b] ; v(a) = v(b) = 0}, tal
que δJ(y0 ; v) esteja definida.
Quando f é suficientemente diferenciável, há muitas dessas direções para inferir que, em (a, b),
y0 é uma solução da Primeira e da Segunda equações de Euler-Lagrange. Estas equações, cujas
soluções C 1 são, por definição, as funções estacionárias de f , serão tratadas nas Seções 4.1 e 4.3 a
seguir.
A liberdade adicional de trabalhar em Db ou em Dτ permite variações em outras direções
especificamente relacionadas à liberdade dos pontos extremos, e isto dá origem às correspondentes
condições naturais de fronteira que a função extremo deve satisfazer. Problemas envolvendo vı́culos
isoperimétricos serão considerados por meio do método dos Multiplicadores de Lagrange, e esta
formulação é extendida para solucionar problemas com vı́nculos de Lagrange de uma forma simples.
Neste capı́tulo, usaremos em C 1 [a, b] a norma do máximo
° °
¯
¯ ¯
¯
°y ° = max{¯y(x)¯ + ¯y 0 (x)¯ ; x ∈ [a, b]}.
M
30
Capı́tulo 4. Primeira Equação: Funções Estacionárias
4.1
Primeira Equação: Funções Estacionárias
Suponha inicialmente que a função f = f (x, y, z), juntamente com suas derivadas fy e fz , sejam
contı́nuas em [a, b] × R2 . Então, o funcional
Zb
F (y) =
¡
¢
f x, y(x), y (x) dx =
Zb
0
a
£
¤
f y(x) dx
a
está definido em Y = C 1 [a, b], e tem, em cada direção v ∈ Y, a variação de Gâteaux
Zb
δF (y; v) =
£
¤
£
¤
fy y(x) v(x) + fz y(x) v 0 (x) dx,
a
£
¤
£
¤
onde
a notação abreviada f y(x) = f (x, y(x), y 0 (x)), analogamente para fy y(x) e
£ usamos
¤
fz y(x) .
Para melhor compreender estas variações, usaremos os resultados abaixo.
Zb
Lema
4.1.
Se
h ∈ C[a, b]
h(x) v 0 (x) dx = 0
e
para
todo
v
pertencente
a
a
D0 = {v ∈ C 1 [a, b] ; v(a) = v(b) = 0}, então h é constante em [a, b].
¢
Rx¡
Demonstração.
Para uma constante dada c, tem-se que a função v(x) = a h(t) − c dt pertence a C 1 [a, b], com derivada v 0 (x) = h(x) − c em (a, b) e satisfaz à condição de que v(a) = 0.
¢
Rb¡
Além disso, v(x) pertence a D0 se v(b) = 0, para o que devemos ter a h(t) − c dt = 0, isto é,
Rb
1
c = b−a
h(t) dt, que é a média de h em [a, b]. Com esta escolha de v e c tem-se, por hipótese, que
a
Zb
Zb
Zb
¯b
¡
¢2
¡
¢ 0
0 6 h(x) − c dx = h(x) − c v (x) dx = h(x) v 0 (x) dx − c v(x)¯a = 0.
a
a
a
¡
¢2
Como o integrando é contı́nuo, concluı́mos que h(x) − c ≡ 0, isto é, h(x) = c em [a, b].
¥
Zb
Proposição
4.2.
Se
g, h ∈ C[a, b]
g(x) v(x) + h(x) v 0 (x) dx = 0
e
para
todo
a
v ∈ D0 = {v ∈ C 1 [a, b] ; v(a) = v(b) = 0} então h ∈ C 1 [a, b] e h0 = g.
Rx
Demonstração.
Seja a função G(x) = a g(t) dt para x ∈ [a, b]. Então G ∈ C 1 [a, b] e G0 = g.
Integrando por partes e usando a hipótese, obtém-se que, ∀ v ∈ D0 ,
Zb
Zb
¯b
¡
¢
0
¯
0 = g(x) v(x) + h(x) v (x) dx = G(x) v(x) a + h(x) − G(x) v 0 (x) dx
a
a
Zb
=
¡
¢
h(x) − G(x) v 0 (x) dx
a
e, pelo Lema 4.1 visto anteriormente, h − G = c é constante em [a, b].
h = G + c ∈ C 1 [a, b] e h0 = G0 = g.
Mas então
¥
31
Capı́tulo 4. Casos Especiais da Primeira Equação
Tomando h ≡ 0 na proposição acima, obtém-se o seguinte
Zb
Corolário
4.3.
Se
g ∈ C[a, b]
e
g(x) v(x) dx = 0
para
todo
v
pertencente
a
Proposição 4.4. Se y ∈ Y é tal£ que¤ δF (y; v) = 0, para todo v pertencente
D0 = {v ∈ Y ; v(a) = v(b) = 0}, então fz y(x) ∈ C 1 e, além disso, satisfaz a equação
a
a
D0 = {v ∈ C 1 [a, b] ; v(a) = v(b) = 0}, então g ≡ 0 em [a, b].
Destes resultados obtém-se a
¤
£
¤
d £
fz y(x) = fy y(x)
dx
¯b
£
¤
de onde segue que δF (y; v) = fz y(x) v(x)¯a ∀v ∈ Y.
(4.1)
x ∈ (a, b),
Demonstração.
Lembrando que a variação de Gâteaux de F é dada por
¤
£
¤ 0
Rb £
δF (y; v) =£ a f¤y y(x) v(x) + £fz y(x)
usando
a¤ Proposição 4.2 acima,
com
¤ v (x) dx,
£
g(x) = fy y(x) e h(x) = fz y(x) , obtem-se que fz y(x) ∈ C 1 e satisfaz à equação 4.1.
Substituindo esta equação na variação de Gâteaux de F , obtem-se
Zb
δF (y; v) =
a
´
¯b
¤
£
¤
d ³ £
fz y(x) v(x) dx = fz y(x) v(x)¯a
dx
∀v ∈ Y.
¥
Definição 4.5. A equação (4.1) acima é dita Primeira Equação de Euler-Lagrange de f , e as
soluções y ∈ C 1 dessa equação em algum intervalo são ditas Funções Estacionárias para f .
4.2
Casos Especiais da Primeira Equação
Apesar de toda função y em C 1 ser estacionária para f (x, y, z) = z ou f (x, y, z) = y z, geralmente
é difı́cil encontrar soluções para a Primeira Equação de Euler-Lagrange. Contudo, quando uma ou
mais variáveis não estão explı́citas, pode-se pelo menos obter uma primeira integral desta equação,
como indicado nos três casos que seguem.
4.2.1
Caso em que f = f (z)
£
¤
d
Neste
caso,
f
=
0,
e
a
Primeira
Equação
de
Euler-Lagrange
reduz-se
a
(
)f
y(x)
= 0, ou seja,
y
z
dx
£
¤
fz y(x) = constante. Assim, as funções estacionárias têm derivadas que estão sobre os conjuntos
de nı́veis de fz . Em particular, as funções lineares, para as quais y 0 = c, são funções estacionárias.
Exemplo. Na caracterização das geodésicas do cilindro circular reto
com raio unitário, chegaRθ p
se ao problema de minimizar o seguinte funcional L(y) = 0 2 1 + [y 0 (θ)]2 dθ no conjunto
D = {y ∈ C 1 [0, θ2 ] ; y(0) = y1 e y(θ2 ) = y2 }. Para esse funcional, tem-se
p
z
,
f = f (z) = 1 + z 2 e fz (z) = √
1 + z2
e portanto, uma condição necessária para que um dado y ∈ D minimize L em D é que y seja
y0
estacionário, isto é, p
= c, de forma que y 0 = constante. Neste caso, as únicas funções
1 + y0 2
estacionárias são as lineares y(θ) = c1 θ + c2 , que correspondem às hélices circulares do cilindro.
Capı́tulo 4. Casos Especiais da Primeira Equação
4.2.2
32
Caso em que f = f (x, z)
£
¤
Neste, fy (x, z) = 0 e a Primeira Equação de Euler-Lagrange reduz-se mais uma vez a fz y(x) =
constante.
Exemplo. Para a caracterização das geodésicas suaves em uma esfera de raio R, que podem ser
parametrizadas, em coordenadas esféricas, por funções θ = y(φ), devemos minimizar o funcional
Rφ p
L(y) = R 0 1 1 + [y 0 (φ) sen φ]2 dφ, no conjunto D1 = {y ∈ C 1 [0, φ1 ] ; y(φ1 ) = 0}.
p
2
Neste£ caso,
¤ f (φ, z) = R 1 + [z sen φ] , e portanto as funções estacionárias são aquelas para as
quais fz y(φ) = constante, isto é,
£
¤
R y 0 (φ) sen2 φ
fz y(φ) = p
= constante
1 + [y 0 (φ) sen φ]2
£
¤
Em particular, se φ = 0, esta expressão se anula, e portanto fz y(φ) = 0 para todo φ, o que implica
em y 0 (φ) = 0. Assim, as funções estacionárias no domı́nio D1 são aquelas que satisfazem y 0 (φ) = 0.
4.2.3
Caso em que f = f (y, z)
Para este caso, com as abreviações anteriores, segue da Regra da Cadeia que, se y ∈ C 2 , então
¤
¢
£
¤
£
¤
d ¡
d £
f y(x) =
f y(x), y 0 (x) = fy y(x) y 0 (x) + fz y(x) y 00 (x).
dx
dx
Com substituições e cancelamentos vemos que
¤
£
¤i
¤
£
¤
d h £
d £
f y(x) − y 0 (x) fz y(x) =
f y(x) − y 00 (x) fz y(x)
dx
dx
·
¸
¤
¤
£
¤
d £
d £
0
0
− y (x) fz y(x) = −y (x)
fz y(x) − fy y(x) ,
dx
dx
em que o lado esquerdo se anula para as funções estacionárias. Então, em cada intervalo de estacionariedade de y, tem-se
f [y(x)] − y 0 (x)fz [y(x)] = constante
Reciprocamente, se a equação acima vale em um intevalo em que y 0 não se anula, então y é estacionária.
Exemplo. Para a função f (y, z) = y 2 (1 − z)2 , onde a derivada£fz (y, z) = 2 ¤y 2 (z − 1), as funções
estacionárias y ∈ C 2 são as soluções da equação y 2 (1 − y 0 )2 − y 0 2 y 2 (y 0 − 1) = constante, a qual,
simplificada, resulta em
¡
2¢
(4.2)
y2 1 − y0 = c
Fazendo a substituição u = y 2 , de forma que u0 = 2 y y 0 , e substituindo em (4.2) obtem-se que u
2
satisfaz u0 = 4 (u − c), que possui a solução singular ũ0 ≡ c. Para u > c tem-se
√
¡√
¢0
1
2 u−c
u−c = √
u0 = ± √
= ±1
2 u−c
2 u−c
√
e integrando esta igualdade obtem-se u − c = x + c1 . Segue-se que a solução geral de (4.2) é dada
por
(4.3)
y 2 (x) = u = (x + c1 )2 + c
As constantes c e c1 podem ser encontradas de forma que y satisfaça as condições de fronteira. Por exemplo, as condições y(−1) = 0 e y(1) = 1 conduzem a c1 = 1/4 e c = −(3/4)2 .
33
Capı́tulo 4. Casos Especiais da Primeira Equação
p
Substituindo estas constantes em (4.3) obtem-se que y0 (x) = (x + 1) (x − 1/2),
√ que é de classe
C 2 apenas se x > 1/2 ou x < −1. Além disso, a solução singular y0 (x) ≡ c não satisfaz estas condições de fronteira. Por isto, para esta função, não existem funções estacionárias em
D = {y ∈ C 2 [−1, 1] ; y(−1) = 0 e y(1) = 1}.
Por
outro
lado,
y0
é
estacionária
para
a
função
f
no
conjunto
√
D1 = {y ∈ C1 [1, 2] ; y(1) = 1 e y(2) = 3/ 2}.
Exemplo. Para o problema da braquistócrona, formulado anteriormente, devemos minimizar o
funcional
Zx1 p
1 + y 0 (x)2
1
p
T (y) = √
dx
2g
y(x)
0
no conjunto
Zx1
D = {0 6 y ∈ Y ; y(0) = 0, y(x1 ) = y1
y(x)−1/2 dx < ∞}.
e
0
onde Y = C 1 [0, x1 ]. Neste caso, a menos de um fator constante,
√
1 + z2
z
f (y, z) = √
e
fz (y, z) = p
,
y
y(1 + z 2 )
e £ as funções
estacionárias,
de classe C 2 , que satisfazem, pelo caso anterior, a equação
¤
£
¤
0
f y(x) − y (x) fz y(x) = constante são as soluções de
p
³
´
1 + y0 2
y0
1
− y0 q
=q
= constante
√
y
2
y(1 + y 0 )
y(1 + y 0 2 )
2
Escolhendo a constante como c−1 , obtem-se y (1 + y 0 ) = c2 ou, equivalentemente,
r
y
(4.4)
y 0 = 1.
c2 − y
Para resolver essa equação,
introduzimos
a variável dependente
¡
¢
y = c2 sen2 (θ/2) = (c2 /2) 1 − cos(θ) ,para 0 6 θ 6 2π, obtendo
c2 − y = c2 cos2 (θ/2)
e
θ = θ(x)
tal
que
y 0 = c2 sen(θ/2) cos(θ/2) θ0 .
Substituindo estas expressões em (4.4), a equação correspondente na variável θ é dada por
¡
¢
c2 sen2 (θ/2) θ0 = 1,
ou ainda,
(c2 /2) 1 − cos(θ) θ0 = 1.
¡
¢
a qual, integrada, resulta em (c2 /2) θ − sen(θ) = x − c1 , para alguma constante c1 . Trocando c2 /2
por c2 , obtem-se as equações paramétricas
½
x = c2 (θ − senθ) + c1 ,
(4.5)
0 6 θ 6 θ1
y = c2 (1 − cos(θ)).
e vemos que as funções estacionárias são aquelas que determinam as curvas ciclóides. Para que
y ∈ D, necessitamos que y(0) = x(0) = 0, de onde segue que c1 = 0. As constantes c2 e θ1 < 2π
podem ser determinadas de forma que a ciclóide , além de passar pela origem, passe também pelo
ponto (x1 , y1 ).
Sobre a introdução da variável dependente θ = θ(x),
notamos que,
como
x0 (θ) = c2 (1 − cosθ) > 0 em (0, 2π), então a equação em x pode ser resolvida (implicita¡
¢
mente) por θ = θ(x) com tantas derivadas quantas forem necessárias. A composta y(x) = y θ(x) é
pelo menos C 2 em (0, 2π) e, com exceção do ponto inferior da cicóide, y 0 (x) 6= 0. Destas¡observações
¢
segue que esta função y(x) é estacionária para o problema. Entretanto, na origem, y 0 θ(0) = ∞,
e portanto esta função não está em D. Assim, apesar dos resultados obtidos, ainda não resolvemos
o problema dentro do contexto a que nos propusemos.
34
Capı́tulo 4. Segunda Equação de Euler-Lagrange
4.3
Segunda Equação de Euler-Lagrange
¡
¢
Suponha f ∈ C 1 [a, b] × R2 e que y ∈ C 1 [a, b] seja uma solução da Primeira Equação de EulerLagrange em [a, b], isto é,
£
¤
¤
d £
fz y(x) = fy y(x) .
dx
(4.6)
Usando esta equação e supondo, além disso, y ∈ C 2 , obtém-se que
£
£
£
¤
¤
¤
d
f [y(x)] = fx y(x) + fy y(x) y 0 (x) + fz y(x) y 00 (x)
dx
£
¤
£
¤i
d h 0
= fx y(x) +
y (x) fz y(x)
dx
Da igualdade acima segue que y satisfaz
¤
£
¤i
£
¤
d h £
f y(x) − y 0 (x) fz y(x) = fx y(x)
dx
que, integrada, resulta em
(4.7)
£
¤
£
¤
f y(x) − y 0 (x) fz y(x) =
Zx
£
¤
fx y(t) dt + c
a
para alguma constante c.
Esta última equação é chamada de Segunda Equação de Euler-Lagrange e, para obtê-la, foi
necessário supor y de classe C 2 , embora o termo y 00 não esteja explı́cito em (4.7). De fato, para o
¤
Rb £
funcional F (y) = a f y(x) dx definido em D = {y ∈ C 1 [a, b] ; y(a) = a1 e y(b) = b1 }, mostra-se
(ver página 154 de [1]) a seguinte
¡
¢
Proposição 4.6. Se f ∈ C 1 [a, b] × R2 e y0 ∈ D é um extremo local do funcional F em D então
y0 satisfaz a Segunda Equação de Euler-Lagrange
£
¤
£
¤
f y(x) − y 0 (x) fz y(x) =
Zx
£
¤
fx y(t) dt + c
a
em [a, b], para alguma constante c.
Em particular, se f = f (y, z), obtém-se o resultado do 3o caso considerado anteriormente (subseção 4.2.3, página 32), sem a hipótese adicional de que y seja de classe C 2 .
Exemplo.
Para
o
funcional
J,
que
D = {u ∈ C 1 [a, b] ; u(a) = a1 e u(b) = b1 }, onde
Zb ·
J(u) =
a
está
definido
no
conjunto
¸
1 0 2
u (t) − cos u(t) dt,
2
a função f é dada por f (x, y, z) = (1/2)z 2 − cos(y), e portanto fx ≡ 0, fy = sen(y) e fz = z. Logo,
de acordo com o resultado acima, um extremo local u de J em D satisfaz à equação
¡
¢
¡
¢
1
1 0 2
u (x) − cos u(x) − u0 (x)2 = − u0 (x)2 − cos u(x) = c,
2
2
2
que é uma forma integrada da conhecida equação do pêndulo.
£ 00 De fato,¡supondo
¢¤ u de classe C e
0
não constante, derivando essa equação obtém-se que −u (x) u (x) − sen u(x) = 0, de onde segue
que
¡
¢
u00 (x) − sen u(x) = 0,
que é a forma usual da equação que rege o movimento pendular.
35
Capı́tulo 4. Condições Naturais de Contorno
4.4
Condições Naturais de Contorno
No estudo dos pontos crı́ticos de uma função real J sobre D ⊂ Y, em que Y é¯ um espaço linear
normado, é natural considerarmos, para cada y ∈ D, as direções v ∈ Y nas quais J ¯D admite variação
em y, isto é, as direções v tais que y + εv ∈ D para todo ε suficientemente pequeno e δJ(y; v) existe.
Tais direções serão chamadas D-admissı́veis em y (para J).
Nosso objetivo agora é apresentar condições necessárias para minimizar o funcional
Zb
F (y) =
¡
¢
f x, y(x), y 0 (x) dx
a
restrito ao domı́nio Da = {y ∈ C 1 [a, b] ; y(b) = b1 }, no qual o valor de y no ponto a não está
especificado. Sabemos que, se y é um extremo local para F , então δF (y; v) = 0 para todo v Da –admissı́vel em y. Se f , fy e fz são funções contı́nuas em [a, b] × R2 , então todo
v ∈ D0a = {v ∈ C 1 [a, b] ; v(b) = 0} é Da –admissı́vel, e, da Proposição 4.4, segue que
¯b
£
¤
£
¤
0 = δF (y; v) = fz y(x) v(x)¯a = −fz y(a) v(a)
∀ v ∈ D0a .
Uma vez que v(x) = b − x é um elemento de D0a para o qual v(a) 6= 0, concluı́mos que, se y
é £um ponto
extremo para F em Da , então y deve satisfazer à condição natural de contorno
¤
fz y(a) = 0.£ Analogamente,
se y minimiza F em Db = {v ∈ C 1 [a, b] ; y(a) = a1 }, então y deve
¤
satisfazer fz y(b) = 0. Naturalmente, se y minimiza F em Y = C 1 [a, b], então as duas condições
acima são satisfeitas.
Podemos fazer uma aplicação interessante dos comentários anteriores ao problema da
braquistócrona com um dos extremos livre. Considere então o problema de minimizar o funcional
s
Zx1
1 + y 0 2 (x)
1
T (y) = √
dx.
y(x)
2g
0
¢−1/2
R x1 ¡
em D1 = {0 6 y ∈ C 1 [0, x1 ] ; y(0) = 0
e
y(x)
dx < ∞}. Conforme as observações
0
anteriores, um mı́nimo y de T deve satisfazer a condição natural de contorno , isto é,
£
¤
0 = fz y(x1 ) = q
y 0 (x1 )
£
¤.
y(x1 ) 1 + y 0 2 (x1 )
de onde segue que y 0 (x1 ) = 0, isto é, o gráfico de y deve interceptar a reta x = x1 ortogonalmente.
4.5
Multiplicadores de Lagrange
Como observado anteriormente, vı́culos nos pontos de fronteira não afetam a estacionariedade dos
¢
Rb ¡
possı́veis extremos para funcionais como F (y) = a f x, y(x), y 0 (x) dx, mas controlam as condições
de fronteira que os extremos devem satisfazer.
Entretanto, frequentemente, são encontrados vı́culos que operam sobre todo o intervalo [a, b].
Quando esses vı́nculos podem ser expressos na forma de uma integral, digamos, exigindo que
¢
Rb ¡
0
G(y) = a g x, y(x), y (x) dx assuma um valor prescrito, então o método dos Multiplicadores de
Lagrange pode ser empregado, como ilustra o resultado a seguir, onde usamos a notação acima e
cuja demonstração pode ser encontrada na página 161 de [1].
Teorema 4.7. Suponha que f = f (x, y, z) e g = g(x, y, z), juntamente com suas derivadas parciais
nas variáveis y e z, sejam contı́nuas em [a, b] × R2 . Seja y0 um extremo local para F (y) no domı́nio
D = {y ∈ C 1 [a, b] ; y(a) = a1 e y(b) = b1 }, restrito ainda ao vı́nculo
Gy0 = {y ∈ C 1 [a, b] ; G(y) = G(y0 )}.
36
Capı́tulo 4. Funções Estacionárias com Valores Vetoriais
Então,
se a variação de Gâteaux δG(y0 ; v) não se anula identicamente em
D0 = {v ∈ C 1 [a, b] ; v(a) = v(b) = 0}, existe λ ∈ R tal que y0 é estacionária para a função
modificada f˜ = f + λg, isto é, y0 é a solução da equação
¤
£
¤
d ˜£
fz y(x) = f˜y y(x)
dx
4.6
x ∈ (a, b).
Funções Estacionárias com Valores Vetoriais
Para examinar se uma curva, não necessariamente gráfico de uma função, pode representar matematicamente a braquistócrona, ou para procurar geodésicas sobre uma superfı́cie em geral, devemos
utilizar integrais dependentes de funções vetoriais. É também o caso para o Problema de Dido, que
agora estamos interessados em estudar do ponto de vista do Cálculo das Variações.
¡
¢d
Como
exemplo,
considere
o
espaço
linear
Y = C 1 [a, b] ,
de
elementos
0
0
0
0
Y
=
(y
,
y
,
.
.
.
,
y
),
tendo
derivadas
contı́nuas
Y
=
(y
,
y
,
.
.
.
,
y
)
com
norma
dada
por
1
2
d
1
2
° °
¯ ¯
¯
©¯
ª
¡d
¢
°Y ° = max ¯Y (x)¯ + ¯Y 0 (x)¯ ; x ∈ [a, b] . Neste caso, dados f ∈ C 1 [a, b] × R2d e A, B ∈ Rd , a
fim de caracterizar as funções Y0 ∈ Y que são extremos locais do funcional
Zb
F (Y ) =
¡
¢
f x, Y (x), Y 0 (x) dx =
a
Zb
£
¤
f Y (x) dx
a
¡
¢d
no domı́nio D = {Y ∈ C 1 [a, b] ; Y (a) = A e Y (b) = B}, devemos considerar as direções vetori¡
¢d
ais em D0 = {V ∈ C 1 [a, b] ; V (a) = V (b) = O}, de maneira inteiramente análoga ao caso já
considerado anteriormente. Além disso, devemos verificar se ε = 0 é ponto crı́tico das funções
reais ε 7→ F (Y0 + εV ) para V ∈ D0 e ε ∈ R suficientemente pequeno, isto é, se Y0 satisfaz
δF (Y0 ; V ) = 0 ∀V ∈ D0 .
Com a notação f (x, Y, Z) = f (x, y1 , . . . , yd , z1 , . . . , zd ), e usando a regra de Leibniz para diferenciação sob a integral, de forma inteiramente análoga à anterior obtém-se que
¯
∂
F (Y + εV )¯ε=0
∂ε
Zb
­ £
¤
® ­ £
¤
®
=
fY Y (x) , V (x) + fZ Y (x) , V 0 (x) dx,
δF (Y ; V ) =
a
onde fY e fZ são as funções de valores vetoriais com componentes fyj e fzj , respectivamente,
j = 1, . . . , d. Com esta notação, tem-se o
¡
¢
¡
¢d
Teorema 4.8. Se f = f (x, Y, Z) ∈ C 1 [a, b] × D para um domı́nio D ⊂ R2d e Y0 ∈ Y = C 1 [a, b]
é um extremo local do funcional F (Y ) no domı́nio
¡
¢
D = {y ∈ Y ; Y (a) = Y0 (a), Y (b) = Y0 (b) e Y (x), Y 0 (x) ∈ D},
então Y0 satisfaz ao sistema de equações
(4.8)
£
¤
£
¤
d
fZ Y (x) = fY Y (x) em (a, b), isto é,
dx
£
¤
£
¤
d
fz Y (x) = fyj Y (x)
dx j
j = 1, 2, . . . , d
Demonstração. Para D = R2d , o resultado é uma generalização imediata dos argumentos apresentados na demonstração da Proposição 4.4. Aqueles argumentos também se aplicam ao caso que
estamos considerando se todas as direções V ∈ D0 = {V ∈ Y ; V (a) = V (b) = 0} são D-admissı́veis
em Y0 . Mas isto é verdade para todo domı́nio aberto D ⊂ R2d , devido à compacidade
¡ do intervalo¢
[a, b], e faremos apenas um esquema desse argumento: para cada x ∈ [a, b], o ponto Y0 (x), Y00 (x)
37
Capı́tulo 4. Aplicação 1: O Problema de Dido
é o centro de uma vizinhança esférica ⊆ D, de raio positivo maximal r(x) 6 1. Além disso, a continuidade de Y0 e Y00 em [a, b] garante que r ∈ C[a, b]; segue que r(x) assume um
mı́nimo
° valor
°
em algum x0 , isto é, r(x) > r(x0 ) = r0 > 0. Portanto, se ε < r0 e V ∈ D0 , com °V ° 6 1, então
Y0 + εV ∈ D, e concluı́mos que todas estas direções são D-admissı́veis em Y0 .
¥
Definição 4.9. A equação (4.8) é dita de Euler-Lagrange com valores vetoriais, e suas soluções de
classe C 1 são chamadas funções estacionárias para a função f .
Mostramos acima que, se δF (Y : V ) = 0 ∀ V ∈ D0 , então Y é estacionária para f em (a, b).
Reciprocamente, supondo Y estacionária para f em (a, b) e V ∈ D0 , de (4.8) segue que
Zb
δF (Y ; V ) =
­
£
¤
® ­ £
¤
®
fY Y (x) , V (x) + fZ Y (x) , V 0 (x) ] dx
a
Zb
=
a
¤
®
­ £
¤
®¯¯b
d ­ £
fZ Y (x) , V (x) dx = fZ Y (x) , V (x) ¯ ≡ 0.
dx
a
Assim, Y é estacionária para f em no intervalo (a, b) se, e somente se, δF (Y : V ) = 0 ∀ V ∈ D0 .
Para considerar condições de fronteiras mais gerais (ou restrições da forma G(Y ) = constante),
podemos empregar o método dos Multiplicadores
de Lagrange. Em vista do Teorema 4.7, esperamos
¯
caracterizar cada extremo local Y0 de F ¯D , quando restrito a GY0 , por um λ ∈ R para o qual
δ(F + λG)(Y0 ; V ) = 0 ∀ V ∈ D0 .
Em particular, se a restrição da função G é definida por uma integral na forma G(Y ) =
Zb
¡
¢
g x, Y (x), Y 0 (x) dx, então Y0 é estacionária para a função modificada f + λg, e portanto satisfaz
a
a correspondente equação de Euler-Lagrange
£
¤
£
¤
d
(f + λg)Z Y (x) = (f + λg)Y Y (x) .
dx
Segundo ainda o Teorema 4.7, esses resultados são válidos desde que a variação de Gâteaux de G
exista para Y ∈ D e, no ponto estacionário Y0 , δG(Y0 , V ) não se anule identicamente para V ∈ D0 .
Estas observações serão usadas no estudo do Problema de Dido, a seguir.
4.7
Aplicação 1: O Problema de Dido
Segundo o problema isoperimétrico de Dido, apresentado no Capı́tulo 2 (página 13), devemos maximizar o funcional da área
Z1
A(Y ) =
£
¤
f Y (t) dt =
Z1
0
x(t) y 0 (t) dt
0
sujeito ao vı́nculo isoperimétrico
Z1
L(Y ) =
0
£
¤
g Y (t) dt =
Z1
¯ 0 ¯
¯Y (t)¯ dt = l
0
onde l é um número real fixo. Por conveniência, estamos agora usando “t”como variável independente, e não “x”, como anteriormente. Usamos ainda notações ligeiramente
diferentes da Seção
p
anterior, a saber: f = f (t, x, y, x0 , y 0 ) = x y 0 e g = g(t, x, y, x0 , y 0 ) = x0 2 + y 0 2 .
38
Capı́tulo 4. Aplicação 2: Geodésicas em Superfı́cies
¡
¢
As curvas Y (t) = x(t), y(t) consideradas são de classe C 1 em [0, 1] e fechadas, isto é,
Y (0) = Y (1), e, sem perda de generalidade, podemos supor que as curvas iniciem e terminem na
origem O. Assim, o domı́nio natural do funcional A é o conjunto D = {Y ∈ Y ; Y (0) = Y (1) = O}
¡
¢2
em que Y = C 1 [0, 1] . Já vimos que
Z1
x(t) v 0 (t) + y 0 (t) u(t) dt,
δA(Y ; V ) =
0
Z1
e não é dificil verificar que δL(Y ; V ) =
0
¯ 0¯
­ Y 0 (t)
®
0
¯ ¯
¯
¯
¯Y 0 (t)¯ , V (t) dt, para as curvas que satisfazem Y 6= 0
em [0, 1]. Desta forma, como a função g não é de classe C 1 em vizinhança da origem, não podemos
aplicar o método dos Multiplicadores de Lagrange como enunciado anteriormente. Entretanto,
pode-se mostrar (conf. [1]) que o método pode ser aplicado se restrito ao domı́nio
¯
¯
D∗ = {Y ∈ D ; ¯Y 0 (t)¯ 6= 0
∀ t ∈ [0, 1]}.
Este domı́nio é de fato apropriado, uma vez que, se Y ∈ D∗ for tal¯ que
¯ δL(Y ; V ) = 0 ∀ V ∈ D0 ,
então, por um argumento análogo ao do Lema (4.1), obtem-se Y 0 /¯Y 0 ¯ = constante em [a, b]. Mas
isto, juntamente com a condição Y (0) = Y (1), implica Y ≡ 0 6∈ D∗ . Desta maneira, para Y ∈ D∗ ,
δL(Y ; V ) não se anula identicamente, e podemos aplicar o método dos Multiplicadores de Lagrange.
Assim, se Y0 maximiza o funcional A localmente no domı́nio D∗ , quando restrito ao vı́nculo
L(Y ) = l, então existe λ ∈ R tal que
¯ ¯δ(A + λL)(Y0 ; V ) = 0 ∀ V ∈ D0 e, portanto, Y0 é estacionário
para a função f + λg = x y 0 + λ¯Y 0 ¯, isto é, satisfaz as equações de Euler-Lagrange associadas:
Ã
Ã
!
!
λ y0
d λ x0
d
0
¯ ¯ =y
x + ¯¯ 0 ¯¯ = 0.
e
dt ¯Y 0 ¯
dt
Y
¯ ¯¢
¯ ¯¢
¡
¡
Segue-se que y − λx0 /¯Y 0 ¯ = c2 e x + λy 0 /¯Y 0 ¯ = c1 , para c1 e c2 constantes.
Assim,
c2 y 0 + c1 x0 = y y 0 + x x0 ou, após integrar e avaliar em t = 0,
x2 + y 2 − 2c1 x − 2c2 y = constante = 0.
Completando os quadrados na equação acima, isso resulta em (x − a)2 + (y − c)2 = c21 + c22 .
Percebe-se, assim, que a curva representada por Y0 está contida em um cı́rculo de raio r, com
r2 = c21 + c22 e, devido ao comprimento l, deve-se ter r = l/2π. Como a curva é fechada, o cı́rculo
tem que ser contornado ao menos uma vez, sendo que a maximização de A para um comprimento l
dado, requer que o cı́rculo seja contornado somente uma vez. Além disso, A não pode assumir um
mı́nimo em D∗ (ou em D).
Assim, obtivemos fortes evidências, mas ainda não demonstramos inteiramente, que o cı́rculo é
a curva que maximiza a área, afirmação também conhecida como Conjectura de Pappus.
4.8
Aplicação 2: Geodésicas em Superfı́cies
Para o estudo de geodésicas em superfı́cies, usaremos o Teorema a seguir a respeito dos vı́nculos de
Lagrange, cuja demonstração pode ser encontrada em [1].
¡
¢
Teorema 4.10. Sejam f e fzj ∈ C 1 [a, b] × R2d , j = 1, 2, . . . , d e suponha que Y0 é C 2 e mı́nimo
Zb
¡
¢
¡
¢d
local de F (Y ) = f x, Y (x), Y 0 (x) dx em D = {Y ∈ C 1 [a, b] ; Y (a) = Y0 (a) e Y (b) = Y0 (b)},
a
sujeito ainda ao vı́nculo
¡
¢
g Y (x) ≡ 0
∀ x ∈ [a, b],
Capı́tulo 4. Aplicação 2: Geodésicas em Superfı́cies
39
¡
¢
em que g = g(Y ) é uma função C 2 para a qual ∇g Y0 (x) 6= O ∀ x ∈ [a, b]. Então existe uma função
λ ∈ C[a, b] tal que Y0 é estacionária para a função modificada f + λg.
Em geral, o conjunto S = {Y ∈ R3 ; g(Y ) = O} descreve uma superfı́cie em R3 , que é regular
se ∇g(Y ) 6= O para todo Y ∈ S. Supondo g de classe C 2 , o teorema acima pode ser usado para
¯
¡
¢3
Rb¯
minimizar o funcional comprimento de arco L(Y ) = a ¯Y 0 (t)¯ dt sobre as curvas Y ∈ C 1 [a, b]
que estão em S e, além disso, ligue dois pontos fixos, digamos A, B ∈ S.
Assim, se Y0 , de classe C 2 , minimiza L sobre todas as curvas nestas condições, então, pelo
teorema, existe uma função λ ∈ C[a, b] para a qual Y0¯ é¯ estacionária para a função modificada f + λg, onde, no caso do funcional L, f (t, Y, Z) = ¯Z ¯. Segue-se que Y0 satisfaz à equação
£
¤i
£
¤
dh
de Euler-Lagrange vetorial
(f + λg)Z Y (t) = (f + λg)Y Y (t) , que, neste caso, se reduz a
dt
¤¢
£
¤
d¡ £
fZ Y (t) = (λgY ) Y (t) , uma vez que fY ≡ gZ ≡ 0. Calculando, obtém-se que a equação é
dt
!
Ã
¡
¢
d
Y0
¯ ¯ (t) = λ(t) ∇g Y (t) .
0
¯
¯
dt
Y
¯
¯
Ao longo de Y0 , podemos usar o comprimento de arco s como parâmetro.
Então ¯Y00 (s)¯ ≡ 1, e,
¡
¢
para um novo valor de λ, a equação acima se torna Y000 (s) = λ(s) ∇g Y0 (s) , o que mostra que, em
geral, a normal principal a uma geodésica sobre uma superfı́cie está na direção do vetor gradiente
(não-nulo) e, portanto, é normal à superfı́cie em cada ponto.
Observe que não estabelecemos a existência de geodésicas para superfı́cies em geral, mas obtivemos uma valiosa compreensão do modo como as geodésicas devem estar sobre a superfı́cie.
Bibliografia
[1] John L. Troutman — Variational Calculus and Optimal Control. Second Edition,
Springer-Verlag, New York, 1996. iv, 34, 35, 38
[2] Keti Tenenblat — Introdução a Geometria Diferencial. Editora UnB, Brası́lia, 1990.
11
[3] V. M. Tikhomirov — Stories about Maxima and Minima. Mathematical World - Volume
1, AMS, 1990.
[4] J. E. Marsden, A. J.Tromba — Vector Calculus. W.H. Freeman and Company, N.Y,
1996. 16
[5] E. L. LIMA — Topologia do Espaços Métricos. IMPA, Rio de Janeiro, 1977.
[6] E. L. LIMA — Curso de Análise Vol. 1. IMPA, Rio de Janeiro, 1977. 2
[7] E. L. LIMA — Curso de Análise Vol. 2. IMPA, Rio de Janeiro, 1977.
Índice Remissivo
2a equação de Euler-Lagrange
definição 34
Aristóteles, iv
bola de gude, 4
ciclóide, 33
Euler, 12, 29
estudo das geodésicas, 11
estudo das superfı́cies mı́nimas, 16
problema isoperimétrico, 13
Euler-Lagrange
1a equação, 31, 32, 34
1a equação — definição, 31
2a equação, 34
equação vetorial, 39
equação vetorial — definição, 37
funções estacionárias
definição, 31
Gauss, 11
integral de Riemann, 17
Jakob Bernoulli, 12, 13, 29
Johann Bernoulli, 11, 12, 29
Lagrange, 29
estudo das geodésicas, 11
Leibniz, 12, 36
multiplicadores de Lagrange, 29, 35, 37, 38
Newton, 12, 13
Pappus
conjectura de, 38
problema de área mı́nima, 17
problema de Dido, 13, 14, 16, 36, 37
problema de Plateau, 17
problema isoperimétrico de Euler, 13
solução de sabão, 17
vı́nculos de Lagrange, 29, 38
variação de Gâteaux
definição, 24
Download

Introdução ao Cálculo das Variações