Trabalhos de Graduação
Volume ? – Departamento de Matemática - UnB
UnB
Departamento de Matemática
UnB
Trabalhos de Graduação em Matemática n.o 2/98
Realização
• Aline G. da Silva Pinto • Carlos Eduardo Cunha • Cleida de
Assis Coutinho • Daniela Amorim Amato • Edson da Costa Júnior
• Josimar da Silva Rocha • Lucas Seco • Marcelo Santos Novais • Marcos Vinı́cius B. T. Lima • Marcus Vinı́cius T. Borba • Olı́mpio Ribeiro
Gomes • Roberto dos Santos M. Oliveira • Santiago Prado P. Fortes •
Solange Maria da C. Gonçalves • Thales Filipe D. de Souza • Wescley
Well V. Bezerra
Introdução ao
Cálculo das Variações
Orientação
Celius Magalhães
Revisão e Editoração: Mauro Patrão, Roberto Oliveira e Lucas Seco
Capa: Lucas Seco
Sumário
Lista de Figuras
iii
Prefácio
iv
1 Revisão de Otimização em Rd
1.1 Exercı́cios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2 Problemas Clássicos de Otimização
2.1 Problemas Geodésicos . . . . . . . . .
2.2 Problemas de Tempo de Trânsito — A
2.3 Problemas Isoperimétricos . . . . . . .
2.4 Problemas de Área de Superfı́cie . . .
3 Espaços Lineares e Variações de
3.1 Espaços Lineares Reais . . . . .
3.2 Fundamentos de Otimizaçao . .
3.3 Vı́nculos . . . . . . . . . . . . .
3.4 Variações de Gâteaux . . . . .
3.5 Funcionais Convexos . . . . . .
4 As
4.1
4.2
4.3
4.4
4.5
4.6
4.7
4.8
. . . . . . . . .
Braquistócrona
. . . . . . . . .
. . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7
7
11
13
16
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
18
18
20
21
24
27
Equações de Euler-Lagrange
Primeira Equação: Funções Estacionárias .
Casos Especiais da Primeira Equação . . . .
Segunda Equação de Euler-Lagrange . . . .
Condições Naturais de Contorno . . . . . .
Multiplicadores de Lagrange . . . . . . . . .
Funções Estacionárias com Valores Vetoriais
Aplicação 1: O Problema de Dido . . . . . .
Aplicação 2: Geodésicas em Superfı́cies . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
29
30
31
34
35
35
36
37
38
Bibliografia
Gâteaux
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
1
6
40
Lista de Figuras
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
2.10
2.11
Coordenadas Esféricas . . . . . . . . . . . .
Um Caminho Ligando A e B na Esfera . . .
Uma Geodésica no Cilindro . . . . . . . . .
Uma Geodésica no Cone . . . . . . . . . . .
Sistema de Coordenadas e a Braquistócrona
Problema de Dido — Analogia Fı́sica. . . .
Problema de Dido — Solução Geométrica A
Problema de Dido — Solução Geométrica B
Problema de Dido — Solução Geométrica C
Problema de Dido — Solução Geométrica D
Problema de Dido — Solução Geométrica E
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
8
9
10
11
12
14
15
15
15
15
15
3.1
Coluna de Fluido em Rotação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
Prefácio
O objetivo inicial dessas notas, redigidas pelos participantes das atividades do PET durante o
segundo perı́odo letivo de 1998, foi de favorecer a capacidade de produção de textos em matemática.
Essa atividade, muitas vezes relegada a um segundo plano nos cursos de graduação, é de extrema
importância no processo de aprendizagem, por permitir que o estudante alcance um conhecimento
estruturado, sem a fragmentação que muitas vezes ocorre nos cursos tradicionais.
Uma vez redigidas, esperamos que possam ser de utilidade aos estudantes interessados em um
primeiro contato com essa importante área da Matemática. De fato, com origens que remontam
a questões formuladas por Aristóteles e Zenodoro, o Cálculo das Variações teve seus princı́pios
básicos formulados por Newton, os Bernoullis, Euler e Lagrange, entre outros, e ainda hoje é capaz
de atrair a atenção de matemáticos como Ambrosseti, Brezis,Chang e Rabinowitz. Desejamos que
essas notas possam sugerir ao leitor o fascı́nio que esta área da Matemática tem exercido sobre os
melhores matemáticos.
Com a intenção de sublinhar a semenhança com o Cálculo usual, o texto tem inı́cio com uma
breve revisão de otimização em Rd , enfatizando as condições suficientes para a existência de máximos
e de mı́nimos e o conceito de derivada direcional. Em seguida, são introduzidos os conceitos próprios
do Cálculo das Variações, como espaços de funções, funcionais definidos em subconjuntos destes
espaços, variações de Gâteaux e equações de Euler-Lagrange escalares e vetoriais. Foram incluı́dos
vários exemplos, que tanto ajudam na compreensão destes conceitos como ilustram sua importância.
A bibliografia básica utilizada foi o excelente texto de Troutman, Variational Calculus and Optimal
Control [1], além de outros em que se procurou esclarecer alguns conceitos especı́ficos.
Finalmente, gostaria de agradecer ao Departamento de Matemática pelo apoio dado ao PET
em todas as suas atividades, e em particular na divulgação dessas notas.
Celius A. Magalhães
Tutor PET/MAT/UnB
Capı́tulo 1
Revisão de Otimização em Rd
Neste capı́tulo, apresentamos um breve resumo dos resultados básicos relacionados à caracterização
de valores máximos e mı́nimos de uma função f definida num conjunto de Rd com valores em R.
Para d = 1, 2, 3..., seja Rd o espaço Euclidiano d-dimensional. Neste espaço definem-se:
i) a norma de um vetor X = (x1 , x2 , ..., xd ) por:
d
¯ ¯ ³X
¯ ¯2 ´1/2
¯X ¯ =
¯x j ¯
, que é positiva a menos que X seja o vetor nulo X = O = (0, 0, 0, ..., 0);
j=1
def
ii) a soma de dois vetores, X = (x1 , x2 , ..., xd ) e Y = (y1 , y2 , ..., yd ), por: X + Y = (x1 + y1 , x2 +
y2 , ..., xd + yd );
def
iii) a multiplicação por escalar como aX = (ax1 , ax2 , ..., axd ), ∀a ∈ R.

® def
A norma de X pode ser expressa utilizando-se o produto interno, isto é, o produto X, Y =
d
X
¯ ¯ q
®
xj yj . De fato, tem-se ¯X ¯ =
X, X para todo X ∈ Rd . É possı́vel verificar que este produto
j=1
tem as propriedades

®

®
i) X, X > 0 , ∀X ∈ Rd e X, X = 0 ⇔ X = O;

® 
®
ii) X, Y = Y, X , ∀X, Y ∈ Rd ;

®

® 
®
iii) aX + Y, Z = a X, Z + Y, Z , ∀a ∈ R, ∀X, Y e Z ∈ Rd
Usando-se estas propriedades, pode-se demonstrar a Desigualdade de Cauchy-Schwarz, como
segue.
¯
®¯
d
¯
¯
¯Lema
¯ ¯ ¯1.1 (Desigualdade de Cauchy-Schwarz). Para todo X, Y ∈ R , tem-se que X, Y 6
¯X ¯ ¯Y ¯.
Demonstração.
¯ ¯
¯ ¯
Seja C o vetor dado por C = ¯Y ¯ X − ¯X ¯ Y . Então,
¯ ¯2 ¯ ¯
¯ ¯
¯ ¯
¯ ¯ ®
¯ ¯2 ¯ ¯2 ¯ ¯¯ ¯
®
0 6 ¯C ¯ = ¯Y ¯ X − ¯X ¯ Y , ¯Y ¯ X − ¯X ¯ Y = 2(¯X ¯ ¯Y ¯ − ¯X ¯¯Y ¯ Y, X )
de onde segue o resultado.
¥
¯
¯
A Desigualdade de Cauchy-Schwarz é usada para provar a Desigualdade Triangular: ¯X + Y ¯ 6
¯ ¯ ¯ ¯
¯
¯ ¯
¯
¯X ¯ + ¯Y ¯, que também pode ser escrita na forma ¯|X| − |Y |¯ 6 ¯X − Y ¯, onde X − Y def
= X + (−1)Y
¯
¯
e ¯X − Y ¯ define a Distância Euclidiana entre X e Y .
No que se segue, apresentamos algumas definições para subconjuntos de Rd e, a não ser que
especificado diferentemente, usaremos “D”para indicar estes subconjuntos.
d
Definição
1.2
¯
¯ (Esfera aberta). Seja X0 ∈ R e δ > 0. Então o conjunto Sδ (X0 ) = {X0 ∈
d ¯
¯
R ; X − X0 < δ} é chamado uma esfera aberta de centro X0 ou uma vizinhança aberta de X0 .
Definição 1.3 (Ponto interior). X0 é dito um ponto interior de D se existe δ > 0, tal que
Sδ (X0 ) ⊆ D.
Definição 1.4 (Conjunto aberto). D é aberto quando consiste somente de pontos interiores.
Capı́tulo 1. Revisão de Otimização em
Rd
2
Definição 1.5 (Domı́nio). Se quaisquer dois pontos de D podem ser conectados por uma curva
contı́nua inteiramente contida em D, então D é um domı́nio.
Assim, por exemplo, cada esfera aberta é um domı́nio, assim como também o é cada
“caixa”aberta,
B = {X ∈ Rd ; aj < xj < bj , j = 1, 2, · · · , d}.
Notar que a união de conjuntos abertos disjuntos não é um domı́nio, apesar de ser um conjunto
aberto.
Definição 1.6 (Ponto de fronteira). Um ponto que não é interior a D e não é interior ao
complemento de D, denotado por Dc = Rd − D, é chamado um ponto de fronteira de D. O
conjunto de todos estes pontos, denotado por ∂D, é chamado fronteira de D. Pode-se definir ∂D
analiticamente por
∂D = {X ∈ Rd ; S² (X) ∩ Dc 6= ∅ e S² (X) ∩ D 6= ∅, ∀² > 0}.
¯ ¯
¯ ¯
Desta maneira, se A = {X ∈ Rd ; ¯X ¯ 6 1}, então ∂A = {X ∈ Rd ; ¯X ¯ = 1}; também, se
∂A = B, então ∂B = B, isto é,∂(∂A) = ∂A.
Definição 1.7 (Conjunto limitado). D é limitado se for subconjunto de alguma esfera.
Definição 1.8 (Conjunto fechado). D é fechado se ∂D ⊆ D.
Definição 1.9 (Conjunto compacto). Se D for limitado e fechado, então D é compacto.
Se quisermos encontrar pontos extremos de uma função f definida num conjunto D ⊆ Rd , ou
seja, se quisermos achar pontos em que a função assume valores máximos e mı́nimos, devemos notar
que:
• f não necessariamente terá valores extremos em D.
Por exemplo, quando D = R, a função f (X) = x1 é ilimitada em ambas as direções de D. Além
disso, se tomarmos D = (−1, 1) ⊆ R, esta mesma função, embora limitada, assume valores tão
próximos de -1 e 1 quanto se queira, mas nunca assume os valores -1 e 1. Já no intervalo fechado
D = [−1, 1], a função assume valores de máximo (1) e mı́nimo (−1).
• f pode assumir somente um valor extremo em D.
Por exemplo, se D = (−1, 1], f (X) = x1 assume um valor de máximo (1), mas não assume valor
de mı́nimo. Já se D = (−1, 1), a função f (X) = x21 assume um valor de mı́nimo (0), mas não
assume valores de máximo.
• f pode assumir valores extremos em mais de um ponto.
Se D = [−1, 1], f (X) = x21 assume valor de máximo (1) em x1 = ±1. Se D = R2 , f (X) = x21
assume valor de mı́nimo em cada ponto do eixo x2 .
As condições suficientes para a existência de valores extremos de uma função estão contidas no
Teorema a seguir, cuja demonstração pode ser encontrada em [6].
Teorema 1.10. Se D ⊆ Rd é compacto e f : D → R é contı́nua, então f assume valores de
máximo e de mı́nimo em D.
Uma função f ¯: D → R ¯é contı́nua em
¯ um ponto X0¯ ∈ D se, e somente se, ∀² > 0, ∃ δ > 0 tal
que, se X ∈ D e ¯X − X0 ¯ < δ, então ¯f (X) − f (X0 )¯ < ². A função f é contı́nua em D se, e
somente se, for contı́nua em cada ponto X0 ∈ D.
Os exemplos anteriores mostram que o fato de D ser compacto ou f contı́nua, sozinhos, não
asseguram a existência de valores extremos.
É claro que o valor máximo de f é o valor mı́nimo de −f , e vice-versa. Desta forma, basta
caracterizar os pontos de mı́nimo de f , aqueles X0 ∈ D para os quais f (X0 ) 6 f (X), ∀ X ∈ D.
Capı́tulo 1. Revisão de Otimização em
Rd
3
Lema 1.11. Se D contém uma vizinhana de um extremo X0 de f , na qual f possui derivadas
parciais contı́nuas, então, para cada vetor unitário U ∈ Rd , a derivada direcional é tal que
·
¸
¯
∂f
f (X0 + εU ) − f (X0 )
∂U f (X0 ) = lim
=
(X0 + εU )¯ε=0 = 0
ε→0
ε
∂ε
Demonstração.
A existência e continuidade das derivadas parciais na vizinhança de X0 garantem que o limite acima existe. Além disso, a expressão entre colchetes muda de sinal quando ε
tende a zero pela direita e pela esquerda, logo deve ser nula.
¥
Como o vetor gradiente é definido como
∇f = (fx1 , fx2 , ..., fxd ), a derivada direcional pode ser
®
expressa como ∂U f (X0 ) = ∇f (X0 ), U . Então, é fácil concluir que, num ponto extremo interior
X0 , tem-se ∇f (X0 ) = 0.
Definição 1.12. O ponto X0 , no qual ∇f (X0 ) = 0, é chamado ponto estacionário (ou ponto
crı́tico) de f , independente de X0 ser ou não ponto de máximo ou de mı́nimo de f .
Por exemplo, em D = [−1, 1] , a função f (X) = x31 tem seu único ponto crı́tico em x1 = 0, mas
o máximo e o mı́nimo ocorrem em 1 e −1, respectivamente.
Em D = R2 , a função f (X) = x22 − x21 tem seu único ponto crı́tico em X0 = (0, 0). Neste
ponto, f tem seu comportamento de máximo na direção x2 = 0 e seu comportamento de mı́nimo
na direção x1 = 0. Neste caso, X0 é denominado ponto de sela de f .
Um ponto estacionário X0 pode ser apenas um extremo local, ou seja, f (X) > f (X0 ) ou f (X) 6
f (X0 ) para todo X ∈ D que esteja numa vizinhana de X0 . Por exemplo, o polinômio f (X) =
x31 − 3x1 tem, em D = [−3, 3] , x1 = 1, −1 como pontos crı́ticos. O primeiro é um máximo local e
o segundo, um mı́nimo.
Definição 1.13. Uma função f definida em D ⊂ Rd é convexa em D se tiver derivadas parciais
contı́nuas em D e, além disso, verificar a desigualdade

®
f (X) > f (X0 ) + ∇f (X0 ), (X − X0 ) , ∀ X, X0 ∈ D.
A função f é estritamente convexa se esta desigualdade é estrita para X 6= X0 .
A desigualdade acima pode também ser escrita na forma

®
f (X + V ) > f (X) + ∇f (X), V
∀ X, X + V ∈ D.
Uma função não precisa ter ponto crı́tico mas, obviamente, quando X0 é ponto crı́tico de uma
função convexa f , então ∇f (X0 ) = 0, e portanto f (X) > f (X0 ), isto é, X0 é ponto de mı́nimo de
f . Isso demonstra a
Proposição 1.14. Se f é uma função convexa em D, então ela assume um valor mı́nimo em cada
ponto crı́tico de D.
Exemplo. A função definida por f (X) = x21 + x22 tem como gradiente ∇f (X) = (2x1 , 2x2 ) e
satisfaz, para cada V = (v1 , v2 ),
f (X + V ) = (x1 +v1 )2 +(x2 +v2 )2 = x21 +x22 +2x1 v1 +2x2 v2 +v12 +v22

® ¯ ¯2

®
= f (X) + ∇f (X), V + ¯V ¯ > f (X) + ∇f (X), V
para todo X ∈ R2 , e portanto f é convexa nesse domı́nio.
Lema 1.15. Se f é estritamente convexa en D, então f não pode ter mais de um ponto crı́tico, e
portanto, mais de um mı́nimo interior em D.
Capı́tulo 1. Revisão de Otimização em
Rd
4
Demonstração.
Se X0 é um ponto crı́tico de f , então f (X) > f (X0 ), para todo X ∈ D − X0 .
Assim, f não assume mı́nimo em nenhum outro ponto.
¥
Exemplo. A função do exemplo anterior é estritamente convexa em cada conjunto D ⊂ R2 . Além
disso, não é difı́cil verificar que, em R2 , a função definida por f (X) = x21 + x22 − 2x1 é estritamente
convexa, a função f (X) = x1 − x2 é convexa, mas não estritamente, enquanto que f (X) = x1 x2
não é convexa.
Definição 1.16. Uma função f é diferenciável em X0 se, para todo X em vizinhança de X0 , tem-se
¯

® ¯
f (X) = f (X0 ) + ∇f (X), X − X0 + ¯X − X0 ¯ζ(X − X0 )
(1.1)
em que lim ζ(X − X0 ) = 0.
X→X0
d+1
Sendo f uma função diferenciável, o seu gráfico
 possui, no ponto® (X0 , f (X0 )) ∈ R , o hiperplano tangente definido por T (X) = f (X0 ) + ∇f (X0 ), (X − X0 ) . Para d = 1, esta é a reta
tangente à curva que representa o gráfico de f em R2 . Para d = 2, este é o plano tangente à
superfı́cie representada pelo gráfico de f em R3 .
Se ∇f (X0 ) = 0, então o gráfico de f tem hiperplano tangente “horizontal” em X0 , isto é, um
subconjunto d-dimensional paralelo à Rd . Para d = 2, uma bola de gude equilibrada em (X0 , f (X0 ))
não deve rolar, mas permanecer “estacionária”. Da definição segue-se que uma função convexa
diferenciável é aquela que está “acima”de seu hiperplano tangente.
A respeito de outras propriedades de funções convexas, observamos ainda o seguinte:
Proposição 1.17. A soma de duas funções f, g [estritamente] convexas em D ⊆ Rd é [estritamente]
convexa em D. Além disso, dado um escalar c > 0, cf é também [estritamente] convexa.
Demonstração.
Com efeito, considere apenas o caso em que f, g são estritamente convexas,
uma vez que o outro
X ∈® D e X + V ∈ D. Então f (X + V ) >
® caso é semelhante, e sejam

f (X) + ∇f (X), V e g(X + V ) > g(X) + ∇g(X), V . Logo, dados a, b escalares positivos, e
definindo h(X) = af (X) + bg(X), tem-se que
h(X + V ) = af (X + V ) + bg(X + V )

®

®
> af (X) + a ∇f (X), V + bg(X) + b ∇g(X), V

®

®
= h(X) + [a∇f (X) + b∇g(X)], V = h(X) + ∇h(X), V
onde foi usada a linearidade das derivadas parciais. Isso mostra que h é estritamente convexa.
¥
Observação. O produto de duas funções convexas não é necessariamente convexo.
Por exemplo, as funções f (X) = x1 +x2 e g(X) = x1 −x2 são convexas, uma vez que são funções
lineares. Contudo,
f (X) g(X) = (x1 + x2 ) (x1 − x2 ) = x21 − x22
é a equação do parabolóide hiperbólico, o qual já se sabe que não é convexo.
Outra importante propriedade das funções convexas é a Proposição a seguir, que ilustra a possibilidade de se caracterizar a convexidade sem supor diferenciabilidade.
Proposição 1.18. Suponha que f : Rd → R seja diferenciável. Então f é convexa em Rd se, e só
se, para todo X, X0 ∈ Rd , têm-se
f (tX + (1 − t)X0 ) 6 tf (X) + (1 − t)f (X0 ), ∀ t ∈ (0, 1).
Capı́tulo 1. Revisão de Otimização em
Rd
5
Demonstração.
De inı́cio, vamos assumir que f seja convexa. Dados X, X0 ∈ Rd , t ∈ (0, 1) e
definindo Yt = tX + (1 − t)X0 , um cálculo simples mostra que
X − Yt =
(1 − t)
(Yt − X0 ).
t
Usando agora a convexidade de f , isto é,

®
f (X) > f (Yt ) + ∇f (Yt ), (X − Yt ) ,
(1.2)
e a expressão de X − Yt acima, obtém-se que

® tf (Yt ) − tf (X)
∇f (Yt ), (X0 − Yt ) >
.
1−t
(1.3)
Por outro lado, usando novamente a convexidade de f , isto é,

®
(1.4)
f (X0 ) > f (Yt ) + ∇f (Yt ), (X0 − Yt ) ,
obtém-se que

®
∇f (Yt ), (X0 − Yt ) 6 f (X0 ) − f (Yt ).
(1.5)
Combinando as equações (1.3) e (1.5) obtém-se
®
tf (Yt ) − tf (X) 
6 ∇f (Yt ), (X0 − Yt ) 6 f (X0 ) − f (Yt ),
1−t
de onde segue o que buscamos, isto é,
(1.6)
f (Yt ) 6 tf (X) + (1 − t)f (X0 ).
Reciprocamente, suponha f diferenciável satisfazendo (1.6) acima. Usando a diferenciabilidade
de f em X0 e que Yt − X0 = t(X − X0 ), obtem-se
¯
¯
f (Yt ) = f (X0 ) + t∇f (X0 )(X − X0 ) + t¯X − X0 ¯ζ(tX − tX0 )
em que ζ(tX − tX0 ) → O quando t → 0. Essa última igualdade, juntamente com (1.6), implica que
f satisfaz
¯

® ¯
t[ ∇f (X0 ), (X − X0 ) + ¯X − X0 ¯ζ(tX − tX0 )] 6 t[f (X) − f (X0 )],
em que t 6= 0. Dividindo por t e usando as propriedades da função ζ obtém-se que f é convexa, isto
é,

®
∇f (X0 ), (X − X0 ) 6 f (X) − f (X0 ) ∀X, X0 ∈ R2 , ∀t ∈ (0, 1)
o que conclui a demostração.
¥
Observação. No estudo dos valores extremos de uma função f , a menos que D seja aberto, isto
é, possui somente pontos interiores, então é também necessário considerar os valores extremos de
f em ∂D, a fronteira de D. Por exemplo, a função f (X) = x22 − x21 em R2 possui um único ponto
estacionário X0 =¯ O,
¯ que é um ponto de sela. Assim, o máximo e o mı́nimo de f em,
¯ ¯digamos,
D = {X ∈ R2 ; ¯X ¯ 6 2}, pode ser encontrado apenas na fronteira de D, em que ¯X ¯ = 2. O
próximo exemplo ilustra melhor este fato.
Exemplo. Para encontrar
os valores de máximo e de mı́nimo da função f (X) = x21 − x1 x2 + 16 x32
¯ ¯
2 ¯ ¯
em D = {X ∈ R ; xj 6 2, j = 1, 2}, notamos, de inı́cio, que ∇f (X) = (2 x1 − x2 , −x1 + 21 x22 ) e,
¡
¢
portanto, os pontos crı́ticos de f em D são X0 = (0, 0), e X̃0 = 12 , 1 . Tem-se que X0 é ponto de
1
sela, enquanto que X̃0 é ponto de mı́nimo local, com f (X̃0 ) = − 12
. Comparando este valor com os
)
é
assumido
no
ponto
(−2, 2) e valor mı́nimo (− 37 ),
valores de f em ∂D, vemos que o máximo ( 28
3
no ponto (−1, −2), ambos na fonteira de D.
6
Capı́tulo 1. Exercı́cios Propostos
1.1
Exercı́cios Propostos
1. Considere a seguinte definição de diferenciabilidade:
Definição 1.19. Uma função real f : U ⊆ Rp → R é diferenciável em X0 ∈ U se existe uma
vizinhança de X0 em U tal que
f (X0 + V ) = f (X0 ) + LX0 (V ) + r(V )
para todo X + V nesta vizinhança, onde LX0 : Rp → R é uma transformação linear e r é uma
função que satisfaz
r(V )
lim ¯ ¯ = 0
V →O ¯V ¯
(Esta definição diz intuitivamente que f é diferenciável num ponto X interior de seu domı́nio
se f admite uma “boa aproximação linear” em vizinhança de X.)
a) Prove que se f é diferenciável em X0 então a matriz da transformação linear LX0 na
base canônica do Rp é precisamente ∇f (X0 ).
b) Estenda a definição acima para funções que tomam valores em Rq e prove que, neste
caso, a matriz de LX0 é a conhecida matriz Jacobiana no ponto X0 . (Sugestão: use a
definição e o item anterior para cada função coordenada fi : Rp → R de F = (f1 , . . . , fp ),
onde F : Rp → Rq .)
2. Supondo f diferenciável em X0 , prove que a derivada direcional de
® f na direção não nula V
no ponto X0 é dada pelo produto interno ∂V f (X0 ) = ∇f (X0 ), V .
3. Supondo f de classe C 2 , prove que a segunda
derivada
direcional de f na direção não nula V

®
no ponto X0 é dada por ∂V2 f (X0 ) = Hf (x0 )V, V , onde Hf (X0 ) é a matriz Hessiana de f
no ponto X0 . (Sugestão: use o exercı́cio anterior.)
Capı́tulo 2
Problemas Clássicos de Otimização
“Qual o melhor método?” Tanto a matemática como as várias ciências clássicas têm feito esta mesma
pergunta durante séculos, e sua resposta nem sempre é definitiva. Se for possı́vel medir o quão
“melhor” é o método usando-se uma quantidade numérica, esta pergunta torna-se naturalmente
um problema de otimização: maximizar tal quantidade numérica. Não se está interessado somente
nos valores ótimos, sejam eles máximos ou mı́nimos, mas também nos métodos para obtê-los.
Quando a pergunta vem das ciências clássicas, a quantidade a ser otimizada é algo como comprimento, área, volume, tempo, trabalho, energia, e também custo, eficiência, etc. Neste capı́tulo,
serão examinados alguns problemas clássicos que foram essenciais para o desenvolvimento da teoria
atual que responde as perguntas deste tipo. Muito embora aqui só se desenvolvam poucos destes
problemas, eles servirão de motivação para os problemas que poderão ser encontrados mais adiante
pelo leitor.
2.1
Problemas Geodésicos
Seja por preguiça inerente ou por interesse na eficiência, o homem sempre esteve procurando qual,
dentre os vários caminhos que ligam dois pontos fixos A e B, é o caminho mais curto, isto é, o
de menor comprimento. No espaço euclideano Rd , uma reta que liga estes dois pontos fornece o
caminho de menor comprimento. No entanto, ao serem considerados obstáculos no caminho, tornase necessário considerar o problema mais delicado de encontrar as geodésicas (caminhos de menor
comprimento) ligando dois pontos numa superfı́cie qualquer.
Serão caracterizadas aqui as geodésicas do espaço Rd . No R3 serão caracterizadas as geodésicas
da esfera, do cilindro e do cone.
2.1.1
Geodésicas em Rd
Seja Y0 (t) = (1 − t)A + tB, t ∈ [0, 1] a equação que determina o segmento de reta de A a B, em que
Y00 (t) = B − A. Se existe uma curva de comprimento mı́nimo Lmin ligando A e B, então deve-se
ter
Z1
Z1
¯
¯
¯
¯
¯
¯
Lmin 6 ¯Y00 (t)¯dt = ¯B − A¯dt = ¯B − A¯,
0
Para mostrar que Lmin
0
¯
¯
= ¯B − A¯, basta mostrar que
¯
¯
¯B − A¯ 6 L(Y ) =
Z1
¯ 0 ¯
¯Y (t)¯dt
0
qualquer que seja o caminho continuammente diferenciável Y (t) que liga A a B. Do Teorema
R1
Fundamental do Cálculo, tem-se que B − A = Y (1) − Y (0) = 0 Y 0 (t)dt, de modo que
¯
¯

® 
¯B − A¯2 = B − A, B − A = B − A,
Z1
®
Y 0 (t)dt =
0
Z1
(2.1)
=
0

®
B − A, Y 0 (t) dt 6
Z1
0
¯
¯¯
¯
¯B − A¯ ¯Y 0 (t)¯dt
8
Capı́tulo 2. Problemas Geodésicos
¯
¯2
em que a última desigualdade decorre da Desigualdade de Cauchy-Schwarz. Portanto, ¯B − A¯ 6
¯
¯R ¯
¯
¯B − A¯ 1 ¯Y 0 (t)¯dt e consequentemente
0
¯
¯
¯B − A¯ 6
Z1
¯ 0 ¯
¯Y (t)¯dt
0
para todo caminho Y (t) nas condições dadas.
Demonstrou-se
¯
¯assim que o comprimento mı́nimo Lmin de um caminho entre dois pontos A e
B no Rd é ¯A − B ¯. Como o segmento de reta que liga A a B tem esse comprimento, ele é uma
geodésica do Rd . No entanto, pode haver, a princı́pio, outros caminhos continuamente diferenciáveis
com o mesmo comprimento Lmin . Este não é o caso, bastando, para isso, notar que a igualdade em
(2.1) ocorre se, e somente se, os vetores Y 0 (t) e B − A forem linearmente dependentes para todo
t, isto é, se, e somente se, Y (t) descrever um segmento de reta entre A e B. Isto mostra que as
geodésicas do Rd são precisamente os segmentos de reta.
2.1.2
Geodésicas na Esfera
Cada ponto Y na superfı́cie de uma esfera de raio R e centrada na origem pode ser dado pelas
coordenadas esféricas de raio R, latitude θ e longitude ϕ por
(2.2)
Y = (R cos θ sen ϕ, R sen θ sen ϕ, R cos ϕ)
para algum ϕ ∈ [0, π) e θ ∈ [−π, π).
Figura 2.1.
Coordenadas Esféricas
Dados dois pontos distintos A e B na superfı́cie de tal esfera, pode-se escolher os eixos de modo
que A seja o pólo norte (ϕ = 0), e que B 6= A tenha coordenadas (R, 0, ϕ1 ) para algum ϕ1 > 0.
Nestas condições, um caminho suave ligando A e B na superfı́cie da esfera é determinado, usando-se
(2.2), por um par de funções continuamente diferenciáveis θ(t) e ϕ(t), com t ∈ [0, 1] onde θ(0) = 0,
ϕ(0) = 0, θ(1) = 0 e ϕ(1) = ϕ1 . Este caminho é dado por (ver figura 2.2)
Y (t) = (R cos θ(t) sen ϕ(t), R sen θ(t) sen ϕ(t), R cos ϕ(t))
em que t ∈ [0, 1].
9
Capı́tulo 2. Problemas Geodésicos
Figura 2.2.
Um Caminho Ligando A e B na Esfera
¯
¯2
Para se calcular o comprimento deste caminho, verifica-se que ¯Y 0 (t)¯ = R2 (sen2 ϕ(t)θ0 (t)2 +
ϕ0 (t)2 ) de modo que seu comprimento é dado pela integral
Z1
L(Y ) =
¯ 0 ¯
¯Y (t)¯dt =
0
Z1
R
p
sen2 ϕ(t)θ0 (t)2 + ϕ0 (t)2 dt
0
¯
¯ p
Usando a desigualdade ϕ0 (t) 6 ¯ϕ0 (t)¯ 6 sen2 ϕ(t)θ0 (t)2 + ϕ0 (t)2 , obtem-se finalmente que
Z1
L(Y ) > R
¯1
ϕ0 (t)dt = Rϕ(t)¯0 = Rϕ1 .
0
Daı́ conclui-se que, para qualquer caminho continuamente diferenciável Y (t) na esfera, seu comprimento é L(Y ) > Rϕ1 , e este último é exatamente o comprimento do menor grande arco1 que une
A e B na esfera.
Assim, pode-se afirmar que os grandes arcos são geodésicas da esfera. Para se mostrar que são
eles precisamente as geodésicas, basta notar que a igualdade ocorre se, e somente se, sen2 ϕ(t)θ0 (t)2 ≡
0 e ϕ0 (t) > 0, ou seja θ(t) ≡ 0, de onde se tem novamente um grande arco.
2.1.3
Geodésicas no Cilindro
Os pontos Y de um cilindro de raio R com eixo central coincidente com o eixo z podem ser dados
unicamente em coordenadas cilı́ndricas (θ, z) por meio de:
Y = (R cos θ, R sen θ, z)
onde −π 6 θ < π e z ∈ R. Dados dois pontos distintos A e B no cilindro, podemos considerar
A = (0, 0) e B = (θ1 , z1 ) em coordenadas cilı́ndricas.
Para encontrar a geodésica entre A e B nesse caso, primeiro notamos que, se B é da forma
(0, z1 ), podemos ligar A e B com a reta (1 − t)A + tB que está no cilindro. Como o cilindro está
em R3 , esta reta é a geodésica no cilindro, neste caso.
Mais geralmente, tem-se de considerar o caminho continuamente diferenciável ligando os pontos
A e B dado por um par de funções θ(t), z(t) com −π 6 θ(t) < π e z(t) ∈ R para t ∈ [0,1].
Além disso deve-se ter θ(0) = 0, z(0) = 0 e θ(1) = θ1 , z(1) = z1 . O caminho no cilindro é
Y (t) = (R cos θ(t), R sen θ(t), z(t)), e devemos minimizar a integral
Z1
L(Y ) = R
0
1 Arco
¯ 0 ¯
¯Y (t)¯dt = R
Z0 p
θ0 2 + z 0 2 dt.
1
determinado pela circunferência de mesmo centro e raio da esfera que passa pelos pontos A e B. Como 2
pontos distintos determinam 2 arcos numa mesma circunferência, toma-se o menor deles, daı́ menor grande arco.
10
Capı́tulo 2. Problemas Geodésicos
Esta integral, a menos da constante multiplicativa R, é a que fornece o comprimento da curva
t 7→ (θ(t), z(t)) no plano zOθ, e portanto basta minimizar o comprimento desta curva. Pelo que foi
visto em Rd , o comprimento mı́nimo é dado pela reta que une os pontos (0, 0) e (θ1 , z1 ), isto é, pela
curva t 7→ (tθ1 , tz1 ) com 0 6 t 6 1. No cilindro, tem-se
Ymin (t) = (R cos tθ1 , R sen tθ1 , tz1 )
que é uma hélice, como pode ser facilmente verificado. Isto mostra que as geodésicas no cilindro
são os arcos de hélice.
Figura 2.3.
2.1.4
Uma Geodésica no Cilindro
Geodésicas no Cone
Para encontrar as geodésicas do cone procede-se como no caso do cilindro: encontra-se uma
parametrização especial que leva o plano ao cone preservando o comprimento de curvas. Para
o cone C, sem o vértice e com ângulo de abertura 2φ0 , 0 < φ0 < π/2, essa parametrização
pode ser construı́da como segue. Denotando a = senφ0 e b = cosφ0 , seja D ∈ R2 o domı́nio
D = {(u, v) ∈ R2 ; u > 0 e − tan(aπ/2)u < v < tan(aπ/2)u}. Seja ainda g : D → D̃ a mudança
de coordenadas
p
g(u, v) = (ρ, θ) = (2 u2 + v 2 , 2 arc tan(v/u)),
em que D̃ = g(D) = {(ρ, θ) ∈ R2 ; ρ > 0 e − π < a−1 θ < π}. Usando coordenadas esféricas, com
longitude fixa φ = φ0 , o cone C pode ser parametrizado por X̃ : D̃ → C, com
X̃(ρ, θ) = (ρa cos(a−1 θ), ρa sen(a−1 θ), bρ).
A parametrização em que estamos interessados é então dada por X : D → C, X = X̃ ◦ g. Apesar
da mudança de coordenadas g parecer artificial, esta é de fato a mais apropriada. Para ver isso,
sejam A e B dois pontos no cone com coordenadas, nas variáveis (u, v), dadas por A = (u0 , 0) e
B = (u1 , v1 ). Um caminho suave Y (t) no cone ligando A e B é dado pelas funções continuamente
diferenciáveis ρ(t) e θ(t), que variam em D̃, ou pelas correspondentes u(t) e v(t), que variam em D,
0 6 t 6 1. Usando a Regra da Cadeia, obtem-se que
ρ0 =
2(uv 0 − vu0 )
−2(uu0 + vv 0 )
√
e ρθ0 = √
u2 + v 2
u2 + v 2
de onde segue que o comprimento L(Y ) deste caminho é dado por
Z1 q
ρ0 2 + (ρθ0 )2 dt = 2
L(Y ) =
0
Z1 p
u0 2 + v 0 2 dt
0
Capı́tulo 2. Problemas de Tempo de Trânsito — A Braquistócrona
11
o qual, a menos de constante, é precisamente o comprimento de um caminho em D ligando os pontos
(u0 , 0) e (u1 , v1 ). Como D é convexo, este comprimento é mı́nimo para a reta u(t) = u0 + t(u1 − u0 ),
v(t) = tv1 , 0 6 t 6 1, que une estes dois pontos. Segue-se que a geodésica Ymin ligando os pontos A
e B no cone é dada por Ymin (t) = X(u0 + t(u1 − u0 ), tv1 ), que é um arco de hélice no cone (figura
2.4).
O fato das hélices aparecerem tanto como geodésicas do cilindro quanto do cone não é mera
coincidência. De fato, verificamos que as curvas do plano quando levadas ao cilindro e ao cone por
meio de uma parametrização apropriada mantêm o comprimento. Deste modo, as geodésicas do
cone e do cilindro provém das geodésicas do plano — as retas — onde a imagem de uma reta é
a hélice em cada uma destas superfı́cies. Assim, dizemos que o cone, o cilindro e o plano (num
domı́nio apropriado) são isométricos (para uma definição mais precisa, veja [2]). Isto possibilita
encontrar as geodésicas destas superfı́cies uma vez que sabemos quais são as geodésicas do plano.
Figura 2.4.
2.1.5
Uma Geodésica no Cone
Outras Geodésicas
Para caracterizar geodésicas de superfı́cies do R3 é possı́vel utilizar sistemas de coordenadas especiais
associados a elas, como se fez anteriormente para a esfera, o cilindro e o cone no R3 . O estudo das
geodésicas de superfı́cies arbitrárias do R3 foi iniciado por Johann Bernoulli (1689), por seu pupilo
Euler (1729), por Lagrange (1760) e quase que decisivamente abordado por Gauss (1827). Há de
se notar que para superfı́cies arbitrárias do R3 o problema não é nada trivial. Curiosamente, o
problema de achar as geodésicas de uma superfı́cie de revolução qualquer foi levantado quando se
descobriu que a Terra não era perfeitamente esférica.
No caso em que S for uma superfı́cie de nı́vel, por exemplo, S = {Y ∈ R3 : g(Y ) = 0}, então o
problema de se achar as geodésicas de S torna-se o problema de minimizar uma integral L(Y ) =
¯
R1¯
¯Y (t)¯dt, como anteriormente, mas agora sujeita à restrição g(Y ) ≡ 0. Este problema constitui
0
um ramo da geometria diferencial, e o leitor interessado pode consultar novamente [2].
2.2
Problemas de Tempo de Trânsito — A Braquistócrona
Se uma partı́cula desloca-se com velocidade constante entre dois pontos dados, então a curva
de menor distância entre esses pontos é também a de menor tempo de trânsito. Isto por que, se a
velocidade é constante, então a velocidade em qualquer ponto da trajetória é igual a V = ∆S/∆T .
Portanto, ∆T = ∆S/V e, para minimizar o tempo de trânsito ∆T , devemos minimizar o deslocamento ∆S, já que V é constante. Deste modo, a curva que minimiza a distância percorrida também
minimiza o tempo de trânsito. Entretanto, se a velocidade não for constante e, em particular, se
Capı́tulo 2. Problemas de Tempo de Trânsito — A Braquistócrona
Figura 2.5.
12
Sistema de Coordenadas e a Braquistócrona
depende do caminho percorrido, então as trajetórias que ligam estes pontos não são necessariamente
coincidentes.
Em 1696, Johann Bernoulli desafiou os matemáticos a encontrarem a braquistócrona, isto é,
a curva plana que forneceria o menor tempo de trânsito. A solução de Bernoulli foi derivada de
uma analogia com a ótica, e outras soluções foram dadas por seu irmão Jakob, por Newton, por
Euler , e por Leibniz. Embora todas essas soluções tenham alcançado a mesma conclusão, isto é,
que a braquistócrona não é um arco circular como se imaginava, mas uma ciclóide, nenhuma delas
é inteiramente satisfatória. Contudo, a de Bernoulli admitiu refinamentos e uma generalização: o
Cálculo Variacional.
Para o estudo do problema da braquistócrona, considere que uma partı́cula M percorra uma
trajetória ligando os pontos A e B, como ilustrado na Figura 2.5, em que o ponto A = O é a origem
e a parte do eixo y que aponta para baixo é tomada como positiva. Consideramos apenas as curvas
ligando os pontos A e B = (x1 , y1 ), em que x1 e y1 são positivos, que podem ser representadas pelo
gráfico de uma função contı́nua y = y(x), x ∈ [0, x1 ], com y(0) = 0 e y(x1 ) = y1 .
Assumimos que a partı́cula M está sob a ação de apenas duas forças: a força gravitacional,
que é conservativa, e a força normal, que, sendo perpendicular ao deslocamento infinitesimal ds da
partı́cula, não realiza trabalho sobre ela, e portanto não contribui para o aumento de sua velocidade.
Desprezamos quaisquer forças dissipativas que possam atuar sobre o sistema, como forças de atrito.
Nestas condições, a velocidade da partı́cula é função de sua altura y e, portanto, da curva que ela
percorrer.
Assumindo diferenciabilidade suficiente, o tempo T , necessário para uma partı́cula percorrer a
distância l ao longo da curva y(x), é dado por
Zl
T = T (y) =
0
ds
v
Rxp
Para x ∈ [0, x1 ], s(x) = 0 1 + [y 0 (x)]2 dx é o comprimento de arco até o ponto (x, y(x)). Considerando v = v(x) e substituindo s e v na equação acima, tem-se que
Zx1 p
T (y) =
0
1 + [y 0 (x)]2
dx
v(x)
13
Capı́tulo 2. Problemas Isoperimétricos
Considerando que não há forças dissipativas, a energia mecânica E se conserva. Segue então que
a variação da energia potencial é igual à variação da energia cinética, isto é, m g y(x) = m v 2 (x)/2,
onde m é a massa da
p partı́cula e g a constante de acelaração gravitacional da Terra. Desta igualdade,
segue que v(x) = 2gy(x) e, portanto,
1
T (y) = √
2g
Zx1 s
0
1 + [y 0 (x)]2
dx
y(x)
Do ponto de vista matemático, o problema é procurar a(s) função(ções) y(x) que minimiza(m) o
funcional acima entre todas as funções contı́nuas no intervalo fechado [0, x1 ], satisfazendo y(0) = 0
e y(x1 ) = y1 , de maneira que a integral exista. Para a existência, deve-se observar que a integral
é imprópria, devido à presença de um denominador que pode se anular. Além disso, é suficiente
requerer que y 0 seja integrável em [0, x1 ] e que y seja positiva em (0, x1 ].
Pode parecer redundante exigir que as funções y(x), que compõem o domı́nio do funcional T (y),
sejam contı́nuas em [0, x1 ] e que suas derivadas sejam integráveis em [0, x1 ], pois se uma função real
é derivável num ponto, então ela é contı́nua neste ponto. O que ocorre aqui, porém, é que o critério
de integrabilidade utilizado requer apenas que y 0 esteja definida em [0, x1 ] a menos de um conjunto
de medida zero 2 . Assim, por exemplo, pode acontecer de y 0 não estar definida em infinitos pontos
de [0, x1 ] e, desta maneira, a integrabilidade de y 0 não é suficiente para garantir que y seja contı́nua
nestes pontos.
De qualquer maneira, com ou sem motivação fı́sica, não há resposta óbvia, embora possa ser
verificada a hipótese feita por Galileu de que um arco de circunferência é superior a uma linha reta.
Variações do problema da braquistócrona logo se seguiram. Por exemplo, em 1698 Jakob
Bernoulli desafiou os matemáticos da época a encontrar a braquistócrona ligando um ponto e uma
reta fixos no plano. Mais tarde, investigou-se o problema de encontrar a braquistócrona entre duas
curvas arbitrárias fixas no espaço, e Newton considerou o problema de encontrar a braquistócrona
conectando dois pontos fixos na Terra passando-se através dela.
2.3
Problemas Isoperimétricos
Os problemas isoperimétricos tratam de questões geométricas nas quais a única condição é a de que
o perı́metro seja constante — a chamada condição isoperimétrica. Nesta categoria, o mais antigo é
o Problema de Dido , que pode ser enunciado assim:
Dada uma curva de perı́metro fixo, achar a forma que abriga a maior área.
Um outro exemplo deste tipo de problema, frequentemente atribuı́do a Euler, é:
Dado um fio de comprimento fixo, fino e inextensı́vel, encontrar a forma que assume
quando suas extremidades se encontram penduradas em dois pontos separados por uma
dada distância horizontal.
Com relação ao Problema de Dido, pode-se fazer a seguinte analogia fı́sica: considere uma
curva fechada de formato qualquer e construa a partir dela um cilindro reto, com paredes flexı́veis,
inextensı́veis e impermeáveis. Fixe este cilindro num plano horizontal de modo que não ocorra
vazamento na base deste cilindro. Preenchendo o interior com água (ver Figura 2.6) verificam-se
dois fatos:
2 Diz-se
que um conjunto A ⊆ R tem medida zero se, dado ² > 0, existir uma cobertura de A, digamos I1 , I2 , I3 , . . .,
∞
X
composta por quantidade enumerável (ou finita) de intervalos abertos tais que
m[Ik ] < ², onde m[Ik ] é a medida
do intervalo Ik . Notar que os intervalos escolhidos podem ser ou não disjuntos.
1
14
Capı́tulo 2. Problemas Isoperimétricos
Figura 2.6.
Problema de Dido — Analogia Fı́sica.
1. Em um mesmo nı́vel, a pressão da água em cada ponto da parede do cilindro é a mesma ,
devido às leis da hidrostática. Assim, em cada altura atuarão forças iguais e ortogonais às
paredes. E, como estas paredes são flexı́veis, elas irão se movimentar até que estas forças
possam ser vetorialmente canceladas, ocasionando uma equalização da pressão entre a parede
e a água. A única forma que possibilita essa equalização é certamente o cı́rculo.
2. Pela ação da gravidade, que é também a causadora das forças hidrostáticas do item anterior,
sabe-se que a água procura as regiões de menor altura possı́vel. E, como o volume de um
cilindro é dado pelo produto da área da base pela altura, então, para um volume constante,
tem-se que maximizar a área da base de modo a minimizar a altura.
Essas considerações fı́sicas indicam que a solução do Problema de Dido é dada pelo cı́rculo. O
Problema de Dido admite, ainda, uma solução geométrica, como segue.
Teorema 2.1. Dentre todas as curvas fechadas de perı́metro dado, o cı́rculo é aquela que engloba
a maior área.
Demonstração.
Suponha que C seja a curva procurada com comprimento l e área máxima.
Afirmamos então o seguinte:
i) C é convexa.
De fato, suponha que C não seja convexa. Então ela deve conter dois pontos A e A0 tal
que os arcos ABA0 e AB 0 A0 , que ligam tais pontos, devem estar do mesmo lado da linha
AA0 , conforme a Figura 2.7. No entanto, ao se substituir qualquer um desses arcos por sua
imagem na reflexão em torno da reta AA0 , obtem-se uma nova curva de mesmo comprimento
da anterior, mas que contém maior área, uma contradição.
ii) Se dois pontos A e B dividem a curva C em arcos de mesmo comprimento, então a linha AB
divide a área no interior de C em duas partes iguais.
Para demonstrar essa afirmação, suponha que A e B dividam a curva C em dois arcos de
mesmo comprimento mas a linha AB não divida a área de C em regiões de mesma área,
conforme ilustrado na Figura 2.8. Neste caso, o lado de maior área poderia ser refletido em
torno do segmento AB e, assim, obtem-se uma nova curva de mesmo comprimento, mas que
engloba maior área que a anterior, novamente uma contadição.
Agora o problema se reduz a determinar o arco de comprimento l/2 com pontos extremos A
e B em um segmento de reta tal que a área entre esse arco e o segmento AB seja máxima.
Neste sentido afirmamos
15
Capı́tulo 2. Problemas Isoperimétricos
Figura 2.7.
Figura 2.8.
iii) Suponha que os pontos A e B dividam a curva C ao meio. Se D é qualquer ponto na curva,
então o ângulo ADB é um ângulo reto.
Novamente por contradição, suponha que D é um ponto tal que o ângulo ADB não é reto.
A área delimitada pelo arco ADB e o segmento AB é dividida em três partes: as áreas A1
e A2 limitadas pela curva e os segmentos AD e DB, respectivamente, e a área A3 limitada
pelo triângulo ADB, conforme ilustrado na figura 2.9
Figura 2.9.
Agora suponha que fosse possı́vel movimentar tais segmentos de modo a obter um ângulo
reto em D, conforme Figura 2.10. Neste caso, as áreas A1 e A2 seriam mantidas inalteradas,
enquanto que a área A3 variaria.
Assim, a área delimitada pelo arco ADB 0 aumentaria, uma vez que, entre todos os triângulos
com dois lados congruentes, o que possui área máxima é o triângulo retângulo 3 , conforme
ilustra a Figura 2.11.
Figura 2.10.
Figura 2.11.
θ
considerar a expressão ab sen
, que fornece a área de um triângulo de lados a, b e c, com θ sendo o
2
ângulo entre os lados a e b (θ ∈ [0, π]). Daı́, quando sen θ = 1, teremos o maior valor para a área, isto é, quando
θ = arc sen 1 = π = 90o .
3 Basta
16
Capı́tulo 2. Problemas de Área de Superfı́cie
Portanto, a figura “máxima”consiste de todos os pontos D a partir dos quais uma corda que
divide o comprimento desta curva em duas partes iguais é vista sob um ângulo reto, isto é, a
curva em questão é um cı́rculo.
¥
Para uma formulação do Problema de Dido no contexto do cálculo das variações, usaremos o
Teorema de Green enunciado a seguir, onde a integral de linha é orientada no sentido anti-horário.
Para uma demostração desse Teorema, ver, por exemplo, [4].
Teorema 2.2 (de Green). Sejam M e N funções de duas variáveis x e y, que tenham derivadas
parciais primeiras contı́nuas em um disco aberto B em R2 . Se C for uma curva fechada simples
seccionalmente suave, contida inteiramente em B, e se R for a região limitada por C, então
¶
I
ZZ µ
∂N
∂M
M (x, y) dx + N (x, y) dy =
−
dA.
∂x
∂y
C
R
Vamos supor que uma curva C, fechada, simples e suave, de comprimento l, seja parametrizada
por Y (t) = (x(t), y(t)), t ∈ [0, 1]. De acordo com o Teorema acima, com N (x, y) ≡ x e M (x, y) ≡ 0,
a área A(Y ) do domı́nio R limitada pela curva é
ZZ
A(Y ) =
Z
dx dy =
R
Z1
x(t)y 0 (t) dt.
x dy =
0
C
onde supomos que Y (t) é uma parametrização orientada no sentido positivo.
O problema é então maximizar A(Y ) sobre todas as funções Y (t) de componentes continuamente diferenciáveis em [0, 1], com a condição de que Y (0) = Y (1) e que satisfaçam a condição
isoperimétrica
Z1
¯
¯
L(Y ) = ¯y 0 (t)¯dt = l
0
para um l dado. Voltaremos ao estudo deste problema no Capı́tulo 4.
2.4
Problemas de Área de Superfı́cie
Em dimensões maiores, um análogo dos problemas geodésicos discutidos anteriormente pode ser
formulado da seguinte forma:
Encontrar a superfı́cie de área mı́nima que une duas curvas fixas e fechadas em R3 .
2.4.1
Superfı́cie Mı́nima de Revolução
Por exemplo, quando as curvas consistem em um par de cı́rculos paralelos “concêntricos”, então
pode-se procurar a superfı́cie de revolução que as une e tem área mı́nima ou, de forma equivalente,
tentar encontrar a forma de sua curva de contorno. Este problema foi abordado primeiramente por
Euler (1744), que empregou o então recente desenvolvimento teórico do Cálculo das Variações em
sua solução.
Em um sistema de coordenadas apropriado, a área da superfı́cie de revolução que une esses dois
cı́rculos é dada por
Zb
S(y) = 2π
Zb
y(x) ds(x) = 2π
a
y(x)
a
p
1 + y 0 (x)2 dx
Capı́tulo 2. Problemas de Área de Superfı́cie
17
em que y(x) é não-negativa, continuamente diferenciável em [a, b], e tal que y(a) = a1 , e y(b) = b1 .
Aqui a1 e b1 representam os raios dos cı́rculos de fronteira, um dos quais pode ser degenerado a
um ponto. O problema é então obter y(x), com essas propriedades, e que minimiza o funcional
S(y). Quando a1 e b1 são comparáveis a b − a, é razoável esperar obter uma curva y(x) com
estas propriedades. Entretanto, quando b − a excede em muito a1 e b1 , então a área da superfı́cie
pode ser feita tão próxima da área dos dois discos de fronteira quanto desejado — e que essa área
provavelmente representa a menor área — mas a curva y(x) associada não é da forma admitida.
2.4.2
Problema de Área Mı́nima
Considere o seguinte problema: “dada uma curva γ em R3 , determinar a superfı́cie de menor área
que tem γ como fronteira”. Supondo que as superfı́cies admissı́veis possam ser representadas como
gráficos de funções u = u(x, y) definidas em um domı́nio comum D ⊂ R2 , então a área de uma
dessas superfı́cie é dada por
ZZ q
S(u) =
1 + u2x + u2y dx dy,
D
Aqui, admitimos que a fronteira ∂D é “bem-comportada”o suficiente para que a Integral de Riemann
de funções contı́nuas esteja definida sobre D, D e sobre ∂D.
Com esta notação, o problema é determinar o mı́nimo do funcional S(u) sobre todas as funções
u que sejam contı́nuas em¯ D = D ∪ ∂D, continuamente diferenciáveis em D e que tenham valores
de fronteira pré-fixados u¯∂D = γ, onde γ é uma função contı́nua.
Para este problema, que não tem necessariamente solução, é possı́vel obter alguns resultados
parciais sobre a hipótese de que D é um Domı́nio de Green.
2.4.3
O Problema de Plateau
Um novo impulso foi dado a esta classe de problemas em 1873, quando o fı́sico-matemático belga
Joseph Plateau notou que arames na forma de curvas fechadas, quando mergulhados em solução de
sabão e água, poderiam suportar uma fina membrana, a qual, para minimizar a tensão superficial,
deveria assumir uma forma associada à superfı́cie de área mı́nima. Estes experimentos têm sido
realizados até os dias de hoje e mostram que, para algumas configurações, mais do que um tipo de
solução é possı́vel, e em alguns casos as soluções podem mudar de forma à medida que a geometria
da curva é alterada. Por exemplo, da discussão sobre superfı́cie de revolução mı́nima acima, esperase que a membrana de sabão que une um par de anéis, inicialmente na forma cilı́ndrica, pode se
transformar em um par de discos à medida que os anéis são afastados um do outro.
Não vamos abordar matematicamente este problema, já que são necessários conceitos
matemáticos que estão fora do alcance deste trabalho.
Capı́tulo 3
Espaços Lineares e Variações de
Gâteaux
Os problemas considerados previamente se reduziam a otimizar (geralmente minimizar) uma função
J, de valor real, definida em um subconjunto D de um espaço linear Y. Neste capı́tulo serão estudados problemas neste contexto e serão introduzidas as derivadas direcionais (Varições de Gâteaux),
que serão necessárias posteriormente. Inicialmente serão vistos alguns exemplos de espaços lineares
pressupondo alguma familiariedade com os conceitos de espaço vetorial real, de continuidade e de
diferenciabilidade em Rd .
3.1
Espaços Lineares Reais
Todas as funções consideradas neste texto assumem valores reais ou valores vetoriais reais. A principal propriedade de um espaço linear (ou vetorial) de funções reais é conter a soma e a multiplicação
por escalar dessas funções. Observamos que a coleção de funções com valores reais f , g definidas
em um conjunto D (não vazio) forma um espaço linear real com respeito as operações de adição
(f + g)(x) = f (x) + g(x), x ∈ D, e multiplicação por escalar (cf )(x) = cf (x), x ∈ D e c ∈ R.
Similarmente, para cada d = 2, 3, · · · , a coleção de todas as funções de valores em Rd definidas
no conjunto D forma um espaço linear com respeito às operações de adição e multiplicação por
escalar, análogas vetoriais das operações acima.
Segue-se que cada subespaço destes espaços, isto é, cada subconjunto que é fechado em relação
às operações de adição e multiplicação por escalar, é ele mesmo um espaço linear.
Em particular, se a continuidade esta definida em D, então C(D) (= C 0 (D)), definido como o
conjunto das funções contı́nuas de valores reais em D, é um espaço linear, pois a soma de funções
contı́nuas ou a multiplicação de uma função contı́nua por um escalar é de novo uma função contı́nua.
Do mesmo modo, se D é um subconjunto aberto do espaço euclidiano e m = 1, 2, · · · , então C m (D),
definido como o conjunto de funções em D com derivadas parciais contı́nuas de ordem 6 m, é um
espaço linear real, pois a lei da diferenciação garante que a soma ou a multiplicação por escalar de
tais funções é ainda uma funcão desse tipo. Se D é limitado com fronteira ∂D, e D = D ∪ ∂D,
então C m (D), definido como o subconjunto de C m (D) ∩ C(D) das funções cujas derivadas parciais
de ordem 6 m admitem extensões contı́nuas em D, é um espaço linear real.
Por exemplo, se a < b, então (a, b) = [a, b] é um intervalo fechado e limitado. Uma função
y, que é contı́nua em [a, b], pertence a C 1 [a, b] se for continuamente diferenciável em (a, b) e sua
derivada y 0 possuir limites finitos à direita de a e à esquerda de b. Denotamos por y 0 (a) e y 0 (b),
respectivamente, esses valores. Observe que y0 (x) = x3/2 define uma função de C 1 [1, 0], enquanto
y1 (x) = x1/2 , não.
Finalmente, para d = 1, 2, · · · , [C(D)]d , [C m (D)]d e [C m (D)]d , os conjuntos d-dimensionais
de funções vetoriais reais cujas componentes estão em C(D), C m (D) e C m (D), respectivamente,
também formam espaços lineares reais.
Sabemos que subconjuntos D destes espaços proporcionam domı́nios naturais para otimização
das funções apresentadas anteriormente. Porém, em geral, estes subconjuntos não são espaços
lineares. Por exemplo, D = {y ∈ C[a, b] ; y(a) = 0, y(b) = 1} não é um espaço linear, pois se y ∈ D
então 2y ∈
/ D. Por outro lado, D0 = {y ∈ C[a, b] ; y(a) = y(b) = 0} é um espaço linear.
Finalmente, lembramos que, em um espaço linear Y, as operações de adição e multiplicação por
escalar satisfazem às leis comutativa, associativa e ditributiva. Em particular, há um único vetor O
tal que c O = 0 y = O, ∀y ∈ Y, c ∈ R; também adotaremos as abreviações padrões de que 1 y = y
e −1 y = −y, ∀y ∈ Y.
19
Capı́tulo 3. Espaços Lineares Reais
Exemplo. O funcional do problema da braquistócrona
Zx1 p
1 + y 0 (x)2
1
p
T (y) = √
dx
2g
y(x)
0
p
não está definido no conjunto Y = C 1 [0, x1 ] devido
do termo y(x) no integrando. Mas,
R x1 à presença
se restringirmos as funções y(x) de forma que 0 y(x)−1/2 dx seja finito, então a integral acima é
finita. De fato, neste caso tem-se que
Zx1 p
Zx1
1 + y 0 (x)2
1
p
p
dx 6 M
dx < ∞
y(x)
y(x)
0
onde M é o valor máximo da função
0
p
1 + y 0 (x)2 em [0, x1 ]. Assim, T (y) está definido no conjunto
Zx1
D = {y ∈ Y ; y > 0
y(x)−1/2 dx < ∞}.
e
0
Notamos que D não é um subespaço linear de Y, uma vez que a condição y(x) > 0 não é preservada
na operação de multiplicação por escalar.
Exemplo. Suponha que f ∈ C([a, b] × R2 ). Então, o funcional F (y) dado por
Zb
f (x, y(x), y 0 (x)) dx
F (y) =
a
1
está bem definido em Y = C [a, b], tendo em vista que, para cada vetor y ∈ Y, a composta
f [y(x)] = f (x, y(x), y 0 (x)) é uma função contı́nua. Entretanto, se f ∈ C([a, b] × D), onde D é um
domı́nio de R2 , devemos ter que (y(x), y 0 (x)) ∈ D ∀x ∈ [a, b]. Então, F (y) está bem definido no
subconjunto D = {y ∈ C 1 [a, b] ; (y(x), y 0 (x)) ∈ D ∀x ∈ [a, b]}.
Exemplo. Para cada d = 1, 2, · · · considere a função de evaluação L(Y ) = Y (a) definida em
¡
¢d
Y= C[a, b] . Esta função, que avalia Y (x) no extremo do intervalo [a, b], é linear, pois, para todo
c, c̃ ∈ R e todo Y, Ỹ ∈ Y, tem-se que
L(cY + c̃Ỹ ) = (cY + c̃Ỹ )(a) = cY (a) + c̃Ỹ (a) = cL(Y ) + c̃L(Ỹ )
Usando a linearidade da derivada, obtem-se que o funcional L1 (Y ) = Y 0 ( a+b
2 ), definido em
¡ 1
¢d
C [a, b] , é também linear, uma vez que, ∀c, c̃ ∈ R e ∀ Y, Ỹ ∈ Y,
L1 (cY + c̃Ỹ )
=
(cY + c̃Ỹ )0 ( a+b
2 )
0 a+b
= cY 0 ( a+b
2 ) + c̃Ỹ ( 2 ) = cL1 (Y ) + c̃L1 (Ỹ )
Finalmente, em virtude da linearidade da integral, conclui-se que o funcional L(y) =
com y ∈ Y = C[a, b], é também linear, pois, ∀ c, c̃ ∈ R e ∀ Y, Ỹ ∈ Y,
Zb
L(cy + c̃ỹ) =
Zb
3x[cy + c̃ỹ](x) dx = c
a
a
3xy(x) dx,
Zb
3xy(x) dx + c̃
a
Rb
3xỹ(x) dx
a
= cL(y) + c̃L(ỹ)
Exemplo. Se J e J˜ são funções de valores reais definidas no subconjunto D de algum espaço linear
˜ eJ e sen J estão também definidos em
Y, então, para todo √
c, c̃ ∈ R, tem-se que cJ, cJ + c̃J˜ , J J,
−1
D. Entretanto J , J e tan J podem não estar definidos em todo o subconjunto D.
20
Capı́tulo 3. Fundamentos de Otimizaçao
3.2
Fundamentos de Otimizaçao
Os extremos de uma função real J, definida em um subconjunto D de um espaço linear Y, são os
pontos y0 ∈ D nos quais J assume um mı́nimo, isto é, J(y0 ) 6 J(y) ∀ y ∈ D, ou os pontos de
máximo, isto é, J(y0 ) > J(y) ∀ y ∈ D. Como os pontos de máximo de J são os pontos de mı́nimo
de −J, basta estudar os pontos de mı́nimo de uma função.
Em muitos problemas, além da existência, é de importância a unicidade de pontos extremos.
Dizemos que um ponto y0 ∈ D minimiza J unicamente em D se y0 satisfaz J(y0 ) 6 J(y), ∀ y ∈ D
e, além disso, a igualdade ocorre
R 1 se, e somente se, y = y0 .
Por exemplo, para J(y) = 0 y(x)2 dx definido em D = C[0, 1], é claro que y0 (x) = 0 é o único
ponto de mı́nimo de J.
Lema 3.1. Um ponto y0 ∈ D minimiza J em D se, e somente se, J(y0 + v) − J(y0 ) > 0 para todo
y0 + v ∈ D. Além disso, y0 é o único ponto de mı́nimo se a igualdade ocorre apenas para v = O
Demonstração.
Basta observar que, se y ∈ D, então y = y0 + v com v = y − y0 . Além disso,
y = y0 se, e somente se, v = O.
¥
Rb 0 2
Exemplo. Para o funcional J(y) = a y (x) dx, definido no conjunto D = {y ∈ C 1 [a, b] : y(a) =
0, y(b) = 1}, é claro que J(y) > 0. Se existe algum y1 ∈ D tal que J(y1 ) = 0, então y10 = 0, e
portanto y1 = c = constante, de onde segue que y1 6∈ D. Assim, J(y) > 0 ∀ y ∈ D. Para determinar
o ponto de mı́nimo nesse caso, usando a formulação do lema anterior, para y0 e y0 + v ∈ D, tem-se
que
Zb
[(y00 (x) + v 0 (x))2 − y00 (x)2 ] dx
J(y0 + v) − J(y0 ) =
a
Zb
Zb
2 y00 (x) v 0 (x)
=
a
Zb
0
dx +
2
y00 (x) v 0 (x) dx
v (x) dx > 2
a
a
Notar que 0 = y0 (a) = (y0 + v)(a) = v(a), e da mesma forma v(b) = 0. Desta observação, da
desigualdade acima e considerando y00 = c, com c constante, tem-se
Zb
J(y0 + v) − J(y0 ) > 2 c
¯b
v 0 (x)dx = c v(x)¯a = 0.
a
Além disso, para y0 (x) = (x − a)/(b − a), tem-se y00 = c e y0 ∈ D. Pelo lema anterior, y0 minimiza
J em D. Além disso, y0 é único, uma vez que, se temos a igualdade J(y0 + v) − J(y0 ) = 0, então,
Rb
necessariamente a v 0 (x)2 dx = 0, e portanto v 0 (x) = 0, ou seja, v(x) = k, onde k é uma constante.
Como v(a) = 0, segue que v = O é o vetor nulo.
Proposição 3.2. Um ponto y0 minimiza J em D [unicamente] se,e somente se, para constantes
c0 e c 6= 0, y0 minimiza c2 J + c0 em D [unicamente].
Demonstração.
Se o ponto y0 minimiza J em D, então, para todo y ∈ D, J(y0 ) 6 J(y), e
portanto (c2 J + c0 )(y0 ) 6 (c2 J + c0 )(y), isto é, y0 minimiza c2 J + c0 em D. Reciprocamente,
se y0 minimiza c2 J + c0 , então, para y ∈ D, (c2 J + c0 )(y0 ) 6 (c2 J + c0 )(y), de onde segue que
J(y0 ) 6 J(y), isto é, y0 minimiza J em D.
¥
Assim, pelo exemplo anterior, y0 (x) = (x − a)/(b − a) também minimiza unicamente o funcional
Rb
J1 (y) = 3 a (y 0 (x)2 + sen3 (x)) dx = 3J(y) + c0 no mesmo domı́nio D.
21
Capı́tulo 3. Vı́nculos
3.3
Vı́nculos
Proposição 3.3. Se o ponto y0
minimiza [unicamente] o funcional J˜ = J +
N
X
λi Gi em
i=1
D , onde λ1 , λ2 , . . . , λN são constantes e J, G1 , G2 , . . . , GN são funções definidas
em D, então y0 minimiza [unicamente] J restrito ao conjunto D ∩ Gy0 , em que
Gy0 = {y ∈ D ; Gi (y) = Gi (y0 ), i = 1, 2, . . . , N }.
Demonstração.
(3.1)
Como y0 minimiza J˜ em D, para cada y ∈ D tem-se
˜ = J(y) +
J(y)
N
X
˜ 0 ) = J(y0 ) +
λi Gi (y) > J(y
i=1
N
X
λi Gi (y0 ).
i=1
Mas, se y ∈ Gy0 , então J(y) > J(y0 ), já que os termos envolvendo as funções Gi terão os mesmos
valores em cada lado da inequação. Logo y0 minimiza J em D quando restrito a Gy0 .
¥
De fato, y0 minimiza J automaticamente em um conjunto muito maior, segundo o corolário a
seguir.
Corolário 3.4. Nas condições da proposição anterior, y0 minimiza [unicamente] J restrito ao
conjunto em D ∩ G∗y0 , em que
G∗y0 = {y ∈ D ; λi Gi (y0 ) > λi Gi (y),
Demonstração.
(3.2)
i = 1, 2, . . . , N }.
Para y ∈ G∗y0 , a desigualdade (3.1) nos dá
J(y) − J(y0 ) >
N
X
[λi Gi (y0 ) − λi Gi (y)] > 0.
i=1
Além disso, se y0 minimiza unicamente J˜ em D e y ∈ G∗y0 é tal que J(y) = J(y0 ), então λj Gj (y0 ) =
˜ = J(y
˜ 0 ), de onde segue que y = y0 .
λj Gj (y), j = 1, 2, · · · , N , e portanto J(y)
¥
Este resultado ilustra um importante princı́pio, o de que a solução de um problema de minimização pode também nos dar uma solução para outros problemas.
Exemplo (Coluna de fluido em rotação). Suponha que um cilindro circular de raio l contenha
um certo volume de água em rotação em torno de seu eixo vertical com um velocidade angular
constante ω. A figura a seguir ilustra esta situação.
A água está sobre a ação da força gravitacional, direcionada verticalmente para baixo, e da
força centrı́peta, que tem direção radial. Nessas condições, a superfı́cie da água assume uma forma
diferente da inicial, que lembra o interior de um ciclone, sendo que esse movimento preserva o
volume e minimiza a diferença entre a energia potencial e a energia cinética do lı́quido (ação).
Intuitivamente, pode-se supor que a superfı́cie da água transforma-se em uma superfı́cie de revolução
em torno do eixo vertical do cilindro. Introduzindo o sistema de coordenadas como na figura, a
secção dessa superfı́cie pelo plano y0x define a curva y0 (x), para x no intervalo [0, l]. A curva y0 (x)
é aquela que minimiza o funcional da ação, deduzido a seguir:
Particionamos o domı́nio dividindo o seguimento [0, l] em n pedaços. Supondo, por aproximação,
que a casca cilı́ndrica correspondente ao pedaço [xi−1 , xi ] possui uma altura constante igual a
i
hi = y(xi ), onde xi = xi +x
, podemos calcular sua energia potencial gravitacional Fi e sua energia
2
cinética Ki .
22
Capı́tulo 3. Vı́nculos
Figura 3.1.
Coluna de Fluido em Rotação
A massa da casca pode ser calculada por:
mi = ρVi = ρAi hi ,
onde Ai = π(x2i − x2i−1 ) = π(xi + xi−1 )(xi − xi−1 ) = 2πxi (xi − xi−1 ) = 2πxi ∆xi é a área do anel,
e ρ é a densidade da água.
Portanto, denotando por g a aceleração da gravidade, a energia potencial gravitacional será
hi
= ρπy 2 (xi )xi ∆xi g
2
e a energia cinética, admitindo que a coluna de água se comporte como um corpo rı́gido em rotação,
é dada por
(vi )2
(ωxi )2
Ki = m i
= mi
= ρπω 2 x2i y(xi )xi ∆xi .
2
2
Então, na casca
Ji = Fi − Ki = πρ[gy 2 (xi ) − ω 2 x2i y(xi )]xi ∆xi ,
Fi = mi g
e, portanto, temos que a ação aproximada de toda coluna será
Jn =
n
X
Ji ,
i=1
que é a soma de Riemman da função f (x) = πρ[gy 2 (x) − ω 2 x2 y(x)]x . Então, quando n → ∞,
obtém-se que a ação total do lı́quido é dada por:
Zl
[gy 2 (x) − ω 2 x2 y(x)]x dx,
J(y) = lim Jn = πρ
n→∞
0
cujo domı́nio é o conjunto D = {y ∈ C[0, l] : y(x) > 0}. Por outro lado, o volume do lı́quido é dado
por
Zl
G(y) = 2π xy(x) dx,
0
23
Capı́tulo 3. Vı́nculos
uma vez que é o volume de um sólido de rotação.
Pela Proposição 3.3, a curva que minimiza o funcional J e preserva o volume G é a mesma que
˜
˜
minimiza o funcional J(y)
= J(y) + λG(y), definido em D. Sabemos que y0 minimiza J(y)
se, e
˜ 0 + v) − J(y
˜ 0 ) > 0, ∀y0 + v ∈ D. Portanto, trocando λ por ρλ/2, simplificando e
somente se, J(y
˜ 0 + v) − J(y
˜ 0 ), obtém-se
usando a abreviação ∆J˜ = J(y
Zl
∆J˜ = πρ
{g[(y0 + v)2 (x) − y02 (x)] + (λ − ω 2 x2 )v(x)}x dx
0
Zl
{gv 2 (x) + [2gy0 (x) + (λ − ω 2 x2 )]v(x)}x dx
= πρ
0
Zl
[2gy0 (x) + (λ − ω 2 x2 )]v(x)x dx.
> πρ
0
e a última integral se anula para todo y0 + v ∈ D se o termo entre colchetes for identicamente nulo,
Rl
ω 2 x2 − λ
ou seja, se y0 (x) =
. Além disso, a igualdade ocorre se, e somente se, 0 v 2 (x)x dx = 0,
2g
o que implica v(x) ≡ 0. Segue-se que y0 minimiza unicamente J˜ em D. Portanto, a superfı́cie é
um parabolóide de revolução. Agora, devemos determinar a constante λ para que o vínculo seja
satisfeito:
Zl
π
πl2 ω 2 l2
λ
G(y0 ) =
(ω 2 x2 − λ)x dx =
[
− ] = Gy0
g
g
4
2
0
e, então,
λ=
ω 2 l2
2gGy0
−
.
2
πl2
Portanto,
ω 2 (2x2 − l2 ) Gy0
+ 2.
4g
πl
Observe que a forma que minimiza a ação depende, como se esperaria, de ω, possuindo altura
constante para ω = 0 (tambor parado). Mas, é independente da densidade ρ, e seria a mesma para
outro fluido (perfeito) à mesma velocidade angular.
y0 (x) =
Proposição 3.5. Suponha que f e g sejam contı́nuas em [a, b] × R2 . Suponha ainda que, para alguRb
ma função λ ∈ C[a, b], tem-se que y0 minimiza F̃ (y) = a f˜[y(x)]dx em D ⊆ C 1 [a, b] [unicamente],
Rb
onde f˜ = f + λg. Então y0 minimiza F (y) = a f [y(x)]dx em D [unicamente] sujeito ao vı́nculo
(3.3)
Demonstração.
λ(x) g[y(x)] 6 λ(x) g[y0 (x)]
∀x ∈ [a, b].
Se y ∈ D, então F̃ (y) > F̃ (y0 ), isto é,
Zb
F (y) +
Zb
λ(x) g[y(x)] dx > F (y0 ) +
a
λ(x) g[y0 (x)] dx.
a
Logo, se y satisfaz 3.3,
Zb
F (y) − F (y0 ) >
λ(x) (g[y0 (x)] − g[y(x)]) dx > 0
a
24
Capı́tulo 3. Variações de Gâteaux
Rb
Além disso, se F (y) = F (y0 ) com a condição (3.3) acima, então a λ(x) (g[y0 (x)] − g[y(x)]) dx = 0,
e F̃ (y) = F̃ (y0 ). Assim, se y0 minimiza F̃ unicamente, então y0 também minimiza F unicamente.
¥
Lamentavelmente este resultado, embora sugestivo, não pode ser implementado rapidamente, já
que ele não provê um método para a determinação de uma função λ conveniente. No entanto, o
resultado pode ser utilizado a partir de uma solução conhecida de outro problema. Por exemplo,
Rb
da análise utilizada na aplicação anterior, obtém-se que y0 = x2 − 1 minimiza F̃ (y) = 0 [y 2 (x) +
(2 − 2x2 ) y(x)]x dx unicamente em D = C[0, b]. Tomando λ(x) = x na Proposição 3.5, segue que y0
Rb
também minimiza F (y) = 0 2x y(x) dx em D unicamente, se sujeito ao vı́nculo Lagrangeano
g[y(x)] = y 2 (x) − 2x2 y(x) 6 g[y0 (x)] = 1 − x4 ,
def
onde usamos o fato de λ(x) = x > 0 em [0, b].
3.4
Variações de Gâteaux
No estudo da otimização de funções escalares definidas em subconjuntos de Rd , o conceito de
derivada parcial — ou mais geralmente de derivada direcional — desempenha um papel decisivo.
Da mesma forma, quando J é um funcional definido num subconjunto de um espaço linear Y
qualquer, por exemplo, se Y é o conjunto de todas as funções reais contı́nuas num intervalo [a, b],
define-se a chamada variação de Gâteaux, que é uma generalização direta do conceito de derivada
direcional.
Definição 3.6. Seja J um funcional definido em um subconjunto D de¯ um
¯ espaço linear Y. Assuma
que, para y ∈ D e v ∈ Y, existe σ > 0 tal que y + ²v ∈ D para todo ¯²¯ < σ. Então, caso exista, o
limite
J(y + ²v) − J(y)
δJ(y; v) = lim
²→0
²
é chamado Variação de Gâteaux de J em y na direção de v.
∂
É interessante notar que a definição acima coincide com a “derivada ordiária” ∂²
J(y + v²) da
função ² 7→ J(y + ²v) no ponto ² = 0, isto é,
δJ(y; v) =
¯
∂
J(y + v²)¯²=0 ,
∂²
caso essa derivada exista.
Como era de se esperar, por comparação com a derivada direcional de uma função escalar, a
variação de Gâteaux tem as seguintes propriedades:
i) Se δI(y; v), δJ(y; v) existem e a, b são números reais, então δ(aI + bJ)(y; v) também existe,
e δ(aI + bJ)(y; v) = aδI(y; v) + bδJ(y; v).
ii) Se δJ(y; v) existe, então δJ(y; cv) também existe para todo c ∈ R, e tem-se δJ(y; cv) =
cδJ(y; v). Esta propriedade garante que, se δJ(y; v) = 0, então δJ(y; cv) = 0 para todo
c ∈ Rd .
A variação de Gâteaux, assim como a derivada, depende somente do comportamento local do
funcional, e pode acontecer de não existir em qualquer direção v 6= 0, ou de existir em algumas
direções, mas não em outras.
Exemplo. Se J ∈ C 1 (Rd ) e Y, V ∈ Rd , então
δJ(Y ; V ) = lim
²→0
J(Y + ²V ) − J(Y )
,
²
25
Capı́tulo 3. Variações de Gâteaux
é exatamente a derivada direcional de J no ponto Y e na direção V , em que a direção é geralmente
um vetor unitário. Portanto, temos que

®
δJ(Y ; V ) = ∇J(Y ), V
e isso vale para todo V ∈ Y.
Rb
Exemplo. O funcional J(y) = a [sen3 x + y 2 (x)] dx está definido em Y = C[a, b]. Assim, para
y, v ∈ Y fixas e ² 6= 0, tem-se que y + ²v ∈ Y, já que Y é um espaço linear. Segue-se que J(y + ²v)
está definido e, além disso,
Zb
1
J(y + ²v) − J(y)
=
²
²
[(y + ²v)2 (x) − y 2 (x)] dx
a
Zb
=2
Zb
v 2 (x) dx.
y(x) v(x) dx + ²
a
a
Tomando o limite com ² → 0, concluı́mos que
Zb
δJ(y; v) = 2
y(x) v(x) dx,
∀ y, v ∈ Y.
a
Alternativamente,
poderı́amos ter obtido esse resultado usando o fato de que δJ(y; v) =
¯
²v)¯²=0 . Neste caso,
∂
∂² J(y
+
Zb
[sen3 x + (y + ²v)2 (x)] dx
J(y + ²v) =
a
Zb
Zb
2
= J(y) + 2²
a
∂
de onde segue que
J(y + ²v) = 2
∂²
v 2 (x) dx,
y(x) v(x) dx + ²
Zb
a
Zb
v 2 (x) dx, e obtemos o mesmo resultado
y(x) v(x) dx + 2²
a
anterior calculando essa derivada no ponto ² = 0.
a
Em geral, é mais fácil tecnicamente usar o segundo método para calcular δJ em casos concretos
porque estamos mais familiarizados com as técnicas de derivar funções reais simples.
Zb
Exemplo. O funcional J(y) =
¡
¢
sen y(x) dx + y 2 (b), para o qual
a
Zb
J(y + ²v) =
¡
¢
sen y(x) + ²v(x) dx + (y + ²v)2 (b),
a
está definido em Y = C[a, b], e tem, em cada y ∈ Y e em cada direção v ∈ Y, a variação de Gâteaux
Zb
δJ(y; v) =
a
¡
¢
cos y(x) v(x) dx + 2 y(b) v(b).
26
Capı́tulo 3. Variações de Gâteaux
Zπ p
Exemplo. O funcional J(y) =
1 − y(x)2 dx não está definido em Y = C[0, π], mas no sub0
° °
¯
¯
° °
conjunto D = {y ∈ Y ; °y °M 6 1}, onde °y °M = max{¯y(x)¯ ; x ∈ [0, π]}. Assim, se y1 (x) = sen x
e y2 (x) = x, ∀ x ∈ [0, π], conclui-se que y1 (x) ∈ D, enquanto
que y2 (x)
¯
¯ 6∈ D. Além disso, para um
dado y ∈ Y, somente aquelas direções v para as quais ¯y(x) + ²v(x)¯ 6 1, com ² suficientemente
pequeno, devem ser consideradas. Por exemplo, y(x) ≡ 1 ∈ D, entretanto, a única direção possı́vel
para y é v(x) ≡ 0.
Aplicando então o segundo método ao cálculo da variação de Gâteaux de J(y), assumindo que
y + ²v ∈ D, para algum y ∈ D e v ∈ Y, tem-se:
∂
∂
J(y + εv) =
∂ε
∂ε
Zπ p
1 − (y +
εv)2 (x) dx
0
0
Zπ
=−
0
Zπ p
∂
=
1 − (y + εv)2 (x) dx
∂ε
(y + εv)(x) v(x)
p
dx,
1 − (y + εv)2 (x)
Zπ
e, para ε = 0, obtem-se que δJ(y, v) = −
0
y(x) v(x)
p
dx.
1 − y 2 (x)
Z1
x(t) y 0 (t) dt está definido em Y = (C 1 [0, 1])2 . Além
Exemplo. O funcional da área A(Y ) =
0
disso, se V = (u, v) ∈ Y, então Y + εV também pertence a Y , pois este é um espaço vetorial.
Segue que A(Y + εV ) está definido e, usando a abreviação Ã(ε) = A(Y + εV ),
Z1
Ã(ε) =
¡
¢¡
¢0
x(t) + εu(t) y(t) + εv(t) dt
0
Z1
=
¡
¢
x(t) y 0 (t) + ε x(t) v 0 (t) + u(t) y 0 (t) + ε2 u(t) v 0 (t) dt.
0
Dessa igualdade segue que
∂
A(Y + εV ) =
∂ε
Z1
¡
¢
x(t) v 0 (t) + u(t) y 0 (t) + 2ε u(t) v 0 (t) dt
0
e portanto A(Y ) possui, em cada Y ∈ Y e em cada direção V ∈ Y, a variação de Gâteaux
¯
∂
δA(Y ; V ) =
A(Y + εV )¯ε=0 =
∂ε
Z1
¡
¢
x(t) v 0 (t) + u(t) y 0 (t) dt
0
Exemplo. Para f ∈ C 1 ([a, b] × R2d ), d = 1, 2, 3, . . ., o funcional
Zb
F (Y ) =
a
¡
¢
f x, Y (x), Y 0 (x) dx =
Zb
a
£
¤
f Y (x) dx
27
Capı́tulo 3. Funcionais Convexos
¡
¢d
está definido em Y = C 1 [a, b] . Calculando a variação de Gâteaux pelo segundo método, com
V ∈ Y, tem-se
Zb
¡
¢
F (Y + ²V ) = f x, (Y + ²V )(x), (Y + ²V )0 (x) dx
a
e portanto, derivando sob o sinal de integral e usando a Regra da Cadeia,
Zb
δF (Y ; V ) =

® 
®
fY [Y (x)], V (x) + fZ [Y (x)], V 0 (x) dx
a
£
¤
£
¤
onde, denotando-se as variáveis por (x, y1 , · · · , yd , z1 , · · · , zd ) ∈ [a, b] × R2d , fY Y (x) e fZ Y (x)
são as funções de valores vetoriais de componentes dadas, respectivamente, por
£
¤
¡
¢
fyj Y (x) = fyj x, Y (x), Y 0 (x)
£
¤
¡
¢
fzj Y (x) = fzj x, Y (x), Y 0 (x)
j = 1, 2, . . . , d.
3.5
Funcionais Convexos
Recordemos que uma função f , de classe C 1 em Rd , é convexa se satisfaz

®
f (Y + V ) − f (Y ) > ∇f (Y ), V
∀ Y, V ∈ Rd ,
e é estritamente convexa quando a igualdade ocorre se, e somente se, V = O. Recordemos,
ainda,

®
que a derivada direcional de f é precisamente a sua variação de Gâteaux, isto é, ∇f (Y ), V =
δf (Y ; V ). Por analogia, e generalizando este resultado para funcionais, introduzimos a seguinte
Definição 3.7. Um funcional real J, definido em um conjunto D de um espaço linear Y, é convexo
em D se, para todo y, y + v ∈ D, existe a variação de Gâteaux δJ(y; v) e, além disso, J satisfaz
J(y + v) − J(y) > δJ(y; v).
O funcional J é estritamente convexo se a igualdade ocorre apenas para v = O.
Propriedades análogas às das funções convexas também são válidas para os funcionais convexos,
como ilustram as proposições a seguir.
Proposição 3.8. Se J e F são funcionais convexos em um subconjunto D de um espaço linear
Y, então, para qualquer c ∈ R, c2 J e J + F também são convexos. Além disso, c2 J e J + F são
estritamente convexos se J o for.
Demonstração.
Basta notar que, se y, y + v ∈ D, então
¡ 2
¢
¡
¢
¡
¢
c J + F (y + v) − c2 J + F (y) > c2 δJ(y; v) + δF (y; v) = δ c2 J + F (y; v).
Logo, se c2 = 1, tem-se a convexidade de J + F , e se F = 0, tem-se a convexidade de c2 J.
¥
Proposição 3.9. Se o funcional J é convexo em D e y0 ∈ D é tal que δJ(y0 ; v) = 0 ∀ y0 + v ∈ D,
então y0 minimiza J em D. Se, além disso, J é estritamente convexo, então y0 é o único ponto de
mı́nimo de J.
Demonstração.
Se y ∈ D, definindo v = y − y0 , obtém-se
J(y) − J(y0 ) = J(y0 + v) − J(y0 ) > δJ(y0 ; v) = 0,
isto é, y0 minimiza J em D. Se J é estritamente convexo, obtém-se que J(y) − J(y0 ) > 0
e portanto y0 é o único ponto de mı́nimo de J em D.
∀ y 6= y0 ,
¥
28
Capı́tulo 3. Funcionais Convexos
Zb
Exemplo.
δJ(y; v) = 2
que
Para
Rb
a
o
funcional
[sen3 x + y 2 (x)] dx
J(y) =
tem-se
a
y(x) v(x) dx ∀ y, v ∈ Y = C[a, b].
Logo, J é estritamente convexo em Y, já
Zb
(y + v)2 (x) − y 2 (x) dx
J(y + v) − J(y) =
a
Zb
=2
Zb
a
Zb
v 2 (x) dx > 2
y(x) v(x) dx +
a
y(x) v(x) dx = δJ(y; v).
a
Rb
e a igualdade ocorre se, e somente se, a v 2 (x) dx = 0, que só é possı́vel se a função contı́nua v 2 (x)
for nula. Logo, como y0 = O ∈ Y é tal que δJ(y0 , v) = 0 ∀ v ∈ Y, então y0 minimiza J em Y
unicamente.
Por
outro
lado,
com
o
objetivo
de
minimizar
o
funcional
J
em
D = {y ∈ C[a, b] ; y(a) = a1 , y(b) = b1 }, devemos obter δJ(y; v) = 0, mas somente para aqueles y, y + v ∈ D, isto é, somente para os v ∈ D0 = {v ∈ C[a, b] ; v(a) = v(b) = 0}. Novamente,
y0 = O faria com que δJ(y0 ; v) = 0, mas agora y0 6∈ D, a menos que a1 = b1 = 0.
Zb
y 0 (x)2 dx , definido no conjunto Y = C 1 [a, b], é tal que
Exemplo. O funcional F (y) =
δF (y; v) = 2
Rb
a
a
y 0 (x) v 0 (x) dx
∀ y, v ∈ Y. Logo, é também convexo, já que
Zb
Zb
0
F (y + v) − F (y) =
2
y 0 (x)2 dx
(y + v) (x) dx −
a
a
Zb
Zb
0
=2
0
y (x) v (x) dx +
a
Mas agora a igualdade só ocorre se
não é estritamente convexo em Y.
a
2
y 0 (x) v 0 (x) dx = δF (y; v).
v (x) dx > 2
a
Rb
Zb
0
a
v 0 (x)2 dx = 0, isto é, se v(x) = c, onde c ∈ R, e, portanto F
Capı́tulo 4
As Equações de Euler-Lagrange
A solução de Jakob Bernoulli, em 1696, para o problema da braquistócrona, proposto por seu
irmão Johann Bernoulli, marcou o inı́cio das considerações variacionais. Contudo, somente com os
trabalhos de Euler e Lagrange é que surgiu a teoria sistemática conhecida hoje.
No princı́pio, esta teoria estava restrita apenas à busca de condições necessárias para que a
integral
Zb
Zb
¡
¢
£
¤
0
f x, y(x), y (x) dx = f y(x) dx
a
a
possuı́sse um extremo local no conjunto
D ⊆ {y ∈ C 1 [a, b] ; y(a) = a1
e y(b) = b1 },
em que a1 e b1 são valores dados, sendo este, portanto, um problema de extremos fixos. Entretanto,
já interessava a Jakob Bernoulli procurar um extremo num conjunto mais amplo, a saber
Db ⊆ {y ∈ C 1 [a, b] ; y(a) = a1 },
o qual descreve uma braquistócrona modificada, na qual se deseja saber o tempo mı́nimo de percurso
descendente a partir de um ponto fixo até uma barra vertical, porém sem especificar nenhum ponto
em particular nessa barra. Este é conhecido como o problema de um extremo livre.
Há, também, problemas com as duas extremidades livres, em subconjuntos arbitrários de
C 1 [a, b].
Um problema relacionado com o de extremos livres é o de unir curvas fixas, denominadas
transversais, no qual poderia ser necessário minimizar a integral de limites variáveis
Zx2
F (y, x1 , x2 ) =
0
¢
Zx2
f x, y(x), y (x) dx =
x1
no conjunto
¡
£
¤
f y(x) dx
x1
¡
¢
Dτ ⊆ {y ∈ C 1 [x1 , x2 ] ; τ xj , y(xj ) = 0 , j = 1, 2},
onde [x1 , x2 ] ⊆ R, e τj são funções dadas.
Todos esses problemas admitem uma formulação variacional comum: se y0 ∈ C 1 [a, b] é, digamos,
uma função minimizante local para um desses problemas, então, com uma seleção apropriada de
a1 , b1 e D, podemos supor que D ⊆ Db ou D ⊆ Dτ , de acordo com o problema. Em cada caso, y0 é
uma função minimizante local para F em D, o problema de extremos fixos considerado inicialmente.
Consequentemente, δF (y0 ; v) = 0, para toda direção v ∈ D0 = {v ∈ C 1 [a, b] ; v(a) = v(b) = 0}, tal
que δJ(y0 ; v) esteja definida.
Quando f é suficientemente diferenciável, há muitas dessas direções para inferir que, em (a, b),
y0 é uma solução da Primeira e da Segunda equações de Euler-Lagrange. Estas equações, cujas
soluções C 1 são, por definição, as funções estacionárias de f , serão tratadas nas Seções 4.1 e 4.3 a
seguir.
A liberdade adicional de trabalhar em Db ou em Dτ permite variações em outras direções
especificamente relacionadas à liberdade dos pontos extremos, e isto dá origem às correspondentes
condições naturais de fronteira que a função extremo deve satisfazer. Problemas envolvendo vı́culos
isoperimétricos serão considerados por meio do método dos Multiplicadores de Lagrange, e esta
formulação é extendida para solucionar problemas com vı́nculos de Lagrange de uma forma simples.
Neste capı́tulo, usaremos em C 1 [a, b] a norma do máximo
° °
¯
¯ ¯
¯
°y ° = max{¯y(x)¯ + ¯y 0 (x)¯ ; x ∈ [a, b]}.
M
30
Capı́tulo 4. Primeira Equação: Funções Estacionárias
4.1
Primeira Equação: Funções Estacionárias
Suponha inicialmente que a função f = f (x, y, z), juntamente com suas derivadas fy e fz , sejam
contı́nuas em [a, b] × R2 . Então, o funcional
Zb
F (y) =
¡
¢
f x, y(x), y (x) dx =
Zb
0
a
£
¤
f y(x) dx
a
está definido em Y = C 1 [a, b], e tem, em cada direção v ∈ Y, a variação de Gâteaux
Zb
δF (y; v) =
£
¤
£
¤
fy y(x) v(x) + fz y(x) v 0 (x) dx,
a
£
¤
£
¤
onde
a notação abreviada f y(x) = f (x, y(x), y 0 (x)), analogamente para fy y(x) e
£ usamos
¤
fz y(x) .
Para melhor compreender estas variações, usaremos os resultados abaixo.
Zb
Lema
4.1.
Se
h ∈ C[a, b]
h(x) v 0 (x) dx = 0
e
para
todo
v
pertencente
a
a
D0 = {v ∈ C 1 [a, b] ; v(a) = v(b) = 0}, então h é constante em [a, b].
¢
Rx¡
Demonstração.
Para uma constante dada c, tem-se que a função v(x) = a h(t) − c dt pertence a C 1 [a, b], com derivada v 0 (x) = h(x) − c em (a, b) e satisfaz à condição de que v(a) = 0.
¢
Rb¡
Além disso, v(x) pertence a D0 se v(b) = 0, para o que devemos ter a h(t) − c dt = 0, isto é,
Rb
1
c = b−a
h(t) dt, que é a média de h em [a, b]. Com esta escolha de v e c tem-se, por hipótese, que
a
Zb
Zb
Zb
¯b
¡
¢2
¡
¢ 0
0 6 h(x) − c dx = h(x) − c v (x) dx = h(x) v 0 (x) dx − c v(x)¯a = 0.
a
a
a
¡
¢2
Como o integrando é contı́nuo, concluı́mos que h(x) − c ≡ 0, isto é, h(x) = c em [a, b].
¥
Zb
Proposição
4.2.
Se
g, h ∈ C[a, b]
g(x) v(x) + h(x) v 0 (x) dx = 0
e
para
todo
a
v ∈ D0 = {v ∈ C 1 [a, b] ; v(a) = v(b) = 0} então h ∈ C 1 [a, b] e h0 = g.
Rx
Demonstração.
Seja a função G(x) = a g(t) dt para x ∈ [a, b]. Então G ∈ C 1 [a, b] e G0 = g.
Integrando por partes e usando a hipótese, obtém-se que, ∀ v ∈ D0 ,
Zb
Zb
¯b
¡
¢
0
¯
0 = g(x) v(x) + h(x) v (x) dx = G(x) v(x) a + h(x) − G(x) v 0 (x) dx
a
a
Zb
=
¡
¢
h(x) − G(x) v 0 (x) dx
a
e, pelo Lema 4.1 visto anteriormente, h − G = c é constante em [a, b].
h = G + c ∈ C 1 [a, b] e h0 = G0 = g.
Mas então
¥
31
Capı́tulo 4. Casos Especiais da Primeira Equação
Tomando h ≡ 0 na proposição acima, obtém-se o seguinte
Zb
Corolário
4.3.
Se
g ∈ C[a, b]
e
g(x) v(x) dx = 0
para
todo
v
pertencente
a
Proposição 4.4. Se y ∈ Y é tal£ que¤ δF (y; v) = 0, para todo v pertencente
D0 = {v ∈ Y ; v(a) = v(b) = 0}, então fz y(x) ∈ C 1 e, além disso, satisfaz a equação
a
a
D0 = {v ∈ C 1 [a, b] ; v(a) = v(b) = 0}, então g ≡ 0 em [a, b].
Destes resultados obtém-se a
¤
£
¤
d £
fz y(x) = fy y(x)
dx
¯b
£
¤
de onde segue que δF (y; v) = fz y(x) v(x)¯a ∀v ∈ Y.
(4.1)
x ∈ (a, b),
Demonstração.
Lembrando que a variação de Gâteaux de F é dada por
¤
£
¤ 0
Rb £
δF (y; v) =£ a f¤y y(x) v(x) + £fz y(x)
usando
a¤ Proposição 4.2 acima,
com
¤ v (x) dx,
£
g(x) = fy y(x) e h(x) = fz y(x) , obtem-se que fz y(x) ∈ C 1 e satisfaz à equação 4.1.
Substituindo esta equação na variação de Gâteaux de F , obtem-se
Zb
δF (y; v) =
a
´
¯b
¤
£
¤
d ³ £
fz y(x) v(x) dx = fz y(x) v(x)¯a
dx
∀v ∈ Y.
¥
Definição 4.5. A equação (4.1) acima é dita Primeira Equação de Euler-Lagrange de f , e as
soluções y ∈ C 1 dessa equação em algum intervalo são ditas Funções Estacionárias para f .
4.2
Casos Especiais da Primeira Equação
Apesar de toda função y em C 1 ser estacionária para f (x, y, z) = z ou f (x, y, z) = y z, geralmente
é difı́cil encontrar soluções para a Primeira Equação de Euler-Lagrange. Contudo, quando uma ou
mais variáveis não estão explı́citas, pode-se pelo menos obter uma primeira integral desta equação,
como indicado nos três casos que seguem.
4.2.1
Caso em que f = f (z)
£
¤
d
Neste
caso,
f
=
0,
e
a
Primeira
Equação
de
Euler-Lagrange
reduz-se
a
(
)f
y(x)
= 0, ou seja,
y
z
dx
£
¤
fz y(x) = constante. Assim, as funções estacionárias têm derivadas que estão sobre os conjuntos
de nı́veis de fz . Em particular, as funções lineares, para as quais y 0 = c, são funções estacionárias.
Exemplo. Na caracterização das geodésicas do cilindro circular reto
com raio unitário, chegaRθ p
se ao problema de minimizar o seguinte funcional L(y) = 0 2 1 + [y 0 (θ)]2 dθ no conjunto
D = {y ∈ C 1 [0, θ2 ] ; y(0) = y1 e y(θ2 ) = y2 }. Para esse funcional, tem-se
p
z
,
f = f (z) = 1 + z 2 e fz (z) = √
1 + z2
e portanto, uma condição necessária para que um dado y ∈ D minimize L em D é que y seja
y0
estacionário, isto é, p
= c, de forma que y 0 = constante. Neste caso, as únicas funções
1 + y0 2
estacionárias são as lineares y(θ) = c1 θ + c2 , que correspondem às hélices circulares do cilindro.
Capı́tulo 4. Casos Especiais da Primeira Equação
4.2.2
32
Caso em que f = f (x, z)
£
¤
Neste, fy (x, z) = 0 e a Primeira Equação de Euler-Lagrange reduz-se mais uma vez a fz y(x) =
constante.
Exemplo. Para a caracterização das geodésicas suaves em uma esfera de raio R, que podem ser
parametrizadas, em coordenadas esféricas, por funções θ = y(φ), devemos minimizar o funcional
Rφ p
L(y) = R 0 1 1 + [y 0 (φ) sen φ]2 dφ, no conjunto D1 = {y ∈ C 1 [0, φ1 ] ; y(φ1 ) = 0}.
p
2
Neste£ caso,
¤ f (φ, z) = R 1 + [z sen φ] , e portanto as funções estacionárias são aquelas para as
quais fz y(φ) = constante, isto é,
£
¤
R y 0 (φ) sen2 φ
fz y(φ) = p
= constante
1 + [y 0 (φ) sen φ]2
£
¤
Em particular, se φ = 0, esta expressão se anula, e portanto fz y(φ) = 0 para todo φ, o que implica
em y 0 (φ) = 0. Assim, as funções estacionárias no domı́nio D1 são aquelas que satisfazem y 0 (φ) = 0.
4.2.3
Caso em que f = f (y, z)
Para este caso, com as abreviações anteriores, segue da Regra da Cadeia que, se y ∈ C 2 , então
¤
¢
£
¤
£
¤
d ¡
d £
f y(x) =
f y(x), y 0 (x) = fy y(x) y 0 (x) + fz y(x) y 00 (x).
dx
dx
Com substituições e cancelamentos vemos que
¤
£
¤i
¤
£
¤
d h £
d £
f y(x) − y 0 (x) fz y(x) =
f y(x) − y 00 (x) fz y(x)
dx
dx
·
¸
¤
¤
£
¤
d £
d £
0
0
− y (x) fz y(x) = −y (x)
fz y(x) − fy y(x) ,
dx
dx
em que o lado esquerdo se anula para as funções estacionárias. Então, em cada intervalo de estacionariedade de y, tem-se
f [y(x)] − y 0 (x)fz [y(x)] = constante
Reciprocamente, se a equação acima vale em um intevalo em que y 0 não se anula, então y é estacionária.
Exemplo. Para a função f (y, z) = y 2 (1 − z)2 , onde a derivada£fz (y, z) = 2 ¤y 2 (z − 1), as funções
estacionárias y ∈ C 2 são as soluções da equação y 2 (1 − y 0 )2 − y 0 2 y 2 (y 0 − 1) = constante, a qual,
simplificada, resulta em
¡
2¢
(4.2)
y2 1 − y0 = c
Fazendo a substituição u = y 2 , de forma que u0 = 2 y y 0 , e substituindo em (4.2) obtem-se que u
2
satisfaz u0 = 4 (u − c), que possui a solução singular ũ0 ≡ c. Para u > c tem-se
√
¡√
¢0
1
2 u−c
u−c = √
u0 = ± √
= ±1
2 u−c
2 u−c
√
e integrando esta igualdade obtem-se u − c = x + c1 . Segue-se que a solução geral de (4.2) é dada
por
(4.3)
y 2 (x) = u = (x + c1 )2 + c
As constantes c e c1 podem ser encontradas de forma que y satisfaça as condições de fronteira. Por exemplo, as condições y(−1) = 0 e y(1) = 1 conduzem a c1 = 1/4 e c = −(3/4)2 .
33
Capı́tulo 4. Casos Especiais da Primeira Equação
p
Substituindo estas constantes em (4.3) obtem-se que y0 (x) = (x + 1) (x − 1/2),
√ que é de classe
C 2 apenas se x > 1/2 ou x < −1. Além disso, a solução singular y0 (x) ≡ c não satisfaz estas condições de fronteira. Por isto, para esta função, não existem funções estacionárias em
D = {y ∈ C 2 [−1, 1] ; y(−1) = 0 e y(1) = 1}.
Por
outro
lado,
y0
é
estacionária
para
a
função
f
no
conjunto
√
D1 = {y ∈ C1 [1, 2] ; y(1) = 1 e y(2) = 3/ 2}.
Exemplo. Para o problema da braquistócrona, formulado anteriormente, devemos minimizar o
funcional
Zx1 p
1 + y 0 (x)2
1
p
T (y) = √
dx
2g
y(x)
0
no conjunto
Zx1
D = {0 6 y ∈ Y ; y(0) = 0, y(x1 ) = y1
y(x)−1/2 dx < ∞}.
e
0
onde Y = C 1 [0, x1 ]. Neste caso, a menos de um fator constante,
√
1 + z2
z
f (y, z) = √
e
fz (y, z) = p
,
y
y(1 + z 2 )
e £ as funções
estacionárias,
de classe C 2 , que satisfazem, pelo caso anterior, a equação
¤
£
¤
0
f y(x) − y (x) fz y(x) = constante são as soluções de
p
³
´
1 + y0 2
y0
1
− y0 q
=q
= constante
√
y
2
y(1 + y 0 )
y(1 + y 0 2 )
2
Escolhendo a constante como c−1 , obtem-se y (1 + y 0 ) = c2 ou, equivalentemente,
r
y
(4.4)
y 0 = 1.
c2 − y
Para resolver essa equação,
introduzimos
a variável dependente
¡
¢
y = c2 sen2 (θ/2) = (c2 /2) 1 − cos(θ) ,para 0 6 θ 6 2π, obtendo
c2 − y = c2 cos2 (θ/2)
e
θ = θ(x)
tal
que
y 0 = c2 sen(θ/2) cos(θ/2) θ0 .
Substituindo estas expressões em (4.4), a equação correspondente na variável θ é dada por
¡
¢
c2 sen2 (θ/2) θ0 = 1,
ou ainda,
(c2 /2) 1 − cos(θ) θ0 = 1.
¡
¢
a qual, integrada, resulta em (c2 /2) θ − sen(θ) = x − c1 , para alguma constante c1 . Trocando c2 /2
por c2 , obtem-se as equações paramétricas
½
x = c2 (θ − senθ) + c1 ,
(4.5)
0 6 θ 6 θ1
y = c2 (1 − cos(θ)).
e vemos que as funções estacionárias são aquelas que determinam as curvas ciclóides. Para que
y ∈ D, necessitamos que y(0) = x(0) = 0, de onde segue que c1 = 0. As constantes c2 e θ1 < 2π
podem ser determinadas de forma que a ciclóide , além de passar pela origem, passe também pelo
ponto (x1 , y1 ).
Sobre a introdução da variável dependente θ = θ(x),
notamos que,
como
x0 (θ) = c2 (1 − cosθ) > 0 em (0, 2π), então a equação em x pode ser resolvida (implicita¡
¢
mente) por θ = θ(x) com tantas derivadas quantas forem necessárias. A composta y(x) = y θ(x) é
pelo menos C 2 em (0, 2π) e, com exceção do ponto inferior da cicóide, y 0 (x) 6= 0. Destas¡observações
¢
segue que esta função y(x) é estacionária para o problema. Entretanto, na origem, y 0 θ(0) = ∞,
e portanto esta função não está em D. Assim, apesar dos resultados obtidos, ainda não resolvemos
o problema dentro do contexto a que nos propusemos.
34
Capı́tulo 4. Segunda Equação de Euler-Lagrange
4.3
Segunda Equação de Euler-Lagrange
¡
¢
Suponha f ∈ C 1 [a, b] × R2 e que y ∈ C 1 [a, b] seja uma solução da Primeira Equação de EulerLagrange em [a, b], isto é,
£
¤
¤
d £
fz y(x) = fy y(x) .
dx
(4.6)
Usando esta equação e supondo, além disso, y ∈ C 2 , obtém-se que
£
£
£
¤
¤
¤
d
f [y(x)] = fx y(x) + fy y(x) y 0 (x) + fz y(x) y 00 (x)
dx
£
¤
£
¤i
d h 0
= fx y(x) +
y (x) fz y(x)
dx
Da igualdade acima segue que y satisfaz
¤
£
¤i
£
¤
d h £
f y(x) − y 0 (x) fz y(x) = fx y(x)
dx
que, integrada, resulta em
(4.7)
£
¤
£
¤
f y(x) − y 0 (x) fz y(x) =
Zx
£
¤
fx y(t) dt + c
a
para alguma constante c.
Esta última equação é chamada de Segunda Equação de Euler-Lagrange e, para obtê-la, foi
necessário supor y de classe C 2 , embora o termo y 00 não esteja explı́cito em (4.7). De fato, para o
¤
Rb £
funcional F (y) = a f y(x) dx definido em D = {y ∈ C 1 [a, b] ; y(a) = a1 e y(b) = b1 }, mostra-se
(ver página 154 de [1]) a seguinte
¡
¢
Proposição 4.6. Se f ∈ C 1 [a, b] × R2 e y0 ∈ D é um extremo local do funcional F em D então
y0 satisfaz a Segunda Equação de Euler-Lagrange
£
¤
£
¤
f y(x) − y 0 (x) fz y(x) =
Zx
£
¤
fx y(t) dt + c
a
em [a, b], para alguma constante c.
Em particular, se f = f (y, z), obtém-se o resultado do 3o caso considerado anteriormente (subseção 4.2.3, página 32), sem a hipótese adicional de que y seja de classe C 2 .
Exemplo.
Para
o
funcional
J,
que
D = {u ∈ C 1 [a, b] ; u(a) = a1 e u(b) = b1 }, onde
Zb ·
J(u) =
a
está
definido
no
conjunto
¸
1 0 2
u (t) − cos u(t) dt,
2
a função f é dada por f (x, y, z) = (1/2)z 2 − cos(y), e portanto fx ≡ 0, fy = sen(y) e fz = z. Logo,
de acordo com o resultado acima, um extremo local u de J em D satisfaz à equação
¡
¢
¡
¢
1
1 0 2
u (x) − cos u(x) − u0 (x)2 = − u0 (x)2 − cos u(x) = c,
2
2
2
que é uma forma integrada da conhecida equação do pêndulo.
£ 00 De fato,¡supondo
¢¤ u de classe C e
0
não constante, derivando essa equação obtém-se que −u (x) u (x) − sen u(x) = 0, de onde segue
que
¡
¢
u00 (x) − sen u(x) = 0,
que é a forma usual da equação que rege o movimento pendular.
35
Capı́tulo 4. Condições Naturais de Contorno
4.4
Condições Naturais de Contorno
No estudo dos pontos crı́ticos de uma função real J sobre D ⊂ Y, em que Y é¯ um espaço linear
normado, é natural considerarmos, para cada y ∈ D, as direções v ∈ Y nas quais J ¯D admite variação
em y, isto é, as direções v tais que y + εv ∈ D para todo ε suficientemente pequeno e δJ(y; v) existe.
Tais direções serão chamadas D-admissı́veis em y (para J).
Nosso objetivo agora é apresentar condições necessárias para minimizar o funcional
Zb
F (y) =
¡
¢
f x, y(x), y 0 (x) dx
a
restrito ao domı́nio Da = {y ∈ C 1 [a, b] ; y(b) = b1 }, no qual o valor de y no ponto a não está
especificado. Sabemos que, se y é um extremo local para F , então δF (y; v) = 0 para todo v Da –admissı́vel em y. Se f , fy e fz são funções contı́nuas em [a, b] × R2 , então todo
v ∈ D0a = {v ∈ C 1 [a, b] ; v(b) = 0} é Da –admissı́vel, e, da Proposição 4.4, segue que
¯b
£
¤
£
¤
0 = δF (y; v) = fz y(x) v(x)¯a = −fz y(a) v(a)
∀ v ∈ D0a .
Uma vez que v(x) = b − x é um elemento de D0a para o qual v(a) 6= 0, concluı́mos que, se y
é £um ponto
extremo para F em Da , então y deve satisfazer à condição natural de contorno
¤
fz y(a) = 0.£ Analogamente,
se y minimiza F em Db = {v ∈ C 1 [a, b] ; y(a) = a1 }, então y deve
¤
satisfazer fz y(b) = 0. Naturalmente, se y minimiza F em Y = C 1 [a, b], então as duas condições
acima são satisfeitas.
Podemos fazer uma aplicação interessante dos comentários anteriores ao problema da
braquistócrona com um dos extremos livre. Considere então o problema de minimizar o funcional
s
Zx1
1 + y 0 2 (x)
1
T (y) = √
dx.
y(x)
2g
0
¢−1/2
R x1 ¡
em D1 = {0 6 y ∈ C 1 [0, x1 ] ; y(0) = 0
e
y(x)
dx < ∞}. Conforme as observações
0
anteriores, um mı́nimo y de T deve satisfazer a condição natural de contorno , isto é,
£
¤
0 = fz y(x1 ) = q
y 0 (x1 )
£
¤.
y(x1 ) 1 + y 0 2 (x1 )
de onde segue que y 0 (x1 ) = 0, isto é, o gráfico de y deve interceptar a reta x = x1 ortogonalmente.
4.5
Multiplicadores de Lagrange
Como observado anteriormente, vı́culos nos pontos de fronteira não afetam a estacionariedade dos
¢
Rb ¡
possı́veis extremos para funcionais como F (y) = a f x, y(x), y 0 (x) dx, mas controlam as condições
de fronteira que os extremos devem satisfazer.
Entretanto, frequentemente, são encontrados vı́culos que operam sobre todo o intervalo [a, b].
Quando esses vı́nculos podem ser expressos na forma de uma integral, digamos, exigindo que
¢
Rb ¡
0
G(y) = a g x, y(x), y (x) dx assuma um valor prescrito, então o método dos Multiplicadores de
Lagrange pode ser empregado, como ilustra o resultado a seguir, onde usamos a notação acima e
cuja demonstração pode ser encontrada na página 161 de [1].
Teorema 4.7. Suponha que f = f (x, y, z) e g = g(x, y, z), juntamente com suas derivadas parciais
nas variáveis y e z, sejam contı́nuas em [a, b] × R2 . Seja y0 um extremo local para F (y) no domı́nio
D = {y ∈ C 1 [a, b] ; y(a) = a1 e y(b) = b1 }, restrito ainda ao vı́nculo
Gy0 = {y ∈ C 1 [a, b] ; G(y) = G(y0 )}.
36
Capı́tulo 4. Funções Estacionárias com Valores Vetoriais
Então,
se a variação de Gâteaux δG(y0 ; v) não se anula identicamente em
D0 = {v ∈ C 1 [a, b] ; v(a) = v(b) = 0}, existe λ ∈ R tal que y0 é estacionária para a função
modificada f˜ = f + λg, isto é, y0 é a solução da equação
¤
£
¤
d ˜£
fz y(x) = f˜y y(x)
dx
4.6
x ∈ (a, b).
Funções Estacionárias com Valores Vetoriais
Para examinar se uma curva, não necessariamente gráfico de uma função, pode representar matematicamente a braquistócrona, ou para procurar geodésicas sobre uma superfı́cie em geral, devemos
utilizar integrais dependentes de funções vetoriais. É também o caso para o Problema de Dido, que
agora estamos interessados em estudar do ponto de vista do Cálculo das Variações.
¡
¢d
Como
exemplo,
considere
o
espaço
linear
Y = C 1 [a, b] ,
de
elementos
0
0
0
0
Y
=
(y
,
y
,
.
.
.
,
y
),
tendo
derivadas
contı́nuas
Y
=
(y
,
y
,
.
.
.
,
y
)
com
norma
dada
por
1
2
d
1
2
° °
¯ ¯
¯
©¯
ª
¡d
¢
°Y ° = max ¯Y (x)¯ + ¯Y 0 (x)¯ ; x ∈ [a, b] . Neste caso, dados f ∈ C 1 [a, b] × R2d e A, B ∈ Rd , a
fim de caracterizar as funções Y0 ∈ Y que são extremos locais do funcional
Zb
F (Y ) =
¡
¢
f x, Y (x), Y 0 (x) dx =
a
Zb
£
¤
f Y (x) dx
a
¡
¢d
no domı́nio D = {Y ∈ C 1 [a, b] ; Y (a) = A e Y (b) = B}, devemos considerar as direções vetori¡
¢d
ais em D0 = {V ∈ C 1 [a, b] ; V (a) = V (b) = O}, de maneira inteiramente análoga ao caso já
considerado anteriormente. Além disso, devemos verificar se ε = 0 é ponto crı́tico das funções
reais ε 7→ F (Y0 + εV ) para V ∈ D0 e ε ∈ R suficientemente pequeno, isto é, se Y0 satisfaz
δF (Y0 ; V ) = 0 ∀V ∈ D0 .
Com a notação f (x, Y, Z) = f (x, y1 , . . . , yd , z1 , . . . , zd ), e usando a regra de Leibniz para diferenciação sob a integral, de forma inteiramente análoga à anterior obtém-se que
¯
∂
F (Y + εV )¯ε=0
∂ε
Zb
 £
¤
®  £
¤
®
=
fY Y (x) , V (x) + fZ Y (x) , V 0 (x) dx,
δF (Y ; V ) =
a
onde fY e fZ são as funções de valores vetoriais com componentes fyj e fzj , respectivamente,
j = 1, . . . , d. Com esta notação, tem-se o
¡
¢
¡
¢d
Teorema 4.8. Se f = f (x, Y, Z) ∈ C 1 [a, b] × D para um domı́nio D ⊂ R2d e Y0 ∈ Y = C 1 [a, b]
é um extremo local do funcional F (Y ) no domı́nio
¡
¢
D = {y ∈ Y ; Y (a) = Y0 (a), Y (b) = Y0 (b) e Y (x), Y 0 (x) ∈ D},
então Y0 satisfaz ao sistema de equações
(4.8)
£
¤
£
¤
d
fZ Y (x) = fY Y (x) em (a, b), isto é,
dx
£
¤
£
¤
d
fz Y (x) = fyj Y (x)
dx j
j = 1, 2, . . . , d
Demonstração. Para D = R2d , o resultado é uma generalização imediata dos argumentos apresentados na demonstração da Proposição 4.4. Aqueles argumentos também se aplicam ao caso que
estamos considerando se todas as direções V ∈ D0 = {V ∈ Y ; V (a) = V (b) = 0} são D-admissı́veis
em Y0 . Mas isto é verdade para todo domı́nio aberto D ⊂ R2d , devido à compacidade
¡ do intervalo¢
[a, b], e faremos apenas um esquema desse argumento: para cada x ∈ [a, b], o ponto Y0 (x), Y00 (x)
37
Capı́tulo 4. Aplicação 1: O Problema de Dido
é o centro de uma vizinhança esférica ⊆ D, de raio positivo maximal r(x) 6 1. Além disso, a continuidade de Y0 e Y00 em [a, b] garante que r ∈ C[a, b]; segue que r(x) assume um
mı́nimo
° valor
°
em algum x0 , isto é, r(x) > r(x0 ) = r0 > 0. Portanto, se ε < r0 e V ∈ D0 , com °V ° 6 1, então
Y0 + εV ∈ D, e concluı́mos que todas estas direções são D-admissı́veis em Y0 .
¥
Definição 4.9. A equação (4.8) é dita de Euler-Lagrange com valores vetoriais, e suas soluções de
classe C 1 são chamadas funções estacionárias para a função f .
Mostramos acima que, se δF (Y : V ) = 0 ∀ V ∈ D0 , então Y é estacionária para f em (a, b).
Reciprocamente, supondo Y estacionária para f em (a, b) e V ∈ D0 , de (4.8) segue que
Zb
δF (Y ; V ) =

£
¤
®  £
¤
®
fY Y (x) , V (x) + fZ Y (x) , V 0 (x) ] dx
a
Zb
=
a
¤
®
 £
¤
®¯¯b
d  £
fZ Y (x) , V (x) dx = fZ Y (x) , V (x) ¯ ≡ 0.
dx
a
Assim, Y é estacionária para f em no intervalo (a, b) se, e somente se, δF (Y : V ) = 0 ∀ V ∈ D0 .
Para considerar condições de fronteiras mais gerais (ou restrições da forma G(Y ) = constante),
podemos empregar o método dos Multiplicadores
de Lagrange. Em vista do Teorema 4.7, esperamos
¯
caracterizar cada extremo local Y0 de F ¯D , quando restrito a GY0 , por um λ ∈ R para o qual
δ(F + λG)(Y0 ; V ) = 0 ∀ V ∈ D0 .
Em particular, se a restrição da função G é definida por uma integral na forma G(Y ) =
Zb
¡
¢
g x, Y (x), Y 0 (x) dx, então Y0 é estacionária para a função modificada f + λg, e portanto satisfaz
a
a correspondente equação de Euler-Lagrange
£
¤
£
¤
d
(f + λg)Z Y (x) = (f + λg)Y Y (x) .
dx
Segundo ainda o Teorema 4.7, esses resultados são válidos desde que a variação de Gâteaux de G
exista para Y ∈ D e, no ponto estacionário Y0 , δG(Y0 , V ) não se anule identicamente para V ∈ D0 .
Estas observações serão usadas no estudo do Problema de Dido, a seguir.
4.7
Aplicação 1: O Problema de Dido
Segundo o problema isoperimétrico de Dido, apresentado no Capı́tulo 2 (página 13), devemos maximizar o funcional da área
Z1
A(Y ) =
£
¤
f Y (t) dt =
Z1
0
x(t) y 0 (t) dt
0
sujeito ao vı́nculo isoperimétrico
Z1
L(Y ) =
0
£
¤
g Y (t) dt =
Z1
¯ 0 ¯
¯Y (t)¯ dt = l
0
onde l é um número real fixo. Por conveniência, estamos agora usando “t”como variável independente, e não “x”, como anteriormente. Usamos ainda notações ligeiramente
diferentes da Seção
p
anterior, a saber: f = f (t, x, y, x0 , y 0 ) = x y 0 e g = g(t, x, y, x0 , y 0 ) = x0 2 + y 0 2 .
38
Capı́tulo 4. Aplicação 2: Geodésicas em Superfı́cies
¡
¢
As curvas Y (t) = x(t), y(t) consideradas são de classe C 1 em [0, 1] e fechadas, isto é,
Y (0) = Y (1), e, sem perda de generalidade, podemos supor que as curvas iniciem e terminem na
origem O. Assim, o domı́nio natural do funcional A é o conjunto D = {Y ∈ Y ; Y (0) = Y (1) = O}
¡
¢2
em que Y = C 1 [0, 1] . Já vimos que
Z1
x(t) v 0 (t) + y 0 (t) u(t) dt,
δA(Y ; V ) =
0
Z1
e não é dificil verificar que δL(Y ; V ) =
0
¯ 0¯
 Y 0 (t)
®
0
¯ ¯
¯
¯
¯Y 0 (t)¯ , V (t) dt, para as curvas que satisfazem Y 6= 0
em [0, 1]. Desta forma, como a função g não é de classe C 1 em vizinhança da origem, não podemos
aplicar o método dos Multiplicadores de Lagrange como enunciado anteriormente. Entretanto,
pode-se mostrar (conf. [1]) que o método pode ser aplicado se restrito ao domı́nio
¯
¯
D∗ = {Y ∈ D ; ¯Y 0 (t)¯ 6= 0
∀ t ∈ [0, 1]}.
Este domı́nio é de fato apropriado, uma vez que, se Y ∈ D∗ for tal¯ que
¯ δL(Y ; V ) = 0 ∀ V ∈ D0 ,
então, por um argumento análogo ao do Lema (4.1), obtem-se Y 0 /¯Y 0 ¯ = constante em [a, b]. Mas
isto, juntamente com a condição Y (0) = Y (1), implica Y ≡ 0 6∈ D∗ . Desta maneira, para Y ∈ D∗ ,
δL(Y ; V ) não se anula identicamente, e podemos aplicar o método dos Multiplicadores de Lagrange.
Assim, se Y0 maximiza o funcional A localmente no domı́nio D∗ , quando restrito ao vı́nculo
L(Y ) = l, então existe λ ∈ R tal que
¯ ¯δ(A + λL)(Y0 ; V ) = 0 ∀ V ∈ D0 e, portanto, Y0 é estacionário
para a função f + λg = x y 0 + λ¯Y 0 ¯, isto é, satisfaz as equações de Euler-Lagrange associadas:
Ã
Ã
!
!
λ y0
d λ x0
d
0
¯ ¯ =y
x + ¯¯ 0 ¯¯ = 0.
e
dt ¯Y 0 ¯
dt
Y
¯ ¯¢
¯ ¯¢
¡
¡
Segue-se que y − λx0 /¯Y 0 ¯ = c2 e x + λy 0 /¯Y 0 ¯ = c1 , para c1 e c2 constantes.
Assim,
c2 y 0 + c1 x0 = y y 0 + x x0 ou, após integrar e avaliar em t = 0,
x2 + y 2 − 2c1 x − 2c2 y = constante = 0.
Completando os quadrados na equação acima, isso resulta em (x − a)2 + (y − c)2 = c21 + c22 .
Percebe-se, assim, que a curva representada por Y0 está contida em um cı́rculo de raio r, com
r2 = c21 + c22 e, devido ao comprimento l, deve-se ter r = l/2π. Como a curva é fechada, o cı́rculo
tem que ser contornado ao menos uma vez, sendo que a maximização de A para um comprimento l
dado, requer que o cı́rculo seja contornado somente uma vez. Além disso, A não pode assumir um
mı́nimo em D∗ (ou em D).
Assim, obtivemos fortes evidências, mas ainda não demonstramos inteiramente, que o cı́rculo é
a curva que maximiza a área, afirmação também conhecida como Conjectura de Pappus.
4.8
Aplicação 2: Geodésicas em Superfı́cies
Para o estudo de geodésicas em superfı́cies, usaremos o Teorema a seguir a respeito dos vı́nculos de
Lagrange, cuja demonstração pode ser encontrada em [1].
¡
¢
Teorema 4.10. Sejam f e fzj ∈ C 1 [a, b] × R2d , j = 1, 2, . . . , d e suponha que Y0 é C 2 e mı́nimo
Zb
¡
¢
¡
¢d
local de F (Y ) = f x, Y (x), Y 0 (x) dx em D = {Y ∈ C 1 [a, b] ; Y (a) = Y0 (a) e Y (b) = Y0 (b)},
a
sujeito ainda ao vı́nculo
¡
¢
g Y (x) ≡ 0
∀ x ∈ [a, b],
Capı́tulo 4. Aplicação 2: Geodésicas em Superfı́cies
39
¡
¢
em que g = g(Y ) é uma função C 2 para a qual ∇g Y0 (x) 6= O ∀ x ∈ [a, b]. Então existe uma função
λ ∈ C[a, b] tal que Y0 é estacionária para a função modificada f + λg.
Em geral, o conjunto S = {Y ∈ R3 ; g(Y ) = O} descreve uma superfı́cie em R3 , que é regular
se ∇g(Y ) 6= O para todo Y ∈ S. Supondo g de classe C 2 , o teorema acima pode ser usado para
¯
¡
¢3
Rb¯
minimizar o funcional comprimento de arco L(Y ) = a ¯Y 0 (t)¯ dt sobre as curvas Y ∈ C 1 [a, b]
que estão em S e, além disso, ligue dois pontos fixos, digamos A, B ∈ S.
Assim, se Y0 , de classe C 2 , minimiza L sobre todas as curvas nestas condições, então, pelo
teorema, existe uma função λ ∈ C[a, b] para a qual Y0¯ é¯ estacionária para a função modificada f + λg, onde, no caso do funcional L, f (t, Y, Z) = ¯Z ¯. Segue-se que Y0 satisfaz à equação
£
¤i
£
¤
dh
de Euler-Lagrange vetorial
(f + λg)Z Y (t) = (f + λg)Y Y (t) , que, neste caso, se reduz a
dt
¤¢
£
¤
d¡ £
fZ Y (t) = (λgY ) Y (t) , uma vez que fY ≡ gZ ≡ 0. Calculando, obtém-se que a equação é
dt
!
Ã
¡
¢
d
Y0
¯ ¯ (t) = λ(t) ∇g Y (t) .
0
¯
¯
dt
Y
¯
¯
Ao longo de Y0 , podemos usar o comprimento de arco s como parâmetro.
Então ¯Y00 (s)¯ ≡ 1, e,
¡
¢
para um novo valor de λ, a equação acima se torna Y000 (s) = λ(s) ∇g Y0 (s) , o que mostra que, em
geral, a normal principal a uma geodésica sobre uma superfı́cie está na direção do vetor gradiente
(não-nulo) e, portanto, é normal à superfı́cie em cada ponto.
Observe que não estabelecemos a existência de geodésicas para superfı́cies em geral, mas obtivemos uma valiosa compreensão do modo como as geodésicas devem estar sobre a superfı́cie.
Bibliografia
[1] John L. Troutman — Variational Calculus and Optimal Control. Second Edition,
Springer-Verlag, New York, 1996. iv, 34, 35, 38
[2] Keti Tenenblat — Introdução a Geometria Diferencial. Editora UnB, Brası́lia, 1990.
11
[3] V. M. Tikhomirov — Stories about Maxima and Minima. Mathematical World - Volume
1, AMS, 1990.
[4] J. E. Marsden, A. J.Tromba — Vector Calculus. W.H. Freeman and Company, N.Y,
1996. 16
[5] E. L. LIMA — Topologia do Espaços Métricos. IMPA, Rio de Janeiro, 1977.
[6] E. L. LIMA — Curso de Análise Vol. 1. IMPA, Rio de Janeiro, 1977. 2
[7] E. L. LIMA — Curso de Análise Vol. 2. IMPA, Rio de Janeiro, 1977.
Índice Remissivo
2a equação de Euler-Lagrange
definição 34
Aristóteles, iv
bola de gude, 4
ciclóide, 33
Euler, 12, 29
estudo das geodésicas, 11
estudo das superfı́cies mı́nimas, 16
problema isoperimétrico, 13
Euler-Lagrange
1a equação, 31, 32, 34
1a equação — definição, 31
2a equação, 34
equação vetorial, 39
equação vetorial — definição, 37
funções estacionárias
definição, 31
Gauss, 11
integral de Riemann, 17
Jakob Bernoulli, 12, 13, 29
Johann Bernoulli, 11, 12, 29
Lagrange, 29
estudo das geodésicas, 11
Leibniz, 12, 36
multiplicadores de Lagrange, 29, 35, 37, 38
Newton, 12, 13
Pappus
conjectura de, 38
problema de área mı́nima, 17
problema de Dido, 13, 14, 16, 36, 37
problema de Plateau, 17
problema isoperimétrico de Euler, 13
solução de sabão, 17
vı́nculos de Lagrange, 29, 38
variação de Gâteaux
definição, 24