Instituto Superior de Economia e Gestão Universidade Técnica de Lisboa Equações Diferenciais & Equações às Diferenças João Nicolau Preparado para a cadeira de Equações Diferenciais (20 ano) da Licenciatura de Matemática Aplicada à Economia e Gestão (versão 2) 2003 Conteúdo I Equações Diferenciais 1 Definições e Resolução de Equações Diferenciais 1.1 Definições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Algumas Equações Diferenciais Univariadas de Primeira Ordem com Solução 6 9 9 Fechada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 1.3 1.4 1.2.1 Equação Linear (Primeira Ordem) . . . . . . . . . . . . . . . . . . . . . . 19 1.2.2 Equação Com Variáveis Separáveis . . . . . . . . . . . . . . . . . . . . . . 22 1.2.3 Equação Homogénea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 1.2.4 Equação Total Exacta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 1.2.5 Equação Redutível a Total Exacta . . . . . . . . . . . . . . . . . . . . . . 28 Equações Diferenciais Redutíveis a Equações Diferenciais de Primeira Ordem . . 31 1.3.1 Equações do Tipo x00 = f (t, x0 ) . . . . . . . . . . . . . . . . . . . . . . . . 31 1.3.2 Equações do Tipo x00 = f (x, x0 ) . . . . . . . . . . . . . . . . . . . . . . . . 32 Aplicação (Modelos Populacionais) . . . . . . . . . . . . . . . . . . . . . . . . . . 33 1.4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 1.4.2 Estimação dos Parâmetros . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 1.4.3 Comentários Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 2 Existência, Unicidade e Prolongamento das Soluções 2.1 43 Existência e Unicidade das Soluções . . . . . . . . . . . . . . . . . . . . . . . . . 43 2.1.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 2.1.2 Teorema de Existência e Unicidade das Soluções . . . . . . . . . . . . . . 44 2.2 Prolongamento das Soluções . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 2.3 Caso Multivariado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 3 Aproximações Numéricas 3.1 Método de Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 3.2 Outras Aproximações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 4 Sistemas de Equações Lineares 76 4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 4.2 Sistema de Equações Diferenciais Homogéneas . . . . . . . . . . . . . . . . . . . . 79 4.3 4.2.1 Primeiras Noções . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 4.2.2 Matriz Fundamental de Soluções . . . . . . . . . . . . . . . . . . . . . . . 83 4.2.3 Resolução do Sistema x0 = Ax . . . . . . . . . . . . . . . . . . . . . . . . 88 Sistema de Equações Diferenciais Não Homogéneas . . . . . . . . . . . . . . . . . 103 5 Estabilidade 111 5.1 Definições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 5.2 Estabilidade de Sistemas Lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 5.3 Estabilidade de Sistemas Não Lineares . . . . . . . . . . . . . . . . . . . . . . . . 123 5.4 II 65 5.3.1 Linearização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 5.3.2 Método Directo de Liapunov . . . . . . . . . . . . . . . . . . . . . . . . . 129 Métodos Gráficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 5.4.1 Equações Univariadas de Primeira ordem . . . . . . . . . . . . . . . . . . 134 5.4.2 Sistemas de Duas ED . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 Equações às Diferenças 6 Equações Lineares 161 166 6.1 Equação Linear Primeira Ordem Não homogénea com Coeficientes Variáveis . . . 166 6.2 Equação Linear de ordem n Não homogénea Com Coeficientes Constantes . . . . 168 6.2.1 Equação Homogénea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 6.2.2 Equação Não Homogénea . . . . . . . . . . . . . . . . . . . . . . . . . . . 174 6.3 Equações Linearizáveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 7 Sistemas de Equações Lineares Não Homogéneas Com Coeficientes Constante 7.1 7.2 185 Caso Homogéneo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 7.1.1 Caso Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188 7.1.2 Sistema de Duas Equações (n = 2) . . . . . . . . . . . . . . . . . . . . . . 192 Caso Não Homogéneo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200 8 Estabilidade 8.1 8.2 202 Pontos Fixos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202 8.1.1 Definições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202 8.1.2 Estabilidade de Sistemas Lineares . . . . . . . . . . . . . . . . . . . . . . 208 8.1.3 Estabilidade de Sistemas Não Lineares . . . . . . . . . . . . . . . . . . . 212 8.1.4 Bacia do Escoadouro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217 Pontos Periódicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225 8.2.1 Definições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225 8.2.2 Estabilidade dos Pontos Periódicos . . . . . . . . . . . . . . . . . . . . . . 231 8.3 Aplicação I (Problema de Afectação de Turmas) . . . . . . . . . . . . . . . . . . 234 8.4 Aplicação II (Método Newton-Raphson) . . . . . . . . . . . . . . . . . . . . . . . 238 Nota Introdutória Apresentamos neste documento um conjunto de apontamentos que servem de base à cadeira Equações Diferenciais do 2o ano da licenciatura de MAEG (Matemática Aplicada à Economia e Gestão/ISEG). Na exposição dos temas procurou-se um equilíbrio entre a abordagem quantitativa, baseada na resolução de equações diferenciais (e às diferenças) e a abordagem qualitativa das soluções, mais avançada, mas mais importante. O mundo é intrinsecamente não linear e complexo. Daí que, quando se analisa um fenómeno real através de equações diferenciais (ou equações às diferenças) não é geralmente possível obter expressões em "forma fechada"das soluções, i.e., expressões analíticas envolvendo funções simples e transcendentais que representem a solução de uma equação diferencial (ou de uma equação às diferenças). Nestes casos a abordagem quantitativa é completamente inútil. Outros casos existem onde a solução, embora conhecida, é demasiadamente complicada para ser analisada. Mais uma vez, o estudo qualitativo das soluções é preferível. A abordagem quantitativa tem, no entanto, a vantagem de ser mais pedagógica, sobretudo para quem inicia o estudo das equações diferenciais. Assim, apresentam-se alguns métodos de resolução de equações diferenciais mais importantes ou mais conhecidas, mas sempre que possível, simplifica-se ou abrevia-se a análise quantitativa. Por exemplo, não se apresenta a teoria das equações diferenciais lineares de ordem n de coeficientes constantes, dado que estas podem ser tratadas no âmbito dos sistemas lineares. Apenas a resolução de sistemas lineares é tratado com algum desenvolvimento, não só porque a teoria é suficientemente geral mas sobretudo porque vários resultados de sistemas lineares são usados no estudo (qualitativo) dos sistemas não lineares. Parte I Equações Diferenciais Suponha-se que se pretende estudar um fenómeno (económico, físico, biológico, etc.) ao longo do tempo. Designamos o fenómeno pela letra x e, como x depende de t (tempo), usaremos também a notação x (t). Na maioria dos casos, é possível estabelecer uma relação entre x0 , t e x. Por exemplo, seja x (t) uma população de uma certa espécie (humana, de bactérias, de predadores, etc.) no instante t e suponhamos, numa situação ideal, que x (t) varia continuamente. Seja r a diferença entre a taxa de natalidade e a taxa de mortalidade por unidade de tempo. A variação da população num certo intervalo de tempo ∆ > 0 pode ser traduzida pela igualdade (x (t + ∆) − x (t)) /x (t) = r∆ ou seja (x (t + ∆) − x (t)) /∆ = rx (t) . Com ∆ → 0 tem-se a equação diferencia (ED) x0 = rx. A partir desta relação é fácil (como veremos) obter a fórmula matemática que estabelece o nível da população em cada instante t, x (t) = x (0) ert , onde x (0) é o valor da população no momento ou instante zero. Quer dizer, se a dinâmica infinitesimal de x é bem traduzida pela ED x0 = rx então a população evolui de acordo com a fórmula x (t) = x (0) ert . Iremos designar esta fórmula por solução. Na maioria dos problemas mais complicados (leia-se não lineares) não é possível obter a ”fórmula” x (t) . Felizmente, a teoria das ED está suficientemente desenvolvida para que todas as questões relevantes possam ser respondidas sem se recorrer à expressão analítica da solução da ED. Questões ”relevantes” podem ser, por exemplo, qual o comportamento de longo prazo das soluções? Serão periódicas? Tenderão para algum valor? Como reagem a pequenas perturbações? O estudo destas questões constitui a abordagem qualitativa das equações diferenciais, em oposição à abordagem quantitativa baseada na resolução das equações diferenciais. Ao contrário do que sucede na área das ciências exactas, não é geralmente possível traduzirse um fenómeno económico ou financeiro ao longo do tempo através de uma relação exacta (por exemplo, não há nenhuma ED que ajuste de forma perfeita o PIB, um índice da bolsa, etc.). Embora se admita que as variáveis económicas e financeiras evoluem ao longo do tempo de acordo com certo padrão, há desvios constantes face ao padrão. Esses desvios devem-se ao acaso ou, eventualmente, a um conjunto de regras que o investigador não conhece. Um dos problemas maiores na modelação dos fenómenos económicos consiste exactamente na procura do padrão subjacente que governa o fenómeno. Retomando o exemplo atrás citado, considerámos como apropriado a ED x0 = rx para descrever a dinâmica infinitesimal de uma população genérica. Ora, para r > 0 tem-se lim x (t) = +∞ pelo que a ED não poderá traduzir a rigor a 7 dinâmica de uma população humana no longo prazo. Para esta ED haveria que levar em conta outros factores, como por exemplo, recursos disponíveis, imigração, emigração, etc. Os factores que individualmente fossem pouco significativos, poderiam ser englobados numa variável erro, susceptível de ser descrita em termos probabilísticos. Em econometria, seguem-se usualmente os seguintes passos na construção do modelo estatístico (modelo de regressão): 1) (a) estabelecer as principais relações a partir da teoria económica e (b) identificar as principais características do fenómeno em estudo; 2) especificar o modelo; 3) estimar o modelo (a partir dos dados disponíveis) e 4) avaliar os resultados obtidos. Estes passos são também válidos na especificação da ED [sobretudo os passos 1) e 2)]. A rigor os fenómenos económicos e sociais não são susceptíveis de serem descritos de forma determinística. Em modelos mais realistas em tempo contínuo, introduz-se explicitamente uma componente aleatória que reflecte tudo aquilo que a relação determinística não explica. Estes modelos são representados por equações diferenciais estocásticas (EDE). Na especificação destas equações, são inteiramente válidos os passos [1) a 4)] acima referidos. Embora as ED determinísticas não sejam apropriadas para modelarem fenómenos de natureza económica (pois como se disse, não contemplam a componente aleatória) são, no entanto, extremamente úteis no âmbito da teoria económica. Além disso, são um bom ponto de partida para o estudo das EDE, da estabilidade e do caos em sistemas dinâmicos. * Incompleto * 8 Capítulo 1 Definições e Resolução de Equações Diferenciais 1.1 Definições Seja t ∈ I ⊂ R onde I é aberto. Uma equação da forma ³ ´ F t, x (t) , x0 (t) , x00 (t) , ..., x(n) (t) = 0 (1.1) é designada por equação diferencial (ED) ordinária de ordem n. A equação (1.1) estabelece uma relação entre a função incógnita x (t), a variável independente t e as derivadas de x. Dado que (1.1) se apresenta numa forma implícita esta equação pode representar de facto uma colecção p de ED. Por exemplo, a ED (x0 (t))2 − x (t) − 1 = 0 conduz a duas equações, x0 (t) = x (t) + 1 e p x0 (t) = − x (t) + 1. Para evitar ambiguidades que a equação (1.1) pode levantar, vai admitirse que (1.1) é resolúvel em ordem a x(n) (t); nestas circunstâncias, a equação (1.1) escreve-se na forma ³ ´ x(n) (t) = f t, x (t) , x0 (t) , x00 (t) , ..., x(n−1) (t) (1.2) onde f é definida em I × Rn . A equação (1.2) pode-se escrever equivalentemente na forma ¡ ¢ x(n) = f t, x, x0 , x00 , ..., x(n−1) , estando implícita a dependência de x e das suas derivadas face a t. Um caso particular importante é quando n = 1 (ED de ordem um), i.e., x0 (t) = f (t, x (t)) 9 ou x0 = f (t, x) . Estudam-se também as chamadas ED parciais. Nestas equações, x depende de várias variáveis independentes (para além de t), e estabelece-se uma relação entre x, as variáveis independentes e as respectivas derivadas parciais de x (por exemplo, z −∂x (t, z) /∂t = z∂x (t, z) /∂z é uma ED parcial). As ED parciais não são objecto do presente texto. Doravante a designação ”ED” quer dizer equação ou equações diferenciais ordinárias. É importante distinguir ED lineares das ED não lineares. Diz-se que a ED (1.2) é linear ¢ ¡ se f t, x, x0 , x00 , ..., x(n−1) é linear em x, x0 , x00 , ..., x(n−1) e não linear no caso contrário. Na situação n = 1 (ordem um), a ED linear é do tipo x0 = a (t) x + b (t) (a (t) e b (t) podem ser funções não lineares). Exemplos de ED lineares de primeira ordem: x0 = tx+1, x0 = (sen t) x+t2 , √ etc. Exemplos de ED não lineares: x0 = x2 + t, x0 = tx + 1. Uma ED (ou um sistema de ED) do tipo x0 = f (x) (f não depende de t) designa-se por ED homogénea ou autónoma. Suponha-se que certo fenómeno x evolui de acordo com a função (a) x (t) = e3t . Como x0 (t) = 3e3t = 3x (t) podemos estabelecer (b) x0 = 3x. Nos problemas que iremos tratar a equação (a) a prior não é conhecida. Normalmente conhece-se a dinâmica infinitesimal dada por uma equação do tipo (b) e o objectivo consiste em obter uma função do tipo (a), designada por solução. Definição 1 (Solução) 1 Uma função x (t) é designada uma solução da ED x(n) = ¢ ¡ f t, x, x0 , x00 , ..., x(n−1) num intervalo I se (a) x(n) (t) existe em I; ¡ ¢ (b) x (t) satisfaz x(n) (t) = f t, x (t) , x0 (t) , x00 (t) , ..., x(n−1) (t) . Exemplo 1 A função x (t) = ce− sen t , c ∈ R, t ∈ R é solução da ED x0 = −x cos t em R (note-se f (t, x) = −x cos t). Com efeito, x0 (t) = ce− sen t (− cos t) = −x (t) cos t = f (t, x (t)) , 1 De igual forma, uma função x (t) é designada uma solução da ED F t, x, x0 , x00 , ..., x(n) = 0 num intervalo I se (a) x(n) (t) existe em I e (b) x (t) satisfaz F t, x (t) , x0 (t) , x00 (t) , ..., x(n) (t) = 0. 10 i.e., a solução satisfaz a ED; por outro lado, x0 (t) = ce− sen t (− cos t) existe em R. Exemplo 2 As funções x1 (t) = e−2t , x2 (t) = et para t ∈ R são soluções da ED de segunda ordem x00 = −x0 + 2x em R (note-se que f (t, x, x0 ) = −x0 + 2x). Por exemplo, em relação a x1 (t), tem-se x01 (t) = −2e−2t e x001 (t) = 4e−2t . Resulta 4e−2t = 2e−2t + 2e−2t [i.e., verificase a alínea b) da definição anterior, x001 (t) = −x01 (t) + 2x1 (t) = f (t, x (t) , x0 (t))]. O mesmo raciocínio se aplica a x2 (t). As soluções destes últimos exemplos foram escritas de forma explícita. Poderíamos também escrever a solução na forma implícita Φ (t, x, c) = 0. Por exemplo, Φ (t, x, c) = x (t)−ce− sen t = 0 é a solução implícita da ED x0 = −x cos t (ver exemplo 1). É sempre preferível apresentar a solução na forma explícita, por razões óbvias. No entanto, por vezes não se consegue ou não é ¯ ¯ fácil escrever a solução explicitamente. Por exemplo, log |t + 1| − x (t) + log ¯ex(t) + 1¯ + c = 0 é solução implícita da ED x0 = (ex + 1) / (t + 1) , t 6= −1 (ver exercícios) e não é possível explicitar x (t) . No exemplo 1 vimos que x (t) = ce− sen t , c ∈ R é solução da ED x0 = −x cos t. Como a constante c pode assumir qualquer valor em R, qualquer das seguintes expressões e− sen t , −50e− sen t , πe− sen t , 101000 e− sen t é uma solução da ED x0 = −x cos t. A definição seguinte esclarece a natureza destas soluções. Definição 2 (Solução Geral & Solução Particular) Uma solução de uma ED é designada por solução geral se inclui todas as soluções da ED. Uma solução particular é uma solução deduzida a partir da solução geral. Exemplo 3 Retomando o exemplo 1, pode-se estabelecer que x (t) = ce− sen t , c ∈ R é a solução geral da ED x0 = −x cos t e, expressões como, e− sen t , −50e− sen t , πe− sen t , 101000 e− sen t são soluções particulares, dado que são deduzidas a partir da solução geral. Na figura 1-1 apresentam-se três soluções particulares2 para t ∈ [0, 10] e, na figura 1-2, apresentam-se 64 soluções particulares, também no mesmo intervalo (a constante c assume agora 64 valores). Em geral não é fácil resolver-se uma ED, i.e., obter-se a sua solução. Considere-se, por exemplo, a ED x0 (t) = f (t, x (t)) ou dx (t) = f (t, x (t)) dt (note-se x0 (t) := dx (t) /dt)3 e 2 3 Quais são os valores que a constante c assume? a := b significa a é igual a b por definição. 11 Figura 1-1: Três Soluções Particulares da ED x0 = −x cos t x 8 6 4 2 2 4 6 8 10 t Figura 1-2: Sessenta e Quatro Soluções Particulares da ED x0 = −x cos t x 7.5 5 2.5 0 -2.5 -5 -7.5 2 4 6 12 8 10 t suponha-se que f é contínua nos seus argumentos. Integrando ambos os termos vem x (t) = R f (t, x (t)) dt + const. A dificuldade inicial não está na resolução do integral mas no seguinte facto: para se obter x (t) (lado esquerdo da equação) é necessário resolver-se o lado direito da equação; mas o lado direito depende de x (t) que é precisamente o que procuramos obter. Iremos estudar oportunamente técnicas para resolver certos tipos de ED. O tipo mais simples de ED de primeira ordem corresponde à ED x0 = f (t) . Integrando ambos os termos resulta que a solução geral é x (t) = Pt (f (t)) + c, onde Pt designa a primitiva de f (t). Por exemplo, a solução geral de x0 = t é x (t) = t2 /2 + c, c ∈ R. Qualquer que seja o valor atribuído a c, a função x (t) é sempre uma solução. Suponha-se que c = 1 então x (t) = t2 /2 + 1 é uma solução particular pois foi deduzida a partir da solução geral. É evidente que para cada valor da constante c definida na solução geral se obtém uma curva no plano (t, x) . A solução geral representa de facto uma família de curvas planas indexadas ao parâmetro c. A esta família dá-se o nome de família de curvas integrais (dependente de um parâmetro). Faremos no entanto a distinção entre a família de curvas integrais e solução geral (ver observação 3). ³ ´ √ Exemplo 4 Considere-se a ED não linear de primeira ordem x0 = −t + t2 + 4x /2 (*). Não existe a prior um método para resolver esta ED. No entanto, considere-se o artifício mu√ ¡ ¢ dança de variável y (t) = y = t2 + 4x. Esta equação expressa em x é x = y2 − t2 /4. Derivando esta equação em ordem a t, resulta x0 = (2yy 0 − 2t) /4 = (yy 0 − t) /2 (**). Logo igualando as equações (*) e (**) vem ¢ ¡ (−t + y) /2 = yy 0 − t /2 ¡ ¢ ou seja y 0 = 1 ou ainda y = t + c1 . Como x = y 2 − t2 /4 resulta x (t) = ´ ³ (t + c1 )2 − t2 4 1 1 = tc1 + c21 = tc + c2 2 4 (para simplificar fizemos c = c1 /2). Na figura 1-3 traçam-se algumas soluções particulares fazendo variar a constante c. 13 ³ ´ √ Figura 1-3: Soluções Particulares da ED x0 = −t + t2 + 4x /2 60 40 20 -10 -5 5 10 -20 Observação 1 (Envolventes de Curvas Integrais) A envolvente de uma família de curvas integrais Φ (t, x, c) = 0 (caso exista) é uma curva g (t, x) = 0 tal que a) em cada ponto da curva g (t, x) = 0 passa (sendo tangente) um elemento da família Φ (t, x, c) = 0 e b) g (t, x) = 0 é tangente a todas a todas as curvas integrais. Assim, g (t, x) = 0 é uma curva envolvente se existir uma função c (t, x) tal que a) g (t, x) = Φ (t, x, c (t, x)) = 0 e b) os declives de g (t, x) = 0 e Φ (t, x, c) = 0 são iguais em todos os pontos (t, x) . Mostra-se a seguir que a alínea b) traduz-se na condição Φ0c = 0. Suponha-se que Φ0x 6= 0 e Φ0t 6= 0. Então g (t, x) = 0 define implicitamente x como função de t através (digamos) de uma expressão do tipo x = φ (t) . O declive da tangente à curva g (t, x) = 0 é x0 = φ0 (t) e obtém-se a partir da equação Φ0t + Φ0x x0 + Φ0c Φ0 + Φ0c ∂c ∂c ∂c ∂t + Φ0c x0 = 0 ⇒ x0 = − t ∂c ∂t ∂x Φ0x + Φ0c ∂x (1.3) (pela fórmula de derivação da função implícita). Encarando Φ (t, x, c) = 0 como a família de curvas integrais (e não como a envolvente) então c é uma constante. Neste caso o declive da tangente à curva Φ (t, x, c) = 0 obtém-se a partir da equação Φ0t + Φ0x x0 = 0 ⇒ x0 = − 14 Φ0t Φ0x (1.4) ³ ´ √ Figura 1-4: Envolvente (traço grosso) e Curvas Particulares da ED x0 = −t + t2 + 4x /2 60 40 20 -10 -5 5 10 -20 Para que g (t, x) = 0 seja a curva envolvente é necessário que os declives (1.3) e (1.4) sejam iguais, pelo que deve-se exigir Φ0c = 0. Para exemplificar retome-se o exemplo 4. Determine-se a envolvente (caso exista) da família de curvas integrais Φ (t, x, c) = x − tc − c2 = 0. Considere-se Φ (t, x, c (t, x)) = 0 e determine-se uma função c (t, x) que satisfaça as condições expressas nas alíneas a) e b). Vem t Φ0c = 0 ⇒ −t − 2c = 0 ⇔ c = − . 2 Por outro lado, Φ (t, x, c (t, x)) = 0 ⇔ x − tc (t, x) − c2 (t, x) = 0. Com c = − 2t vem ¶ µ ¶ µ ¶2 µ t t t 1 =0⇔x−t − − − Φ (t, x, c (t, x)) = Φ t, x, − = 0 ⇒ x = − t2 . 2 2 2 4 Assim x (t) = − 14 t2 é a expressão (explícita) da curva envolvente da família de curvas integrais. Na figura 1-4 representa-se a envolvente (a traço grosso) assim como algumas curvas particulares. Observação 2 (Soluções Singulares) Designamos soluções singulares de uma ED às soluções da ED que não podem ser obtidas a partir da família de curvas integrais. Toda a curva envolvente que não pode ser obtida a partir da família de curvas integrais é naturalmente uma solução 15 singular. Com efeito, a curva envolvente é uma solução da ED pois em cada ponto da envolvente Φ (t, x, c (t, x)) = 0 as quantidades t, x e x0 são as mesmas para a envolvente e para a curva da família. Mas a envolvente pode ser ou não uma curva da família. Se não for é óbvio que também não pode ser deduzida a partir da família das curvas integrais e, neste caso, a envolvente é uma solução singular da ED. Resulta claro também que a existência de soluções singulares implica a violação da unicidade das soluções (este aspecto será discutido com mais detalhe no ponto 2.1). Para exemplificar retome-se o exemplo 4. Vimos na observação 1 que − 14 t2 é a ³ ´ √ envolvente da família de curvas integrais associadas à ED não linear x0 = −t + t2 + 4x /2. ³ ´ p Por isso φ (t) = − 14 t2 é também solução (de facto φ0 = −t + t2 + 4φ /2) e, como φ (t) não pode ser deduzida a partir da solução x (t) = tc + c2 resulta que φ (t) = − 14 t2 é uma solução singular. Observação 3 Iremos mostrar que uma ED linear tem apenas uma única solução geral. Por seu lado, uma ED não linear, como vimos na observação 2, pode ter uma solução "geral"e soluções singulares. Para evitar ambiguidades, reservamos o termo solução geral apenas para ED lineares. Assim, no caso de ED não lineares utilizaremos preferencialmente a designação família de curvas integrais (dependente de um parâmetro) para designar soluções do tipo x (t) = tc + c2 (ver observação anterior). Na generalidade dos problemas não estamos interessados na solução geral (ou na família de curvas integrais) mas apenas numa solução particular que satisfaz uma condição inicial. A determinação de uma solução particular corresponde a seleccionar uma particular função da família de curvas integrais. Exemplo 5 Suponha-se que no momento t = 0 dispomos de 1000 Euros para investir a uma taxa fixa de 5% ao ano capitalizável continuamente. Para determinarmos o valor do capital no momento t, x (t) (podemos convencionar: t = 1 representa um ano), começamos por formular o problema a partir de uma ED. Se o capital se valorizasse em tempo discreto, a variação do capital num certo intervalo de tempo ∆ > 0 poderia ser traduzida pela igualdade (x (t + ∆) − x (t)) /x (t) = r∆, onde r = 0.05, ou seja (x (t + ∆) − x (t)) /∆ = rx (t) . Como, por hipótese, o capital se valoriza continuamente tem-se, com ∆ → 0 a ED x0 = rx, ou x0 = 0.05x. Pode-se provar que a solução geral da ED é x (t) = ce0.05t , c ∈ R. Como 16 x (0) = 1000 (no momento t = 0 o capital é 1000 Euros) a constante c determina-se univocamente. Com efeito, x (0) = ce0.05×0 = c = 1000. Por exemplo, o valor do capital ao fim de 10 anos e 6 meses é x (10.5) = 1000e0.05×10.5 = 1690. 5 (Euros). Definição 3 (PVI) Uma ED x0 = f (t, x) equipada com uma condição do tipo x (t0 ) = x0 forma um problema de valor inicial (PVI). No exemplo 5 o PVI corresponde a x0 = 0.05x, x (0) = 1000. Definição 4 (Solução do PVI) Uma função real x (t) definida em I é designada por solução do PVI x0 = f (t, x) , x (t0 ) = x0 , t∈I se, (i) x0 (t) existe para t ∈ I; (ii) x0 (t) = f (t, x (t)) , t ∈ I e (iii) x (t0 ) = x0 , t0 ∈ I. Exemplo 6 A solução do PVI x0 = −x cos t, x (π) = 3 é x (t) = 3e− sen t . Com efeito, suponhase que já se conhece a solução geral x (t) = ce− sen t , c ∈ R, t ∈ R [ver exemplo 1]. Basta verificar que x (π) = 3 ⇔ ce− sen π = 3 ⇔ c = 3. Observação 4 Temos vindo a assumir que a ED é escalar (ou univariada). Os sistemas de ED de primeira ordem, x01 = f1 (t, x1 , x2 , ..., xn ) x02 = f2 (t, x1 , x2 , ..., xn ) .. . x0n = fn (t, x1 , x2 , ..., xn ) também se podem escrever na forma x0 = f (t, x) onde, obviamente, x = (x1 , x2 , ..., xn )T e f = (f1 , f2 , ..., fn )T é uma função definida em I × Rn . As principais definições apresentadas adaptam-se facilmente ao caso multivariado. Por exemplo, considere-se a definição 4. Uma 17 função x (t) = (x1 (t) , x2 (t) , ..., xn (t))T definida em I é designada por solução do PVI se as alíneas (i)-(iii) são válidas. Por exemplo, no caso (iii) x (t0 ) = x0 , t0 ∈ I a condição interpretase da seguinte forma: x (t0 ) = x0 ⇔ (x1 (t0 ) , x2 (t0 ) , ..., xn (t0 ))T = (x10 , x20 , ..., xn0 )T . Também os sistemas de ED de ordem superior a um podem ser escritos na forma x0 = f (t, x) mediante uma substituição apropriada das variáveis. Voltaremos a esta questão. Exemplo 7 Mostre-se que x (t) = é solução do PVI x1 x2 0 = x1 (t) x2 (t) x1 x2 −x2 em R (note-se que x0 = f (x) onde f (x) = f1 (x) f2 (x) , = e2−2e x1 (1) = 1−t 2e1−t x2 (1) f1 (x1 , x2 ) f2 (x1 , x2 ) = = 1 2 x1 x2 −x2 ). É imediato verificar-se (i), (ii) e (iii). Com efeito, 1−t x01 (t) = 2e1−t e2−2e = x1 (t) x2 (t) x02 (t) = −2e1−t = −x2 (t) e x (1) = x1 (1) x2 (1) = 18 1−1 e2−2e 2e1−1 = 1 2 . 1.2 Algumas Equações Diferenciais Univariadas de Primeira Ordem com Solução Fechada 1.2.1 Equação Linear (Primeira Ordem) A ED x0 = f (t, x) designa-se por equação linear de primeira ordem não autónoma (ou não homogénea) se f (t, x) = a (t) x + b (t). Tem-se, Teorema 1 Considere-se a ED x0 = a (t) x + b (t) onde a (t) e b (t) são funções contínuas em I. Então a solução geral em I é ξ(t) x (t) = e onde ξ (t) = R µZ −ξ(t) b (t) e ¶ dt + c , t∈I (1.5) a (t) dt. Dem. Em primeiro lugar note-se que as expressões ξ (t) e R b (t) e−ξ(t) dt estão bem definidas em I dado que a (t) e b (t) são funções contínuas nesse intervalo. Seja x (t) uma solução de x0 (t) = a (t) x (t) + b (t) . Multipliquemos ambos os termos desta equação por e−ξ(t) . Temos x0 (t) e−ξ(t) = a (t) x (t) e−ξ(t) + b (t) e−ξ(t) x0 (t) e−ξ(t) − a (t) x (t) e−ξ(t) = b (t) e−ξ(t) ³ ´0 x (t) e−ξ(t) = b (t) e−ξ(t) Z −ξ(t) x (t) e = b (t) e−ξ(t) dt + c µZ ¶ ξ(t) −ξ(t) x (t) = e b (t) e dt + c . Provámos que qualquer solução x (t) tem a forma (1.5). Reciprocamente, qualquer função da forma (1.5) é solução de x0 = a (t) x + b (t) . Com efeito, por derivação e considerando o teorema 19 fundamental do cálculo integral, dx (t) dt ¤¢ ¡ £R d eξ(t) b (t) e−ξ(t) dt + c = ¡R ¢ ¡ ξ(t) ¢ µZ dt ¶ b (t) e−ξ(t) dt + c d e −ξ(t) ξ(t) d b (t) e dt + c + e = dt dt µZ ¶ b (t) e−ξ(t) dt + c + eξ(t) b (t) e−ξ(t) = a (t) eξ(t) {z } | x(t) = a (t) x (t) + b (t) .¥ Observação 5 É fácil verificar que a solução do PVI x0 = a (t) x+b (t) , x (t0 ) = x0 com t0 ∈ I é ξ(t) x (t) = e µZ t −ξ(s) b (s) e t0 ¶ ds + c , c = x0 e−ξ(t0 ) . (1.6) Exemplo 8 Resolva-se o PVI x0 = (sen t) x + sen t, x (0) = 1. Como a (t) = sen t e b (t) = sen t são funções contínuas em R, a solução está definida em R. Considere-se em primeiro lugar, Z ξ (t) = Z Z b (t) e−ξ(t) dt = Z = (sen t) dt = − cos t, (sen t) e−ξ(t) dt (sen t) ecos t dt = −ecos t . A solução geral vem então, µZ ¶ b (t) e dt + c x (t) = e ¡ ¢ = e− cos t −ecos t + c ξ(t) −ξ(t) = −1 + e− cos t c Considerando agora x (0) = 1, tem-se x (0) = 1 ⇔ −1 + e− cos 0 c = 1 ⇔ c = 2e. 20 Figura 1-5: Curva x (t) = −1 + 2e1−cos t , t ∈ [0, 10] x 14 12 10 8 6 4 2 2 4 6 8 10 t Figura 1-6: Curva x (t) = −1 + 2e1−cos t , t ∈ [0, 200] x 14 12 10 8 6 4 2 50 100 150 200 t Assim, a solução do PVI é x (t) = −1 + 2e1−cos t , t ∈ R [poderíamos também ter considerado a equação (1.6)]. A representação gráfica de x (t) no intervalo t ∈ [0, 10] é dada na figura 1-5; a mesma representação mas no intervalo t ∈ [0, 200] é dada na figura 1-6. Observe-se que a solução é periódica. Exemplo 9 Considere-se a ED x0 = −x/t + 2, t > 0. A solução geral é x (t) = t + c/t, t > 0. O facto de x (t) não estar definido para t = 0 não causa surpresa pois a (t) = −1/t não é contínua no ponto t = 0. Com efeito, o teorema 1 só garante a existência de uma única solução de x0 = −x/t + 2 no intervalo onde a (t) = −1/t e b (t) = 2 são contínuas. É no entanto interessante observar que a ED com a condição inicial x (1) = 1 tem por solução particular 21 x (t) = t e esta solução está definida para t ∈ R. Conclusão: se a (t) e b (t) forem contínuas em I a solução de um PVI está necessariamente bem definida em I. Pode no entanto suceder que a solução exista para outros pontos não contidos em I. Mas, se a solução não está definida para certos valores de t é porque nesses mesmos pontos a (t) e/ou b (t) não são contínuas. 1.2.2 Equação Com Variáveis Separáveis A ED x0 = f (t, x) designa-se por equação com variáveis separáveis se f (t, x) = f1 (t) f2 (x) . Ou seja, nestas condições, f (t, x) pode decompor-se no produto de duas funções, uma dependendo apenas de t e a outra dependendo apenas de x. Suponha-se que f1 (t) e f2 (x) são contínuas em I1 e I2 , respectivamente, e f2 (x) 6= 0 em I2 . Tem-se x0 = f1 (t) f2 (x) ⇔ dx/dt = f1 (t) f2 (x) e, portanto, com f2 (x) 6= 0 em I2 , dx dx (t) = f1 (t) dt ou = f1 (t) dt f2 (x) f2 (x (t)) (1.7) Integrando ambos os termos da última equação com respeito a t, obtém-se a solução da ED em I1 Z t 1 dx (s) = f2 (x (s)) Z t f1 (s) ds + c onde c é uma constante arbitrária. A equação anterior pode-se escrever na forma Z ou ainda x(t) Z 1 dy = f2 (y) 1 dx = f2 (x) Z Z t f1 (s) ds + c, f1 (t) dt + c. Mostre-se que (1.8) é solução da ED. Definindo F (t) = Φ (t, x (t) , c) = Z x(t) 1 dy − f2 (y) 22 Z t f1 (s) ds − c = 0 (1.8) (1.9) vem, pela fórmula da derivação da função implícita, dF (t) /dt = ∂Φ (t, x, c) /∂t+∂Φ (t, x, c) /∂x dx/dt = 0 e pelo teorema fundamental do cálculo integral, −f1 (t) + 1 x0 = 0 f2 (x) isto é, x0 = f1 (t) f2 (x) . Resulta imediato que o PVI x0 = f1 (t) f2 (x) , x (t0 ) = x0 tem por solução4 Z x(t) x0 1 dy = f2 (y) Z t f1 (t) dt. (1.10) t0 Observação 6 Suponha-se que f2 (x) se anula no ponto a, i.e. f2 (a) = 0. Então x (t) ≡ a é também solução da equação pois a0 = 0 e f (t, a) = 0. Se a solução obtida em (1.8) [ou (1.9)] não contemplar como solução particular x (t) ≡ a então esta solução foi perdida no processo formal de separação de variáveis (note-se que a equação (1.7) apenas está definida para f2 (x) 6= 0). √ Exemplo 10 Considere-se x0 = t x. A função f (t, x) pode decompor-se no produto f1 (t) f2 (x) R R √ onde f1 (t) = t e f2 (x) = x, x ≥ 0. Aplicando a fórmula (1.9) vem √1x dx = tdt + c i.e. √ 1 4 t + 14 t2 c + 14 c2 . Observa-se que 2 x = 12 t2 + c . A solução na forma explícita é x (t) = 16 √ x (t) ≡ 0 é também solução pois f2 (0) = 0 = 0. R Exemplo 11 Considere-se o PVI x0 = x2 , x (0) = 1. Aplicando a fórmula (1.9) vem x12 dx = R dt + c ou seja − x1 = t + c ou ainda x (t) = −1/ (t + c) . Para determinar c faz-se x (0) = −1/ (0 + c) = 1 o que implica c = −1. A solução do PVI é portanto x (t) = 1/ (1 − t) para −∞ < t < 1. Observe-se que a solução ”explode” em tempo finito, i.e. limt↑1 x (t) = +∞. ED com soluções deste tipo, geralmente não servem para modelarem fenómenos naturais e económicos. Uma discussão mais ampla sobre esta problemática é apresentada no ponto 2.1. 1.2.3 Equação Homogénea A ED x0 = f (t, x) (com f contínua, como habitualmente) designa-se por equação homogénea se f (t, x) é uma função homogénea de grau zero (em relação a t e x). Recorda-se que f (t, x) é uma função homogénea de grau n em relação às variáveis t e x se se tiver para todo o 4 t t0 Com efeito, seja F a primitiva de 1/f2 . A solução (1.10) pode-se escrever na forma F (x (t)) = F (x0 ) + f1 (t) dt e é imediato que F (x (t0 )) = F (x0 ) . 23 λ, f (λt, λx) = λn f (t, x) . As funções homogéneas de grau zero possuem a particularidade de f (t, x) ser igual a f (1, x/t) (t 6= 0). Basta considerar n = 0 e λ = 1/t na expressão f (λt, λx) = λn f (t, x) . Assim, se f é homogénea de grau zero vem ³ x´ . f (t, x) = f 1, t (1.11) Sob a hipótese (1.11) a ED inicial pode-se escrever na forma x0 = f (1, x/t) . Considere-se a mudança de variável y = x/t. A partir das relações x = yt e x0 = y0 t + y obtemos uma nova ED y 0 t + y = f (1, y) que é uma ED com variáveis separáveis. Ponha-se y 0 t + y = f (1, y) na forma y0 1 = . f (1, y) − y t Depois de se integrar ambos os termos da equação vem ou ainda Z Z 1 dy = f (1, y) − y Z 1 dy = log |t| + c. f (1, y) − y 1 dt + c t (1.12) Esta equação fornece a solução da ED y 0 t + y = f (1, y) . Para obter a solução da ED original basta substituir na solução obtida em (1.12) y por x/t. ¡ ¢ Exemplo 12 Considere-se x0 = f (t, x) = x + 2te−x/t /t, t > 0. Verifique-se em primeiro lugar que f (t, x) é homogénea de grau zero: f (λt, λx) = x + 2te−x/t λx + 2 (λt) e−(λx)/(λt) = λ0 = f (t, x) . λt t Logo com λ = 1/t e y = x/t fica ³ x ´ x/t + 2 (t/t) e−(x/t)/1 f 1, = = y + 2e−y = f (1, y) . t 1 24 1 Figura 1-7: x (t) = (log (2 log t + 1)) t para t > e− 2 8 6 4 2 1 2 3 4 5 6 -2 -4 Aplicando a fórmula (1.12) resulta Z 1 dy = log t + c ⇔ y + 2e−y − y Z 1 dy = log |t| + c 2e−y e a solução na forma implícita é 1 y e = log t + c. 2 A solução da ED original na forma implícita é 1 x/t e = log t + c. 2 Resolvendo em ordem a x vem x (t) = (log (2 log t + 2c)) t com t tal que 2 log t + 2c > 0. Suponha-se agora que a condição inicial é x (1) = 0. Assim x (1) = (log (2 log 1 + 2c)) 1 = (log (2c)) = 0 ⇒ 2c = 1, i.e. c = 1/2. Assim a solução do PVI é x (t) = (log (2 log t + 1)) t ³ 1 ´ 1 para t > e− 2 . O intervalo e− 2 , +∞ designa-se por intervalo de existência da solução e, como veremos oportunamente, o intervalo é maximal. Na figura 1-7 representa-se a solução do PVI. 1.2.4 Equação Total Exacta Assuma-se que as funções M (t, x) e N (t, x) são contínuas num certo rectângulo R e têm derivadas parciais com respeito a t e x contínuas no mesmo rectângulo R. 25 Definição 5 A ED M (t, x) dt + N (t, x) dx = 0 designa-se por ED total exacta se existe uma função F : R ⊆ R2 → R tal que dF (t, x) = M (t, x) dt + N (t, x) dx. A solução na forma implícita é naturalmente F (t, x) = c. Colocam-se duas questões: primeiro, em que condições existe esta função F ?; segundo, como determinar F , ou seja, como determinar a solução? O teorema seguinte e a respectiva demonstração esclarecem estas questões. Teorema 2 Assuma-se que as funções M (t, x) e N (t, x) são contínuas num certo rectângulo R e têm derivadas parciais com respeito a t e x contínuas no mesmo rectângulo R. Então a condição ∂N (t, x) ∂M (t, x) = . ∂x ∂t (1.13) implica a existência de uma função F : R ⊆ R2 → R (designada primitiva da diferencial) tal que dF (t, x) = M (t, x) dt + N (t, x) dx, (t, x) ∈ R. (1.14) Reciprocamente, se existe F nas condições de (1.14) então verifica-se (1.13). Dem. Suponha-se que (1.14) é um diferencial total de F . Então dF (t, x) = Ft0 dt + Fx0 dx 00 = F 00 se F 00 e F 00 são funções e, como se sabe do cálculo diferencial, necessariamente Ftx xt tx xt 00 ≡ contínuas. Mas Ftx ∂M(t,x) ∂x 00 ≡ e Fxt ∂N(t,x) ∂t são funções contínuas, por hipótese. Logo (1.13) é uma condição necessária para que M (t, x) dt + N (t, x) dx = 0 seja um diferencial total. Falta mostrar o recíproco, i.e. que (1.13) é suficiente para que exista uma função F nas condições do teorema. Em particular dever-se-á ter Ft0 = M e Fx0 = N. Suponha-se válida a condição (1.13). Considere-se uma função F tal que Ft0 (t, x) = M (t, x) . Tem-se, integrando em ordem à variável t, F (t, x) = Z t M (u, x) du + φ (x) t1 onde t1 é a abcissa dum ponto arbitrário no domínio de existência da solução e φ (x) é uma função com derivada contínua em R (constante para a derivação em t). Observe-se que 26 ∂F (t, x) = ∂x Z t ∂M (u, x) du + φ0 (x) . ∂x t1 A derivada parcial Fx0 é igual a N se e só se ∂F (t, x) = N (t, x) ⇔ ∂x mas como ∂M ∂x = ∂N ∂t vem Rt t1 Z t t1 ∂M (u, x) du + φ0 (x) = N (t, x) ∂x ∂N(u,x) du + φ0 (x) ∂t = N (t, x) i.e. [N (u, x)]tt1 + φ0 (x) = N (t, x) ou ainda N (t, x) − N (t1 , x) + φ0 (x) = N (t, x) e, portanto, φ0 (x) = N (t1 , x) . Resulta φ (x) = Z x N (t1 , z) dz x1 (x1 é uma constante arbitrária). Consequentemente, F (t, x) = Z t M (u, x) du + φ (x) = t1 Z t M (u, x) du + t1 Z x N (t1 , z) dz (1.15) x1 Se tomarmos o diferencial desta última expressão juntamente com a equação (1.13) chega-se a (1.14)5 , isto é, provámos que sob a hipótese (1.13) existe uma função F , dada pela expressão (1.15), tal que o diferencial é dF (t, x) = M (t, x) dt + N (t, x) dx.¥ O teorema anterior e a respectiva demonstração permite estabelecer o seguinte: 1) a ED M (t, x) dt + N (t, x) dx = 0 é exacta sse a condição (1.13) se verifica; 2) a solução da ED é definida implicitamente por F (t, x) = c, c ∈ R i.e. Z t M (u, x) du + t1 Z x N (t1 , z) dz = c. (1.16) x1 ¢ ¡ Exemplo 13 Considere-se o PVI et + 2x dx + et xdt = 0, x (0) = 1. A ED não é de variáveis separáveis nem homogénea. No entanto, com N = et + 2x, M = et x tem-se ∂M ∂N = = et ∂x ∂t 5 t t1 Note-se que a derivada de t t1 M (u, x) du + t t1 x x1 N (t1 , z) dz em ordem a t é M (t, x) e em ordem a x é (∂M (u, x) /∂x) du + N (t1 , x) = (∂N (u, x) /∂t) du + N (t1 , x) = N (t, x) . Logo o diferencial da expressão (1.15) é efectivamente dF = M (t, x) dt + N (t, x) dx. 27 e, portanto, a ED é total exacta (i.e. a igualdade ∂M/∂x = ∂N/∂t garante a existência de uma função F nos termos da definição 5). Aplicando a fórmula (1.16), a solução (ou família de curvas integrais) na forma implícita é Z t u e xdu + t1 Z x¡ x1 ¢ et1 + 2z dz = c ⇔ et x − et1 x + et1 x + x2 − x1 et1 − x21 = c ou et x (t) + x (t)2 = c (note-se que x1 et1 e x21 são constantes arbitrárias; podemos fazer x1 = 0). Atendendo a x (0) = 1 ⇔ e0 + 1 = c a solução do PVI na forma implícita é et x (t) + x (t)2 = 2. 1.2.5 Equação Redutível a Total Exacta Considere-se a ED M (t, x) dt + N (t, x) dx = 0 onde M (t, x) e N (t, x) são contínuas num certo rectângulo R e têm derivadas parciais com respeito a t e x contínuas no mesmo rectângulo R. Vimos no ponto anterior que a condição (1.13) é necessária e suficiente para que a ED M (t, x) dt + N (t, x) dx = 0 seja uma ED total exacta. Suponha-se agora que ∂N (t, x) ∂M (t, x) 6= . ∂x ∂t Definição 6 Uma ED M (t, x) dt + N (t, x) dx = 0 diz-se redutível a uma ED total exacta se existir uma função não nula µ (t, x) tal que µ (t, x) M (t, x) dt + µ (t, x) N (t, x) dx = 0 (1.17) é uma ED total exacta. A função µ (t, x) designa-se factor integrante. A situação é, portanto, a seguinte: a ED M (t, x) dt + N (t, x) dx = 0 não é uma ED total exacta e não se sabe resolver; por outro lado (1.17) é uma ED total exacta e sabe-se resolver. De facto, com M̃ (t, x) = µ (t, x) M (t, x) e Ñ (t, x) = µ (t, x) N (t, x) a solução de (1.17) é, pela fórmula (1.16), Z t t1 M̃ (u, x) du + Z x Ñ (t1 , z) dz = c. (1.18) x1 Deixa-se como exercício mostrar que (1.18) é solução da ED (1.17). Impõem-se as seguintes questões: a) a solução de (1.17), i.e. (1.18), é também solução da ED inicial M (t, x) dt + 28 N (t, x) dx = 0? b) como determinar µ? A resposta a a) é positiva. Com efeito, seja x (t) a solução da ED (1.17) (considere-se Φ (t, x, c) = 0, no caso de não ser possível obter uma solução explícita). Logo x (t) satisfaz a ED µ (t, x) M (t, x) dt + µ (t, x) N (t, x) dx = 0 ou seja µ (t, x) (M (t, x) dt + N (t, x) dx) = 0. Como µ é uma função não nula, resulta que x (t) satisfaz também a ED M (t, x) dt + N (t, x) dx = 0 e, portanto, x (t) é solução da ED M (t, x) dt + N (t, x) dx = 0.6 Relativamente à alínea b) iremos mostrar como determinar µ nos casos em que µ depende apenas de t ou apenas de x (outros casos são possíveis - ver exercícios). Para que a ED (1.17) seja uma ED total exacta é necessário e suficiente que ∂ (µ (t, x) N (t, x)) ∂ (µ (t, x) M (t, x)) = , ∂x ∂t ou seja µ ∂M ∂µ ∂N ∂µ + M =µ + N. ∂x ∂x ∂t ∂t (1.19) A equação (1.19) é uma ED parcial com função desconhecida µ. A solução de (1.19) é, em geral, difícil de obter. No entanto, se µ = µ (t) (µ depende apenas de t) ou µ = µ (x) (depende apenas de x) então (1.19) é uma ED ordinária com solução conhecida. Formule-se a hipótese Ht : µ = µ (t). Nestas circunstâncias, a equação (1.19) pode escrever-se na forma µ ∂N dµ ∂M =µ + N ∂x ∂t dt ou ainda na forma 1 dµ = h1 (t) dt, µ h1 (t) = ∂M ∂x − N ∂N ∂t (1.20) A equação (1.20) é uma ED com variáveis separáveis (com função incógnita µ) com solução U µ=e h1 (t)dt . 6 No entanto, algumas soluções podem perder-se. Por exemplo, se o factor integrante for µ = 1/x, x 6= 0 e uma das soluções da ED M (t, x) dt + N (t, x) dx = 0 for x (t) ≡ 0, pode suceder que a solução da ED (1.17) não revele a solução x (t) ≡ 0. 29 No caso Hx : µ = µ (x) pode-se mostrar que U µ=e h2 (x)dx , h2 (x) = ∂N ∂t − ∂M ∂x . M Existem outras hipóteses simplificadoras. Por exemplo, µ = µ (xy) ou µ = (x + y) . Num exercício concreto, µ é desconhecido pelo que não se sabe de que forma µ depende de t e/ou x (ou mesmo se µ existe nas condições da definição 6). Nestas circunstâncias, podese seguir o seguinte procedimento quando se procura determinar µ: 1) formular a hipótese Ht : µ = µ (t) ; 2) calcular h1 ; 3) se h1 depender apenas de t, aceita-se a hipótese Ht e o factor ¢ ¡R integrante é µ = exp h1 (t) dt . A solução da ED é dada pela expressão (1.18). Se h1 depende de x rejeita-se Ht e passa-se ao passo 4): formular a hipótese Hx : µ = µ (x) ; 5) calcular h2 ; 6) se h2 depender apenas de x, aceita-se a hipótese Hx e o factor integrante é µ = exp (h2 (x) dx) . A solução da ED é dada pela expressão (1.18). Se h2 depende de t deve-se procurar outro método de resolução (ou, eventualmente, investigar outras hipóteses relativas a µ). ¡ ¢ Exemplo 14 Considere-se a ED x + tx2 dt − tdx = 0. Tem-se M = x + tx2 e N = −t. Como ∂M/∂x = 1 + 2tx 6= ∂N/∂t = −1 a ED não é total exacta. Analise-se a hipótese Ht : µ = µ (t) . Tem-se h1 = ∂M ∂x − N ∂N ∂t = 1 + 2tx − (−1) 1 + tx = −2 . −t t Como h1 depende explicitamente de t e x (devia depender apenas da variável t) a hipótese Ht não é válida. Investigue-se a hipótese Hx : µ = µ (x) . Tem-se h2 = ∂N ∂t − ∂M −1 − 1 − 2tx 2 −2 (1 + tx) ∂x = =− = 2 M x + tx x (1 + tx) x e a hipótese Hx é válida, pelo que o factor integrante é U µ=e h2 (x)dx U =e − x2 dx 30 = e−2 log x = 1 . x2 Assim, multiplicando a ED inicial por 1/x2 obtém-se a ED total exacta ¡ ¢ ¶ µ x + tx2 t 1 t + t dt − dx = 0 ou dt− 2 dx = 0, x2 x2 x x | {z } |{z} Ñ M̃ cuja solução é Z t M̃ (u, x) du + t1 ou ainda 2t+t2 x−2t1 −t21 x 2x Z x Ñ (t1 , z) dz = c i.e. x1 Z tµ t1 1 − t1 x−x xx1 = c. Com t1 = 0 vem ¶ ¶ Z xµ 1 t1 + u du + − 2 dz = c x z x1 2t+t2 x 2x = c ou seja (na forma explícita) x (t) = 2t . 2c−t2 1.3 Equações Diferenciais Redutíveis a Equações Diferenciais de Primeira Ordem Certas ED de ordem superior à primeira podem ser transformadas numa ED de primeira ordem através de uma mudança de variáveis. As ED lineares de ordem superior a um são abordadas no ponto 4.1. 1.3.1 Equações do Tipo x00 = f (t, x0 ) Trata-se de uma ED de segunda ordem que não depende explicitamente de x. Considerando a mudança de variável y (t) = x0 (t) tem-se y0 = f (t, y) que é uma ED de primeira ordem. Resolvendo a ED y 0 = f (t, y) obtém-se y (t) que, por integração dá x (t) . Exemplo 15 Considere-se a ED tx00 − x0 = t2 et que verifica as condições x (1) = −1 e x0 (1) = 0. Considerando a mudança de variável y = x0 vem ty0 − y = t2 et , i.e., 1 y0 = y + tet , t que é uma ED linear de primeira ordem. 31 y (1) = 0 Aplicando a fórmula (1.6) vem ξ (t) = Z a (t) dt = Z y (t) dt, Z 1 dt = log t t y (t) = eξ(t) µZ t ¶ s − log s = t se e ds + 0 1 ¶ µZ t s e ds = t ¡ t1 ¢ = t e −e . Assim x (t) = = Z x (1) = −1 ¢ ¡ t et − e dt 1 = tet − et − t2 e + c 2 e, portanto, x (1) = −1 ⇒ c = 12 e − 1. ¡ ¢ Observação 7 A ED x(n) = f t, x(n−1) sem x resolve-se de forma similar, considerando a mudança de variável y (t) = x(n−1) (t) . 1.3.2 Equações do Tipo x00 = f (x, x0 ) Trata-se de uma ED de segunda ordem que não depende explicitamente de t. Considerando a mudança de variável y (x) = x0 (t) tem-se x00 (t) = dy dx d (y (x (t))) = = y 0 (x) y (x) . dt dx dt Logo a ED x00 = f (x, x0 ) pode escrever-se na forma y0 (x) y (x) = f (x, y) 32 que é uma ED de primeira ordem (com variável independente x). Resolvendo esta ED obtém-se y (x). Dada a relação y (x) = x0 (t) , obtém-se x (t) resolvendo 1 dx = dt y (x) que é uma ED de variáveis separáveis. Exemplo 16 Resolva-se a ED x00 = 2x0 x. Com a mudança de variável y (x) = x0 (t) obtém-se y 0 y = 2yx, i.e. y 0 = 2x (ED com variável independente x) cuja solução é y = x2 + c1 . Para obter x (t) resolve-se agora a ED x2 1 dx = dt + c1 cuja solução, na forma implícita é ´ ³ arctg √xc1 = t + c2 . √ c1 1.4 1.4.1 Aplicação (Modelos Populacionais) Introdução Seja x (t) uma população de uma certa espécie (humana, de bactérias, de predadores, etc.) no instante t e suponhamos, numa situação ideal, que x (t) varia continuamente7 . Seja r (t, x) a diferença entre a taxa de natalidade e a taxa de mortalidade (por unidade de tempo) no momento t. A variação da população num certo intervalo de tempo ∆ > 0 pode ser traduzida pela igualdade (x (t + ∆) − x (t)) /x (t) = r (t, x (t)) ∆ ou seja (x (t + ∆) − x (t)) /∆ = r (t, x (t)) x (t) . Com ∆ → 0 tem-se a ED x0 = r (t, x) x. No caso r (t, x) = r (constante) a equação x0 = rx é conhecia como a equação de Malthus. Sabendo-se o valor da população x0 num dado momento t0 , é imediato concluir-se que a solução (do PVI) é x (t) = x0 er(t−t0 ) . Toda a espécie que satisfaça a lei de Malthus cresce exponencialmente no tempo. O modelo, apesar de atractivo (pela sua simplicidade) é pouco realista. Se tomarmos para r o valor 0.02 para dados 7 Na verdade x (t) varia discretamente com t pelo que x (t) não é uma função diferenciável (nem mesmo contínua) com respeito a t. No entanto, se o valor da população é alto a variação de uma unidade tem pouca expressão comparada com o valor da população. Nestas circunstâncias pode-se admitir, com um erro negligenciável, que x (t) é uma função contínua e mesmo diferenciável. 33 anuais (estimativa obtida a partir de dados da população dos EUA) qualquer previsão a longo prazo é desprovida de significado8 . Mesmo assim, o modelo de Malthus pode aproximar razoavelmente o crescimento de populações de dimensão reduzida (ver Braun, 1993). Todavia, quando o valor da população excede certo limiar os indivíduos passam a competir entre si pelos recursos disponíveis (espaço, recursos naturais e alimentação). Esta competição abranda ou trava o crescimento da população. Para contemplar este efeito é necessário definir na ED um termo (função) tal que, quando x é alto ou muito alto, x0 deve abrandar ou diminuir. Uma possibilidade consiste em adicionar o termo −bx2 (b > 0) na equação de Malthus, ficando x0 = r1 x − bx2 , r, b > 0. Esta equação, designada por equação logística, foi proposta pelo matemático e biologista Verhulst em 1837. Normalmente o parâmetro b é pequeno, comparado com o de r1 . Assim, quando o valor da população é baixo a quantidade −bx2 é negligenciável e a população evolui aproximadamente de acordo com a regra x0 = r1 x. À medida que x aumenta, o termo −bx2 passa a exercer um efeito de contracção no crescimento da população. A resolução da equação logística, embora fácil é trabalhosa. Trata-se de uma ED com variáveis separáveis, 1 dx = dt r1 x − bx2 cuja família de curvas integrais é Z Para primitivar a função 1 r1 x−bx2 1 dx = r1 x − bx2 Z dt + c. em ordem a x é necessário decompor a função em fracções simples. Deixa-se como exercício verificar que b 1 −1 1 1 = + r1 x − bx2 r1 bx − r1 r1 x 8 Por exemplo, se a população mundial crescer de acordo com o modelo x0 er(t−t0 ) , r = 0.02, no ano de 2515 a área disponível para cada habitante no planeta, incluindo mares, rios e lagos será inferior a um metro quadrado (ver Braun, 1993, pp. 26-27). 34 Figura 1-8: Cronograma da População dos EUA (em milhões de Hab.) 300 250 200 150 100 50 e Z µ b 1 1 −1 + r1 bx − r1 r1 x ¶ 2000 1990 1980 1970 1960 1950 1940 1930 1920 1910 1900 1890 1880 1870 1860 1850 1840 1830 1820 1810 1800 0 ¯ ¯ ¯ bx − r1 ¯ 1 ¯. dx = ... = − log ¯¯ r1 x ¯ A família de curvas integrais na forma explícita é x (t) = r1 , b − e−r1 t c1 (c1 é uma constante). Dada a condição inicial x (0) = x0 , a solução do PVI é x (t) = x0 r1 . bx0 + e−tr1 (r1 − bx0 ) Vai analisar-se a qualidade dos modelos x0 = rx e x0 = rx − bx2 com base nos dados da população dos EUA. Na figura 1-8 apresenta-se a evolução da população dos EUA desde 1800. Existe claramente uma tendência crescente, porém a ritmos decrescentes, como se pode observar na figura 1-9, onde se apresenta a variação relativa da população ao longo do tempo (log (x (t + ∆) /x (t)) ≈ (x (t + ∆) − x (t)) /x (t)). Se o modelo de Malthus fosse correcto a expressão r = log (x (t + ∆) /x (t)) /∆ deveria ser (aproximadamente) constante ao longo dos anos. 35 Figura 1-9: Variação Relativa da População (log (x (t + ∆) /x (t))) 0.34 0.29 0.24 0.19 0.14 1.4.2 2000 1990 1980 1970 1960 1950 1940 1930 1920 1910 1900 1890 1880 1870 1860 1850 1840 1830 1820 1810 0.09 Estimação dos Parâmetros Uma das fases mais importantes em qualquer estudo empírico consiste na estimação dos parâmetros dos modelos especificados. Esta tarefa apenas pode ser resolvida cabalmente no contexto de um modelo probabilístico, que exigiria, no nosso caso, acrescentar-se às ED um termo estocástico construído a partir dos chamados processos de Wiener (ou movimentos Brownianos). Como não pode entrar-se nessa área, vai apresentar-se um procedimento mecânico de estimação dos parâmetros9 . Convencione-se: t = 0 ⇔ ano 1800; t = 1 ⇔ ano 1810 e assim sucessivamente. Em qualquer dos modelos a condição inicial pode ser fixada como x (0) = 5.3. O modelo de Mathus vem então xM (t) = 5.3ert . A questão é estimar o parâmetro desconhecido r. Devemos escolher r de tal forma que a diferença entre os valores efectivamente observados x (t) e o modelo xM (t) seja mínima. Trata-se então 9 Poderá provar-se que os resultados que se obtêm por este método mecânico são idênticos aos que se alcançariam se se usasse o método de estimação dos Mínimos Quadrados Condicionados, o qual fornece estimadores consistentes em sentido probabilístico. 36 de um problema de minimização em ordem a r, i.e., x (1) x (2) min d r>0 ... x (n) xM (1) xM (2) , ... xM (n) onde d (a, b) representa uma distância entre os vectores a e b e n representa o número de observações disponíveis. Considerando o critério habitual (minimização das diferenças quadráticas10 ) P d (a, b) = (a − b)T (a − b) = t (at − bt )2 o problema de optimização é então min r>0 20 X t=1 (x (t) − xM (t))2 = min r>0 20 X ¡ ¢2 x (t) − 5.3ert . t=1 Qualquer programa de estatística (por ex., GAUSS, TSP, EXCEL11 ) resolve facilmente este problema de optimização. A solução é r̂ = 0.20712 (taxa de crescimento na unidade 10 anos note-se que t = 1 representa 10 anos; numa base anual a taxa de crescimento é de 0.020712)12 . Uma medida do erro associado ao modelo é 20 ³ ´2 X x (t) − 5.3er̂t = 908.9. t=1 Relativamente ao modelo logístico o problema de minimização é min r1 ,b>0 20 X t=1 20 µ X x (t) − (x (t) − xL (t)) = min 2 r1 ,b>0 t=1 5.3r1 −tr b5.3 + e 1 (r1 − b5.3) ¶2 10 O estimador dos mínimos quadrados do modelo de regressão clássico (para modelos discretos) baseia-se neste princípio, como se verá na cadeira de econometria. 11 Opção Solver em Tools (escolher Add-Ins caso a opção não esteja disponível). 12 Uma estimativa alternativa pode-se obter tendo em conta que log xM (t) = log 5.3 + rt. O problema de opti2 20 2 mização é agora minr>0 20 t=1 (log x (t) − log xM (t)) = minr>0 t=1 (log x (t) − log 5.3 − rt) . É fácil deduzir, aplicando a condição de primeira ordem do problema de optimização, que r̂ = 20 t=1 log xM − n log 5.3 = 0.23. 20 t=1 ti Esta estimativa não coincide com a anterior. A estimativa "correcta"dependeria do modelo probabilístico que se considerasse. Por exemplo, se o modelo fosse log xM (t) = log 5.3 + rt + e (t) sendo e (t) uma variável aleatória com "boas propriedades"então a estimativa "correcta"seria r̂ = 0.23. Se o modelo fosse xM (t) = 5.3ert + e (t) a estimativa "correcta"seria r̂ = 0.20712. 37 Figura 1-10: Ajustamento: Modelo de Malthus vs. Modelo Logístico 400 Pop. 350 Pop. Est (Malthus) 300 Pop. Est (Logis.) 250 200 150 100 50 2000 1990 1980 1970 1960 1950 1940 1930 1920 1910 1900 1890 1880 1870 1860 1850 1840 1830 1820 1810 1800 0 cuja solução é r̂1 = 0.2754 e b̂ = 0.000823. Os erros de ajustamentos são agora 2 5.3r̂ x (t) − ³1 ´ = 31.23. −tr̂ 1 r̂1 − b̂5.3 b̂5.3 + e t=1 20 X Observa-se com o modelo logístico uma redução muito forte dos erros de ajustamento. Também a figura 1-10, na qual se compara o valor observado x (t) com os valores estimados pelos dois modelos, corrobora essa ideia. Os modelos podem também servir para prever o valor futuro de x (t) . Por exemplo, a previsão do modelo de Malthus para o ano 2140 é xM (34) = 5.3er̂×34 = 6062 (milhões)13 . Na figura 1-11 mostram-se as previsões dos dois modelos até ao ano 2140. Enquanto o modelo logístico estabelece uma estabilização da população dos EUA em torno do valor 334 (milhões), o modelo de Malthus prevê valores arbitrariamente altos à medida que t → +∞. 13 Note-se que se convencionou que t = 0 corresponde ao ano 1800, t = 1 ao ano 1810 e assim sucessivamente. Procedendo assim t = 34 corresponde ao ano 2140. 38 Figura 1-11: Previsão: Modelo de Malthus vs. Modelo Logístico 500 Pop. 450 Pop. Est (Malthus) 400 Pop. Est (Logis.) 350 300 250 200 150 100 50 1.4.3 2130 2100 2070 2040 2010 1980 1950 1920 1890 1860 1830 1800 0 Comentários Finais Retomando o modelo logístico, é interessante verificar que x0 r1 −tr 1 (r t→+∞ bx0 + e 1 lim x (t) = lim t→+∞ − bx0 ) = r1 , b r1 , b > 0 Assim a população tende para o valor r1 /b quando t → +∞. Observe-se também que no ponto x = r1 /b a função f (t, x) = f (x) = r1 x − bx2 é nula pelo que, nesse ponto, a população não cresce nem decresce (digamos, está em equilíbrio). No capítulo Estabilidade designaremos o valor r1 /b como um ponto de equilíbrio assimptoticamente estável. No contexto do exemplo anterior, obteve-se r̂1 = 0.2754 e b̂ = 0.000823. Assim, a previsão de (muito) longo prazo para o valor da população é 0.2754/0.000823 = 334. 63 (milhões de indivíduos), valor que a figura 1-11 também confirma. 39 Exercícios 1. Classifique as ED (ordem, linearidade e autonomia) apresentadas nos restantes exercícios do Cap. 1. 2. Mostre que x (t) = cecos t , c ∈ R é solução da ED x0 = −x sen t = 0 em R. 3. Mostre que x (t) = c1 et + c2 tet + 2 + t, c1 , c2 ∈ R é solução da ED x00 − 2x0 + x = t em R. ¡ ¢ 4. Mostre que log (t + 1) − x (t) + log ex(t) + 1 + c = 0, c ∈ R é solução (implícita) da ED x0 = (ex + 1) / (t + 1) em t > −1. ¢ ¡ £ √ ¢ 5. Mostre que x (t) = 2t/ 3 − t2 é solução do PVI x0 = x/t + x2 , x (1) = 1 em I = 1, 3 . ¢ ¡√ ¢ ¡ 6. Mostre que x (t) = log t2 /2 − 2 é solução do PVI x0 = te−x , x 6 = 0 em I = ]2, +∞[ . 7. Obtenha a solução geral da ED x0 = −x/t + 2, t > 0. 8. Obtenha a solução geral da ED x0 − (n/t) x = et tn , n ∈ R, t > 0. ¡ ¢ 9. Resolva x2 1 + x02 = k 2 , obtenha as curvas envolventes à família de curvas integrais e mostre que estas curvas são soluções singulares. 0 10. Resolva o PVI t2 xx + 2t log x = 0, x (1) = e1 . 11. Resolva x0 + 1+x3 tx2 (1+t2 ) 12. Resolva o PVI x0 = x t = 0. ¡ ¢ 1 + log xt , x (1) = e. ¡ ¢ 13. Resolva x0 = tx/ t2 − x2 . 14. Resolva 2t x3 + x2 −3t2 0 x x4 = 0. 15. Resolva o PVI x0 = −x + g (t) , x (0) = 0 onde 2 0≤t≤1 g (t) = 0 t > 1. 16. Dada a ED x0 = a (t) x + b (t) com a e b contínuas e a e f tais que a (t) ≤ −k < 0 e limt→+∞ b (t) = 0, mostre que qualquer solução tende para zero quando t → +∞. 40 17. Mostre que uma ED com variáveis separáveis pode sempre se escrever como uma ED total exacta (suponha verificadas certas condições de regularidade). 18. Mostre que uma ED do tipo M (t, x) dt + N (t, x) dx = 0 onde M e N são funções homogéneas do mesmo grau é uma ED homogénea. 19. (Exame) Resolva o seguinte PVI ¡ ¢ ¡ ¢ t3 + 3x2 t + 5 dx + 3t2 x + x3 + 2 dt = 0, x (1) = 1. 20. Mostre que a ED (de Bernoulli) x0 +P (t) x = Q (t) xn , n 6= 1, n 6= 0, onde P (t) e Q (t) são funções contínuas pode-se transformar-se através de mudança de variável z (t) = x (t)1−n na ED linear z 0 + (1 − n) P (t) z = (1 − n) Q (t) . Como aplicação resolva x0 + tx = t3 x3 . 21. (Exame) Resolva o PVI x0 = x´ x³ 1 + log , x (1) = e. t t 22. Considere a ED M (t, x) dt+N (t, x) dx = 0 com M e N funções reais de classe C 1 definidas ª © em D = (t, x) ∈ R2 : t > 0, x > 0 . (a) Considere a hipótese de o factor integrante µ depender apenas do produto tx, i.e. µ = µ (tx) com µ definido em D e de classe C 1 . Fazendo a substituição z = tx, mostre que esta hipótese é válida se dado h3 = ∂N ∂t − ∂M ∂x tM − xN a função h3 depender apenas de z = tx. Conclua, nesse caso, que o factor integrante U é µ (z) = e h3 (z)dz . ¡ ¢ (b) Como aplicação resolva x2 t + 1/t + 1/x − t2 x x0 = 0. 23. (Exame) Considere a equação diferencial linear posta na forma dx + (a (t) x + b (t)) dt = 0 41 onde a e b são funções contínuas em R. (a) Mostre que esta equação é redutível a uma equação diferencial total exacta (para o efeito determine o factor integrante). (b) Encarando a equação linear como uma equação redutível a uma equação diferencial total exacta, obtenha a solução geral para o caso a (t) = b (t) = 2t e calcule limt→+∞ x (t) . 24. Resolva o PVI x00 = (x0 )2 /x, x0 (0) = 1, x (0) = −1. 25. Resolva a ED x00 = x0 t ³ ´ 0 1 + log xt . 26. (Exame) Considere o PVI x0 = −ax + g (t, x) , x (0) = x0 , a: constante positiva. (a) Mostre que −at x (t) = e −at x0 + e Z t eas g (s, x (s)) ds 0 é solução do PVI. (b) Admita as seguintes hipóteses: H1: |g (t, x)| ≤ b (t) |x| , R +∞ H2: t0 b (t) dt < +∞, b (t) ≥ 0 t0 ∈ R. Mostre que |x (t)| tende para zero quando t → +∞. Considere o seguinte lema: seja c uma constante não negativa e z (t) e v (s) funções não negativas. Se z (t) ≤ c + Z t z (s) v (s) ds 0 então Ut z (t) ≤ ce 42 0 v(s)ds . Capítulo 2 Existência, Unicidade e Prolongamento das Soluções 2.1 2.1.1 Existência e Unicidade das Soluções Introdução Um PVI pode não ter solução, ter uma única solução ou ter mais do que uma solução (por exemplo, uma infinidade delas). Exemplo 17 a) Se f é a função Dirichlet, 1 se t é racional f (t, x) = 0 se t é irracional não é naturalmente possível encontrar uma função x (t) que satisfaça x0 = f (t, x) . b) Considerese a ED x02 + x2 = 0. A única solução real é x (t) ≡ 0. Assim o PVI x02 + x2 = 0, x (0) = 1 √ não tem solução. c) O PVI x0 = x, x (0) = 0 tem mais do que uma solução: x (t) ≡ 0 e x (t) = t2 /4. d) O PVI x0 = ex , x (0) = 0 tem uma única solução x (t) = − log (1 − t) em t ∈ (−∞, 1) . e) O PVI x0 + x = 0, x (0) = 1 tem uma única solução, x (t) = e−t em R. Modelos sem soluções não têm obviamente interesse. Problemas de valores iniciais com várias soluções colocam o problema de se saber qual é a solução que efectivamente traduz o 43 comportamento do fenómeno. Modelos deste tipo geralmente estão mal especificados (i.e., a função f (t, x) não está bem definida). Estes problemas não ocorrem com ED lineares, as quais possuem, como vimos no teorema 1, uma única solução. Além disso, a solução é conhecida (i.e. é sempre possível obter uma solução fechada). Com as ED não lineares a situação é diferente. Se a solução é conhecida é possível discutir-se a questão da existência da solução directamente a partir da respectiva expressão analítica. Por exemplo, considere-se o PVI x0 = x2 , x (0) = 1. A solução deste PVI é x (t) = 1/ (1 − t) e claramente se verifica que a solução existe para −∞ < t < 11 . Mas, se for impossível obter uma solução fechada para o PVI x0 = f (t, x) , x (t0 ) = x0 como poderemos garantir que o PVI admite uma solução única? E será esta questão relevante? Afinal de contas, mesmo que a solução exista e seja única é impossível obtê-la. É importante verificar que, na prática, mesmo desconhecendo-se a solução, é possível, através de métodos numéricos (fazendose uso da função f (t, x)), obter-se aproximações tão precisas quanto se deseje. Por outro lado, as propriedades limites (assimptóticas) da solução podem também ser estudadas apenas a partir da função f (t, x) e sem o conhecimento da solução fechada. No entanto, a aplicação de métodos numéricos e o estudo das propriedades limites da solução só fazem sentido no caso em que a solução existe e é única. Assim, é fundamental estudarmos a questão da existência e unicidade das soluções. 2.1.2 Teorema de Existência e Unicidade das Soluções O caso linear x0 = a (t) x + b (t), onde a (t) e b (t) são funções contínuas em I, foi abordado no teorema 1 e observação 5. Vimos que a solução do PVI x0 = a (t) x + b (t) , x (t0 ) = x0 existe e é única em I. O caso não linear é tratado a seguir (até ao final do corrente ponto). A demonstração do teorema de existência e unicidade para o PVI x0 = f (t, x) , x (t0 ) = x0 (2.1) 1 É incorrecto dizer-se que a solução existe para t 6= 1, embora a função 1/ (1 − t) esteja definida para t 6= 1. De facto, a solução passa no ponto (t, x) = (0, 1) e ”explode” ou "extingue-se"quando t ↑ 1. Não se admite, portanto, que a solução possa continuar para valores de t tais que t > 1. 44 consiste em mostrar que, sob as condições do teorema, que iremos especificar, existe uma sequência de funções {xn (t) , n ≥ 1} construídas a partir do PVI tal que, a) xn (t) converge para x (t), b) x (t) é a solução do PVI, c) x (t) é uma função contínua e d) x (t) é solução única. Para demonstrarmos o teorema de existência e unicidade é necessário estabelecer alguns resultados preliminares. Considere-se o conjunto compacto Ra,b = {(t, x) : |t − t0 | ≤ a, |x − x0 | ≤ b} . (2.2) Lema 1 Se a função f (t, x) é contínua em Ra,b então o PVI (2.1) é equivalente à equação integral x (t) = x0 + Z t f (s, x (s)) ds (2.3) t0 para t tal que |t − t0 | ≤ a. Dem. Devido à continuidade de f em Ra,b tem-se o seguinte. Se x (t) é uma solução de (2.1) então integrando (2.1) no intervalo [t0 , t] obtemos (2.3). Reciprocamente, derivando (2.3) obtém-se x0 = f (t, x (t)). Além disso, considerando t = t0 na expressão (2.3) obtém-se x (t0 ) = x0 + 0 = x0 .¥ Nas condições do lema anterior uma equação integral é uma forma de escrever uma ED e vice-versa, i.e. as duas representações são equivalentes. Definição 7 (Condição de Lipschitz) Diz-se que a função f (t, x) satisfaz a condição de Lipschitz com respeito a x no conjunto Ra,b se existe um K > 0 tal que para todo o (t, x) , (t, y) ∈ Ra,b se tem |f (t, x) − f (t, y)| ≤ K |x − y| . (2.4) (K designa-se por constante de Lipschitz). A condição de Lipschitz (com respeito a x) pode ser entendida como uma condição forte de continuidade (com respeito a x). Com efeito, veja-se, por exemplo em Agudo (1989), a seguinte relação: f satisfaz a condição Lipschitz em Ra,b ⇒ f é uniformemente é contínua2 em Ra,b ⇒ 2 Diz-se que g : D ⊂ R → R é uniformemente contínua em S ⊆ D se, para cada δ > 0 existe ε > 0 tal que 45 f é contínua em Ra,b . É imediato verificar que Observação 8 a) Se ∂f/∂x é contínua Ra,b então f satisfaz a condição de Lipschitz com respeito a x no mesmo conjunto. Com efeito, pelo teorema do valor médio, f (t, x) = f (t, y) + e, portanto, ∂f (t, ξ) (x − y) , ∂x ξ = θx + (1 − θ) y, 0 ≤ θ ≤ 1 ¯ ¯ ¯ ¯ ¯ ¯ ∂f (t, ξ) ¯ ¯ ∂f (t, ξ) ¯ ¯ ¯ |x − y| . ¯ (x − y)¯ = ¯ |f (t, x) − f (t, y)| = ¯ ∂x ∂x ¯ Ora, como ∂f /∂x é contínua no conjunto compacto Ra,b (logo limitada) segue-se que existe um K < +∞ tal que |∂f (t, x) /∂x| ≤ K para (t, x) ∈ Ra,b . Logo |f (t, x) − f (t, y)| ≤ K |x − y| . Se o conjunto de referência é R2 então é necessário exigir que ∂f/∂x seja contínua e limitada (só assim se garante a existência de um K < +∞ tal que |∂f (t, x) /∂x| ≤ K). b) O recíproco de a) não é verdade. Isto é, existem certas funções que satisfazem a condição de Lipschitz em certo conjunto mas não possuem derivadas contínuas com respeito a x nesse mesmo conjunto. Por exemplo, f (t, x) = |x| satisfaz a condição de Lipschitz num intervalo que contenha o ponto 0, pois |f (t, x) − f (t, y)| = ||x| − |y|| ≤ |x − y| mas ∂f (x) /∂x não existe no ponto 0. Exemplo 18 a) A função f (t, x) = f (x) = √ x definida em S = [0, c] , c > 0 (embora uniformemente contínua em S) não satisfaz a condição de Lipschitz em S. Com efeito, tomando √ y = 0 na equação (2.4), vem: ∀K > 0 ∃x0 ∈ ]0, ε] , ε > 0 : 0 < x < x0 ⇒ x > Kx. b) A |g (x) − g (y)| < δ sempre que |x − y| < ε (x, y ∈ S). Analiticamente: ∀δ > 0, ∃ ε > 0 : ∀x, y ∈ S, |x − y| < ε ⇒ |g (x) − g (y)| < δ. Por outro lado, g não é uniformemente contínua em S se ∃ δ > 0, ∀ ε > 0 : ∃x, y ∈ S, |x − y| < ε ⇒ |g (x) − g (y)| > δ. 46 função f (t, x) = 1/x definida em S = ]0, 1] , não satisfaz a condição de Lipschitz em S. Basta mostrar que f (t, x) = 1/x não é uniformemente contínua em S.3 Com efeito, seja x = ε/2 e y = ε (logo |x − y| < ε). Vem |1/x − 1/y| = |2/ε − 1/ε| = 1/ε. Para todos os valores de x, y < 1, i.e. ε < 1, tem-se |x − y| < ε ⇒ |f (x) − f (y)| > 1.4 c) A função f (t, x) = t2 e−x satisfaz a condição de Lipschitz no rectângulo R = {(t, x) : |t| ≤ 1, |x| ≤ 1} . Basta considerar a observação 8. Com efeito, ∂f /∂x = −t2 e−x é contínua em R. Definição 8 (Iterações de Picard) As aproximações sucessivas ou iterações de Picard para o PVI x0 = f (t, x) , x (t0 ) = x0 definem-se como a sucessão de funções {xn (t) , n ≥ 0} onde x0 (t) = x0 x1 (t) = x0 + Z t f (s, x0 (s)) ds t0 ... xn (t) = x0 + Z t f (s, xn−1 (s)) ds t0 para n = 0, 1, .... Exemplo 19 Calcular as iterações de Picard para o PVI x0 = x, x (0) = 1. Tem-se, com f (t, x) = x, x0 (t) = 1 Z Z t t f (s, x0 (s)) ds = 1 + 1ds = 1 + t x1 (t) = 1 + 0 0 Z t Z t t2 f (s, x1 (s)) ds = 1 + (1 + s) ds = 1 + t + x2 (t) = 1 + 2 0 0 3 Dada a relação, (a) f satisfaz a condição Lipschitz em Ra,b ⇒ (b) f é uniformemente é contínua em Ra,b , conclui-se que (b) é uma condição necessária para que (a) se realize. 4 Uma forma mais simples de negar a condição de Lipschitz consiste em mostrar que, para certo valor de y, y0 ∈ S, a função em x, |f (x) − f (y0 )| / |x − y0 | não é limitada quando x varia num certo subconjunto de S. No exemplo em análise é fácil verificar que, para y = 1, a expressão |1/x − 1| / |x − 1| √= 1/ |x| não é limitada quando x varia no intervalo ]0, 1] . Este raciocínio pode também servir para mostrar que x definida em S = [0, c] , c > 0 √ não satisfaz a condição de Lipschitz em S. Com efeito, tomando y = 0 observa-se que | x − 0| / |x − 0| = 1/ |x| não é limitada em S. 47 e, em geral, xn (t) = 1 + Z t f (s, xn−1 (s)) ds = 1 + 0 = 1+t+ Z tµ 1 + s + ... + 0 t2 tn + ... + . 2! n! sn−1 (n − 1)! ¶ ds Conclui-se xn (t) → et i.e. xn (t) converge para a solução x (t) = et do PVI. Considere-se M = max(t,x)∈Ra,b |f (t, x)|, h = min (a, b/M ) , J = {t : |t − t0 | ≤ h} e Rh,b = {(t, x) : |t − t0 | ≤ h, |x − x0 | ≤ b} . Lema 2 Assuma-se f contínua no rectângulo Rh,b . Então: a) as iterações de Picard {xn (t) , n ≥ 1} existem e são contínuas para t ∈ J; b) (t, xn (t)) ∈ Rh,b para t ∈ J. Dem. a) Para x0 (t) = x0 é óbvio que x0 (t) existe e é contínua para t tal que |t − t0 | ≤ h. Naturalmente, f (t, x0 (t)) é contínua pois a composição de funções contínuas é ainda uma função contínua. Pelo teorema fundamental do cálculo integral, resulta que x1 (t) é contínua. Por indução facilmente se conclui que todos os elementos da sucessão {xn (t) , n ≥ 1} são funções contínuas. b) Temos de provar que |xn (t) − x0 | ≤ b para t tal que |t − t0 | ≤ h. Em primeiro lugar verifique-se o seguinte. Como f é contínua no conjunto compacto Rh,b então existe um M > 0 tal que |f (t, x)| ≤ M para (t, x) ∈ Rh,b . Assim, dado que (t, x0 (t)) ∈ Rh,b podemos escrever, ¯Z t ¯ Z t ¯ ¯ ¯ |x1 (t) − x0 | = ¯ f (s, x0 (s)) ds¯¯ ≤ |f (s, x0 (s))| ds t0 t0 Z t ≤ M ds = M |t − t0 | ≤ M h ≤ b. t0 O resto da demonstração resulta por indução. Assuma-se para t ∈ J que |xk (t) − x0 | ≤ b, k = 1, 2, ..., n − 1. 48 Figura 2-1: Iterações de Picard x0 + b x − x0 = − M (t − t0 ) B x − x0 = M (t − t0 ) C x (t0 , x0 ) P xn (t ) x0 − b D A t0 − a t t0 − h t0 + h t0 + a Isto implica (t, xn−1 (t)) ∈ Rh,b e, portanto, |f (t, xn−1 (t))| ≤ M. Logo |xn (t) − x0 | ≤ M |t − t0 | ≤ M h ≤ b i.e., (t, xn (t)) ∈ Rh,b .¥ Observação 9 Se t permitíssemos que t variasse no conjunto {t : |t − t0 | ≤ a} então teríamos |x1 (t) − x0 | ≤ M a, com M a eventualmente superior a b. Não poderíamos assim garantir |f (t, x1 (t))| ≤ M (pois f estaria a ser avaliada num ponto (t, x) não pertencente ao conjunto Rt Ra,b ) e, portanto, a quantidade |x2 (t) − x0 | ≤ t0 |f (s, x1 (s))| ds não poderia ser majorada (nem obviamente todos os demais termos |xk (t) − x0 |, k = 1, 2, ..., n − 1). Naturalmente, todas as propriedades que se asseguram para f no conjunto Ra,b não podem garantir-se se a função f é avaliada fora do conjunto Ra,b . Na figura 2-1 mostra-se que as iterações de Picard estão contidas nos triângulos AP B e CP D. Se permitirmos que t varie até t0 − a ou, no sentido inverso, até t0 + a então é claro que as iterações de Picard {xn (t) , n ≥ 1} poderão sair dos limites x0 ± b. 49 Lema 3 Suponha-se w (t) contínua e não negativa satisfazendo a desigualdade w (t) ≤ k Z t w (s) ds. (2.5) t0 Então w (t) ≡ 0. Dem. Ver Braun (1993), p. 78.¥ Apresenta-se agora o resultado fundamental. Teorema 3 (Existência e Unicidade das Soluções - Caso Escalar) Se f (t, x) é contínua em Ra,b = {(t, x) : |t − t0 | ≤ a, |x − x0 | ≤ b} e, além disso, satisfaz a condição de Lipschitz em Ra,b com respeito a x, então existe uma solução única para o PVI x0 = f (t, x) , x (t0 ) = x0 em t ∈ J = {t : |t − t0 | ≤ h} onde h = min (a, b/M ) . Dem. Assume-se que t ∈ [t0 , t0 + h]. O caso t ∈ [t0 − h, t0 ] demonstra-se de forma similar. A demonstração consiste em provar o seguinte: a) xn (t) → x (t) quando n → +∞; b) x (t) satisfaz o PVI; c) x (t) é uma função contínua e d) Se z (t) é também uma solução do PVI necessariamente se tem x (t) = z (t) . Comecemos por verificar a). Por construção tem-se xn (t) = x0 (t) + [x1 (t) − x0 (t)] + ... + [xn (t) − xn−1 (t)] n X [xk (t) − xk−1 (t)] . = x0 (t) + k=1 Ora xn (t) converge sse P+∞ n=1 [xn (t) − xn−1 (t)] +∞ X n=1 converge. Para o efeito é suficiente mostrar que |xn (t) − xn−1 (t)| < +∞. Vamos em primeiro lugar estabelecer uma desigualdade para o termo geral da série, |xn (t) − xn−1 (t)| ≤ P δ (n) e depois mostramos que n≥1 δ (n) < +∞. 50 Atendendo a (2.3) e a (2.4) vem para t ∈ [t0 , t0 + h] ¯Z t ¯ ¯ ¯ |xn (t) − xn−1 (t)| = ¯¯ [f (s, xn−1 (s)) − f (s, xn−2 (s))] ds¯¯ t0 Z t ≤ |f (s, xn−1 (s)) − f (s, xn−2 (s))| ds t0 t ≤ Z t0 K |xn−1 (s) − xn−2 (s)| ds. (2.6) Observe-se que a função f satisfaz a condição de Lipchtiz, i.e., para todo o (t, xi (t)) , (t, xi−1 (t)) ∈ Rh,b tem-se |f (t, xi (t)) − f (t, xi−1 (t))| ≤ K |xi (t) − xi−1 (t)|. Esta garantia é dada (para além do enunciado do teorema em análise) pelo lema 2 que estabelece (t, xi (t)) ∈ Rh,b ⊆ Ra,b , i = 1, ..., n pois t ∈ [t0 , t0 + h]. Se permitíssemos que t variasse no conjunto [t0 , t0 + a] poderia suceder, por exemplo, que |x1 (t) − x0 (t)| ≤ M a com M a eventualmente superior a b. Logo (t, x1 (t)) poderia sair do conjunto Ra,b e não haveria garantia que a função f satisfizesse a condição de Lipchtiz. Usa-se agora a desigualdade (2.6) sucessivamente para n = 2, n = 3, etc. ¯R ¯ Rt ¯ t ¯ Para n = 2 e considerando |x1 (t) − x0 (t)| = ¯ t0 f (s, x0 (s)) ds¯ ≤ t0 M ds = M (t − t0 ) vem |x2 (t) − x1 (t)| ≤ ≤ = Z t t0 Z t t0 K |x1 (s) − x0 (s)| ds KM (s − t0 ) ds KM (t − t0 )2 ; 2 para n = 3, |x3 (t) − x2 (t)| ≤ ≤ = Z t t0 Z t K |x2 (s) − x1 (s)| ds K 2 M (s − t0 )2 ds 2 t0 K 2M Por indução chega-se a |xn (t) − xn−1 (t)| ≤ 51 (t − t0 )3 . 3! K n−1 M (t − t0 )n . n! Finalmente podemos concluir: +∞ X n=1 |xn (t) − xn−1 (t)| = |x1 (t) − x0 (t)| + |x2 (t) − x1 (t)| + ... + |xn (t) − xn−1 (t)| + ... K n−1 M (t − t0 )n KM (t − t0 )2 + ... + + ... 2! n! +∞ +∞ M X (K (t − t0 ))n M X (K (t − t0 ))n M K(t−t0 ) ≤ = e < +∞ K n=1 n! K n=0 n! K ≤ M (t − t0 ) + = para t ∈ [t0 , t0 + h]. Provámos que, para cada t ∈ [t0 , t0 + h] , a sequência xn (t) converge (pontualmente) para x (t). Prova-se a seguir que xn (t) → x (t) uniformemente em t ∈ J, i.e., supt∈J |xn (t) − x (t)| → 0 quando n → +∞.5 Tem-se ¯ ¯Z t ¯ ¯ ¯ sup |xn (t) − x (t)| = sup ¯ (f (s, xn−1 (s)) − f (s, x (s))) ds¯¯ t∈J t∈J t0 Z t ≤ sup |f (s, xn−1 (s)) − f (s, x (s))| ds t∈J t0 ≤ K sup t∈J Z t t0 |xn−1 (s) − x (s)| ds Atendendo a xn−1 (t) = x0 (t) + n−1 X k=1 vem [xk (t) − xk−1 (t)] , x (t) = x0 (t) + k=1 sup |xn (t) − x (t)| ≤ K sup t∈J [xk (t) − xk−1 (t)] . ¯ +∞ ¯ +∞ ¯X ¯ X K k−1 M (s − t )k ¯ ¯ 0 [xk (s) − xk−1 (s)]¯ ≤ |xn−1 (s) − x (s)| = ¯ ¯ ¯ k! k=n e, portanto, +∞ X t∈J ≤ K sup Z k=n t t0 |xn−1 (s) − x (s)| ds ≤ K sup t∈J Z +∞ X K k−1 M hk t∈J k=n k! t t0 5 ds ≤ M h Z tX +∞ K k−1 M (s − t0 )k +∞ X (Kh)k k=n k! t0 k=n k! ds → 0. Nesta alínea a) é suficiente considerar-se a convergência pontual. A convergência uniforme é invocada nas alíneas seguintes. 52 Vejamos agora a alínea b). Para mostrar que o limite de xn (t), x (t) , satisfaz o PVI basta mostrar, atendendo ao lema 1, que x (t) satisfaz a equação integral x (t) = x0 + Z t f (s, x (s)) ds. t0 Considerando a iteração de Picard, xn+1 (t) = x0 + Z t f (s, xn (s)) ds t0 e tomando o limite em ambos os termos da equação quando n → +∞ obtém-se x (t) = x0 + lim Z t n→+∞ t 0 f (s, xn (s)) ds. Rt Para mostrar que a equação anterior é igual a x (t) = x0 + t0 f (s, x (s)) ds é necessário mostrar Rt Rt em primeiro lugar que limn→+∞ t0 f (s, xn (s)) ds = t0 limn→+∞ f (s, xn (s)) ds. A permutação do limite com o integral não é geralmente válida. Sabe-se, no entanto, que se f (t, xn (t)) converge uniformemente para f (t, x (t)) então a referida permutação é válida. Nas condições do teorema pode-se provar que f (t, xn (t)) converge uniformemente para f (t, x (t)) 6,7 , pelo Rt que o limite pode permutar com o integral. Falta mostrar que t0 limn→+∞ f (s, xn (s)) ds = Rt t0 f (s, x (s)) ds. Este resultado é imediato devido à continuidade de f e à alínea a). Prove-se c). Como xn (t) é contínua e converge uniformemente em t ∈ J a função limite, x (t) é também contínua (ver Sarrico, 1999, teorema 7.2.1). Finalmente, veja-se d). Mostramos agora que se z (t) é também uma solução do PVI necessariamente se tem x (t) = z (t). Assim, x (t) = x0 + Z t f (s, x (s)) ds, z (t) = x0 + t0 Z t f (s, z (s)) ds. t0 6 De facto, como f satisfaz a condição de Lipschitz e supt∈J |xn (t) − x (t)| → 0 tem-se supt∈J |fn (t, xn (t)) − f (t, x (t))| ≤ K supt∈J |xn (t) − x (t)| → 0 quando n → +∞. 7 Alternativamente, invocando o teorema da convergência dominada de Lebesgue, imediatamente se conclui que a permutação do limite com o integral é válida [Teorema da convergência dominada de Lebesgue: suponha-se que f, g são tais que |f | < ∞ e |g| < ∞. Se |fn | ≤ |g| para n = 1, 2, ... e lim fn = f então limn fn = f ]. De facto, xn (t) é limitada (está contido em Rh,b ), t varia num intervalo limitado e f é contínua em Ra,b . Logo t |f (s, xn (s))| ds < +∞. t0 53 Considerando |x (t) − z (t)| e atendendo ao facto de f satisfazer a condição de Lipschitz, ¯ ¯Z t ¯ ¯ |x (t) − z (t)| = ¯¯ [f (s, x (s)) − f (s, z (s))] ds¯¯ t0 Z t ≤ |f (s, x (s)) − f (s, z (s))| ds t0 t ≤ Z t0 K |x (s) − z (s)| ds. Aplicando agora o lema 3 com w (t) = |x (t) − z (t)| resulta x (t) = z (t) .¥ O teorema anterior exige que a função f seja contínua e satisfaça a condição de Lipschitz em certo rectângulo. Se a condição de Lipschitz falha é possível ainda assim estabelecer um teorema de existência nas seguintes condições. Teorema 4 (Existência) Admita-se que f (t, x) é contínua no conjunto S = {(t, x) : t0 ≤ t ≤ t0 + a, |x − x0 | ≤ b} . Então o PVI (2.1) admite pelo menos uma solução no intervalo [t0 , t0 + a] . Exemplo 20 Determine-se um intervalo de existência e unicidade para o PVI x0 = 1 + x + x2 cos t, x (1) = 2 em R = {(t, x) : |t − 1| ≤ 3, |x − 2| ≤ 4} (note-se t0 = 1, x0 = 2, a = 3, b = 4). A função f (t, x) é contínua e ∂f /∂x = 1 + 2x cos t é contínua em R (logo limitada e, portanto, satisfaz a condição de Lipschitz - ver observação 8, p. 46). Por outro lado, M = max |f (t, x)| = 1 + 6 + 62 = 43. (t,x)∈R Pelo teorema 3 existe uma solução única em t ∈ J = {t : |t − 1| ≤ h} onde h = min (3, 4/43) = 4/43. Assim um intervalo de existência e unicidade é J = {t : |t − 1| ≤ 4/43} = [−39/43, 47/43] . Exemplo 21 Para determinar o intervalo de existência da solução do PVI x0 = x2 , x (0) = 2, t ≥ 0, usando o teorema 3, considera-se: R = {(t, x) : 0 ≤ t ≤ a, |x − 2| ≤ b} , 54 M = max |f (t, x)| = (b + 2)2 . (t,x)∈R A função f (t, x) é contínua e ∂f /∂x = 2x é contínua em R (logo limitada). Pelo teorema ³ ´ 3 a solução existe no intervalo 0 ≤ t ≤ h = min a, b/ (b + 2)2 . Tem obviamente interesse obter o maior h possível. A questão é portanto maximizar h. Como max b/ (b + 2)2 = 1/8, podemos seleccionar a = 1/8 e, portanto, pelo teorema 3 existe uma solução única no intervalo 0 ≤ t ≤ 1/8. Como o PVI admite uma solução fechada tem interesse verificar se o maior intervalo de existência estabelecido pelo teorema 3 corresponde de facto ao maior intervalo de existência do PVI. Pode-se mostrar que x (t) = 2/ (1 − 2t) é a solução do PVI e a solução está claramente definida em 0 ≤ t < 1/2. O exemplo anterior mostra que o teorema 3 não fornece necessariamente o maior intervalo de existência. De facto o teorema 3 é um teorema local de existência e unicidade. 2.2 Prolongamento das Soluções Estabelecem-se agora condições que permitem prolongar o intervalo J definido pelo teorema 3 caso J não coincida com o maior intervalo de existência (intervalo maximal de existência) mantendo-se as condições de existência e unicidade. Definição 9 (Prolongamento, Extensão, Solução Maximal e Intervalo Maximal) Seja x (t) , t ∈ I, uma solução de um certo PVI. Suponha-se que existe uma solução y (t) , t ∈ I1 do mesmo PVI tal que y (t) = x (t) para t ∈ I e I ⊂ I1 . Nestas circunstância diz-se que y (t) é um prolongamento de x (t) e I1 é uma extensão de I. Se não existe y (t) nas condições enunciadas então x (t) designa-se por solução maximal e I o intervalo maximal de existência (ou não prolongável). Teorema 5 (Prolongamento) Seja f (t, x) contínua e limitada no domínio R ⊂ R2 . Se x (t) é uma solução do PVI x0 = f (t, x) , x (t0 ) = x0 num intervalo (ta , tb ) , então os limites x (ta + 0) := limt→ta +0 x (t) e x (tb − 0) := limt→ta −0 x (t) existem. Além disso se (tb , x (tb − 0)) ∈ R então x (t) pode ser prolongada à direita de tb e de igual forma, se (ta , x (ta + 0)) ∈ R então x (t) pode ser prolongada à esquerda de ta . 55 Dem. Mostre-se que x (tb − 0) existe. Considere-se ta < u < v < tb . Nas condições do teorema podemos usar o lema 1 para x (v) e x (u) . Depois de algumas simplificações obtém-se |x (v) − x (u)| ≤ Z v u |f (s, x (s))| ds ≤ M |v − u| (2.7) onde M é tal que |f | ≤ M em R. Podemos usar agora o critério de convergência de Cauchy. De facto, quando v → tb e u → tb vê-se, pela equação (2.7) que x (v) − x (u) → 0, o que implica, de acordo com o critério de Cauchy, que x (tb − 0) existe. Um argumento similar aplica-se ao limite à esquerda. Suponha-se agora que (tb , x (tb − 0)) ∈ R. Podemos definir a seguinte função y (t) = x (t) x (t − 0) b t ∈ (ta , tb ) t = tb . Claramente y (t) , t ∈ (ta , tb ] é um prolongamento de x (t) , t ∈ (ta , tb ). Um outro prolongamento de y (t) pode ser obtido usando (tb , x (tb − 0)) como condição inicial. Com efeito, como f é contínua, existe uma solução z (t) para t ∈ [tb , tb + β] , β > 0 tal que z (tb ) = x (tb − 0) (teorema de existência). Conclui-se agora que a solução y (t), t ∈ (ta , tb ] pode ser prolongada pela solução y (t) t ∈ (ta , tb ] w (t) = z (t) t ∈ [t , t + β] , β > 0.¥ b b Exemplo 22 Retome-se o exemplo 21, x0 = x2 , x (0) = 2 onde, como vimos, o teorema 3 estabelece uma solução única no rectângulo R = {(t, x) : 0 ≤ t ≤ 1/8, |x − 2| ≤ 2} . Pelo teorema do prolongamento é possível prolongar a solução x (t) , t ∈ [0, 1/8] , dado que f (t, x) = x2 é contínua e limitada em R. Tome-se como condição inicial x (1/8) = k e formese novo rectângulo R1 = {(t, x) : 0 ≤ t ≤ 1/8 + a, |x − k| ≤ b} (passamos a ter t0 = 1/8 e x0 = k). Sabe-se que existe uma solução única z (t) com 1/8 ≤ t ≤ 56 1/8 + h onde h = min (a, b/M ) e M = max |f (t, x)| = (b + k)2 . (t,x)∈R1 Como o valor máximo de b/ (b + k)2 é obtido quando b = k, tem-se que max b/ (b + k)2 = 1/ (4k) . O valor de h é então maximizado quando a = 1/ (4k) , e vem portanto h = 1/ (4k) . Existe portanto um prolongamento de x (t) e a extensão é I1 = [0, 1/8 + 1/ (4k)] . Em geral, o valor de k pode ser determinado numericamente. No nosso caso concreto, k é x (1/8) = 2/ (1 − 2 (1/8)) = 2. 666 7 o que significa que I1 é de facto o intervalo [0, 0.21875]. Como o intervalo maximal é [0, 0.5) (ver exemplo 21) outros prolongamentos são possíveis de obter. Como nota final convém sublinhar que a procura de prolongamentos só faz sentido quando a solução fechada não é conhecida. O exemplo presente serviu apenas para ilustrar a técnica de obtenção de prolongamentos, mas a rigor como a solução é conhecida não é necessário invocarse o teorema de existência e o de continuação: sabemos de facto que a solução do PVI existe em 0 ≤ t < 1/2, sendo este intervalo maximal. Teorema 6 Admita-se que f (t, x) é uma função contínua e limitada em R2 e f (t, x) satisfaz a condição de Lipschitz em relação a x no mesmo conjunto R2 . Então o PVI x0 = f (t, x) , x (t0 ) = x0 tem solução única em R. Dem. Considere-se R = {(t, x) : |t − t0 | ≤ a, |x − x0 | ≤ b} , M = max |f (t, x)| < +∞ (t,x)∈R ¡ b¢ Nas condições do teorema, existe uma solução única no intervalo |t − t0 | ≤ h = min a, M . Quando a → +∞ e b → +∞ a constante M mantém-se finita, pelo que h pode assumir qualquer valor arbitrariamente alto.¥ O teorema de existência e unicidade e do prolongamento não permitem obter o intervalo maximal de existência. Uma solução satisfatória é dada pelo teorema seguinte. Teorema 7 Considerem-se os seguintes PVI: x0 = f (t, x) , x (t0 ) = x0 , y 0 = g (t, y) , y (t0 ) = y0 , z 0 = h (t, z) , z (t0 ) = z0 . Admita-se que (i) f (t, x) , g (t, x) e h (t, x) satisfazem as condições 57 Figura 2-2: Argumento usado na demonstração do teorema 7. xt yt t1 t2 t do teorema de existência e unicidade num conjunto R ⊂ R2 , (ii) h (t, x) ≤ f (t, x) ≤ g (t, x) , ∀ (t, x) ∈ R e (iii) z0 ≤ x0 ≤ y0 . Então as soluções dos PVI definidas em certo intervalo I verificam as desigualdade z (t) ≤ x (t) ≤ y (t) para todo o t ≥ t0 em I. Dem. (Por redução ao absurdo) É suficiente mostrar uma desigualdade. Suponhamos que não é verdade que x (t) ≤ y (t) em I (i.e., x (t) > y (t)). Como as soluções são contínuas e x0 ≤ y0 então existe um t1 ≥ t0 e um t2 > t1 em I tal que x (t1 ) = y (t1 ) e x (t) > y (t) para todo o t ∈ (t1 , t2 ) ⊂ I (ver figura 2-2). Resulta x (t) > y (t) ⇔ x (t) − x (t1 ) > y (t) − y (t1 ) para todo o t ∈ (t1 , t2 ) e, portanto, f (t1 , x (t1 )) = x0 (t1 ) = lim t→t1 + x (t) − x (t1 ) y (t) − y (t1 ) > lim = y0 (t1 ) = g (t1 , y (t1 )) , t→t1 + t − t1 t − t1 i.e., f (t1 , x (t1 )) > g (t1 , y (t1 )) o que é uma contradição com a hipótese f (t, x) ≤ g (t, x) , ∀ (t, x) ∈ R (verifique através da figura 2-2 que x0 ≤ y0 e x (t) > y (t) implica f (t1 , x (t1 )) > g (t1 , y (t1 )) o que é uma contradição com a hipótese f (t, x) ≤ g (t, x)).¥ Nas condições do teorema anterior a solução x (t) existe no intervalo I onde z (t) e y (t) estão definidos. Além disso conclui-se que z (t) ≤ x (t) ≤ y (t) para t ≥ t0 . O teorema 7 pode ser aplicado nas seguintes condições. Dada a função f (t, x) procura-se h (t, x) e g (t, x) nas condições do teorema e tal que as ED y 0 = g (t, y) e z 0 = h (t, z) tenham soluções conhecidas. 58 Exemplo 23 Considere-se o PVI x0 = x cos (t + x) , 1 + 2x2 x (0) = 1 com solução analítica desconhecida. O teorema 6 pode ser aplicado, atendendo a que f (t, x) = ¡ ¢ x cos (t + x) / 1 + 2x2 é contínua e limitada em R2 e ∂f (t, x) − cos (t + x) + 2x2 cos (t + x) + x sen (t + x) + 2x3 sen (t + x) =− ∂x 1 + 4x2 + 4x4 é contínua e limitada em R2 (o que implica que a constante de Lipschitz é finita). Logo o PVI tem solução única em R. Também o teorema 7 pode ser invocado. Com efeito, ¯ ¯ ¯ x cos (t + x) ¯ ¯ ≤ |x| ≤ |x| < 1, |f (t, x)| = ¯¯ 1 + 2x2 ¯ 1 + 2x2 1 + x2 ¢ ¡ isto é −1 < x cos (t + x) / 1 + 2x2 < 1. Logo o PVI tem solução única em R (note-se: (ii) h (t, x) = −1 < f (t, x) < g (t, x) = 1 e (iii) −1 ≤ x0 ≤ 1 implica 1 − t ≤ x (t) ≤ 1 + t, t ≥ 0). Exemplo 24 Considere o PVI x0 = x (1 + x) cos (t) , x (0) = 1 cuja solução é x (t) = 1 2e− sen(t) −1 para t ∈ [0, arcsen (log 2)) = [0, 0.765846) . Se a solução x (t) fosse desconhecida seria interessante aplicar-se o teorema 7. Uma possibilidade na escolha das funções h e g é h (t, x) = −x (1 + x) ≤ x (1 + x) cos (t) ≤ g (t, x) = x (1 + x) . ¢ ¡ A solução do PVI y 0 = y (1 + y) , y (0) = 1 é y (t) = et / 2 − et para t ∈ [0, log 2) e a solução ¡ ¢ do PVI z 0 = −z (1 + z) , z (0) = 1 é z (t) = 1/ −1 + 2et para t ≥ 0.Conclui-se, pelo teorema 7 que 1 et ≤ x (t) ≤ , t ∈ [0, log 2) = [0, 0.693 15) . −1 + 2et 2 − et Na figura 2-3 mostram-se as soluções y (t) , x (t) e z (t) . 59 Figura 2-3: Soluções x (t) = 1 −1+2et ≤ x (t) ≤ et 2−et . 1 2e− sen(t) −1 ¡ ¢ ¡ ¢ , y (t) = et / 2 − et e z (t) = 1/ −1 + 2et satisfazendo 30 25 20 15 10 5 0.1 2.3 0.2 0.3 0.4 0.5 0.6 Caso Multivariado Considere-se agora um sistema de ED de primeira ordem x0 = f (t, x) , onde x = (x1 , x2 , ..., xn )T e f = (f1 , f2 , ..., fn )T . Com ligeiras adaptações, os teoremas apresentados neste capítulo são válidos também para o caso multivariado. Seja kxk a norma do vector x. Teorema 8 (Existência e Unicidade das Soluções - Caso Multivariado) Se f (t, x) é contínua em R = {(t, x) : t0 ≤ t ≤ t0 + a, kx − x0 k ≤ b} e, além disso, satisfaz a condição de Lipschitz em R com respeito a x então existe uma solução única para o PVI (2.1) em t ∈ [t0 , t0 + h] onde h = min (a, b/M ) e M = max(t,x)∈R kf (t, x)k . Naturalmente a condição de Lipschitz no caso multivariado deve ser interpretada nos seguintes termos. Diz-se que a função f (t, x) satisfaz a condição de Lipschitz com respeito a x no conjunto S ⊂ Rn+1 se existe um K > 0 tal que para todo o (t, x) , (t, y) ∈ S se tem kf (t, x) − f (t, y)k ≤ K kx − yk . Suponha-se que f (t, x) tem derivadas parciais contínuas com respeito a t e x e ainda ° ° ° ∂f (t, x) ° ° ° ° ∂xi ° ≤ K para (t, x) ∈ S e i = 1, ..., n 60 (a desigualdade anterior é imediatamente satisfeita se S é um conjunto limitado e fechado em Rn+1 ). Aplicando o teorema do valor médio para cada variável obtém-se kf (t, x) − f (t, y)k ≤ K kx − yk . Exemplo 25 Considere-se o PVI x01 = −x1 , x1 (0) = 1, x02 = tx1 x2 , x2 (0) = 1 e o conjunto R = {(t, x) : 0 ≤ t ≤ 1, kx − x0 k ≤ 4} onde x= x1 x2 , x0 = 1 1 e k·k é a norma Euclidiana. Mostre-se que existe uma solução única no intervalo [0, 1]. Para o efeito verifique-se o seguinte. (i) A função f (t, x) = f1 (t, x) f2 (t, x) = −x1 tx1 x2 é obviamente contínua em R; (ii) as normas (Euclidianas) de −1 0 ∂f e ∂f = = ∂x1 ∂x 2 tx2 tx1 ° ° p ° ° p ° ∂f ° ∂f ° 2 x2 e ° respectivamente, ° ∂x = = 1 + t t2 x21 = |tx1 | são contínuas no compacto R ° ° ° 2 ∂x2 1 e, portanto, satisfazem a condição de Lipschitz em R. Assim, pelo teorema 8, existe uma solução p única em t ∈ [0, h] onde h = min (1, 4/M ) e M = max(t,x)∈R kf (t, x)k = max(t,x)∈R x21 + t2 x21 x22 = 2.73.8 Logo h = min (1, 4/2.73) = 1. 8 Note-se que se trata de um problema de optimização com restrições de desigualdades. 61 Exercícios 1. Considere o PVI x0 = 4t + 2t x, x (0) = 1. (a) Utilize o método de Picard para obter a solução do PVI. (b) Confirme o resultado obtido na alínea anterior resolvendo o PVI pelo método habitual 2. Considere a equação x (t) = 1 + Rt 0 (t − s) x (s) ds. (a) Utilize o método de Picard para resolver a equação. (b) Mostre que a equação dada representa um certo PVI. (c) Mostre que a solução obtida na alínea (a) satisfaz o PVI (alínea (b)). 3. Considere o PVI x0 = t2 x + x2 , x (0) = 1 em R = {(t, x) : |t| ≤ 2, |x − 1| ≤ 2} . (a) Utilize o método de Picard para obter as três primeiras aproximações da solução x (t). (b) Mostre que f (t, x) = t2 x + x2 satisfaz a condição de Lipschitz em R e determine a constante de Lipschitz. (c) Determine um intervalo de existência e unicidade da solução. 4. Seja g : R→R uma função contínua e não identicamente nula. Mostre que o PVI x0 = √ g (t) x, x (0) = 0 não tem solução única. O que falha no teorema de existência e unicidade? 5. Mostre que o PVI x0 = √ x2 − 1, x (0) = 1 não tem solução única. O que falha no teorema de existência e unicidade? 6. (Exame) Considere o PVI x0 = x2 +xt−5, x (0) = 0 no rectângulo R = {(t, x) : 0 ≤ t ≤ 2, |x| ≤ 2} (a) Mostre que f (t, x) = x2 + xt − 5 satisfaz a condição de Lipschitz com respeito a x no conjunto R e determine a constante de Lipschitz. (b) Determine um intervalo de existência e unicidade para a solução do PVI. 62 (c) Utilizando o método de Picard obtenha as três primeiras aproximações da solução (x0 (t) , x1 (t) e x2 (t)) e proponha uma estimativa para x (2/3) . 7. Considere o PVI x0 = x2 +5 cos t2 , x (0) = 2 definido em R = {(t, x) : |t| ≤ a, |x − 2| ≤ b} . Aplicando o teorema de existência e unicidade das soluções determine o maior intervalo que o teorema admite, onde existe uma solução única. 8. Considere o PVI x0 = t2 + x2 , x (0) = 0 definido em R = {(t, x) : 0 ≤ t ≤ a, |x| ≤ b} . Aplicando o teorema de existência e unicidade das soluções determine o maior intervalo que o teorema admite, onde existe uma solução única. 9. Considere o PVI x0 = θx2 , x (0) = 1 onde θ é um parâmetro positivo. Que condição devemos impor a θ para que exista uma solução única no intervalo [0, T ]? Resolva a questão considerando separadamente: (a) a solução do PVI; (b) o teorema de existência e unicidade das soluções. 2 10. Considere o PVI x0 = θex − 1 − cos t, x (0) = 0 onde θ é um parâmetro positivo. Que condição devemos impor a θ para que exista uma solução única no intervalo [0, T ] . 11. Mostre que o PVI x0 = arctg x, x (0) = 0 tem uma solução única em R. 12. Mostre que o PVI x0 = ecos t , x (0) = 0 tem uma solução única em R. 13. (Exame) Considere o PVI x0 = ex , 1 + ex x (0) = 0. (a) Mostre que existe uma solução única em R. (b) Sem resolver o PVI mostre que |x (t)| ≤ t para t ≥ 0. 14. Considere o PVI x0 = (arctg x) x + t, x (0) = 0, t ≥ 0. Determine um intervalo I = [0, b) e duas funções z (t) e y (t) tais que z (t) ≤ x (t) ≤ y (t) em I. ¡ ¢ 15. Considere o PVI x0 = x2 +cos t + x2 , x (0) = 0, t ≥ 0. Determine um intervalo I = [0, b) e duas funções z (t) e y (t) tais que z (t) ≤ x (t) ≤ y (t) em I. 63 16. (Exame) Considere os PVI x0 = f (t, x) , x (0) = x0 e x0 = f (t, x) , x (0) = y0 e as respectivas soluções x (t, 0, x0 ) e x (t, 0, y0 ). Suponha que f satisfaz a condição de Lipschitz com respeito a x. Determine uma função φ (t) tal que |x (t, 0, x0 ) − x (t, 0, y0 )| ≤ |x0 − y0 | φ (t) , para todo o t ≥ 0. Utilize a desigualdade de Bellman e Gronwall: se z (t) é uma função Rt real contínua tal que z (t) ≥ 0 e z (t) ≤ C + K 0 z (s) ds para todo o t ≥ 0, onde C > 0 e k > 0 então z (t) ≤ CeKt . 64 Capítulo 3 Aproximações Numéricas Quando a ED é não linear a solução analítica geralmente não é conhecida. Tem interesse assim investigar-se aproximações numéricas para x (t) . Considere-se o PVI x0 = f (t, x) , x (t0 ) = x0 com solução única em t ∈ J. O objectivo consiste em aproximar x (t) no intervalo [t0 , tn ] ⊆ J através de uma função y (t). Uma possível aproximação para x (t) pode ser fornecida pelo método de Picard (definição 8). No entanto, este método é difícil de aplicar pois, em cada iteração, é necessário realizar-se uma integração. Vamos apresentar esquemas alternativos de aplicação mais simples. Nestes esquemas começa-se por discretizar o intervalo [t0 , tn ] na forma t0 ≤ t1 ≤ ... ≤ tn−1 ≤ tn . Sem perda de generalidade pode-se considerar uma amplitude de discretização ti − ti−1 = ∆ constante para i = 1, 2, ..., n. Vem assim ∆ = (tn − t0 ) /n e ti = t0 + i∆, i = 0, 1, ..., n (ver a figura 3-1). Como veremos, o objectivo consiste em aproximar a solução x (t) nos instantes de discretização ti através de uma função y (ti ). Investiga-se agora possíveis funções aproximadoras y. Para o efeito, considere-se o seguinte. Admita-se que x (t) tem derivadas de ordem s em [t0 , tn ]. Então pela fórmula de Taylor tem-se (t − t0 )2 2! s−1 ) (t − t (t − t0 )s 0 +... + x(s−1) (t0 ) + x(s) (z) (s − 1)! s! x (t) = x (t0 ) + x0 (t0 ) (t − t0 ) + x00 (t0 ) 65 (3.1) Figura 3-1: Discretização (ou decomposição) do intervalo [t0 , tn ] de acordo com a regra ti = t0 + i∆, i = 0, 1, .., n, ∆ = (tn − t0 ) /n ... 14243 14243 14243 ∆ ∆ ∆ t3 t1 t2 14243 tn −1 ∆ tn t0 com z = θt + (1 − θ) t0 , 0 ≤ θ ≤ 1. Note-se que x0 (t0 ) = f (t0 , x (t0 )) = f (t0 , x0 ) ∂f (t0 , x0 ) ∂f (t0 , x0 ) dx (t0 ) df (t0 , x (t0 )) = + x00 (t0 ) = dt ∂t ∂x dt ∂f (t0 , x0 ) ∂f (t0 , x0 ) + f (t0 , x0 ) , = ∂t ∂x (3.2) etc. É necessário nesta fase escolher a ordem da aproximação, i.e., é necessário truncar a fórmula de Taylor. 3.1 Método de Euler O caso mais simples consiste em considerar, a partir da equação (3.1), a expressão x (t) = x (t0 ) + x0 (t0 ) (t − t0 ) + e1 onde e1 representa o resto da fórmula de Taylor. Como x0 (t0 ) = f (t0 , x0 ) vem, x (t) = x (t0 ) + f (t0 , x0 ) (t − t0 ) + e1 . Como se sabe, o erro de aproximação que se comete ao se desprezar o resto da fórmula de Taylor é tanto maior quanto maior for o valor |t − t0 | . Podemos tornar este valor "pequeno"considerando 66 a correspondente a expressão dinâmica x (ti ) = x (ti−1 ) + f (ti−1 , x (ti−1 )) (ti − ti−1 ) + e2 , (3.3) baseada na discretização do intervalo [t0 , tn ] . Anulando e2 , obtém-se uma função aproximadora (para simplificar, y (ti ) passa a escrever-se yi ): y0 = x0 (3.4) yi = yi−1 + f (ti−1 , yi−1 ) ∆, i = 1, 2, ..., n. (3.5) As equações (3.4) e (3.5) são conhecidas como a aproximação ou esquema de Euler1 . Exemplo 26 Considere-se o PVI x0 = t2 +log |1 + x| , x (0) = 1 com solução única no intervalo [0, +∞) (mostre). A solução x (t) não é conhecida. Aproxime-se o valor da solução x (t) em certos instantes t no intervalo [0, 2] com base numa amplitude de discretização de ∆ = 1/2. Logo n = (tn − t0 ) /∆ = 4 e ti = t0 + i∆ = i/2, i = 0, 1, 2, 3, 4. Tem-se, atendendo às equações (3.4) e (3.5) (e notando yi := y (ti )), y0 = x0 = 1 ¡ ¢ y1 = y0 + f (t0 , y0 ) ∆ = 1 + 02 + log |1 + 1| /2 = 1. 346 6 (aprox.) ³ ´ y2 = y1 + f (t1 , y1 ) ∆ = 1. 346 6 + (1/2)2 + log |1 + 1. 346 6| /2 = 1. 898 1 (aprox.) ¡ ¢ y3 = y2 + f (t2 , y2 ) ∆ = 1. 898 1 + 12 + log |1 + 1. 898 1| /2 = 2. 930 1 (aprox.) ³ ´ y4 = y3 + f (t3 , y3 ) ∆ = 2. 930 1 + (3/2)2 + log |1 + 2. 930 1| /2 = 4. 739 4 (aprox.). Em cada iteração ocorrem dois erros de aproximação: um dos erros deve-se ao anulamento do termo e2 na equação (3.3); o outro deve-se aos arredondamentos que se efectuam nas várias 1 Podemos também obter o esquema de Euler notando que a função f (t, x) é o declive da recta tangente ao gráfico da solução x (t) no instante t. Assim, a partir da definição de derivada de x (t) tem-se, para ∆ suficientemente pequeno, x (t + ∆) − x (t) ≈ f (t, x) ∆ ou seja x (t + ∆) ≈ x (t) + f (t, x) ∆. 67 Figura 3-2: Esquema de Euler (∆ = 1/2) yi = yi−1 + f (ti−1 , yi−1 ) 12 , (i = 1, 2, ..., 5) 4 3 2 1 0.5 1 1.5 2 2.5 -1 iterações (é desejável não se proceder a arredondamentos grosseiros para que não se acumule no final um erro de aproximação significativo). Uma questão que imediato se coloca é a seguinte. Qual é o impacto sobre a qualidade da aproximação quando a amplitude de discretização diminui. O exemplo e o teorema seguinte clarificam esta questão. Exemplo 27 Considere-se a ED linear x0 = f (t, x), f (t, x) = −x + 7e−t cos 8t com a condição inicial x (0) = 1/2. Atendendo ao teorema 1 obtém-se a solução única x (t) = 18 e−t (4 + 7 sen (8t)) para t ∈ R. Conhecendo-se a solução pode-se avaliar de forma precisa o erro que se comete usando o esquema Euler. Nas figuras 3-2 a 3-4 compara-se a solução exacta (traço grosso) com o esquema de Euler no intervalo t ∈ [0, 2.5] para diferentes valores de ∆ (os pontos {yi } são liga- dos uns aos outros, i.e. faz uma interpolação linear entre eles - o esquema de Euler é agora uma função contínua). É evidente que quanto mais pequeno é ∆ (i.e. mais fina é a decomposição do intervalo) mais precisa é a aproximação. Obviamente, numa aplicação concreta, só se aplica o esquema de Euler se a solução for desconhecida. Nestas circunstâncias, como avaliar a magnitude dos erros de aproximação? O teorema seguinte responde a esta questão. Concretamente, fornece uma majoração para o erro Ei = |x (ti ) − yi | , i = 1, ..., n no caso em que yi corresponde ao esquema de Euler. 68 1 Figura 3-3: Esquema de Euler (∆ = 1/10) yi = yi−1 + f (ti−1 , yi−1 ) 10 , (i = 1, 2, ..., 25) 2 1.5 1 0.5 0.5 1 1.5 2 2.5 -0.5 -1 1 Figura 3-4: Esquema de Euler (∆ = 1/50) yi = yi−1 + f (ti−1 , yi−1 ) 50 , (i = 1, 2, ..., 125) 2 1.5 1 0.5 0.5 1 1.5 -0.5 -1 69 2 2.5 Teorema 9 Considere-se o PVI x0 = f (t, x), x (t0 ) = x0 com solução única em t ∈ J = [t0 , t0 + h], onde h = min (a, b/M ) , M = max(t,x)∈R |f (t, x)| e R = {(t, x) : t0 ≤ t ≤ t0 + a, |x − x0 | ≤ b} . Suponha-se que ¯ ¯ ¯ ∂f (t, x) ¯ ¯ ≤ L, ¯ max ¯ ∂x ¯ (t,x)∈R ¯ ¯ ¯ ∂f (t, x) ∂f (t, x) ¯¯ ¯ max ¯ ≤ D. + f (t, x) ∂t ∂x ¯ (t,x)∈R Então, o erro absoluto associado ao esquema de Euler verifica Ei ≤ ´ D∆ ³ ´ D∆ ³ (1 + ∆L)i − 1 ≤ ehL − 1 2L 2L i = 1, ..., n. Para provarmos este teorema precisamos do seguinte lema. Lema 4 Suponha-se que {Ei , i = 1, 2, ..., n} satisfaz Ei ≤ AEi−1 + B, E0 = 0 onde A e B são constantes positivas. Então ¢ ¡ i B A −1 , (A − 1) ≤ Bi, Ei ≤ Ei se A 6= 1 se A = 1. Dem. Seja yi = Ayi−1 + B, y0 = 0. Por indução conclui-se que Ei ≤ yi . Atendendo à teoria ¢ ¡ i B A − 1 se A 6= 1 e das equações lineares às diferenças finitas, basta verificar que yi = (A−1) yi = Bi se A = 1.¥ Dem. do Teorema 9 Atendendo às equações (3.1) e (3.2) pode-se obter x (ti ) = x (ti−1 ) + f (ti−1 , x (ti−1 )) ∆ + µ ¶ 2 ∆ ∂f (z, x (z)) ∂f (z, x (z)) + f (z, x (z)) ∂t ∂x 2! com z = θti + (1 − θ) ti−i , 0 ≤ θ ≤ 1. Considerando f (ti−1 , x (ti−1 )) = f (ti−1 , yi−1 ) + 70 ∂f (ti−1 , x∗ ) (x (ti−1 ) − yi−1 ) ∂x (pela fórmula de Taylor) onde x∗ = λx (ti−1 )+(1 − λ) yi−1 , 0 ≤ λ ≤ 1 e o facto de (ti−1 , x (z ∗ )) ∈ R e (z, x (z)) ∈ R vem, para i = 1, ..., n, Ei = |x (ti ) − yi | = |x (ti−1 ) − yi−1 + (f (ti−1 , x (ti−1 )) − f (ti−1 , yi−1 )) ∆ ¶ 2 µ ∆ ∂f (z, x (z)) ∂f (z, x (z)) + f (z, x (z)) | + ∂t ∂x 2! ¯ ¯ ¯ ∂f (ti−1 , x∗ ) ¯ ¯ ¯ |x (ti−1 ) − yi−1 | ∆ ≤ |x (ti−1 ) − yi−1 | + ¯ ¯ ∂x ¯ ¯ 2 ¯ ∂f (z, x (z)) ∂f (z, x (z)) ¯∆ ¯ +¯ + f (z, x (z))¯¯ ∂t ∂x 2! ∆2 ≤ |x (ti−1 ) − yi−1 | + L |x (ti−1 ) − yi−1 | ∆ + D 2! ∆2 = Ei−1 + LEi−1 ∆ + D 2! 2 = (1 + L∆) Ei−1 + D∆ /2! isto é, Ei ≤ AEi−1 + B, E0 = 0 com A = (1 + L∆) e B = D∆2 /2! (notar que a relação E0 = 0 decorre de x (t0 ) = y0 ). Pelo ³ ´ i (1 + L∆) − 1 . Para obter uma estimativa independente de i observe-se lema 4 vem Ei ≤ D∆ 2L que (1 + L∆) ≤ e∆L . Assim, Ei ≤ ´ D∆ ¡ ´ ¢ D∆ ³ hL D∆ ³ (1 + L∆)i − 1 ≤ ei∆L − 1 ≤ e −1 2L 2L 2L (3.6) tendo-se considerado i∆ ≤ h.¥ No teorema anterior poderíamos ter trabalhado com o intervalo [t0 , tn ] em lugar de [t0 , t0 + h] ¡ (t −t )L ¢ n 0 e − 1 . (com tn ≤ h). Neste caso, em lugar da equação (3.6), ter-se-ia Ei ≤ D∆ 2L De acordo com o teorema 9 podemos estabelecer que Ei = O (∆). Logo lim∆→0 Ei = 0 (mas lim∆→0 Ei / |∆| = const.). Observe-se: se ∆ diminui para metade Ei diminui pelo menos metade. Em geral, o esquema de Euler, com ∆ relativamente pequeno, permite obter boas aproximações à solução. Todavia, para obter boas aproximações é necessário, em certos casos, considerar-se um ∆ muito pequeno e isto levanta dois problemas. Primeiro, há um custo em termos de tempo de computação - o número de iterações que é necessário efectuar com o esquema de Euler é 71 igual a n = (tn − t0 ) /∆ (quanto menor ∆ maior é n). Este custo não pode ser valorizado tendo em conta a velocidade de processamento dos computadores actuais. Segundo, sabe-se que as operações aritméticas envolvendo valores fraccionários nunca são processadas de forma exacta pelos computadores - existem pequenos erros de arredondamento. Estes erros podem tornar-se significativos se o número de iterações processadas é alto, i.e. quando ∆ é baixo (ver exercícios). 3.2 Outras Aproximações Para minorar os inconvenientes relacionados com o esquema de Euler, podem-se definir esquemas de aproximações mais precisos para ∆ fixo. Por exemplo, considerando as equações (3.1) e (3.2), tem-se x (ti ) = x (ti−1 ) + f (ti−1 , x (ti−1 )) ∆ µ ¶ 2 ¡ ¢ ∂f (ti−1 , x (ti−1 )) ∂f (ti−1 , x (ti−1 )) ∆ + f (ti−1 , x (ti−1 )) + O ∆3 . + ∂t ∂x 2! ¡ ¢ Desprezando os termos de ordem O ∆3 obtém-se o esquema de aproximação y0 = x0 yi = yi−1 + f (ti−1 , yi−1 ) ∆ + µ ¶ 2 ∂f (ti−1 , yi−1 ) ∂f (ti−1 , yi−1 ) ∆ + f (ti−1 , yi−1 ) ∂t ∂x 2! ¡ ¢ para i = 1, 2, ..., n. Pode-se provar que o erro de aproximação |x (ti ) − yi | é de ordem O ∆2 (notar que no caso do esquema de Euler o erro é de ordem O (∆)). Um esquema de aproximação bastante conhecido pela sua simplicidade e eficiência é o esquema de Runge-Kutta y0 = x0 yi = yi−1 + (Li−1,1 + 2Li−1,2 + 2Li−1,3 + Li−1,4 ) ∆ 6 ¡ ¢ ∆ para i = 1, 2, ..., n, onde Li−1,1 = f (ti−1 , yi−1 ) , Li−1,2 = f ti−1 + ∆ 2 , yi−1 + 2 Li−1,1 , Li−1,3 = ¢ ¡ ∆ f ti−1 + ∆ 2 , yi−1 + 2 Li−1,2 e Li−1,4 = f (ti−1 + ∆, yi−1 + ∆Li−1,3 ) . Pode-se provar que o erro ¡ ¢ de aproximação |x (ti ) − yi | é neste caso de ordem O ∆4 . 72 No caso multivariado suponha-se que se tem x01 = f1 (t, x1 , x2 , ..., xm ) x02 = f2 (t, x1 , x2 , ..., xm ) .. . x0m = fm (t, x1 , x2 , ..., xm ) . Seja yj (ti ) a aproximação à solução xj (ti ) . No caso do esquema de Euler a aproximação corresponde a yj (ti ) = yj (ti−1 ) + fj (ti−1 , y1 (ti−1 ) , ..., ym (ti−1 )) ∆ para i = 1, 2, ..., n e j = 1, 2, ..., m. 73 Exercícios ¡ ¢ 1. Considere o PVI x0 = t2 + x2 /2, x (0) = 0. (a) Mostre que existe uma solução única definida em R = {(t, x) : 0 ≤ t ≤ 1, |x| < 1}. (b) Considerando ∆ = 1/10 e o esquema de Euler obtenha uma aproximação para x (0) , x (1/10) , x (2/10) e x (3/10) . (c) Resolva a alínea (b) considerando um esquema com um erro absoluto de ordem ¡ ¢ O ∆2 . (d) Resolva a alínea (b) considerando o esquema de Runge-Kutta . (e) Determine ∆ de forma que o erro absoluto cometido na aproximação a x (ti ) , ti ∈ [0, 1] , utilizando-se o esquema de Euler, não seja superior a 0.0001. 2. Considere o PVI x0 = f (t, x) , x (0) = 0. Suponha que |f (t, x)| ≤ 1, |∂f (t, x) /∂x| ≤ 1 e |∂f (t, x) /∂t + f (t, x) ∂f (t, x) /∂x| ≤ 2 no rectângulo R = {(t, x) : 0 ≤ t ≤ 1, −1 ≤ x ≤ 1} . Sabe-se que o esquema de Euler com ∆ = 1/10 produz y (5/10) = y5 = −.09157 7 e y (5/10) = y6 = .09 258 7. Mostre que existe pelo menos um t∗ ∈ [5/10, 6/10] tal que x (t∗ ) = 0. 3. Suponha que o computador avalia o esquema de Euler introduzindo em cada iteração um erro de arredondamento de εi , i = 1, 2, ... verificando |εi | < ε, i.e. ỹi = ỹi−1 + f (ti−1 , ỹi−1 ) ∆ + εi , i = 1, 2, ..., n. Suponha |∂f (t, x) /∂x| ≤ L e |∂f (t, x) /∂t + f (t, x) ∂f (t, x) /∂x| ≤ D para todo o t e x. (a) Mostre que Ẽi = |x (ti ) − ỹi | ≤ µ D∆ ε + 2L ∆L ¶³ ´ ehL − 1 . (b) Determine o valor de ∆ que minimiza Ẽi . 4. Considere o PVI x0 = θx, x (0) = 1. Mostre que a aproximação de Euler converge para a solução quando ∆ → 0. Sugestão: Comece por mostrar y1 = (1 + θ∆) , y2 = (1 + θ∆) y1 = 74 (1 + θ∆)2 , ..., yn = (1 + θ∆)n . Faça ∆ = tn /n e considere n → +∞. Conclua y (tn ) = x (tn ) para qualquer tn . 5. Seja o PVI x01 = −x1 , x02 = tx1 x2 , x1 (0) = 1, x2 (0) = 1. Considerando ∆ = 1/2 e o esquema de Euler obtenha uma aproximação para a solução do sistema nos instantes 0, 1/2 e 1. 75 Capítulo 4 Sistemas de Equações Lineares 4.1 Introdução Até agora estudámos essencialmente ED univariadas (embora tenhamos já introduzido sistemas de ED diferenciais - ver a observação 4 e o ponto 2.3). Com os sistemas de ED assume-se que as taxas de variação x0i (t) dependem não só da própria variável xi (t) como também de outras variáveis xj (t) , j 6= i. Um exemplo clássico é do modelo predador-presa. Se designarmos respectivamente, x1 (t) e x2 (t) as populações de predadores e presas é natural concluir-se que nenhuma das variáveis x1 e x2 pode ser estudada de forma independente, já que elas interagem dinamicamente ao longo do tempo. Como resultado, devemos considerar o sistema de ED x01 = f1 (t, x1 , x2 ) , x02 = f2 (t, x1 , x2 ) . São numerosos os exemplos na área da economia e das finanças (modelo de ajustamento procura-oferta, modelo neoclássico de crescimento, etc. - ver Gandolfo, 1997, Cap. 19). Neste capítulo vamos estudar o sistema de equações diferenciais (SED) lineares x01 = a11 x1 + ... + a1n xn + g1 (t) x02 = a21 x1 + ... + a2n xn + g2 (t) .. . x0n = an1 x1 + ... + ann xn + gn (t) 76 ou, compactamente x0 = Ax + g (t) (4.1) onde x1 .. x := . , xn x01 .. 0 x := . , 0 xn a ··· 11 .. .. A := . . an1 · · · a1n .. . , ann g1 (t) .. g (t) := . gn (t) (a := b lê-se: a é igual a b por definição). O PVI virá, como habitualmente, na forma x0 = Ax + g (t) , x (t0 ) = x0 . O objectivo deste capítulo consiste em obter a solução geral do sistema e estabelecer alguns resultados que servirão depois o estudo da estabilidade. Definição 10 O sistema (4.1) designa-se por sistema de equações diferenciais não homogéneas. Se g (t) ≡ 0 o sistema designa-se por sistema de equações diferenciais homogéneas. Observação 10 Tem interesse verificar que a ED linear não homogénea de ordem n y (n) = an−1 y (n−1) + ... + a1 y 0 + a0 y + b (t) onde y (k) := dk y (t) /dtk e b (t) é uma função contínua em certo intervalo I, pode ser representada como um sistema de equações lineares de primeira ordem (definido em I) e, portanto, ser resolvida como tal. Com efeito, considere-se x1 = y, x2 = y0 , ..., xn = y (n−1) . 77 resulta x01 = x2 x02 = x3 .. . x0n = an−1 xn + an−2 xn−1 ... + a0 x1 + b (t) isto é, x0 = Ax + g (t) onde A= 0 1 0 ··· 0 0 .. . 0 .. . 1 .. . ··· .. . 0 .. . 0 0 0 ··· 1 a0 a1 a2 · · · an−1 g (t) = , 0 0 .. . 0 b (t) . Exemplo 28 Represente-se a ED linear de ordem 3 y 000 = −2y00 + y 0 − 4y + e3t através de uma sistema de ED de primeira ordem. Com as transformações x1 = y, x2 = y 0 , x3 = y 00 tem-se x01 = x2 , x02 = x3 e x03 = −2x3 + x2 − 4x1 + e3t isto é, x01 0 1 0 0 x2 = 0 0 1 0 −4 1 −2 x3 x1 0 x2 + 0 3t e x3 Vamos começar por abordar o caso dos sistemas de equações diferenciais lineares homogéneos, x0 = Ax (A não depende de t e, portanto, A é uma matriz de constantes). 78 4.2 Sistema de Equações Diferenciais Homogéneas 4.2.1 Primeiras Noções Começa-se por recordar que uma função x (t) é designada uma solução da ED (ou do SED) x0 = f (t, x) num intervalo I se x0 (t) existe em I e x (t) satisfaz x0 (t) = f (t, x (t)) (definição 1). No caso x0 = f (x) = Ax, x1 com valores em Rn é uma solução em I do SED se x1 (t) existe em ¡ ¢0 ¡ ¢0 I (neste capítulo admitiremos sempre esta condição) e se x1 é tal que x1 = Ax1 . Outra definição que recordamos é a de solução geral. Vimos (definição 2) que uma solução de uma ED (ou de um SDE) é designada por solução geral se inclui todas as soluções da ED (ou do SED). Uma solução particular é uma solução deduzida a partir da solução geral. Exemplo 29 Considere-se o SED x01 = 2x1 x02 = 3x2 (observe-se que as variáveis evoluem de forma independente, pelo que, a rigor, não é necessário tratar x1 e x2 de forma conjunta, i.e. através de um sistema). O SED pode escrever-se na forma Se tomarmos é fácil ver que i.e. ¡ x1 ¢0 x1 0 x0 x1 = ¡ 1 ¢0 2e2t , x = 0 e2t 0 2 0 | 0 3 x2 {z }| {z } A , x2 = = x2 | {z } x1 x Ax1 = 2 0 0 3 . 0 e3t e2t 0 = 2e2t 0 ¡ ¢0 = Ax1 e, da mesma forma, x2 = Ax2 ou seja x1 e x2 são soluções do SED x0 = Ax. Também se pode verificar que c1 x1 e c2 x2 onde c1 , c2 ∈ R são soluções do SED. 79 Naturalmente c1 x1 e c2 x2 (considerados separadamente) não representam a solução geral (por exemplo −x2 não pode obter-se a partir de c1 x1 , qualquer que seja o valor da constante c1 ). No entanto, tome-se uma combinação linear de x1 e x2 , i.e., x = c1 x1 + c2 x2 . É imediato que x é solução do SED1 . A solução assim obtida é mais ”abrangente” do que c1 x1 e c2 x2 (tomados individualmente). Em particular, x gera as soluções c1 x1 e c2 x2 . Será x a solução geral? Iremos ver que a resposta é positiva, mas não podemos ainda garanti-lo sem que se mostre primeiro que x = c1 x1 + c2 x2 , c1 , c2 ∈ R, gera todas as soluções do SED. Teorema 10 Seja S o conjunto de todas as soluções do SED x0 = Ax. O conjunto S munido das operações usuais de soma de vectores e multiplicação escalar é um espaço vectorial (sobre o corpo R). Dem. Basta mostrar que são válidos os axiomas definidores de espaço vectorial (ver Gregório Luís e Silva Ribeiro, 1985, capítulo 1). Em particular, se x1 , x2 ∈ S então uma combinação linear de elementos de S é ainda um elemento de S, i.e. x = c1 x1 + c2 x2 ∈ S.¥ A demonstração dos resultados seguintes pode ver-se em Braun (1993), Cap. 3. Caso não seja especificado nada em contrário, A é uma matriz quadrada de ordem n. Teorema 11 A dimensão do espaço vectorial S, formado por todas as soluções do SED x0 = Ax, é igual a n. Teorema 12 Se x1 , x2 , ..., xn são soluções linearmente independentes do sistema x0 = Ax então ª © 1 2 x , x , ..., xn forma uma base do espaço das soluções S. A solução geral de x0 = Ax é x = c1 x1 + c2 x2 + ... + cn xn . Lema 5 (Teste de Independência Linear) Sejam x1 (t) , x2 (t) , ..., xk (t) soluções de x0 = Ax. Então x1 (t) , x2 (t) , ..., xk (t) são linearmente independentes sse x1 (t0 ) , x2 (t0 ) , ..., xk (t0 ) são linearmente independentes. Com efeito, dado que c1 x1 e c2 x2 são soluções, tem-se x0 = A c1 x1 + c2 x2 = Ax. 1 80 c1 x1 0 + c2 x2 0 = Ac1 x1 + Ac2 x2 = Exemplo 30 Verifique-se que x1 (t) = e2t 0 x2 (t) = , 0 e3t são linearmente independentes. Pelo lema anterior x1 (t) e x2 (t) são linearmente independentes sse x1 (t0 ) e x2 (t0 ) são linearmente independentes. Faça-se a escolha mais simples: t0 = 0. É simples verificar que x1 (0) = (1, 0)T e x2 (0) = (0, 1)T são linearmente independentes, logo x1 (t) e x2 (t) são também linearmente independentes. Exemplo 31 Considere-se o exemplo 29.Vimos que x1 = e2t 0 , x2 = 0 e3t são soluções do SED x0 = Ax. Além disso, x1 e x2 são linearmente independentes (ver o exemplo ª © anterior). Assim, os vectores x1 , x2 formam uma base de dimensão 2 do espaço das soluções. Em consequência não é possível encontrar uma terceira solução linearmente independente das duas soluções já obtidas. Pelo teorema 12 a solução geral do sistema é x (t) = c1 e2t 0 + c2 0 e3t = c1 e2t c2 e3t , c1 , c2 ∈ R. Observe-se que se chegaria exactamente a esta conclusão se se resolvesse as ED x01 = 2x1 , x02 = 3x2 de forma independente. Exemplo 32 Considere-se o seguinte PVI x01 = x2 x02 = −x1 − 2x2 81 x (0) = (1, 1)T . Na notação matricial temos x0 = Ax onde A= 0 1 . −1 −2 (Note-se que o PVI definido em sistema é equivalente ao PVI y 00 + 2y 0 + y = 0, y (0) = 1, y 0 (0) = 1). Verique-se que uma solução de x0 = Ax é x1 = e−t −e−t . Com efeito, ¡ 1 ¢0 −e−t , x = −t e Ax1 = 0 1 −1 −2 e−t −e−t = −e−t e−t ¡ ¢0 e, portanto, verifica-se x1 = Ax1 . Também se pode verificar que c1 x1 (t) , c1 ∈ R é solução de x0 = Ax. No entanto x1 não forma uma base do espaço do espaço das soluções. Verifique-se que x2 = te−t (1 − t) e−t é também solução do sistema e x2 não pode ser obtido a partir de x1 . Uma forma de apresentar uma solução mais ”abrangente” é considerar a combinação linear das duas soluções, x = c1 x1 + c2 x2 , c1 , c2 ∈ R. Como o SED x0 = Ax com n = 2 equações admite no máximo n = 2 soluções linearmente independentes não é possível encontrar uma terceira solução linearmente independente das duas soluções já obtidas. A solução geral do sistema é x (t) = c1 e−t −e−t + c2 te−t (1 − t) e−t = 82 c1 −c1 e−t e−t + c2 + c2 te−t (1 − t) e−t , c1 , c2 ∈ R. 4.2.2 Matriz Fundamental de Soluções Seja eAt definida da seguinte forma: eAt := I + At + Ak tk A2 t2 + ... + + ... 2! k! (4.2) onde I é a matriz identidade de dimensão n. A expressão eAt existe já que a série que figura do lado direito da expressão (4.2) converge para todo o t. Exemplo 33 Suponha-se Como resulta A= a 0 0 b . k i h 0 a Ak = diag ak , bk = k 0 b Ak tk A2 t2 eAt = I + At + + ... + + ... 2! k! k 2 k 0 a 1 0 a 0 a2 0 t + ... + t + ... + t + = 0 b2 2! 0 bk k! 0 1 0 b a2 t2 1 + at + 2! + ... 0 = b2 t2 0 1 + bt + 2! + ... eat 0 . = bt 0 e Mais geralmente, se A é uma matriz diagonal de ordem n, isto é, A = diag [a1 , ..., an ] então ¤ £ eAt = diag ea1 t , ..., ean t . Se a matriz A é não diagonal o cálculo de eAt é mais complicado. Retomaremos esta questão adiante. Apresentam-se algumas propriedades de eAt : Lema 6 Considere-se eAt definida pela equação (4.2) e sejam A e B matrizes quadradas de ordem n e v um vector de tipo n × 1. Então: 83 deAt dt = AeAt ; ¡ ¢−1 = e−At ; P2: eAt P1: P3: eAt+Bt = eAt eBt apenas se AB = BA; P4: eA(t+s) = eAt eAs ; P5: eλIt v = eλt v. Dem. Vejam-se apenas as propriedades P1, P3 e P5. As demais demonstrações podem ver-se em Braun (1993). Tem-se deAt dt ³ d I + At + A2 t2 2! + ... + Ak tk k! ´ + ... A2 t Ak tk−1 =A+ + ... + + ... dt 1 (k − 1)! µ ¶ A2 t2 Ak tk = A I + At + + ... + + ... = AeAt . 2! k! = Relativamente a P3 vejam-se os exercícios (P4 é caso particular de P3). Quanto a P5, tem-se λIt e ¶ µ λ2 t2 λ2 I 2 t2 + ... v = v + λtv + v + ... v = I + λIt + 2! 2! ¶ µ λ2 t2 + ... v = eλt v.¥ = 1 + λt + 2! © ª Definição 11 (Matrix Fundamental das Soluções) Seja x1 , x2 , ..., xn uma base (de di- mensão n) do espaço das soluções do SED x0 = Ax. Considere-se Φ (t) = h x1 x2 · · · xn i . A matriz Φ (t) designa-se por matriz fundamental das soluções (MFS) do SED x0 = Ax. Resulta óbvio da definição que Φ (t) é formada por colunas linearmente independentes, pelo que |Φ (t)| 6= 0 para qualquer t. Exemplo 34 A solução geral do SED x0 = Ax onde 1 −1 A= 3 2 2 1 84 4 −1 −1 é dada por −et e3t x (t) = c1 4et + c2 2e3t t e e3t Uma base do espaço S é portanto e, assim, t −e e3t 4et , 2e3t et e3t é uma MFS do SDE x0 = Ax. −e−2t + c3 e−2t e−2t −e−2t e3t −e−2t 2e3t e−2t e3t e−2t −2t , e e−2t −et Φ (t) = 4et et . Lema 7 (a) Se Φ (t) é uma MFS do SED x0 = Ax então Φ0 (t) = AΦ (t) e |Φ (0)| 6= 0; (b) Reciprocamente, se Φ0 (t) = AΦ (t) e |Φ (0)| 6= 0 então Φ (t) é uma MFS do SED x0 = Ax. Em suma, Φ (t) é uma MFS do SED x0 = Ax sse Φ0 (t) = AΦ (t) e |Φ (0)| 6= 0. © ª Dem. (a) Como x1 , x2 , ..., xn são soluções linearmente independentes do SED então re¡ ¢0 sulta: (1) |Φ (t)| 6= 0 e, portanto, |Φ (0)| 6= 0, pelo lema 5; (2) xj = Axj , j = 1, ..., n. i0 i h h = A x1 · · · xn ou Φ0 (t) = AΦ (t) . (b) Matricialmente isto significa x1 · · · xn Reciprocamente, se |Φ (0)| 6= 0 e Φ0 (t) = AΦ (t) então xj , com j = 1, ..., n são soluções lin- earmente independente do SED. Pelo teorema 12 formam uma base do espaço das soluções. ¥ Lema 8 A matriz eAt é uma MFS do SED x0 = Ax. ¯ ¯ ¡ ¢0 Dem. Tem-se eAt = AeAt (lema 6 propriedade P1, p. 83). Por outro lado ¯eA×0 ¯ = |I| = 1 6= 0. Logo eAt é uma MFS do SED x0 = Ax.¥ Lema 9 Sejam Φ1 (t) e Φ2 (t) duas MFS. Então existe uma matriz C tal que Φ1 (t) = Φ2 (t) C. 85 i i h h Dem. Considerem-se as matrizes Φ1 (t) = y1 · · · yn e Φ2 (t) = x1 · · · xn nas ª © ª © condições do enunciado, i.e. onde y 1 , y2 , ..., y n e x1 , x2 , ..., xn formam duas bases de S. © ª Como x1 , x2 , ..., xn é uma base do espaço das soluções do SED então qualquer solução, yj , pode-se expressar como combinação linear dos vectores da base. Isto é, existe um vector de iT h de tipo n × 1 tal que escalares C•,j = C1j · · · Cnj j y = n X xk Ckj . k=1 Vale também P y 1 = nk=1 xk Ck1 .. . P yn = n xk C kn k=1 e, portanto, h y1 · · · yn i h P n k k=1 x Ck1 · · · h i = x1 · · · xn C = Pn k k=1 x Ckn i ou seja Φ1 (t) = Φ2 (t) C.¥ Deve-se verificar |C| 6= 0 (ver exercícios). Lema 10 Seja Φ (t) uma MFS do SED x0 = Ax. Então eAt = Φ (t) Φ−1 (0) . Dem. Pelos lemas 8 e 9 podemos escrever eAt = Φ (t) C. Fazendo t = 0 resulta eA0 = Φ (0) C. Sabe-se também, pela definição (4.2) que eA0 = I. Igualando estas equações vem eA0 = Φ (0) C = I ⇒ C = Φ−1 (0) já que |Φ (0)| 6= 0 (i.e. existe inversa de Φ (0)).¥ 86 Teorema 13 A solução única do PVI x0 = Ax, x (t0 ) = x0 é x (t) = eA(t−t0 ) x0 , t∈R Dem. Pelo lema 6, propriedades P1 e P4, vem x0 (t) = AeA(t−t0 ) x0 = Ax (t) . Por outro lado, x (t0 ) = Ix0 = x0 . Logo x (t) = eA(t−t0 ) x0 é uma solução do PVI. Esta solução existe para todo o t ∈ R, de acordo com a definição estabelecida em (4.2). Para mostrar que a solução é única seja z (t) uma outra solução da forma z (t) = eA(t−t0 ) y (t) . Mostre-se que y (t) é constante. Vem y (t) = e−A(t−t0 ) z (t) e y 0 (t) = −Ae−A(t−t0 ) z (t) + e−A(t−t0 ) z 0 (t) = −Ae−A(t−t0 ) z (t) + e−A(t−t0 ) Az (t) = 0 para todo o t dado que e−A(t−t0 ) e A comutam (ver exercícios). Fixando t = t0 vem y (t) = x0 . Conclui-se x (t) ≡ z (t) .¥ Para resolver o SED temos portanto que obter eAt . No exemplo 33 já vimos como calcular eAt no caso em que A é diagonal (este caso é pouco relevante já que os sistemas dinâmicos xj (t) , j = 1, ..., n evoluem separada e independentemente ao longo do tempo, podendo por isso ser tratados, cada um por si, como processos univariados). Existem ainda outros casos onde o cálculo de eAt é relativamente simples (ver exercícios). O procedimento geral que iremos seguir para determinarmos eAt baseia-se nos valores e vectores próprios de A (existem outras alternativas). O procedimento assenta nos seguintes resultados. Lema 11 Suponha-se que (A − λI)m v = 0 para certo m ∈ N. Então µ v + t (A − λI) v + ... + e v=e At λt ¶ tm−1 m−1 (A − λI) v . (m − 1)! Dem. Tem-se eAt v = eAt−λIt+λIt v = e(A−λI)t+λIt v e eAt v = e(A−λI)t eλIt v (i) = e(A−λI)t eλt v ´ ³ = e(A−λI)t v eλt ¶ µ tm−1 t2 2 m−1 (A − λI) v + ... eλt = v + t (A − λI) v + (A − λI) v + ... + 2! (m − 1)! µ ¶ t2 tm−1 2 m−1 = v + t (A − λI) v + (A − λI) v + ... + (A − λI) v eλt . 2! (m − 1)! 87 (ii) (iii) (iv) (v) A equação (i) resulta da propriedade P3 (lema 6), a equação (ii) da propriedade P5 (lema 6), a equação (iv) deve-se à definição (4.2) e, finalmente (v) resulta do facto de (A − λI)m+k v = (A − λI)k [(A − λI)m v] = (A − λI)k 0 = 0, para k ∈ N.¥ Lema 12 φ = eλt v é uma solução do SED sse Av = λv. Dem. Suponha-se que φ é solução. Então φ0 = λeλt v = eλt λv ⇒ λv = Av pois só nestas ¡ ¢ condições se tem φ0 = eλt λv = eλt Av = A eλt v = Aφ. Reciprocamente suponha-se válida a relação Av = λv. Então, considerando λφ = λeλt v = eλt λv = eλt Av ⇔ φ = λ−1 eλt Av, (λ 6= 0) ¡ ¢ resulta que φ é solução pois, φ0 = λ−1 λeλt Av = eλt Av = A eλt v = Aφ (o caso λ = 0 obrigaria a considerar φ = v).¥ 4.2.3 Resolução do Sistema x0 = Ax A resolução do SED x0 = Ax, com solução dada pelo teorema 13, vai basear-se nos valores e vectores próprios da matriz A. Vamos considerar três situações distintas: (a) valores próprios reais e distintos; (b) valores próprios complexos (conjugados) e (c) valores próprios iguais. Valores Próprios Reais e Distintos Considere-se uma solução do SED x0 = Ax µ eAt v1 = eλ1 t v1 + t (A − λ1 I) v1 + ... + tm−1 (A − λ1 I)m−1 v1 (m − 1)! ¶ (4.3) ¡ ¡ ¢0 ¢ (pois eAt v1 = A eAt v1 ) e seja λ1 um valor próprio de A com multiplicidade algébrica igual a um e v1 um vector próprio associado. Claro que a expressão (4.3) se simplifica, pois se v1 é vector próprio associado a λ1 i.e., tal que (A − λ1 I) v = 0 então, pelo lema 11, todos os termos (A − λ1 I)m v1 para m ≥ 1 são nulos. Desta forma a equação (4.3) escreve-se eAt v1 = eλ1 t v1 88 (observe-se que o lema 12 também identifica a expressão eλ1 t v1 onde v1 é vector próprio associado a λ1 , como uma solução do SED). Repetindo o procedimento anterior para os demais valores próprios (λ2 , ..., λn que se assumem distintos) obtém-se n soluções linearmente independentes ª © 1 x , ..., xn com xi = eλi t vi (sendo vi um vector próprio associado a λi ). A independência linear está garantida pelo facto de que vectores próprios de valores próprios distintos são linearmente independentes. Assim a solução geral é x (t) = c1 eλ1 t v1 + ... + cn eλn t vn , ci ∈ R. Uma forma alternativa de se apresentar a solução consiste em obter explicitamente a função eAt . Considere-se eAt onde P = h v1 ... vn h i v1 ... vn i = h eλ1 t v1 ... eλn t vn i = P Λ (t) £ ¤ e Λ (t) = diag eλ1 t , ..., eλn t . Naturalmente P Λ (t) é solução do SED e, como os vectores próprios (de valores próprios distintos) são linearmente independentes, P Λ (t) é uma matriz fundamental. Escreva-se assim Φ (t) = P Λ (t) . Resulta (pelo lema 10), eAt = Φ (t) Φ (0)−1 = P Λ (t) P −1 . Assim, a solução do PVI x0 = Ax, x (t0 ) = x0 no caso em que os valores próprios são reais e distintos é x (t) = P Λ (t − t0 ) P −1 x0 (4.4) (sendo a solução geral dada simplesmente por P Λ (t) P −1 c onde c é um vector de constantes arbitrárias). Observação 11 Se os valores próprios λ1 , ..., λn de uma matriz quadrada de ordem n são reais e distintos então qualquer conjunto de vectores próprios {v1 , ..., vn } forma uma base do i h espaço Rn . Prova-se também que P −1 AP = diag [λ1 , ..., λn ] onde P = v1 ... vn (ver Gregório Luís e Silva Ribeiro, 1985, Cap. 6). Por outras palavras, se uma transformação linear T : Rn → Rn é representada por uma matriz A com respeito à base natural {e1 , ..., en } então, 89 na base {v1 , ..., vn } , a transformação T é representada pela matriz diagonal diag [λ1 , ..., λn ] . Observação 12 Considere-se o PVI y0 = diag [λ1 , ..., λn ] y, y (0) = y0 . É fácil concluir que £ ¤ a solução é y (t) = ediag[λ1 ,...,λn ]t y0 = Λ (t) y0 onde Λ (t) = diag eλ1 t , ..., eλn t (ver exemplo 33, p. 83). Considere-se agora o PVI x0 = Ax, x (0) = x0 e suponha-se que A tem valores próprios reais e distintos, {λ1 , ..., λn } . Com a mudança de variável y = P −1 x (logo x = P y) i h onde P = v1 ... vn é a matriz dos vectores próprios tem-se x0 = Ax ⇔ P y 0 = AP y ⇔ y 0 = P −1 AP y ⇔ y0 = diag [λ1 , ..., λn ] y com solução (com respeito a y) y (t) = Λ (t) y0 . Logo a solução com respeito a x é x (t) = P y (t) = P Λ (t) y0 = P Λ (t) P −1 x0 (y (0) = P −1 x (0)) que é exactamente a expressão (4.4) com t0 = 0. Exemplo 35 Considere-se o PVI x0 = Ax, x (0) = x0 onde A= 1 2 3 2 x0 = , 1 4 Obtenha-se a solução do PVI. Os valores próprios são λ1 = −1 e λ2 = 4. Um vector próprio associado ao valor próprio −1 é v1 = 1 −1 e um vector próprio associado ao valor próprio 4 é v2 = 2 3 . . A solução geral pode-se escrever na forma x (t) = = x1 (t) x2 (t) = c1 eλ1 t v1 + c2 eλ2 t v2 = c1 e−t c1 e−t + c2 2e4t −c1 e−t + c2 3e4t . 90 1 −1 + c2 e4t 2 3 Com a condição inicial x (0) = c1 + 2c2 −c1 + 3c2 = resulta c1 = −1 e c2 = 1. A solução do PVI é portanto x (t) = x1 (t) x2 (t) = 1 4 −e−t + 2e4t e−t + 3e4t . Naturalmente, também se pode chegar a este resultado aplicando a fórmula (4.4) x (t) = P Λ (t) P −1 x0 −1 1 2 1 1 2 e−t 0 = 0 e4t −1 3 4 −1 3 −e−t + 2e4t . = e−t + 3e4t Valores Próprios Complexos Comecemos por analisar um dos valor próprios da matriz A do tipo λ = α + βi com vector próprio v = u + iw. Invocando o lema 12 tem-se que eλt v = eλt (u + iw) é uma solução do SED x0 = Ax. Relativamente ao conjugado de λ, o lema seguinte estabelece que Lema 13 O valor próprio conjugado de λ = α + βi, λ̄ = α − βi, tem como vector próprio o conjugado de v, v̄. Dem. Por hipótese Av = λv. Tomando os conjugados em ambos os termos da equação e, dado que A é uma matriz real, vem Av̄ = λ̄v̄.¥ Mostramos agora que a partir da solução eλt v = eλt (u + iw) se extraem duas soluções reais linearmente independentes. Como se sabe, se z = α + βi ∈ C então ez = eα eβi = eα (cos β + i sen β). 91 Assim, podemos expressar a solução complexa da seguinte forma x = eλt v = e(α+βi)t (u + iw) = eαt (cos βt + i sen βt) (u + iw) = eαt [(u cos βt − w sen βt) + i (u sen βt + w cos βt)] = x1 + ix2 onde x1 = eαt (u cos βt − w sen βt) , x2 = eαt (u sen βt + w cos βt) . (4.5) O lema seguinte estabelece que estas expressões são soluções reais linearmente independentes de x0 = Ax. Lema 14 Seja x = eλt v = e(α+βi)t (u + iw) = x1 +ix2 uma solução complexa do SED x0 = Ax. Então x1 e x2 são soluções reais linearmente independentes. Dem. Por hipótese x0 = Ax. Vem ¢ ¡ ¢0 ¡ ¢0 ¡ x0 = x1 + i x2 = A x1 + ix2 = Ax1 + iAx2 . ¡ ¢0 ¡ ¢0 Igualando os termos reais e imaginários resulta x1 = Ax1 e x2 = Ax2 . Mostre-se agora que x1 e x2 são linearmente independentes. Segue-se agora em diagrama: valores próprios λ e λ̄ são distintos ⇒ v = (u + iw) e v̄ = (u − iw) são linearmente independentes em C ⇒ u, w são linearmente independentes ⇒ x1 , x2 são linearmente independentes. ¯ ¯ ¯ ¯ A segunda implicação decorre do seguinte. Por hipótese, o determinante ¯ v v̄ ¯ é diferente de zero. Assim, pelas propriedades dos determinantes 92 ¯ ¯ ¯ ¯ ¯ ¯ = v v̄ ¯ ¯ u + iw u − iw ¯ ¯ ¯ ¯ ¯ ¯ ¯ + ¯ ¯ iw u − iw ¯ u u − iw ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ u u ¯ + ¯ u −iw ¯ + ¯ iw u ¯ + ¯ iw −iw ¯ ¯ ¯ ¯ ¯ ¯ ¯ u −iw ¯ + ¯ iw u ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ = − ¯ u iw ¯ − ¯ u iw ¯ ¯ ¯ ¯ ¯ = −2 ¯ u iw ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ = −2i ¯ u w ¯ 6= 0 ⇒ ¯ u w ¯ 6= 0 ⇒ u e w são linearmente independentes ¯ ¯ 0 6= ¯ ¯ ¯ = ¯ ¯ ¯ = ¯ ¯ ¯ = ¯ A última relação explica-se nos seguintes termos. Considere-se [ver expressão (4.5)] x1 = eαt (u cos βt − w sen βt) , x2 = eαt (u sen βt + w cos βt) . Os vectores x1 (t) e x2 (t) são independentes sse a relação θ1 x1 (t) + θ2 x2 (t) = 0 implica θ1 = θ2 = 0 para qualquer t. Pelo lema 5 basta verificar se θ1 x1 (0) + θ2 x2 (0) = 0 implica θ1 = θ2 = 0. Ora θ1 x1 (0) + θ2 x2 (0) = θ1 u + θ2 w = 0 ⇒ θ1 = θ2 = 0 dado que u e w são linearmente independentes.¥ Observação 13 As soluções reais que se obtêm a partir de eλ̄t v̄ são as soluções reais que se obtêm a partir de eλt v. Com efeito, pelo lema 13, a solução complexa associada ao valor própio λ̄ vira, x = eλ̄t v̄ = e(α−βi)t (u − iw) = eαt (cos (−βt) + i sen (−βt)) (u − iw) = eαt [(u cos (−βt) + w sen (−βt)) + i (u sen (−βt) − w cos (−βt))] = z 1 + iz 2 onde z 1 = eαt (u cos (−βt) + w sen (−βt)) e z 2 = eαt (u sen (−βt) − w cos (−βt)) . Como sen (−θ) = − sen θ e cos (−θ) = cos θ é fácil ver que z 1 = x1 e z 2 = x2 . Como resultado, quando se procuram os vectores u e w basta considerar apenas λ ou λ̄. 93 Exemplo 36 Obtenha-se a solução geral do SED x0 = Ax onde 1 0 0 A = 0 1 −1 . 0 1 1 Passo 1: Determinar os valores próprios de A. O polinómio característico de A é ¡ ¢ P (λ) = |A − λI| = (1 − λ) λ2 − 2λ + 2 . Resolvendo P (λ) = 0 sai, λ = 1 e λ = 1 ± i. Passo 2: Determinar os vectores próprios associados a cada um dos valores próprios. (i) Vector próprio associado a λ = 1. Trata-se de obter um vector não nulo v tal que (A − I) v = 0. Depois de algumas contas, conclui-se que qualquer vector do tipo 1 v = c 0 , 0 c∈R é um vector próprio associado a λ1 = 1. Assim, uma solução do SED é 1 x1 = c1 et 0 . 0 (ii) Vector próprio associado a λ = 1 + i. Trata-se de determinar um vector v não nulo tal que −i [A − (1 + i) I] v = 0 0 0 0 v1 0 −i −1 v2 = 0 . 1 −i v3 0 94 Resulta (depois de algumas contas) que o vector próprio é 0 0 0 v = i = 0 + i 1 . 1 1 0 | {z } | {z } u w Atendendo à equação (4.5) têm-se com α = 1 e β = 1 0 x2 = eαt (u cos βt − w sen βt) = et 0 cos t − 1 0 x3 = eαt (u sen βt + w cos βt) = et 0 sen t + 1 0 t 1 sen t = e 0 0 t = e cos t 1 0 0 − sen t cos t 0 cos t . sen t x2 e x3 são soluções reais linearmente independentes. Passo 3: A solução geral é 1 0 x = c1 et 0 + c2 et − sen t 0 cos t 0 c1 et + c3 et cos t = −c2 et sen t + c3 et cos t sen t c2 et cos t + c3 et sen t Como observação final note-se que et Φ (t) = 0 0 0 0 −et sen t et cos t et cos t et sen t 95 . é uma MFS e (pelo lema 10, p. 86) et eAt = Φ (t) Φ (0)−1 = 0 0 0 0 1 0 0 −1 −et sen t et cos t 0 0 1 0 1 0 et cos t et sen t et = 0 0 0 0 et cos t −et sen t . et sen t et cos t Suponha-se agora que existem 2n valores próprios complexos distintos (naturalmente a matriz A é de tipo 2n × 2n). Para o valor próprio genérico λj = αj + β j i vimos que duas soluções linearmente independentes são ¢ ¢ i ¡ ¡ eαj t uj sen β j t + wj cos β j t eαj t uj cos β j t − wj sen β j t h i eαj t cos β t −eαj t sen β t j j = . wj uj α t α t e j sen β j t e j cos β j t h Repetindo o procedimento para os restantes valores próprios obtém-se a matriz fundamental Φ (t) = h w1 u1 · · · = P Q (t) wn eα1 t cos β 1 t −eα1 t sen β 1 t · · · α1 t e sen β 1 t i .. un . 0 0 eα1 t cos β .. . 1t ··· .. . 0 0 0 0 0 0 0 0 0 0 α t α t n n e cos β n t −e sen β n t α t α t n 1 e sen β n t e cos β n t Resulta agora eAt = Φ (t) Φ (0)−1 = P Q (t) P −1 e assim a solução do PVI x0 = Ax, x (t0 ) = x0 (quando todos os valores próprios são complexos e distintos) é x (t) = P Q (t − t0 ) P −1 x0 . 96 Valores Próprio Iguais Comecemos com um exemplo. Seja 1 1 0 A = 0 1 0 . 0 0 2 Os valores próprios são 1 (multiplicidade algébrica 2) e 2. Os vectores próprios associados a λ = 1 resultam do sistema (A − I) v = 0, 0 1 0 0 0 0 0 0 1 v1 0 v =0 2 v2 = 0 ⇔ 0=0 v =0 0 v3 3 com v1 ∈ R. O sistema tem um grau de indeterminação e, portanto, a dimensão do subespaço próprio associado a λ = 1 é de apenas um: é possível apenas extrair um vector próprio linearmente independente. Por outras palavras, a multiplicidade geométrica do valor próprio (igual ao grau de indeterminação do sistema homogéneo) é inferior à multiplicidade algébrica. Nestas condições a matriz A possui apenas 2 vectores próprios linearmente independentes2 . A questão que nos interessa abordar é a seguinte: suponha-se que uma matriz A de tipo n×n tem apenas k < n vectores próprios linearmente independentes. Então o SED x0 = Ax tem k soluções linearmente independentes da forma eλt v. O problema consiste então em encontrar as restantes n − k soluções linearmente independentes, para que se forme uma base do espaço das soluções de dimensão n. Considere-se assim um valor próprio λ com multiplicidade algébrica superior à respectiva multiplicidade geométrica (para simplificar suponha-se, sem perda de generalidade, que esta multiplicidade é igual a um). Associado a λ existe um vector v1 tal que (A − λI) v1 = 0. Uma solução do SED é eAt v1 = eλt v1 . Para encontrarmos as outras soluções independentes do 2 Pode suceder que um certo valor próprio tenha multiplicidade algébrica superior a um (portanto temos o caso de valores próprios iguais) e existam ainda assim n vectores próprios linearmente independentes. Isto sucede se as multiplicidades algébricas associados aos vários valores próprios coincidirem com as respectivas multiplicidades geométricas. 97 SED determinamos vectores próprios generalizados. Seja v2 um vector de tipo n × 1 tal que (A − λI)2 v2 = 0 e (A − λI) v2 6= 0. Sabe-se a prior que eAt v2 é solução do SED (qualquer ex- pressão do tipo eAt v é solução do SED). Invocando o lema 11, p. 87, pode-se escrever a expressão eAt v2 na forma simplificada, eAt v2 = eλt (v2 + t (A − λI) v2 ) (atendendo a (A − λI)2 v2 = 0 e (A − λI) v2 6= 0). Esta solução é independente da primeira solução3 . Se o número de soluções independentes é ainda inferior à multiplicidade algébrica, continua-se o procedimento, determinando outro vector próprio generalizado. Neste caso, seja v3 tal que (A − λI)3 v3 = 0 e (A − λI)2 v3 6= 0. Naturalmente eAt v3 é também solução do SED e, de acordo com o lema ³ ´ 2 11, eAt v3 escreve-se na forma eAt v3 = eλt v3 + t (A − λI) v3 + t2 (A − λI)2 v3 . Esta solução é independente das duas primeiras. O procedimento repete-se até se obter um número de soluções linearmente independentes igual à multiplicidade algébrica. A obtenção de eAt simplifica-se no caso em que λ é valor próprio de multiplicidade algébrica n. Com efeito, eAt = eÃλIt e(A−λI)t !µ ¶ t2 (λt)2 2 I + ... I + t (A − λI) + (A − λI) + ... = I + λtI + 2 2! µ ¶ tk t2 2 k λt = e I + t (A − λI) + (A − λI) + ... + (A − λI) 2! k! = B (t) . 3 (4.6) (4.7) Note-se que θ1 v1 + θ2 v2 = 0 implica θ1 = θ2 = 0. Com efeito, pré multiplique-se ambos os termos da equação θ1 v1 + θ2 v2 = 0 por (A − λI) . Vem θ1 (A − λI) v1 + θ2 (A − λI) v2 = 0. Como (A − λI) v1 = 0 e (A − λI) v2 6= 0 resulta imediato que θ2 = 0. Assumindo θ2 = 0 na equação θ1 v1 + θ2 v2 = 0, i.e., θ1 v1 = 0, conclui-se que θ1 = 0 pois v1 6= 0. Em suma, v1 e v2 são linearmente independentes e, como consequência, as solução eAt v1 e eAt v2 são linearmente independentes (verifique). 98 com k < n. Note-se que (A − λI)n+i = 0, i = 0, 1, 2, ... devido ao lema de Cayley-Hamilton4,5 . Nestas circunstâncias, a solução do PVI x0 = Ax, x (t0 ) = x0 , no caso em que λ é valor próprio de multiplicidade algébrica n, é x (t) = eA(t−t0 ) x0 = B (t − t0 ) x0 . (4.8) Exemplo 37 Obtenha-se a solução geral do SED x0 = Ax onde 1 1 0 A= 0 1 0 0 0 2 . Passo 1: Determinar os valores próprios de A. Resolvendo P (λ) = 0 sai, λ = 1 (multiplicidade algébrica 2) e λ = 2. Passo 2: Determinar os vectores próprios associados a cada um dos valores próprios. (i) Vector(es) próprio(s) associado(s) a λ = 1. Trata-se de obter um vector não nulo v1 tal que 0 1 0 (A − I) v1 = 0 0 0 0 0 1 z1 0 z2 = 0 . z3 0 | {z } v1 4 Lema de Cayley-Hamilton: Seja A uma matriz quadrada e p (λ) = |A − λI| = 0 a respectiva equação característica. Então p (A) = 0. Por exemplo, no caso A= 1 3 2 4 a equação característica é p (λ) = |A − λI| = λ2 − 5λ − 2 = 0. Pelo lema de Cayley-Hamilton vem p (A) = A2 − 5A − 2I = 7 15 10 22 − 5 15 10 20 − 2 0 0 2 0 0 = 0 0 . Outro exemplo: suponha-se que o valor próprio 3 tem multiplicidade n, i.e., p (λ) = (λ − 3)n = 0 então p (A) = (A − 3I)n = 0. Note-se que, se λ não tem multiplicidade algébrica n, então a equação (4.7) não é válida. Claro que a equação (4.6) permanece válida. 5 Outra forma de se obter eAt = B (t) é a seguinte: eAt P = B (t) v1 B (t) v2 ··· B (t) vn = B (t) v1 v2 ··· vn = B (t) P, onde P é a matriz dos vectores próprios generalizados, com |P | 6= 0. Logo eAt = B (t) P P −1 = B (t) . 99 Este sistema implica z2 = z3 = 0 e, portanto, 1 v1 = 0 0 é um vector próprio associado a λ1 = 1. Assim, uma solução do SED é 1 x1 (t) = et 0 . 0 Não é possível determinar outro vector próprio independente pois a multiplicidade geométrica de λ = 1 é um (igual ao grau de indeterminação do sistema homogéneo). Procura-se agora um vector v2 tal que 0 1 0 0 1 0 (A − I) v2 = 0 0 0 0 0 0 0 0 1 0 0 1 2 0 0 0 z 1 z2 = 0 0 0 z3 0 0 1 | {z } v2 0 z 1 z2 = 0 . z3 0 Este sistema implica que z3 = 0. Escolha-se por exemplo o vector 0 v2 = 1 . 0 Naturalmente para este vector v2 tem-se (A − I)2 v2 = 0 e (A − I) v2 6= 0. Pelo lema 11 segue-se que 0 0 0 t x2 (t) = eAt 1 = et e(A−I)t 1 = et [I + t (A − I)] 1 = ... = et 1 0 0 0 0 100 é uma segunda solução linearmente independente. (ii) Vector próprio associado a λ = 2. Depois de algumas contas conclui-se que 0 0 x3 (t) = e2t 0 1 é outra solução independente. Passo 3: A solução geral é 1 t x = c1 et 0 + c2 et 1 + c3 e2t 0 = 0 0 1 c1 et + c2 et t c2 et c3 e2t . Como nota final, observe-se que et tet eAt = 0 0 et 0 0 0 . 2t e Exemplo 38 Obtenha-se a solução do PVI x0 = Ax, x (0) = (0, 1, 1)T onde 2 1 0 A= 0 2 1 0 0 2 . O valor próprio 2 tem multiplicidade 3. Podemos usar a fórmula (4.8). Veja-se em primeiro lugar que 0 1 0 A − 2I = 0 0 1 , 0 0 0 0 0 1 (A − 2I) = 0 0 0 , 0 0 0 2 101 0 0 0 (A − 2I) = 0 0 0 . 0 0 0 3 Considerando (4.8) vem µ ¶ t2 2 x (t) = e I + t (A − 2I) + (A − 2I) x0 = 0 2! 0 2t 1 2t 2 2e t e2t e2t t e2t e2t t 0 e2t 0 1 = 1 e2t t + 12 e2t t2 e2t + e2t t e2t Solução Geral no Caso n = 2 No caso de sistemas de duas equações (A é quadrada de ordem 2) a solução geral do SED x0 = Ax pode apresentar-se nas seguintes formas: Caso 1: Valores Próprios Reais e λ1 6= λ2 x (t) = c1 eλ1 t v1 + c2 eλ2 t v2 , c1 , c2 ∈ R (4.9) onde v1 e v2 são vectores próprios associados aos valores próprios λ1 e λ2 . Caso 2: Valores Próprios Complexos (conjugados) x (t) = c1 eαt (u cos βt − w sen βt) + c2 eαt (u sen βt + w cos βt) , c1 , c2 ∈ R (4.10) onde u + iw é vector próprio associado ao valor próprio λ = α + βi. Caso 3: Valores Próprios Reais Iguais λ1 , λ2 = λ x (t) = c1 eλt v1 + c2 eλt (I + t (A − λI)) v2 , c1 , c2 ∈ R (4.11) onde v1 é vector próprio associado a λ e v2 é vector próprio generalizado associado a λ (se λ tem multiplicidade geométrica igual a 2 a solução é x (t) = c1 eλt v1 + c2 eλt v2 ). A solução neste caso 3 pode apresentar-se na forma da equação (4.8): x (t) = eλt (I + t (A − λI)) c1 c2 que tem a vantagem de dispensar o cálculo dos vectores próprios. 102 (4.12) 4.3 Sistema de Equações Diferenciais Não Homogéneas Consideramos agora o caso x0 = Ax + g (t) (ver o ponto 4.1, p. 76). Teorema 14 Considere-se o PVI x0 = Ax + g (t) , x (t0 ) = x0 onde g (t) é função contínua em I (eventualmente I = R). Então a solução do PVI em I é A(t−t0 ) x (t) = e x0 + Z t eA(t−s) g (s) ds. (4.13) t0 Dem. (A demonstração é similar à demonstração do teorema 1, p. 19) Multipliquemos ambos os termos do SED x0 = Ax + g (t) por e−At . Vem e−At x0 (t) = e−At Ax (t) + e−At g (t) i.e. e−At x0 (t) − Ae−At x (t) = e−At g (t) (notando que e−At A = Ae−At ) ou ¡ ¢0 e−At x (t) = e−At g (t) . Integrando ambos os termos desta equação entre t0 e t obtém-se −At e −At0 x (t) − e x (t0 ) = Z t e−As g (s) ds t0 ou, ainda, depois de se pré-multiplicar ambos os termos da equação anterior por eAt A(t−t0 ) x (t) = e x0 + Z t t0 103 eA(t−s) g (s) ds. Provámos que qualquer solução x (t) tem a forma (4.13). Reciprocamente, qualquer função da forma (4.13) é solução de x0 = Ax + g (t) . Com efeito, µ ¶0 Z t A(t−t0 ) A(t−s) e x0 + e g (s) ds x (t) = 0 t0 ¶0 Z t ´0 µ ³ A(t−t0 ) At −As = e x0 + e e g (s) ds t0 µZ t ¶0 ³ ´0 ¡ ¢0 Z t A(t−t0 ) At −As At −As = e x0 + e e g (s) ds + e e g (s) ds Z t0 t0 t = AeA(t−t0 ) x0 + AeAt e−As g (s) ds + eAt e−At g (t) t0 µ ¶ Z t A(t−t0 ) At −As = A e x0 + e e g (s) ds + g (t) t0 = Ax (t) + g (t) . Falta verificar que para t = t0 se tem x (t0 ) = eA(t0 −t0 ) x0 + R t0 t0 eA(t−s) g (s) ds = x0 .¥ Exemplo 39 Resolva-se o PVI x01 et 0 x 1 1 0 1 0 x2 = 0 1 0 x2 + 0 , 0 0 0 2 x3 x3 0 No exemplo 37 estabelecemos At e et tet = 0 0 et 0 104 0 . 2t e 0 x (0) = 0 1 Aplicando a fórmula (4.13) para t0 = 0 Z t eA(t−s) g (s) ds x (t) = eAt x0 + 0 t t 0 e te 0 Z t = 0 et 0 0 + 0 1 0 0 e2t R t t 0 et t e ds 0 = 0 + = 0 0 2t e 0 e2t et−s (t − s) e(t−s) 0 0 0 e(t−s) 0 0 e2(t−s) es 0 ds 0 . É possível simplificar a calculatória propondo uma solução particular ψ (t) para o SED não homogéneo. Concretamente, suponha-se que ψ (t) (solução particular) satisfaz x0 = Ax + g (t) e φ (t) é solução geral de x0 = Ax. Então a solução geral do SED não homogéneo vem x (t) = φ (t) + ψ (t) . Com efeito, x0 (t) = φ0 (t) + ψ 0 (t) = Aφ (t) + Aψ (t) + g (t) = A (φ (t) + ψ (t)) + g (t) = Ax (t) + g (t) . Exemplo 40 Considere-se o SED x0 = Ax + g (t) onde 1 0 0 A = 2 1 −2 , 3 2 1 ect g (t) = 0 , c 6= 1. 0 Para ψ (t) propomos uma função similar a g (t) , ψ (t) = bect onde b é um vector de tipo 3 × 1 cujos elementos devemos determinar. Como exigimos que ψ (t) seja solução particular, i.e., ψ 105 tal que ψ 0 = Aψ + g (t), o vector b obtém-se da resolução da equação matricial ψ 0 = Aψ + g (t) , i.e. 1 1 cbect = Abect + 0 ect 0 ou (cI − A) b = 0 . 0 Isto implica 1 −1 b = (cI − A)−1 0 = 1−c 0 Como At e 1 2(c−4) 4+(1−c)2 1+3c 4+(1−c)2 . et 0 0 t = e sen 2t + 32 et cos 2t − 32 et et cos 2t −et sen 2t 3 t t t et sen 2t et cos 2t 2 e sen 2t − e cos 2t + e (verifique!), a solução geral é c1 x (t) = φ (t) + ψ (t) = eAt c2 + ψ (t) c3 1 c1 −1 2(c−4) ct = eAt c2 + 4+(1−c)2 e . 1−c 1+3c c3 4+(1−c)2 106 Exercícios 1. Mostre que eAt+Bt = eAt eBt se AB = BA. Para o efeito mostre sucessivamente que (a) Y (t) = eAt+Bt satisfaz o PVI Y 0 (t) = (A + B) Y (t) , Y (0) = I, (b) eAt B = BeAt se AB = BA e, nestas circunstâncias, Z (t) = eAt eBt é solução do PVI Z 0 (t) = (A + B) Z (t) , Z (0) = I. Conclua Y (t) ≡ Z (t) . 2. Seja A uma matriz idempotente (A2 = A). Calcule eAt . 3. Seja Φ1 (t) uma matriz fundamental de soluções do SED x0 = Ax. Mostre que Φ2 (t) = Φ1 (t) C é uma matriz fundamental de soluções sse |C| 6= 0. 4. Mostre que eT −1 AT = T −1 eA T. 5. Considere o SED x0 = Ax onde A= (a) Verifique que 1 1 0 2 Φ (t) = é uma matriz fundamental de soluções. . et e2t 0 e2t (b) Calcule eAt . 6. Seja A uma matriz de tipo 2 × 2 de traço nulo e determinante positivo. (a) Mostre que A2 = − |A| I (I é a matriz identidade). Sugestão: tenha em conta que tr (A) = 0 ⇒ a11 + a22 = 0. (b) Mostre que ³p ´ ³p ´ A sen |A|t + cos |A|t I. eAt = p |A| Sugestão: (i) Considere a definição de eAt = I + A2 t2 /2! + A3 t3 /3! + ...; (ii) Calcule A3 , A4 , etc. a partir da relação A2 = − |A| I e (iii) considere os desenvolvimentos em série sen (x) = x − x3 /3! + x5 /5! − ... e cos (x) = 1 − x2 /2! + x4 /4! − ... 107 (c) Usando a alínea anterior determine a solução do PVI x0 = Ax, x (0) = (1, 2)T onde A= 2 4 −2 −2 . 7. Considere a ED linear de segunda ordem y00 = a1 y0 + a0 y. Determine a1 e a0 sabendo que uma solução da ED é y (t) = cos (2t) + 12 sen (2t) . 8. Obtenha a solução geral da ED y 000 = 2y 00 − 2y0 . 9. Suponha que A = S + N onde S = diag [a1 , ..., an ], N (de tipo n × n) é uma matriz nilpotente de ordem k (i.e., N k−1 6= 0 e N k = 0) e SN = N S. Mostre que ¶ µ £ ¤ N k−1 tk−1 N 2 t2 + ... + . eAt = diag ea1 t , ..., ean t I + N t + 2! (k − 1)! Como aplicação obtenha eAt onde 1 0 0 A= 0 2 1 0 0 2 . Confirme o resultado através de um procedimento expedito. 10. (Exame) Seja Φ1 (t) uma matriz fundamental do sistema de equações diferenciais x0 = Ax e Φ2 (t) uma matriz fundamental do sistema de equações diferenciais y0 = By. Sabendo que AB = BA obtenha a solução do PVI z 0 = (A + B) z, z (0) = z0 (como função de Φ1 e Φ2 ). 11. (Exame) Sejam A e B matrizes quadradas de ordem n > 1. Suponha que • λ é valor próprio de A e v é um vector próprio de A associado a λ; • θ é valor próprio de B e v é um vector próprio de B associado a θ. Mostre que φ (t) = e(λ+θ)t v é uma solução do sistema de equações diferenciais x0 = (A + B) x. 108 12. Resolva os seguintes PVI x0 = Ax, x (0) = x0 : 1 e−t 1 2 , x0 = Solução: (a) A = −t −1 1 0 −e −1 −1 −1 −1 , x0 = (b) A = Solução: −1 −1 1 1 1 et cos 2t 1 2 , x0 = Solução: (c) A = −et sen 2t 0 −2 1 1 −1 1 et − tet , x0 = (d) A = Solução: t e 0 1 1 13. Resolva os seguintes SED x0 = Ax para −2t −e −1 1 0 0 +1 Solução: 1 + e−2t (a) A = 1 −1 0 , x0 = 2 −4t 0 0 −4 1 e −2 −3 0 e−2t cos 3t 1 (b) A = 3 −2 0 , x0 = 0 Solução: e−2t sen 3t 0 0 −4 1 e−4t e2t − et 2 0 1 0 t t Solução: e − te (c) A = 0 1 −1 , x0 = 1 t 0 0 1 1 e 1 0 1 tet 0 (d) A = 0 1 −1 , x0 = 1 Solução: et − tet t 0 0 1 e 1 et − tet + t2 et 1 −2 1 1 Solução: (e) A = 0 1 −1 , x0 = 1 et − tet 0 0 1 1 et 109 14. Especifique as condições que a função b (t) deve verificar para que todas as soluções da ED y00 = −y 0 + b (t) sejam limitadas em t ∈ [0, ∞) . 15. Considere o PVI x0 = Ax + b, x (0) = x0 onde b é um vector de constantes de tipo n × 1. ¡ ¢ (a) Mostre que a solução do PVI é x (t) = eAt x0 + eAt − I A−1 b. (b) Determine a solução para o caso A= 1 0 10 −4 , b= 0 1 , x (0) = 1 0 16. Resolva o PVI x0 = Ax + g (t) , x (0) = x0 onde A= 1 0 0 2 , g (t) = e4t e−2t , x0 = 110 1 1 Solução: 2 t 3e 1 4t 3e + ¡ ¢ 2t 1 2t −4t e −4 e −1 e Capítulo 5 Estabilidade Até agora centramos o nosso estudo em duas grandes áreas: análise da existência e unicidade das soluções e resolução de equações e sistemas de ED. Uma área de enorme importância é a análise da estabilidade das soluções de ED. Basicamente procura-se extrair informação qualitativa sobre as soluções quando t → +∞. Poderão interessar aspectos como, o limt→+∞ x (t) (previsão a longo prazo), o comportamento de x (t) quando a condição inicial é alterada, a periodicidade da solução, o conjunto de pontos iniciais tais que x (t) converge, etc. **Incompleto** 5.1 Definições Seja x (t) a solução única do PVI x0 = f (t, x) , x (t0 ) = x0 (x é de tipo n × 1). A solução pode também escrever-se na forma x (t) = x (t, t0 , x0 ) , o que evidencia a dependência da solução face aos argumentos t0 e x0 . Em certos casos pode-se ainda escrever a solução na forma x (t) = x (t, t0 , x0 , θ) onde θ é um parâmetro (ou um vector de parâmetros) não especificado (i.e. não é concretizado com um valor). Por exemplo, o PVI x0 = θx, x (t0 ) = x0 , θ ∈ R tem por solução a expressão x0 eθ(t−t0 ) . Para evidenciar a dependência da solução face aos parâmetros t, t0 , x0 e θ podemos escrever x (t, t0 , x0 , θ) = x0 eθ(t−t0 ) . Também a função f pode escrever-se na forma f (t, x, θ) . Sob certas condições pode-se garantir a continuidade da solução com respeito aos parâmetros t0 , x0 e θ. Nestas condições, pequenas alterações nos dados iniciais (t0 e x0 ) ou no parâmetro θ não causam desvios significativos na solução. Este resultado é particularmente 111 significativo em aplicações económicas quando existem erros de observação nos parâmetros t0 , x0 e θ 1 . Se a solução é contínua com respeito a esses valores, então pequenos erros na estimação de t0 , x0 e θ não causam desvios significativos nos resultados do modelo. O teorema seguinte estabelece as condições. Teorema 15 (Continuidade da Solução com respeito a t0 , x0 e θ) Assuma-se: (1) f (t, x, θ) é contínua com respeito a t, x e θ num conjunto compacto D; (2) f satisfaz a condição de Lipschitz com respeito a x no conjunto D. Então a solução x (t, t0 , x0 , θ) do PVI x0 = f (t, x, θ) , x (t0 ) = x0 é contínua nos argumentos t, t0 , x0 e θ no conjunto D. Assuma-se adicionalmente que (3) ∂f/∂x existe e é contínua em D. Então a solução é contínua e diferenciável com respeito a x0 . Dem. Ver Coddington e Levinson (1955, pp. 25-28).¥ A estabilidade (que se analisa adiante) difere da questão da continuidade da solução com respeito a t0 , x0 e θ. No estudo da estabilidade investiga-se o que sucede com uma solução para valores grandes de t, nomeadamente quando t → +∞, quando se impõe uma pequena variação no valor inicial. Considere-se o PVI x0 = f (t, x) , x (t0 ) = x0 com solução x (t) = x (t, t0 , x0 ) . Utilizaremos também a notação x̃ (t) = x (t, t0 , x̃0 ) para designar a solução do PVI x0 = f (t, x) , x (t0 ) = x̃0 . Definição 12 (Solução Estável, Assintoticamente Estável e Instável) A solução x̃ (t) = x (t, t0 , x̃0 ) diz-se estável se para cada ε > 0 existe um δ = δ (t0 , ε) tal que, para cada qualquer solução x (t) = x (t, t0 , x0 ) a desigualdade kx0 − x̃0 k ≤ δ implica2 kx (t) − x̃ (t)k < ε para todo o t ≥ t0 . A solução x̃ (t) = x (t, t0 , x̃0 ) diz-se assimptoticamente estável se é estável e se existe um δ 0 > 0 tal que a desigualdade kx0 − x̃0 k ≤ δ 0 implica kx (t) − x̃ (t)k → 0 quando t → +∞. A solução x̃ (t) = x (t, t0 , x̃0 ) diz-se instável se não é estável. 1 Um dos problemas maiores da inferência estatística em processos de difusão governados por equações diferenciais estocásticas trata do problema da estimação de θ. 2 Note-se que kxk é a norma do vector x. Exemplos de normas: sup |xi | , i i |xi | , No caso univariado a norma corresponde ao módulo habitual. 112 x2i . i Figura 5-1: Solução φ (t, t0 , x0 ) Estável Na figura 5-1 ilustra-se o conceito de estabilidade. Fixe-se um ε positivo. Se a solução é estável é sempre possível encontrar um δ > 0 tal que kx0 − x̃0 k ≤ δ implica kx (t) − x̃ (t)k < ε (por mais pequeno que seja ε > 0). Por outras palavras, pequenos desvios na condição inicial não afectam significativamente o comportamento futuro da solução. Exemplo 41 Suponhamos que a população de uma certa espécie evolui de acordo com o modelo x0 = f (t, x). Num dado momento, há uma perturbação no meio (por exemplo, introdução de novos elementos na população) que faz alterar subitamente o valor da população para x̃0 . Situemos este momento em t0 . Na ausência deste choque externo, o valor da população em t0 seria de x0 e a sua trajectória futura seguiria a fórmula x (t, t0 , x0 ), t ≥ t0 . No entanto, devido à perturbação, o comportamento da população passará a seguir a fórmula x (t, t0 , x̃0 ) (solução do PVI x0 = f (t, x) , x (t0 ) = x̃0 ). Se a solução é estável, o choque externo (supondo pequeno) não irá alterar significativamente a trajectória da população, pois, supondo |x0 − x̃0 | relativamente ”pequeno” implica |x (t, t0 , x0 ) − x (t, t0 , x̃0 )| igualmente ”pequeno”. Se a solução é assimptoticamente estável devemos mesmo esperar que |x (t, t0 , x0 ) − x (t, t0 , x̃0 )| → 0 quando t → +∞ (o efeito do choque é diluído ao longo do tempo e desaparece assimptoticamente). Pelo contrário, se a solução é instável, pequenas alterações das condições iniciais (ou pequenos choques) afectam, para todo o sempre, o comportamento da solução e o comportamento da população tenderia a desviar-se cada vez mais da solução x (t, t0 , x0 ) . A figura 5-2 ilustra os 113 três casos. Exemplo 42 A solução constante x̃ (t) = x (t, 0, 2) = 2 do PVI x0 = 0, x (0) = 2 é estável mas não assimptoticamente estável. Com efeito, atendendo a |x (t) − x̃ (t)| = |x0 − 2| ≤ δ < ε, basta tomar, no contexto da definição, um δ tal que 0 < δ < ε. Exemplo 43 A solução x̃ (t) = x (t, 0, 1) = 1e−t do PVI x0 = −x, x (0) = 1 é assimptoticamente estável. Veja-se em primeiro lugar que é estável. Existe um δ tal que |x0 − x̃0 | ≤ δ ⇒ |x (t) − x̃ (t)| < ε para todo o t ≥ t0 . Ora ¯ ¯ |x (t) − x̃ (t)| = ¯x0 e−t − x̃0 e−t ¯ = |x̃0 − 1| e−t ≤ δe−t ≤ δ < ε. Para cada ε > 0 fixado, basta escolher um δ < ε para que a definição de solução estável seja satisfeita. Por outro lado, para qualquer δ 0 verifica-se |x (t) − x̃ (t)| → 0. Exemplo 44 A solução x (t, t0 , x̃0 ) = x̃0 e(t−t0 ) do PVI x0 = x, x (t0 ) = x̃0 é instável. Verifiquese em primeiro lugar que ¯ ¯ ¯ ¯ |x (t) − x̃ (t)| = ¯x0 e(t−t0 ) − x̃0 e(t−t0 ) ¯ = |x0 − x̃0 | e(t−t0 ) . É imediato concluir-se que a solução é instável dado que a expressão |x (t) − x̃ (t)| não é limitada para todo o t ∈ R. Para se concluir que a solução é instável, também se pode verificar que existe um ε, por exemplo ε = 1, tal que, para qualquer δ = δ (t0 , ε) > 0 e |x0 − x̃0 | < δ, tem-se |x (t) − x̃ (t)| = |x0 − x̃0 | e(t−t0 ) > ε = 1 a partir de certo t em diante. Na figura 5-3 representam-se as trajectórias x (t, 0, 3) = 3et e x (t, 0, 10) = 10et . Observe-se que a amplitude |x (t, 0, 10) − x (t, 0, 3)| aumenta com t. Exemplo 45 A solução x (t, 0, x̃0 ) = 1+ x̃0 −cos t−t sen t da ED x0 = −t cos t é estável embora não assimptoticamente estável. De facto, δ < ε ⇒ |x (t, 0, x0 ) − x (t, 0, x̃0 )| = |x0 − x̃0 | < ε. No entanto |x (t, 0, x0 ) − x (t, 0, x̃0 )| não tende para zero quando t → +∞. Na figura 5-4 apresentam-se duas trajectórias x (t, 0, 3) e x (t, 0, 10) . Observe-se que a amplitude é |x (t, 0, 3) − x (t, 0, 10)| é constante. 114 Figura 5-2: Solução Estável, Assintoticamente Estável e Instável (ver exemplo 41) x (t , t0 , ~ x0 ) ~ x0 x (t , t 0 , x0 ) x0 t0 x (t , t0 , ~ x0 ) ~ x0 x (t , t 0 , x0 ) x0 t0 x (t , t0 , ~ x0 ) ~ x0 x0 x (t , t 0 , x0 ) t0 115 Figura 5-3: Trajectórias x (t, 0, 3) = 3et e x (t, 0, 10) = 10et x 60 50 40 30 20 10 0.5 1 1.5 2 t Figura 5-4: Trajectórias x (t, 0, 3) = 1 + 3 − cos t − t sen t e x (t, 0, 10) = 1 + 10 − cos t − t sen t x 60 40 20 0 -20 -40 10 20 30 116 40 50 t Tem particular interesse o estudo da estabilidade da chamada solução de equilíbrio. Definição 13 (Solução de Equilíbrio) Uma solução (ou valor de equilíbrio) é uma solução designada por x̄ que satisfaz a equação f (t, x̄) = 0 para t ≥ 0. É imediato verificar-se que x̄ é solução (de facto x̄0 ≡ 0 e f (t, x̄) ≡ 0). Intuitivamente, se f (t, x̄) ≡ 0 então no ponto x̄ a variação infinitesimal é nula pelo que o sistema no ponto x̄ não se altera (i.e. está em equilíbrio). Exemplo 46 Determine-se o valor de equilíbrio da ED x0 = αx. Trata-se de encontrar x̄ : f (t, x̄) = αx̄ = 0. Obviamente a solução de equilíbrio é x̄ = 0 para qualquer α. Neste caso sabemos que x (t) = ceθt e, em particular |x (t)| → +∞ se θ > 0 e c 6= 0 e x (t) → 0 se θ < 0. Exemplo 47 Determine o valor de equilíbrio do SED x0 = (x1 − 1) (x2 − 1) 1 x0 = (x + 1) (x + 1) . 1 2 2 x̄ é um valor de equilíbrio sse f (t, x̄) = 0, i.e. (x̄1 − 1) (x̄2 − 1) = 0 (x̄ + 1) (x̄ + 1) = 0. 1 2 Trata-se, portanto, de resolver o sistema anterior em ordem a x̄1 e x̄2 . Da primeira equação sai x̄1 = 1 ou x̄2 = 1; da segunda sai x̄1 = −1 ou x̄2 = −1. A solução do sistema é (x̄1 = 1 ∨ x̄2 = 1) ∧ (x̄1 = −1 ∨ x̄2 = −1) , obtendo-se, assim, dois valores de equilíbrio, x̄1 = 1 −1 x̄2 = , −1 1 . Definição 14 (Solução de Equilíbrio Estável, Assintoticamente Estável e Instável) A solução de equilíbrio x̄ diz-se estável se para cada ε > 0 existe um δ = δ (t0 , ε) tal que, para 117 cada qualquer solução x (t) = x (t, t0 , x0 ) a desigualdade kx0 − x̄k ≤ δ implica kx (t) − x̄k < ε para todo o t ≥ t0 . A solução de equilíbrio x̄ diz-se assimptoticamente estável se é estável e se existe um δ 0 > 0 tal que a desigualdade kx0 − x̄k ≤ δ 0 implica kx (t) − x̄k → 0 quando t → +∞. A solução de equilíbrio x̄ diz-se instável se não é estável. Por outras palavras, uma solução de equilíbrio é estável se, qualquer solução inicializada no momento t0 suficientemente perto de x̄, permanece perto de x̄ para todo o t ≥ t0 e assimptoticamente estável se não só é estável como também tende para x̄ quando t → +∞. Observe-se que a definição 14 corresponde à definição 12 onde, nesta última, deve ler-se x̄ em lugar de x̃ (t). Na verdade a solução de equilíbrio pode ser encarada como a solução do PVI x0 = f (t, x) , x (t0 ) = x̄. Observação 14 Para se concluir que uma solução x (t, t0 , x̃0 ) (incluindo a solução de equilíbrio x̄) é instável é suficiente verificar-se que kx (t, t0 , x0 ) − x (t, t0 , x̃0 )k não é limitado para todo o t ou que kx (t, t0 , x0 ) − x (t, t0 , x̃0 )k → k 6= 0 e k não depende de x0 . Exemplo 48 A solução de equilíbrio x̄ = 0 da ED x0 = −x é assimptoticamente estável. Veja-se em primeiro lugar que é estável. Tem-se ¯ ¯ |x (t) − x̄| = ¯x0 e−t ¯ = |x0 | e−t ≤ δe−t ≤ δ < ε. Para cada ε > 0 fixado basta escolher um δ < ε para que a definição de solução de equilíbrio estável seja satisfeita. Por outro lado, para qualquer δ 0 verifica-se |x (t)| → 0. Na figura 5-5 apresentam-se as quatro trajectórias, x (t, 0, −4) , x (t, 0, −3) , x (t, 0, 3) e x (t, 0, 4) (i.e. todas as trajectórias são iniciadas no momento t = 0 mas com valores x0 igual a −4, −3, 3, 4). Exemplo 49 A solução de equilíbrio x̄ = 0 da ED x0 = x é instável. Com efeito, basta verificar que a expressão |x (t) − x̄| = |x0 | e(t−t0 ) não é limitada para todo o t ∈ R. 118 Figura 5-5: Quatro Soluções da ED x0 = −x x 4 2 0 -2 -4 1 2 3 4 5 t Exemplo 50 A solução de equilíbrio x̄ = 0 da ED x0 = −a (t) x onde ¶ µ 12t cos log (t + 1) a (t) = 13 + 12 sen log (t + 1) + t+1 é assimptoticamente estável. Com efeito a solução geral é x (t, 0, x0 ) = x0 e−(13+12 sen log(1+t))t e |x (t, 0, x0 )| ≤ |x0 | e−t (ver exemplo 48). Todos os exemplos fornecidos neste ponto baseiam-se em ED que admitem uma solução fechada. Investigaremos adiante a estabilidade de SED com solução desconhecida. 5.2 Estabilidade de Sistemas Lineares Aborda-se a estabilidade da solução do SED x0 = Ax. Tem particular interesse o estudo da estabilidade da solução de equilíbrio do SED. A(s) solução (soluções) de equilíbrio verificam Ax̄ = 0 e, portanto, pertencem ao núcleo (ou espaço nulo) da matriz A, N (A) = {z ∈ Rn : Az = 0} . 119 Se A tem característica n (nenhum valor próprio é igual a zero) então N (A) = {0} , i.e., a única solução de equilíbrio é x̄ = 0. Caso contrário, N (A) é o espaço próprio correspondente ao valor próprio λ = 0 da matriz A. Em qualquer dos casos, centra-se a análise apenas na solução de equilíbrio x̄ = 0. Teorema 16 Qualquer solução (incluindo a solução de equilíbrio x̄ = 0) do SDE é: (a) assimptoticamente estável se todos os valores próprios tiverem parte real negativa; (b) estável se todos os valores próprios tiverem parte real negativa ou nula e os valores próprios da parte real nula tiverem multiplicidade algébrica igual à multipliciade geométrica; (c) instável se pelo menos um dos valores próprios tiver parte real positiva ou se existir algum valor próprio com parte real nula com multiplicidade algébrica superior à multiplicidade geométrica. Dem. Sem perda de generalidade podemos analisar a estabilidade da solução de equilíbrio x̄ = 0 pois, para sistemas lineares a diferença de duas soluções é ainda uma solução3 . (a) Toda a solução x (t) = (x1 (t) , ..., xn (t))T do SED x0 = Ax é da forma x (t) = eAt x (0) = eAt x0 . Seja φij (t) o elemento ij da matriz eAt e x0 = (x10 , ..., xn0 )T . Então xi (t) = φi1 (t) x10 + ... + φin (t) xn0 . Suponha-se que todos os valores próprios de A têm parte real negativa (por outras palavras, maxi=1,...,n {Re (λi )} < 0). Seja −α1 = maxi=1,...,n {Re (λi )} o valor da parte real mais elevada no conjunto dos valores próprios (por exemplo, se λ1 = −1, λ2 = −2 + 4i, λ3 = −2 − 4i então maxi=1,2,3 {Re (λi )} = −1). Então, existe um K > 0 e α > 0 a verificar −α1 < −α < 0 tal que 3 Analisar a estabilidade da solução x (t, t0 , x̃0 ) corresponde a analisar a estabilidade da solução nula. Com efeito kx (t, t0 , x0 ) − x (t, t0 , x̃0 )k = kx (t, t0 , x0 − x̃0 )k = kx (t, t0 , x0 − x̃0 ) − x̄k = kx (t, t0 , x∗0 ) − x̄k e x∗0 desempenha o mesmo papel que x0 . 120 ¯ ¯ ¯φij (t)¯ ≤ Ke−αt para todo o t ≥ 0. Consequentemente, verifica-se para i = 1, ..., n |xi (t)| = |φi1 (t) x10 + ... + φin (t) xn0 | ≤ Ke−αt |x10 + ... + xn0 | ≤ Ke−αt (|x10 | + ... + |xn0 |) ≤ Ke−αt n max {|x10 | , ..., |xn0 |} = Ke−αt n kx0 k . Assim, kx (t)k ≤ max {|x1 (t)| , ..., |xn (t)|} ≤ nKe−αt kx0 k . Para garantir kx (t)k < ε é suficiente que ocorra kx0 k < ε/ (nK) (t = 0). Nestas condições escolha-se 0 < δ < ε/ (nK) pelo que kx0 k ≤ δ ⇒ kx (t)k < ε. Resulta também, para qualquer valor inicial, que kx (t)k → 0. Em suma, nas condições de (a) a solução de equilíbrio (ou qualquer outra) é assimptoticamente estável. O resto da demonstração pode ver-se em Braun (1993), Cap. 4.¥ Exemplo 51 Considere-se o SED x0 = Ax onde A é uma matriz quadrada de ordem 2 e os seguintes cenários e respectiva solução geral: (C1) λ1 = −1, λ2 = −2. A solução geral é x (t) = c1 e−t v1 + c2 e−2t v2 , c1 , c2 ∈ R onde v1 e v2 são vectores próprios associados aos valores próprios λ1 e λ2 ; (C2) λ1 = −3 ± 2i. A solução geral é x (t) = c1 e−3t (u cos 2t − w sen 2t) + c2 e−3t (u sen 2t + w cos 2t) , c1 , c2 ∈ R onde u+iw é vector próprio associado ao valor próprio λ = α+βi; (C3) λ1 , λ2 = −4. A solução geral é x (t) = c1 e−4t v1 + c2 e−4t (I + t (A − λI)) v2 , 121 c1 , c2 ∈ R onde v1 é vector próprio associado a λ e v2 é vector próprio generalizado associado a λ. Nos cenários (C1), (C2) e (C3) a solução de equilíbrio x̄ = 0 é assimptoticamente estável, pois, em qualquer dos casos, todos os valores próprios têm parte real negativa. Observe-se, que |x (t)| < ε e |x (t)| → 0, em qualquer dos três casos. Considere-se agora (C4) λ1 , λ2 = 0. A solução geral é x (t) = c1 v1 + c2 (I + t (A − λI)) v2 , c1 , c2 ∈ R. A estabilidade depende da multiplicidade geométrica do valor próprio nulo. Se a multiplicidade geométrica de λ = 0 é igual um então é possível obter apenas um vector próprio linearmente independente (v1 ). O vector v2 é vector próprio generalizado, verificando (A − λI) v2 6= 0. Resulta que a solução de equilíbrio é instável. Se a multiplicidade geométrica é igual a dois então é possível obter dois vectores próprios linearmente independentes. Nestas circunstâncias, v2 é vector próprio e (A − λI) v2 = 0. A solução reduz-se agora a x (t) = c1 v1 + c2 v2 . Tratandose de uma solução constante, a solução do PVI com a condição inicial x (0) = x0 , só poderá ser x (t, 0, x0 ) = x0 . Conclui-se imediatamente que a solução é estável, pois, para garantir kx (t, 0, x0 ) − x̄k = kx0 k < ε basta tomar um 0 < δ < ε nos termos da definição 14. Exemplo 52 Considere-se o SED x0 = Ax onde 0 0 1 A = 0 −1 0 0 0 0 . É imediato verificar que os valores próprios são λ1 = 0, λ2 = 0 e λ3 = −1. A multiplicidade algébrica do valor próprio nulo é dois e a multiplicidade geométrica é apenas 1, i.e., existe apenas um vector próprio linearmente independente associado ao valor próprio nulo (verifique!). Pelo teorema 16 a solução de equilíbrio (ou qualquer outra) é instável. Verifique-se, pela definição, que a solução é efectivamente instável. Para o efeito determine-se a solução x (t) = x (t, 0, x0 ) = 122 eAt x0 . Deixa-se como exercício verificar que At e Assim, 1 0 1 0 t = 0 e−t 0 . 0 0 1 t x10 x (t) = 0 e−t 0 x20 x30 0 0 1 = Tem-se agora, utilizando, por exemplo, a norma kxk = ° ° ° x10 + tx30 ° ° kx (t) − x̄k = kx (t)k = ° e−t x20 ° ° ° x30 x10 + tx30 e−t x20 x30 . p x21 + x22 + x23 , ° ° ° r ° ³ ´ ° |x10 + tx30 |2 + e−2t |x20 |2 + |x30 |2 → +∞ °= ° ° ° quando t → +∞. Pela definição 14 e observação 14 a solução de equilíbrio é instável. 5.3 Estabilidade de Sistemas Não Lineares Aborda-se agora a estabilidade da solução de equilíbrio x̄, do SED x0 = f (x) onde, como habitualmente, f (x) = 5.3.1 f1 (x) .. . . fn (x) Linearização Uma forma de abordar a estabilidade consiste em linearizar f (x) em torno da solução de equilíbrio. Suponha-se que f (x) possui derivadas de segunda ordem contínuas. Então, pela fórmula de Taylor, vem 123 fi (x) = fi (x̄) + 2 ∂fi (x̄) 1 T ∂fi (z) (x − x̄) (x − x̄) + (x − x̄) , ∂xT 2 ∂x∂xT i = 1, ..., n (5.1) onde z é uma combinação linear convexa entre x e x̄. A equação (5.1) pode-se escrever, mais compactamente, na forma f (x) = f (x̄) + f 0 (x̄) (x − x̄) + onde f 0 (x̄) = 1 2 (x − x̄)T ∂f12 (z) ∂x∂xT (x − x̄)T ∂fn2 (z) ∂x∂xT ∂f1 (x̄) ∂x1 ··· .. . ∂f1 (x̄) ∂xn ∂fn (x̄) ∂x1 ··· ∂fn (x̄) ∂xn .. . .. . .. . (x − x̄) (x − x̄) (5.2) Note-se que f 0 (x̄) é o Jacobiano de f no ponto x̄ (é uma matriz de constantes). Reescreva-se a equação (5.2) na forma f (x) = Ax + g (x) onde A = f 0 (x̄) , (x − x̄)T 1 g (x) = f (x̄) − f 0 (x̄) x̄ + 2 (x − x̄)T ∂f12 (z) ∂x∂xT .. . ∂fn2 (z) ∂x∂xT (x − x̄) (x − x̄) (5.3) (note-se que z varia com x). Tem-se agora: Teorema 17 Suponha-se que f (x) possui derivadas de segunda ordem contínuas. Então a 124 solução de equilíbrio x̄ do SED x0 = f (x) , ou equivalentemente, x0 = Ax + g (x) com A = f 0 (x̄) = ∂f1 (x̄) ∂x1 ··· .. . ∂f1 (x̄) ∂xn ∂fn (x̄) ∂x1 ··· ∂fn (x̄) ∂xn .. . .. . é (a) assimptoticamente estável se todos os valores próprios de A tiverem parte real negativa e (b) instável se pelo menos um dos valores próprios de A tiver parte real positiva. c) A estabilidade da solução de equilíbrio não pode ser determinada a partir da estabilidade da solução de equilíbrio x0 = Ax se todos os valores próprios de A tiverem parte real menor ou igual a zero e pelo menos um dos valores próprios tiver parte real nula. Nota: As soluções de equilíbrio que estão nas condições das alíneas (a) e (b) designam-se por pontos hiperbólicos. Dem. Nota introdutória: é frequente assumir-se sem perda de generalidade que x̄ = 0 é a solução de equilíbrio. Mostre-se em primeiro lugar que assim pode suceder. Considere-se z = x − x̄ e portanto também x = z + x̄. Tem-se z 0 = f (x) = f (z + x̄) ou ainda z 0 = g (z). Se x̄ é a solução de equilíbrio do SED x0 = f (x), i.e., verifica-se f (x̄) = 0, então 0 é a solução do equilíbrio do SED z 0 = g (z) pois g (0) = f (0 + x̄) = 0. Claro que as propriedades dinâmicas de z são equivalentes às de x (basta verificar que z = x − x̄). Assim, assuma-se sem perda de generalidade que x̄ = 0. (a) Como x0 = f (x) = Ax + g (x) e g é contínua tem-se, pela equação (4.13), com a condição x (0) = x0 , At x (t) = e x0 + Z t eA(t−s) g (x (s)) ds. 0 Precisamos de provar sob a condição (a) do teorema que não só kx (t)k é limitado para qualquer t como também kx (t)k → 0. Sob a condição (a) sabe-se que existe um K > 0 e um k > 0 tal que ° At ° °e x0 ° ≤ Ke−kt kx0 k (ver demonstração do teorema 16). Resulta também ° ° ° ° A(t−s) g (x (s))° ≤ Ke−k(t−s) kg (x (s))k . °e 125 Nas condições do teorema existe um σ > 0 tal que4 k kxk 2K kxk < σ ⇒ kg (x)k ≤ (5.4) Podemos agora escrever, para kxk < σ Z t° ° ° ° A(t−s) g (x (s))° ds °e 0 Z t ≤ Ke−kt kx0 k + Ke−k(t−s) kg (x (s))k ds 0 Z t k kx (s)k ds Ke−k(t−s) ≤ Ke−kt kx0 k + 2K 0 Z k t −k(t−s) −kt kx0 k + e kx (s)k ds = Ke 2 0 ° ° kx (t)k ≤ °eAt x0 ° + Multiplicando a equação anterior por ekt vem k e kx (t)k ≤ K kx0 k + 2 kt Z t eks kx (s)k ds 0 e fazendo z (t) = ekt kx (t)k a desigualdade pode ainda escrever na forma z (t) ≤ K kx0 k + k 2 Z t z (s) ds. 0 Pela desigualdade de Bellman e Gronwall5 vem k z (t) ≤ K kx0 k e 2 t , 4 Note-se que, com a norma kxk = maxi=1,...,n {|xi |}, kg (x)k é uma forma quadrática e kxk é uma forma linear. Para valores de xi próximos da solução de equilíbrio, isto é, próximos de zero, kg (x)k é uma quantidade ”pequena” comparativamente a kxk . Assim, num vizinhança de zero, certamente se tem kg (x)k ≤ c kxk , onde c é uma constante positiva e que depende do conjunto onde os xi variam. Por conveniência, podemos escolher c = k/ (2K) . Basta admitir que os xi variam num certo conjunto respeitando a restrição kxk < σ para um certo σ > 0. 5 Desigualdade de Bellman e Gronwall: se z (t) é uma função real contínua tal que z (t) ≥ 0 e t z (t) ≤ C + k para todo o t ≥ 0, onde C > 0 e k > 0 então z (s) ds 0 z (t) ≤ Cekt . 126 k e portanto z (t) = ekt kx (t)k ≤ K kx0 k e 2 t , k 1 kx (t)k ≤ K kx0 k e−kt e 2 t = K kx0 k e− 2 kt (5.5) desde que kx (s)k < σ, 0 ≤ s ≤ t. Mas se kx0 k = kx (0)k < σ/K a desigualdade (5.5) garante que kx (t)k < σ se verifica para todo o t. Consequentemente, a desigualdade (5.5) é verdadeira para todo o t se o valor inicial respeitar a desigualdade kx0 k < σ/K. Nestas condições, verificase também kx (t)k → 0. (b) Remete-se a demonstração para Perko (2001). Relativamente à alínea (c) veja-se o exemplo 55.¥ Exemplo 53 Naturalmente a teoria aplica-se também a ED univariadas. Considere-se a ED x0 = f (x) = −x2 +5x+6. Resolvendo f (x) = 0 resulta x̄ = −1 e x̄ = 6. Estude-se a estabilidade de x̄ = −1. Nos termos do teorema 17 a ”matriz” A é A = f 0 (−1) = −2 (−1) + 5 = 7 > 0 e o valor próprio (único) é positivo. Logo, a solução de equilíbrio x̄ = −1 é instável. A solução de equilíbrio x̄ = 6 é, no entanto, assimptoticamente estável pois A = f 0 (6) = −2 (6) + 5 = −7 < 0 e o valor próprio (único) é negativo. Qualquer solução inicializada numa vizinhança de x̄ = 6, tende para x̄ = 6 quando t → +∞; no entanto, o valor inicial x0 não pode ser escolhido livremente em R (i.e., não se garante x (t, 0, x0 ) → x̄ = 6 para todo o x0 ∈ R - esta conclusão é evidente tende em conta que −1 é uma solução de equilíbrio instável). Voltaremos a esta questão adiante. O exemplo em análise mostra que o tipo de estabilidade que estudamos é essencialmente uma propriedade local. Exemplo 54 Considere-se o SED x0 = f (x) = 1 − x1 x2 x1 − x32 . Determine-se a solução (ou as soluções) de equilíbrio. Procura-se portanto x̄ tal que f (x̄) = 0. Da equação 1 − x1 x2 = 0 sai x1 = 1/x2 . Substituindo este valor na segunda equação vem 1/x2 − x32 = 0 ⇔ x42 = 1. Esta equação tem 4 soluções6 x2 = 1 ∨ x2 = −1 ∨ x2 = i ∨ x2 = −i. Como as soluções de equilíbrio complexas não interessam assume-se apenas x2 = 1 ∨ x2 = −1. 6 √ Note-se que x4 = 1 dá lugar a x2 = 1 ∨ x2 = −1 e que x2 = −1 implica x = ± −1 = ±i. 127 As soluções de equilíbrio são x̄1 = 1 1 , x̄2 = −1 −1 . Analise-se primeiro a solução x̄1 . Nos termos do teorema 17, vem A = f 0 (x̄1 ) = ∂(1−x1 x2 ) ∂x1 ∂ (x1 −x32 ) ∂x1 ∂(1−x1 x2 ) ∂x2 ∂ (x1 −x32 ) ∂x2 x1 =1,x2 =1 = −x2 −x1 1 −3x22 x1 =1,x2 =1 = −1 −1 1 −3 . Como os valores próprios −2, −2 têm ambos parte real negativa a solução de equilíbrio x̄1 , pelo teorema 17, é assimptoticamente estável. No outro caso a matriz A é A = f 0 (x̄1 ) = ∂(1−x1 x2 ) ∂x1 ∂ (x1 −x32 ) ∂x1 ∂(1−x1 x2 ) ∂x2 ∂ (x1 −x32 ) ∂x2 x1 =−1,x2 =−1 = 1 1 1 −3 . √ Como os valores próprios são −1± 5 , tendo um deles parte real positiva, a solução de equilíbrio x̄2 , pelo teorema 17, é instável. Exemplo 55 Considere-se o SED ¡ 2 ¢ 2 x x − x + x 2 1 1 2 x0 = f (x) = ¡ 2 ¢ . −x1 − x2 x1 + x22 A única solução de equilíbrio é x̄ = 0. Depois de algumas contas conclui-se A = f 0 (x̄) = 0 1 −1 0 . Os valores próprios são ±i e a solução de equilíbrio do SED x0 = Ax é estável (verifique). Pode-se provar (por métodos engenhosos) que a solução (na forma implícita) do SED inicial é x1 (t) + x2 (t) = c 1+2ct , com c = x21 (0) + x22 (0) . Como existe um K tal que |x1 (t) + x2 (t)| < K e como x1 (t) + x2 (t) → 0 tem-se que x̄ = 0 é uma solução de equilíbrio assimptoticamente estável. Estamos nas condições do teorema 17 c): no caso em que um dos valores próprios tem 128 parte real nula, a estabilidade da solução de equilíbrio do SED inicial não pode ser determinada a partir da estabilidade da solução de equilíbrio x0 = Ax. Considere-se agora o SED x0 = f (x) = ¡ x2 + x1 x21 + x22 ¢ ¢ . ¡ −x1 − x2 x21 + x22 Como no caso anterior, a única solução de equilíbrio é x̄ = 0. Depois de algumas contas concluise A = f 0 (x̄) = 0 1 −1 0 . Os valores próprios são ±i e a solução de equilíbrio do SED x0 = Ax é estável. No entanto, podese provar (por métodos engenhosos) que a solução (na forma implícita) é x1 (t) + x2 (t) = c 1−2ct , com c = x21 (0) + x22 (0) . Assim, a solução só está definida para t ∈ (0, 1/ (2c)) e claramente a solução é não limitada. A solução x̄ é instável. Também neste caso a estabilidade da solução de equilíbrio do SED inicial não pode ser determinada a partir da estabilidade da solução de equilíbrio x0 = Ax já que pelo menos um dos valores próprios tem parte real nula [teorema 17 c)]. Em suma, quando pelo menos um dos valores próprios tem parte real nula a análise da estabilidade da solução de equilíbrio do SED inicial não pode ser determinada a partir da estabilidade da solução de equilíbrio x0 = Ax. Em particular, a solução de equilíbrio do SED inicial pode ser assimptoticamente estável, instável (ou apenas estável). 5.3.2 Método Directo de Liapunov O exemplo 55 mostra as limitações do teorema 17. Um método para decidir sobre a estabilidade de soluções de equilíbrio, incluindo pontos não hiperbólicos, é devida a Liapunov. Considere-se um SED de n equações não linear x0 = f (x) satisfazendo as condições de existência e unicidade no conjunto R = I × E (t ∈ I) onde E é aberto e está contido em Rn e seja x̄ uma solução de equilíbrio contida em E. Considere-se uma função V : Rn → [0, +∞] tal que V ∈ C 1 (E) , V (x) > 0 se x 6= x̄ e V (x̄) = 0. Uma função nestas condições designa-se por função Liapunov. Note-se que n V 0 (x (t)) := dV (x (t)) X ∂V 0 = x (t) . dt ∂xi i i=1 129 (5.6) Teorema 18 Se (a) V 0 (x (t)) ≤ 0 para todo o x ∈ E então a solução x̄ é estável; se (b) V 0 (x (t)) < 0 para todo o x ∈ E e x 6= x̄ então a solução x̄ é assimptoticamente estável; se (c) V 0 (x (t)) > 0 para todo o x ∈ E e x 6= x̄ então a solução x̄ é instável. Dem. Sem perda de generalidade assuma-se x̄ = 0. (a) Escolha-se um ε > 0 tal que {x : kxk ≤ ε} ⊂ E e defina-se V0 = minkxk=ε V (x) . Dado que V (0) = 0 e V (x) é contínua em E segue-se que existe um δ, 0 < δ ≤ ε tal que kxk ≤ δ ⇒ V (x) < V0 . Assim se kx0 k < δ a hipótese V 0 (x) ≤ 0 implica que V (x (t, t0 , x0 )) ≤ V (x0 ) < V0 (5.7) para t ≥ t0 . Suponha-se agora que para kx0 k < δ existe um t1 > 0 tal que kx (t1 , t0 , x0 )k = ε. Nestas condições, como V0 é o mínimo no conjunto kxk = ε segue-se que V (x (t1 , t0 , x0 )) ≥ V0 o que é uma contradição com (5.7). Conclui-se então que kx0 k < δ implica kx (t, t0 , x0 )k < ε para todo o t ≥ 0 e, portanto, x̄ é estável. (b) Pela parte (a), quando kx0 k < δ, x (t, t0 , x0 ) converge, digamos para x̃, no compacto {x : kxk ≤ ε} quando t → +∞. Uma vez que V (x) é estritamente decrescente com t a aumentar e dado que V (x (t, t0 , x0 )) → V (x̃) devido à continuidade de V, segue-se que V (x (t, t0 , x0 )) > V (x̃) (5.8) para todo o t > 0. Mas se x̃ 6= x̄ = 0 então para s > 0 tem-se V (x (s, t0 , x̃)) < V (x̃) e, devido à continuidade segue-se que, para todo o y suficientemente próximo de x̃, V (x (s, t0 , y)) < V (x̃) . Mas então para y = x (t∗ , t0 , x0 ) e t∗ suficientemente grande tem-se V (x (s + t∗ , t0 , x0 )) < V (x̃) o que é uma contradição com (5.8). Logo x̃ = x̄ = 0 e x̄ é uma solução assimptoticamente estável. Remete-se à alínea (c) para Perko (2001), p. 132.¥ 130 Figura 5-6: Função Liapunov V (x) (n = 1) onde V 0 (x) < 0 V (x ) = x 2 x(t 2 , t 0 , x0 ) x(t1 , t0 , x0 ) x0 x A maior dificuldade deste método consiste em encontrar a função de Liapunov apropriada. Uma primeira tentativa consiste em analisar V (x) = c1 (x1 − x̄1 )2 + ... + cn (xn − x̄n )2 , ci > 0 onde x̄i são as coordenadas do vector x̄. Certas combinações lineares entre os parâmetros ci permitem esclarecer a natureza das soluções de equilíbrio, tal como mostra o exemplo 57 (ver adiante). Exemplo 56 Considere-se x0 = −x. Sabe-se que a solução de equilíbrio x̄ = 0 é assimptoticamente estável (ver exemplo 48). Na figura 5-6 representa-se a função Liapunov V (x) = x2 estritamente decrescente com respeito a t (caso n = 1). Com efeito, dV (x (t)) /dt = 2xx0 = −2x2 < 0, x 6= x̄. Pelo teorema 18, x̄ = 0 é assimptoticamente estável. Observe-se que dV (x (t)) /dt < 0 implica V (x (t2 , t0 , x0 )) < V (x (t1 , t0 , x0 )) < V (x0 ) para t0 < t1 < t2 . Dado um ponto inicial x0 a solução x (t) desloca-se no sentido onde a função V (x (t)) decresce. Este movimento processa-se em direcção a x̄ = 0. Na figura 5-7 representa-se uma função de Liapunov V (x (t)) no caso n = 2. Observe-se que V (x (t)) decresce à medida que t → +∞. As trajectórias x (t) representadas na figura por Γ cruzam sucessivas curvas de nível y1 , y2 , ... de amplitude decrescente à medida que x (t) se aproxima da solução de equilíbrio x̄ = 0. 131 Figura 5-7: Função Liapunov V (x1 , x2 ) (n = 2) onde V 0 (x) < 0 Exemplo 57 Considere-se o SED x01 = −2x2 + x2 x3 x02 = x1 − x1 x3 x03 = x1 x2 . Resolvendo o sistema f (x) = 0 conclui-se que x̄ = (0, 0, 0)T é uma das soluções de equilíbrio. Aplicando o teorema 17 vem 0 −2 0 f (x̄) = A = 1 0 0 0 0 0 0 e os valores próprios de A são {0, ±2i} . Logo a estabilidade do SED inicial não pode ser deduzido a partir do SED x0 = Ax. Para usar o método de Liapunov é necessário em primeiro lugar encontrar uma função V (x) apropriada. Uma primeira tentativa passa por funções do tipo V (x) = c1 x21 + c2 x22 + c3 x23 , 132 c1 , c2 , c3 > 0 (note-se que V satisfaz: V : Rn → [0, +∞] , V ∈ C 1 (E) , V (x) > 0 se x 6= x̄ e V (x̄) = 0). Calcule-se a derivada de V com respeito a t. Usando a fórmula (5.6) vem V 0 (x (t)) = 3 X ∂V 0 x (t) ∂xi i i=1 = 2c1 x1 x01 + 2c2 x2 x02 + 2c3 x3 x03 = 2c1 x1 (−2x2 + x2 x3 ) + 2c2 x2 (x1 − x1 x3 ) + 2c3 x3 (x1 x2 ) = 2 (c1 − c2 + c3 ) x1 x2 x3 + 2 (−2c1 + c2 ) x1 x2 . Não é possível escolher c1 , c2 e c3 de forma que V 0 (x) > 0 ou V 0 (x) < 0 para todo o E. No entanto, impondo (c1 − c2 + c3 ) = 0, (−2c1 + c2 ) = 0 e c1 , c2 , c3 > 0, i.e., c2 = 2c1 > 0 e c3 = c1 > 0 resulta V 0 (x) = 0. Nas condições do teorema 18 a solução de equilíbrio é estável. Exemplo 58 Considere-se o SED x01 = −2x2 + x2 x3 − x31 x02 = x1 − x1 x3 − x32 x03 = x1 x2 − x33 . À semelhança do exemplo anterior, também neste caso a estabilidade deste SED não pode ser deduzido a partir do SED x0 = Ax. Verifique-se que a solução de equilíbrio (0, 0, 0)T é assimptoticamente estável a partir da função V (x) = x21 + 2x22 + x23 . 5.4 Métodos Gráficos Apresenta-se neste ponto um conjunto de procedimentos gráficos que permitem discutir o comportamento da solução quando esta é desconhecida. 133 5.4.1 Equações Univariadas de Primeira ordem Retratos de Fases (n = 1) Considere-se a ED autónoma x0 = f (x) e suponha-se que a solução x (t) é desconhecida. Se atendermos ao sinal de f (x) numa vizinhança de x0 , podemos estabelecer se x (t, t0 , x0 ) aumenta ou diminui a partir desse ponto. Se x (t) aumenta (diminui) podemos inserir, junto a x0 , uma seta no sentido oeste-este (este-oeste). A magnitude de f (x) numa vizinhança de x0 pode ser também relevante (dá informação sobre se o aumento ou diminuição de x (t) é forte ou fraco). Esta informação incorpora-se no gráfico traçando uma seta com um comprimento, ou espessura, proporcional à magnitude de f (x) . Esta representação gráfica, que se designa por retrato de fases (caso univariado), fornece uma ideia geral sobre o comportamento da solução, nomeadamente, permite discutir (ou conjecturar) sobre a estabilidade das soluções de equilíbrio. Na figura 5-8 apresentam-se duas situações distintas. Na caso A a solução de equilíbrio ocorre no ponto x = a, pois f (a) = 0. Esta solução é assimptoticamente estável. Intuitivamente é claro: quando x é inicializado num valor abaixo de a resulta que f (x) > 0, i.e. x0 > 0 e, assim, o valor de x aumenta; neste caso x move-se da esquerda para a direita até atingir o valor x = a (as setas indicam o movimento de x). Se x é inicializado num valor acima de a resulta que f (x) < 0, i.e. x0 < 0 e, assim, o valor de x diminui; neste caso x move-se da direita para a esquerda até atingir o valor x = a (as setas indicam o movimento de x). Em ambas as situações a solução tende para o valor de equilíbrio. No caso B a solução de equilíbrio é b, mas não é estável. Com efeito, verifica-se que f (x) > 0 quando x > b e f (x) < 0 quando x < b. Nestas circunstâncias, a solução afasta-se sempre de b. O teorema 17, p. 125, permite fundamentar estas conclusões. Com efeito, no caso A (B) a função f (x) verifica f 0 (a) < 0 (f 0 (b) > 0). Exemplo 59 Considere-se x0 = f (x) = −x2 +5x+6. A partir da figura 5-9 pode-se concluir que a solução de equilíbrio −1 é instável enquanto que a solução de equilíbrio 6 é assimptoticamente estável. Mais: se x0 < −1 ⇒ limt→+∞ x (t, 0, x0 ) = −∞ e se x0 > −1 ⇒ limt→+∞ x (t, 0, x0 ) = 6. Deixa-se ao cuidado do leitor a inserção das setas no eixo das abcissas. 134 Figura 5-8: Retratos de Fase f (x) A B f (x) x x a b Figura 5-9: Curva f (x) = −x2 + 5x + 6 10 5 -2 2 4 -5 135 6 Campos de Direcções Considere-se agora o caso da ED não autónoma x0 = f (t, x). O campo de direcções é uma aplicação que atribui, a cada ponto de uma região de duas ou três dimensões, um vector. No caso de ED univaridadas, o campo de direcções obtém-se associando r³a cada ponto ´(t, x) do plano 1 + |f (t, x)|2 . Observe-se: um vector com a direcção (1, f (t, x)) e com um comprimento quando t aumenta o par ordenado (t, x (t)) movimenta-se ao longo da sua trajectória. A tangente a esta trajectória, num dado ponto (t, x) ∈ R2 tem inclinação f (t, x); por outras palavras, a tangente tem a direcção do vector (1, f (t, x)). Podemos então associar a cada ponto (t, x) do plano um vector (graficamente representado por um segmento derrecta ou mesmo uma ³ ´ 1 + |f (t, x)|2 . Em seta) com a direcção do vector (1, f (t, x)) e com um comprimento certos casos, para se obter melhor informação gráfica, pode impor-se que os vectores tenham comprimento unitário: para o efeito divide-se (1, f (t, x)) pela norma Euclidiana do vector7 . A informação fornecida pelo campo de direcções é relevante no estudo do comportamento da solução. Nomeadamente, permite inferir (ou conjecturar) sobre a estabilidade das soluções. Exemplo 60 Considere-se a ED x0 = −x cos t. A solução geral é x (t) = ce− sen t . Com a condição inicial x (0) = x0 vem x (t) = x0 e− sen t . Se a solução fosse desconhecida poder-se-ía tentar saber algo mais sobre a solução traçando o campo de direcções. Represente-se então o campo de direcções (figuras 5-10 e 5-11 - utilizando o programa Maple) e tente-se imaginar a solução nos seguintes casos x0 = −1, x0 = 1 e x0 = 2. Na figura 5-12 traça-se o mesmo campo de direcções (agora com o programa Mathematica) mas apresentando as soluções iniciadas em x0 = −1, x0 = 1 e x0 = 2. ¡ ¢ Exemplo 61 Considere-se a ED x0 = e−5 e−5x − e5x t e tente discutir-se a estabilidade da solução de equilíbrio, a partir do campo de direcções. A solução de equilíbrio x̄ verifica f (x̄) = 0. ¡ ¢ Ora e−5 e−5x̄ − e5x̄ t = 0 se x̄ = 0. As figura 5-13 e 5-14 parecem indicar que a solução de 7 Isto é, considera-se o vector 1 , 2 f (t, x) 1 + |f (t, x)|2 1 + |f (t, x)| 136 . Figura 5-10: Campo de Direcções da ED x0 = −x cos t (vectores de comprimento unitário) 4 x 2 0 2 4 6 t 8 10 12 14 -2 -4 Figura 5-11: Campo de Direcções da ED x0 = −x cos t (vectores de comprimento 4 x -4 -2 2 0 -2 -4 137 2 t 4 p 1 + f 2 (t, x)) Figura 5-12: Campos de Direcções e Comparação com a Solução x 6 4 2 0 -2 -4 2 4 6 8 10 12 14 t equilíbrio 0 é estável: para qualquer valor numa vizinhança de x̄ = 0, a solução diminui de valor se x > x̄ (pois x0 < 0 para x > x̄) e aumenta de valor se x < x̄ (pois x0 > 0 se x < x̄) existindo, portanto, um ”efeito de reversão” para o valor de equilíbrio. Provavelmente a figura 5-14 é mais informativa pois mostra que o efeito de reversão é mais forte à medida que t → +∞. 5.4.2 Sistemas de Duas ED Retrato de Fases (n = 2) Introdução Considere-se o sistema com duas ED x0 = f1 (x1 , x2 ) 1 x0 = f (x , x ) . 2 2 1 2 Toda a solução x1 (t) , x2 (t) permite definir as seguintes curvas, com t a variar em certo intervalo: 1. uma curva em R2 gerada pelos pontos (t, x1 (t)) ; 2. uma curva em R2 gerada pelos pontos (t, x2 (t)) ; 3. uma curva em R3 gerada pelos pontos (t, x1 (t) , x2 (t)) ; 4. uma curva em R2 gerada pelos pontos (x1 (t) , x2 (t)) . 138 ¡ ¢ Figura 5-13: Campo de Direcções da ED x0 = e−5 e−5x − e5x t (vectores de comprimento unitário) 1 x 0.5 0 1 2 t 3 4 5 -0.5 -1 ¡ ¢ Figura 5-14: Campo de Direcções da ED x0 = e−5 e−5x − e5x t (vectores de comprimento p 1 + f 2 (t, x)) 1 x 0.5 0 1 2 t -0.5 -1 139 3 4 5 Figura 5-15: Trajectória x1 (t) = cos t − sin t 1 0.5 5 10 15 20 -0.5 -1 Exemplo 62 Considere-se o sistema x0 = −x2 1 x0 = x . 1 2 Resolvendo o sistema com as condições x1 (0) = x2 (0) = 1 obtém-se x1 (t) = cos t − sen t x (t) = cos t + sen t. 2 As trajectórias (ou curvas) x1 (t) e x2 (t) estão representadas nas figuras 5-15 e 5-16. Uma trajectória em R3 gerada pelos pontos (t, x1 (t) , x2 (t)) = (t, cos t − sen t, cos t + sen t) é representada na figura 5-17 a traço grosso. Observe-se que as trajectórias representadas nas figuras 5-15 e 5-16 estão também representadas na figura 5-17. Como estabelecemos no ponto 4 atrás, toda a solução x1 (t) , x2 (t) permite definir uma curva em R2 gerada pelos pontos (x1 (t) , x2 (t)) quando t varia num certo intervalo. Designamos estas curvas por órbitas (em R2 ) (pode-se ter uma infinidade de órbitas quando se analisa a solução geral ou apenas uma órbita, quando se analisa um PVI).Tratam-se, portanto, de curvas paramétricas em R2 . O plano onde as órbitas se definem designa-se por plano de fases (espaço de fases no caso Rn , n > 2). Assim, a órbita de uma solução é a projecção do gráfico da solução no plano de fases. Ao conjunto de todas as órbitas (de uma solução geral) designamos por 140 Figura 5-16: Trajectória x2 (t) = cos t + sin t 1 0.5 5 10 15 20 -0.5 -1 Figura 5-17: Curvas Associadas ao SED x01 = −x2 , x02 = x1 -1 -2 20 x1 0 2 1 15 t 10 5 0 -2 -1 x2 0 1 141 2 Figura 5-18: Órbita de (x1 , x1 ) = (cos t − sin t, cos t + sin t) x2 1 0.5 0 -0.5 -1 -1 -0.5 0 0.5 1 x1 retrato de fases. Retome-se o exemplo 62. Vimos que a solução do PVI é x1 (t) = cos t − sen t, x2 (t) = cos t + sen t. Assim, a órbita associada é definida por todos os pontos (x1 , x2 ) = (cos t − sen t, cos t + sen t) quando t varia num certo intervalo (ver figura 5-18). A solução de equilíbrio x̄ = 0 não é assimptoticamente estável pois (x1 , x2 ) não se dirige para o ponto 0 ∈ R2 quando t aumenta (seta indica a direcção do movimento sobre a órbita). Retrato de Fases do SED Linear x0 = Ax Analisa-se agora com mais profundidade os retratos de fases do SED x0 = Ax em R2 , os quais se baseiam quase inteiramente na natureza dos valores próprios λ1 e λ2 da matriz A. Vamos distinguir os seguintes casos: Caso 1: λ2 < λ1 < 0 A solução é dada pela equação (4.9) x (t) = c1 eλ1 t v1 + c2 eλ2 t v2 , 142 c1 , c2 ∈ R. Figura 5-19: Representação do vector v1 x2 v1 v21 x1 v11 Suponhamos por um momento que c2 = 0 pelo que x (t) = c1 eλ1 t v1 i.e., x (t) = x1 (t) x2 (t) = c1 eλ1 t v11 . v21 | {z } v1 Com c2 = 0 a solução é proporcional ao vector v1 (a constante de proporcionalidade é c1 eλ1 t ). Para simplificar um pouco mais suponha-se, para um certo t, que c1 eλ1 t = 1. A solução para esse valor de t viria igual ao vector v1 . Nestas circunstâncias, x1 = v11 e x2 = v21 e (x1 , x2 ) = (v11 , v21 ) define um ponto no plano. Permitindo agora que a constante de proporcionalidade varie livremente, tem-se que a solução x (t) = c1 eλ1 t v1 , no plano de fases, situa-se ao longo de todo o segmento definido pelo vector v1 - ver a figura 5-19. Como, por hipótese, λ1 < 0, a solução desloca-se sobre o segmento em direcção ao ponto (0, 0) , à medida que t → +∞. No caso em que c2 6= 0, a solução desloca-se entre os vectores v1 e v2 de acordo com a regra do paralelogramo. Como, por hipótese, λ1 < 0 e λ2 < 0, todas as órbitas dirigem-se para (0, 0) quando t → +∞. O ponto de equilíbrio x̄ = (0, 0)T (que se sabe ser assimptoticamente estável) designa-se por nó estável. Podemos ainda refinar a análise, observando que, para t suficientemente grande, eλ2 t v2 é pequeno em comparação com eλ1 t v1 . Em resultado, o retrato de fases sob a hipótese λ2 < λ1 < 0 é do tipo da figura 5-20-A. Caso 2: 0 < λ1 < λ2 143 O retrato de fases é neste caso o da figura 5-20-A excepto que a direcção das setas é revertido. Claro que kx (t)k → +∞. A solução de equilíbrio designa-se por nó instável. Caso 3: λ1 = λ2 < 0 A solução é dada pela equação (4.11) x (t) = c1 eλt v1 + c2 eλt (I + t (A − λI)) v2 , c1 , c2 ∈ R. É necessário distinguir: (a) A possui dois vectores próprios independentes e (b) A possui apenas um vector próprio independente. No caso (a) v2 é vector próprio e (A − λI) v2 = 0 pelo que a solução se reduz a x (t) = c1 eλt v1 + c2 eλt v2 = eλt (c1 v1 + c2 v2 ) . O vector eλt (c1 v1 + c2 v2 ) é paralelo a c1 v1 + c2 v2 para todo o t e dado que {v1 , v2 } é uma base de R2 o retrato de fases é constituído por todos os segmentos de recta que cruzam a origem (ou seja, o conjunto de todas as órbitas cobrem todas as direcções do plano, quando c1 e c2 variam em R) - figura 5-20-B. No caso (b) a solução é x (t) = c1 eλt v1 + c2 eλt (I + t (A − λI)) v2 = eλt (c1 v1 + c2 v2 ) + c2 eλt t (A − λI) v2 . Ora v1 é proporcional a (A − λI) v2 , i.e. existe um k 6= 0 tal que v1 = k (A − λI) v2 (multipliquese ambos os termos por (A − λI)). Assim, a solução pode ainda apresentar-se na forma x (t) = eλt (c1 v1 + c2 v2 ) + c2 kteλt v1 . Quando t é grande a quantidade eλt (c1 v1 + c2 v2 ) é pequena comparativamente a c2 kteλt v1 . Assim as tangentes às órbitas de x (t) aproximam-se de ±v1 (consoante o sinal de c2 ). O retrato de fases é dado pela figura 5-20-C. Caso 4: λ1 = λ2 > 0 O retrato de fases apresenta-se nas figuras 5-20-B e 5-20-C excepto que a direcção das setas é revertido. Caso 5: λ1 < 0 < λ2 144 A solução é x (t) = c1 eλ1 t v1 + c2 eλ2 t v2 . No caso c2 = 0 a solução tende para zero; i.e., a solução movimenta-se sobre o vector v1 em direcção a (0, 0) . Na situação c2 6= 0 a solução é dominada pelo termo c2 eλ2 t v2 , que tende para +∞. Com t grande, a quantidade c1 eλ1 t v1 é (muito) pequena comparada com c2 eλ2 t v2 . Assim, as órbitas movimentam-se em direcção ao vector v2 , tendendo para +∞. Consequentemente, o retrato de fases tem a forma representada na figura 5-20-D. A solução de equilíbrio designa-se por ponto sela (o retrato de fases parece-se com uma sela, numa vizinhança da solução de equilíbrio). Caso 6: λ1 , λ2 = α ± βi A solução é x (t) = c1 eαt (u cos βt − w sen βt) + c2 eαt (u sen βt + w cos βt) , Definindo u= a solução pode escrever-se na forma x1 (t) x2 (t) = eαt u1 u2 w= , w1 w2 c1 , c2 ∈ R. (c1 u1 + c2 w1 ) cos βt + (c2 u1 − c1 w1 ) sen βt (c1 u2 + c2 w2 ) cos βt + (c2 u2 − c1 w2 ) sen βt . Para α = 0 resulta que |x1 (t)| ≤ K1 e |x2 (t)| ≤ K2 para qualquer t, pelo que a órbita, definida parametricamente por (x1 (t) , x2 (t)) , t ≥ 0 está contida num certo rectângulo. Pode mesmo mostrar-se que a órbita é uma elipse (ou circunferência) com centro na origem - ver figura 5-20-E. A solução move-se ao longo da elipse ou no sentido do ponteiro do relógio ou inversamente. Para determinarmos o sentido, verifica-se (por exemplo) o sinal de x02 quando x2 = 0. Se x02 > 0 para x2 = 0 e x1 > 0 então as soluções movem-se no sentido contrário aos ponteiros do relógio (sob a condição x2 = 0 e x1 > 0 a órbita encontra-se algures num ponto da abcissa, com x1 > 0; se x02 < 0 a órbita desloca-se para ”baixo” e a órbita entra no quadrante {(x1 , x2 ) : x1 > 0, x2 < 0}; se x02 > 0 a órbita desloca-se para ”cima” e entra no quadrante {(x1 , x2 ) : x1 > 0, x2 > 0}). A solução de equilíbrio designa-se por centro. No caso α < 0 existe um efeito de ”contracção” das soluções (as coordenadas (x1 , x2 ) tendem ambas 145 para zero quando t → +∞) e, desta forma, as órbitas são espirais que convergem para a origem (mais uma vez o sentido do movimento deve-se determinar). A solução de equilíbrio designa-se por foco estável. No caso α > 0 as órbitas são também espirais, mas a solução afasta-se da origem à medida que t aumenta. A solução de equilíbrio designa-se por foco instável. Deixa-se como exercício a análise dos casos λ1 = 0, λ2 6= 0 e λ1 = λ2 = 0. Para exemplificar, representa-se na figura 5-21 quatro retratos de fases associados com seguintes cenários: Situação A B C D Matriz A 1 − 10 −1 1 1 − 10 −1 1 0 −2 −1 0 0 −1 −1 −3 0 1 Val. Próprios 1 λ1 , λ2 = − 10 ± 1 10 i λ1 = −2, λ2 = −1 λ1 = −1, λ2 = −1 λ1 = −1, λ2 = 1 Vect. Próprios v1 = v1 = v1 = v1 = i 1 1 0 1 , v2 = 1 1 −i , v2 = −1 0 , v2 = , v2 = 1 0 1 0 −3 2 Nota sobre a figura 5-21: os pequenos círculos escuros representam valores iniciais, e as setas o movimento das soluções ao longo das órbitas (mais adiante confere-se um significado mais preciso às setas que não se encontram desenhadas sobre as órbitas). Retrato de Fases do SED Não Linear x0 = f (x) Seja x̄ uma solução de equilíbrio do SED não linear x0 = f (x) . Pelo teorema 17, se A = f 0 (x̄) não possui valores próprios com parte real nula, então a estabilidade da solução de equilíbrio x̄ do SED não linear pode ser deduzida a 146 Figura 5-20: Retrato de Fases do SED x0 = Ax A B x2 r v2 x2 r v1 x1 x1 C D x2 x2 r v2 x1 E r v1 x1 F x2 x2 x1 x1 147 Figura 5-21: Retratos de Fases do SED x0 = Ax (e Campo de Direcções - Ver ponto seguinte) 10 A x2 B 10 5 5 0 0 -5 -5 -5 10 0 5 10 x2 x1 -5 C x2 10 5 5 0 0 -5 -5 -5 0 5 10 x1 0 10 x1 D x2 -5 148 5 0 5 10 x1 partir da estabilidade da solução nula do SED linear x0 = Ax. Nestas circunstâncias, é natural o seguinte resultado devido a Hartman-Grobman (versão simplificada): Teorema 19 Seja E um subconjunto de Rn contendo a solução de equilíbrio x̄ do SED x0 = f (x) e seja f ∈ C 1 (E) . Suponha-se que A = f 0 (x̄) e que A não possui qualquer valor próprio com parte real nula. Então, na vizinhança de x̄, o SED não linear tem a mesma estrutura qualitativa do SED linear x0 = Ax. Dem. Ver Perko (2001), pp. 121-124. ¥ Exemplo 63 Considere-se o SED x01 = 2x1 − 2x21 − 5x1 x2 x02 = x2 − x22 − 2x1 x2 . Resolvendo o sistema f (x) = 0 obtêm-se as seguintes soluções de equilíbrio: x̄1 = 0 0 , x̄2 = 0 1 1 , x̄3 = 2 − 4x1 − 5x2 −5x1 −2x2 1 − 2x2 − 2x1 0 , x̄4 = 3/8 1/4 Observe-se que A (x1 , x2 ) = f 0 (x1 , x2 ) = Resulta: 149 . . x̄ 0 0 0 1 1 0 Matriz A 2 0 0 1 −3 −2 −5 3/8 1/4 0 −2 −1 0 Val. Próprios −1 λ1 = 2, λ2 = 1 −3/4 −15/8 −1/2 λ1 = −3, λ2 = −1 −1/4 λ1 = −2, λ2 = −1 λ1 = −3/2, λ2 = 1/2 Vect. Próprios v1 = v1 = 1 0 1 1 1 15 v1 = v1 = 0 6 , v2 = , v2 = , v2 = , v2 = 0 1 0 1 5 −1 3 −2 Na figura 5-22 apresenta-se o campo de direcções do SED (esclarece-se adiante o significado do campo de direcções de um SED). Em certos casos pode-se explicitar a órbita através de uma função x2 = g (x1 ) (geralmente é necessário mais do que uma função para definir a órbita; por exemplo, a órbita (x1 , x2 ) tal que p x21 + x22 = 1 pode ser representada pelas curvas x2 = ± 1 − x21 ). Suponha-se, para concretizar, que um certo SED tem por solução x1 (t) = 3t + 2 e x2 (t) = 5t2 + 7. A órbita é definida por ¡ ¢ todos os pontos (x1 , x2 ) = 3t + 2, 5t2 + 7 quando t varia num certo intervalo. Resolvendo x1 = 3t + 2 em ordem a t obtém-se t = t (x1 ) = (x1 − 2) /3. Substituindo esta última expressão na solução x2 obtém-se x2 (t (x1 )) = 5 ((x1 − 2) /3)2 + 7 = 59 x21 − 20 9 x1 + 83 9 . Temos, portanto, x2 como função de x1 . Neste caso a órbita é representada pela equação x2 = 59 x21 − 20 9 x1 + 83 9 (com x1 a variar num certo intervalo). Aparentemente é necessário conhecer-se a solução do SED para se construir uma órbita. Mostra-se agora que de facto não é necessário. Supondo f1 (x1 , x2 ) 6= 0 vem x02 f2 (x1 , x2 ) ⇔ = 0 x1 f1 (x1 , x2 ) dx2 dt dx1 dt = dx2 f2 (x1 , x2 ) f2 (x1 , x2 ) ⇔ . = f1 (x1 , x2 ) dx1 f1 (x1 , x2 ) 150 (5.9) Figura 5-22: Campo de Direcções do SED x01 = 2x1 − 2x21 − 5x1 x2 , x02 = x2 − x22 − 2x1 x2 . 2 (0,0) x2 2 1 1 0 0 -1 -1 -1 2 0 1 2 x1 -1 (1,0) x2 2 1 1 0 0 -1 -1 -1 0 1 2 (0,1) x2 x1 151 0 1 2 1 2 x1 (3/8,14) x2 -1 0 x1 Figura 5-23: Órbitas do SED x01 = x2 , (1+x1 )2 x02 = −x22 15 10 5 -4 -2 2 4 -5 -10 -15 A resolução da ED (5.9) com a condição x1 = a, x2 = b permite obter a órbita que passa no ponto (a, b) (com (a, b) tal que f1 (a, b) 6= 0). De uma forma geral, a resolução da ED envolve uma constante arbitrária. Fazendo variar esta constante (com a restrição de que (x2 , x1 ) não seja uma solução de equilíbrio) obtém-se o retrato de fases do SED x01 = f1 (x1 , x2 ) , x02 = f2 (x1 , x2 ) . Exemplo 64 Considere-se x01 = x2 , (1 + x1 )2 x02 = −x22 Pela fórmula 5.9 vem dx2 = −x2 (1 + x1 )2 . dx1 A ED anterior é de variáveis separáveis. A sua solução, e portanto, a expressão das órbitas é 3 x2 = e−(1+x1 ) /3 c. Graficamente obtém-se a figura 5-23. Campo de Direcções No caso em que não é possível obter as órbitas (não se conhecem as soluções x1 (t) e x2 (t) ou não se consegue obter x2 (x) como solução de x02 = f2 (x2 , x1 ) /f1 (x2 , x1 )) consegue-se ainda assim visualizar o campo de direcções do SED com um significado que se apresenta a seguir. 152 Quando t aumenta o par ordenado (x1 (t) , x2 (t)) movimenta-se no plano ao longo da órbita. A velocidade na direcção do eixo x1 é f1 (x) ; a velocidade na direcção do eixo x2 é f2 (x) . ¡ ¡ ¢ ¡ ¢¢ Assim, este movimento, num dado ponto x1 ∈ R2 , tem a direcção do vector f1 x1 , f2 x1 . Podemos visualizar graficamente a forma como a órbita se movimenta no ponto x1 inserindo junto a x1 um vector (graficamente um segmento de recta ou uma seta) com a direcção do vector ¡ ¡ 1¢ ¡ ¢¢ f1 x , f2 x1 . Resulta assim que o campo de direcções do sistema de ED obtém-se asso¡ ¡ ¢ ¡ ¢¢ ciando a cada ponto x1 = (x1 , x2 ) do plano um vector com a direcção f1 x1 , f2 x1 e com r³ ´ |f1 (x)|2 + |f2 (x)|2 (fornece uma medida da velocidade do movimento da um comprimento solução sobre a órbita). Graficamente, este comprimento pode ser relacionado com o tamanho ou espessura das setas. Em certos casos, para se obter melhor informação gráfica, pode impor-se ¡ ¢¢ ¡ ¡ ¢ que os vectores tenham comprimento unitário e, para o efeito, divide-se f1 x1 , f2 x1 pela r³ ´ 8 |f1 (x)|2 + |f2 (x)|2 pode-se norma Euclidiana do vector . Para não se perder a informação r³ ´ |f1 (x)|2 + |f2 (x)|2 . Na figura 5-24 fazer variar a espessura da seta de acordo com o valor representa o campo de direcções do SED apresentado no exemplo 62. São apresentadas também duas órbitas definidas a partir de duas condições iniciais diferentes. Comparar com a figura 5-18. Na figura5-25 representa o campo de direcções do SED x01 = x2 , x02 = −x1 − x2 /10 e uma órbita com dada a condição x1 (0) = 0, x2 (0) = 1. Ver ainda a figura 5-21. 8 Isto é, considera-se o vector f1 (x) , |f1 (x)|2 + |f2 (x)|2 f2 (x) |f1 (x)|2 + |f2 (x)|2 153 . Figura 5-24: Campo de Direcções e Órbitas do SED x01 = −x2 , x02 = x1 . x2 4 2 0 -2 -4 -4 -2 0 2 4 x1 Figura 5-25: Campo de Direcções e Uma Órbita do SED x01 = x2 , x02 = −x1 − x2 /10 x2 4 2 0 -2 -4 -4 -2 0 154 2 4 x1 Exercícios 1. Estude a estabilidade das soluções das equações diferenciais seguintes, a partir directamente da definição: (a) x0 = 1, x (0) = 1; (b) x0 = tx, x (0) = 5; (c) x0 = −x + t, x (0) = 1; (d) x0 = − sen t, x (π/2) = 1; 2. Estude a estabilidade das solução de equilíbrio das equações diferenciais seguintes, a partir directamente da definição: (a) x0 = x/ (t + 1) (b) x0 = −x sen t (c) x0 = − (x − 1) log (t + 1) 3. Considere a ED x0 = x (1 − x) (a) Estude a estabilidade das soluções de equilíbrio, a partir directamente da definição. (b) Estude a estabilidade das soluções de equilíbrio efectuando uma linearização. (c) Utilize um procedimento gráfico para confirmar os resultados. 4. (Exame) Seja x0 x (t, 0, x0 ) = q ¡ ¢ e2t 1 − x20 + x20 a solução de um certo PVI (x0 = f (t, x), x (0) = x0 ). (a) Mostre que x̄ = 0 e x̄ = 1 são soluções de equilíbrio. Obtenha uma terceira solução de equilíbrio. (b) Estude a estabilidade da solução x̄ = 0 considerando x0 ∈ ]−1, 1[ . Verifique se as conclusões se mantêm no caso x0 ∈ [−1 − θ, 1 + θ], θ > 0. Comente o resultado. 155 5. Estude a estabilidade das soluções de equilíbrio da ED x0 = x3 − x e represente o retrato de fases. 6. Estude a estabilidade da solução de equilibrio x̄ = 0 dos sistemas apresentados nos exercícios 12 e 13 do Cap. 4. 7. Considere o SED x0 = Ax + b onde b é um vector de constantes e A tem inversa. (a) Determine a solução de equilíbrio. (b) Mostre que a estabilidade das soluções do SED dado é equivalente à estabilidade das soluções do SED x0 = Ax (sugestão: considere a mudança de variável z (t) = x (t) − x̄). 8. Considere o SED de segunda ordem u00 + w0 + u − w = 0 u0 + w0 + u − w = 0. (a) Efectuando uma mudança de variáveis escreva o sistema na forma x0 = Ax (b) Estude a estabilidade da solução de equilíbrio x̄ = 0 do SED inicial. 9. (Exame) Considere o SED x01 x02 = | −2 0 1 −3 {z A } x1 x2 com as condições x1 (0) = 1 e x2 (0) = 2. Sabe-se que v1 = 1 1 é um vector próprio da matriz A associado ao valor próprio λ1 = −2. (a) Determine a solução do PVI e estude a estabilidade da solução nula. 156 (b) Represente graficamente no plano (de forma aproximada) as órbitas que no instante t = 0 se encontram nos pontos (1, 1) , (0, 1) e (1, 2) e insira setas sobre as três órbitas para indicar como é que as soluções evoluem à medida que t aumenta a partir de zero. 10. Considere o SED x01 = sen (x1 + x2 ) x02 = ex1 − 1 (a) Determine as soluções de equilíbrio. (b) Estude a estabilidade das soluções de equilíbrio. (c) Esboce um retrato de fases do sistema. 11. Considere o SED x01 = −x2 − x31 − x1 x22 x02 = x1 − x32 − x2 x21 (a) Determine a solução de equilíbrio. (b) Efectuando uma linearização estude a estabilidade da solução de equilíbrio. (c) Discuta a estabilidade utilizando a função de Liapunov V (x1 , x2 ) = x21 + x22 . 12. (Exame) Considere o sistema de equações diferenciais x01 = x2 x02 = −x1 − ex1 x2 (a) Mostre que a solução nula ³ 0 0 ´T , é uma solução de equilíbrio. (b) Estude a estabilidade da solução nula efectuando uma linearização. (c) Estude a estabilidade da solução nula a partir da função de Liapunov V (x1 , x2 ) = 1 2 2 x1 + 12 x22 . 157 (d) Faça um retrato de fases numa vizinhança da solução nula (insira setas sobre as órbitas para indicar como é que o sistema evolui ao longo do tempo). 13. (Exame) Considere o modelo x01 = −x1 x02 = ax2 + x1 x2 . (a) Mostre que a solução nula é uma solução de equilíbrio e estude a estabilidade dessa solução nos casos a > 0 e a < 0. (b) Determine a solução geral do sistema e confirme que no caso a < 0 se tem limt→+∞ x1 (t) = limt→+∞ x2 (t) = 0. (c) Determine a expressão analítica das órbitas no caso a = 0. (d) Mostre que no caso a = 0 a solução nula não é assimptoticamente estável (aproveite resultados já obtidos). 14. Considere a ED de segunda ordem não linear x00 = −f (x) x0 − g (x) onde f (x) e g (x) são funções reais de variável real de classe C 1 em R que verificam as seguintes condições: f (x) > 0, ∀x ∈ R, xg (x) > 0 e g (0) = 0. (a) Apresente o SED de primeira ordem equivalente à equação dada. (b) Determine as soluções de equilíbrio. (c) Analise a estabilidade das soluções de equilíbrio utilizando a função de Liapunov Rx x2 V (x1 , x2 ) = 22 + 0 1 g (u) du. 15. Faça um esboço do retrato de fases dos SED definidos no exercício 12 do Cap. 4. 16. Obtenha a expressão analítica das órbitas para o SED x0 = Ax onde A é uma matriz quadrada de ordem 2 e λ é valor próprio de A com multiplicidade algébrica e geométrica igual a dois. 17. Esboce o retrato de fases do SED x0 = Ax no caso em que os valores próprios de A são 158 (a) λ1 = 0, λ2 6= 0. (b) λ1 = λ2 = 0. 18. Mostre que as órbitas do SED x0 = são elipses. 0 4 −9 0 x 19. Considere o SED x01 = x2 x02 = x1 + 2x21 . (a) Obtenha as soluções de equilíbrio. (b) Determine a expressão analítica das órbitas e represente o retrato de fases (recorra ao computador para traçar o retrato de fases). (c) Represente o retrato de fases numa vizinhança da solução de equilíbrio (0, 0) a partir do SED linearizado. Compare este retrato de fases com o definido na alínea anterior. 20. Discuta o campo de direcções das quatro figuras quanto à estabilidade das soluções de equilíbrio e identifique caso existam, nós, focos e pontos de sela. 2 x2 2 1 1 0 0 -1 -1 -1 0 1 2 x2 x1 -1 159 0 1 2 x1 2 x2 2 1 1 0 0 -1 -1 -1 0 1 2 x2 x1 -1 160 0 1 2 x1 Parte II Equações às Diferenças 161 Com as ED admite-se que o fenómeno x (t) é caracterizável em termos infinitesimais, i.e., é possível atribuir um significado à equação x0 = f (t, x) . Está implícito que x (t) é uma variável contínua e que t varia de forma contínua num certo conjunto. No entanto, em certos casos, o fenómeno apenas se altera em momentos precisos do tempo. Por exemplo, se x (t) representa um certo depósito e se a sua capitalização for anual, x (t) , com t mensurável na unidade ano, apenas varia nos momentos t = 1, t = 2, etc. Neste caso não pode ser conferido um significado a x0 (t) dado que t varia de forma discreta. Sucede, em muitos outros casos, x (t) ser uma função contínua, mas não se sabe, ou é difícil, estabelecer a respectiva ED. Nestes casos prefere-se uma abordagem em tempo discreto. Em econometria é frequente estabelecer-se uma especificação discreta na modelação dos fenómenos (i.e., com t a variar discretamente) embora, em muitos casos, os fenómenos em estudo variem continuamente ao longo do tempo9 . Para distinguirmos a ED da equação às diferenças finitas (doravante EDF) identifica-se o fenómeno em tempo discreto pela letra y. Como se estuda geralmente y como uma função do tempo, escreve-se yt (notação usada em econometria e em sucessões cronológicas), com t ∈ Z (considera-se, habitualmente, sem perda de generalidade, t = 0, 1, 2, ...). Exemplo 65 (a) Na data t = 0 faz-se um depósito de C = 12000 à taxa anual de 5%. Qual o valor do capital na data t = 3? Seja yt o valor do capital na data t. Tem-se y0 = 12000 y1 = y0 + y0 × 0.05 = 12000 + 12000 × 0.05 = 12600 y2 = y1 + y1 × 0.05 = 12600 + 12600 × 0.05 = 13230 y3 = y2 + y2 × 0.05 = 13230 + 13230 × 0.05 = 13892. Deduz-se facilmente que o modelo é yt = yt−1 + yt−1 × 0.05 ou yt = (1.05) yt−1 com a condição inicial y0 = 12000. Questão: existe alguma fórmula que forneça o valor do capital para qualquer valor de t e que dispense, consequentemente, a substituição recursiva dos valores? Observa-se 9 Não cabe aqui explicar as razões pelas quais os econometristas preferem a especificação discreta na modelação dos fenómenos económicos. De qualquer forma, é um facto que os modelos em tempo discreto oferecem suficiente flexibilidade para modelarem a generalidade dos fenómenos económicos. Além disso, é mais fácil a inferência estatística em modelos em tempo discreto do que em modelos em tempo contínuo. 162 que y1 = 1.05y0 y2 = 1.05y1 = 1.052 y0 y3 = 1.05y2 = 1.053 y0 ... sendo possível inferir que yt = (1.05)t y0 . Logo y3 = 1.053 12000 = 13892. (b) Igual à alínea anterior com diferença de que se deposita todos os anos, depois do momento inical, C = 5000. O modelo é agora yt = (1.05) yt−1 + 5000, y0 = 12000. P (c) É interessante observar que yt = ti=0 ai pode-se escrever na forma yt = t−1 X i=0 ai + at ⇔ yt = yt−1 + at , y0 = a0 . (d) Seja yt o número de elementos que existem abaixo da diagonal de uma matriz quadrada de ordem t. Defina-se o modelo para yt (na forma yt = f (yt−1 ) . É fácil constatar que y1 = 0 y2 = 1 y3 = y2 + 2 = 3 y4 = y3 + 3 = 6 ... pelo que yt = yt−1 + t − 1, y1 = 0. A "fórmula"é agora yt = t (t − 1) /2. Veremos adiante como determinar esta expressão no contexto dos modelos de EDF lineares (naturalmente a expressão t (t − 1) /2 pode ser vista como a soma dos termos de uma progressão aritmética). (e) Considere-se o PVI x0 = f (t, x) , x (0) = x0 . O esquema de Euler y0 = x0 yi = yi−1 + f (ti−1 , yi−1 ) ∆, 163 i = 1, 2, ..., n é uma EDF. (f ) Considere-se o seguinte modelo económico multiplicador-acelerador simplificado Ct = byt−1 It = Iti + G Iti = k (Ct − Ct−1 ) yt = Ct + It onde, C é o consumo que depende do rendimento nacional, y do período anterior, I é o investimento que é igual ao investimento induzido, I i , mais gastos do estado, G, e k é o coeficiente de aceleração A última equação representa a condição de equilíbrio do modelo económico. Uma simples substituição produz yt = b (1 + k) yt−1 − bkyt−2 + G. A equação deduzida expressa yt como função de yt−1 e yt−2 . Vejam-se agora algumas definições. Seja t ∈ Z (ou t ∈ N). Uma equação da forma F (t, yt , yt−1 , ..., yt−n ) = 0 é designada por equação às diferenças finitas (EDF) de ordem n. A equação estabelece uma relação entre yt e t, yt−1 , ..., yt−n . Para simplificar admite-se que a equação anterior se pode escrever na forma yt = f (t, yt−1 , ..., yt−n ) . A distinção entre EDF lineares e não lineares e, entre EDF autónoma e não autónoma é idêntica 2 +3 é uma EDF não linear à que foi apresentada para ED (ver ponto 1.1). Por exemplo, yt = yt−1 autónoma de primeira ordem; yt = e−t yt−1 + yt−4 + sen (2t) é uma EDF linear não autónoma da quarta ordem. Definição 15 Uma função φt é designada uma solução da EDF yt = f (t, yt−1 , ..., yt−n ) se φt 164 ¢ ¡ satisfaz φt = f t, φt−1 , ..., φt−n . Todas as definições apresentadas no ponto 1.1 para ED, tais como, solução geral e particular, PVI e solução do PVI servem, com as necessárias adaptações, para EDF. Por exemplo, a expressão yt = t (t − 1) /2 é solução do PVI yt = yt−1 + t − 1, y1 = 0 [ver exemplo 65, alínea d)]. Com efeito, t (t − 1) (t − 1) (t − 2) = + t−1 2 } | 2 | {z {z } yt yt−1 Por outro lado, y1 = (1 × 0) /2 = 0. 165 Capítulo 6 Equações Lineares A EDF linear de ordem n é yt + a1t yt−1 + ... + ant yt−n = et onde ait (i = 1, ..., n) e et são funções em t. Note-se a convenção: et é uma expressão em t onde t varia discretamente; e (t) é uma expressão em t onde t varia continuamente. Assim, se et = t2 , para t ≥ 0, então et assume os valores {0, 1, 4, 9, ...} . Neste capítulo estudam-se as EDF de primeira ordem com coeficientes variáveis e a EDF de ordem n de coeficientes constantes. 6.1 Equação Linear Primeira Ordem Não homogénea com Coeficientes Variáveis A EDF de primeira ordem não homogénea com coeficientes variáveis é da forma yt = φt yt−1 + et . 166 (6.1) Esta EDF é resolúvel pelo método iterativo. Dada a condição inicial yt0 , vem yt0 +1 = φt0 +1 yt0 + et0 +1 yt0 +2 = φt0 +2 yt0 +1 + et0 +2 = φt0 +2 (φt0 +1 yt0 + et0 +1 ) + et0 +2 = φt0 +2 φt0 +1 yt0 + φt0 +2 et0 +1 + et0 +2 yt0 +3 = φt0 +3 yt0 +2 + et0 +3 ¡ ¢ = φt0 +3 φt0 +2 φt0 +1 yt0 + φt0 +2 et0 +1 + et0 +2 + et0 +3 = φt0 +3 φt0 +2 φt0 +1 yt0 + φt0 +3 φt0 +2 et0 +1 + φt0 +3 et0 +2 + et0 +3 ... yt = yt0 t Y φj + j=t0 +1 t X t Y ek k=t0 +1 φj . (6.2) j=k+1 Os seguintes casos particulares são importantes: • φj ≡ φ. Tem-se t−t0 yt = yt0 φ + t X ek φt−k k=t0 +1 t−t0 = yt0 φ t X ek +φ . φk k=t +1 t 0 Na tabela seguinte calcula-se φt Pt k k=1 ek /φ φt et a + bt abt bt2 (t0 = 0) para certas funções e : Pt ek k=1 φk (aφ−bt−a+bφ+btφ+aφt −aφφt −bφφt ) −(φ−1)2 φt b−φ ¶ µ ³ ´ t b ab φ − ab (φ−2tφ−φφt +t2 +φ2 +2tφ2 −2t2 φ−φ2 φt +t2 φ2 )b (1−φ)3 167 (6.3) • ej ≡ e. Tem-se yt = yt0 t Y φj + e j=t0 +1 t X t Y φj . (6.4) k=t0 +1 j=k+1 • e = 0 . Tem-se yt = yt0 t Y φj . (6.5) j=t0 +1 • Se φj ≡ φ 6= 1 e ej ≡ e vem t−t0 yt = yt0 φ t−t0 = yt0 φ +e t X φt−k k=t0 +1 ¡ t−t0 −1 +e φ + φt−t0 + φt−t0 +1 + ... + φ0 1 − φ(t−(t0 +1)+1) 1−φ t−t0 1−φ +e 1−φ = yt0 φt−t0 + eφ0 = yt0 φt−t0 ¢ (6.6) • Se φj ≡ 1 e ej ≡ e vem yt = yt0 + e t X k=t0 +1 1 = yt0 + e (t − t0 ) . (6.7) Exemplo 66 Retome-se o exemplo 65 alínea d): yt = yt−1 + t − 1, y1 = 0. Pela fórmula (6.3), P yt = yt0 φt−t0 + φt tk=t0 +1 φekk , com t0 = 1, yt0 = 0, φ = 1 e et = t − 1 vem yt = t X k=2 6.2 ek = t X k=2 (k − 1) = 1 + 2 + ... + (t − 1) = t (t − 1) /2. Equação Linear de ordem n Não homogénea Com Coeficientes Constantes Considere-se a EDF linear não homogénea de ordem n de coeficientes constantes, an yt+n + an−1 yt+n−1 + ... + a0 yt = et . 168 (6.8) O método iterativo, utilizado no ponto precedente, não funciona eficientemente para estas equações. Exige-se assim um método alternativo de resolução. Começa-se por resolver a equação (6.8) assumindo et ≡ 0. 6.2.1 Equação Homogénea Teorema 20 A solução geral da equação homogénea an yt+n + an−1 yt+n−1 + ... + a0 yt = 0 é da forma yt = c1 u1 + ... + cn un (6.9) onde ci (i = 1, ..., n) são constantes arbitrárias, ui = ui,t são funções em t e {u1 , ..., un } é uma base de dimensão n do espaço das soluções. © ª Exemplo 67 Considere-se a EDF de ordem 2, yt+1 − 5yt + 6yt−1 = 0. Mostre-se que 2t , 3t é uma base do espaço de soluções. Qualquer base do espaço das soluções de uma EDF de ordem 2 deve ser formada por duas soluções linearmente independentes (note-se que a EDF é de ordem dois). Ora como 2t+1 − 5.2t + 6.2t−1 = 0, 3t+1 − 5.3t + 6.3t−1 = 0. conclui-se que 2t e 3t são soluções. Estas soluções são linearmente independentes sse α1 2t + α2 3t = 0, ∀t ⇒ α1 = α2 = 0. Ora α1 = 0 (t = 0) α1 + α2 = 0 ⇔ α =0 (t = 1) 2α1 + 3α2 = 0 2 e as soluções são lineramente independentes. A solução geral é yt = c1 2t + c2 3t , c1 , c2 ∈ R (qualquer solução particular pode.ser obtida a partir da equação precedente mediante uma es- 169 colha apropriada de c1 e c2 ). O exemplo anterior mostrou como se pode verificar se um conjunto de soluções são linearmente independentes. O teorema seguinte estabelece uma forma alternativa mais eficiente de verificar a independência linear. Teorema 21 Sejam u1,t , ..., un,t n soluções da EDF homogénea an yt+n + an−1 yt+n−1 + ... + a0 yt = 0. Estas soluções são linearmente independentes sse o determinante (designado determinante de Casorati) ¯ ¯ u2,t ··· un,t ¯ u1,t ¯ ¯ ¯ u1,t+1 u2,t+1 · · · un,t+1 ¯ ¯ .. .. .. .. ¯ . . . . ¯ ¯ ¯ u1,t+n−1 u2,t+n−1 · · · un,t+n−1 for diferente de zero para algum valor de t. ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ (6.10) Dem. Designe-se o Casorati por Ca (t) . Forme-se o sistema linear homogéneo α1 u1,t + ... + αn un,t = 0 α1 u1,t+1 + ... + αn un,t+1 = 0 S (t) = ··· α1 u1,t+n−1 + ... + αn un,t+n−1 = 0. Como se sabe, obtém-se uma solução única nula do sistema S (t0 ) , i.e., α1 = ... = αn = 0 sse Ca (t0 ) 6= 0. Naturalmente α1 = ... = αn = 0 implica que as soluções {u1,t0 , ..., un,t0 } são linearmente independentes. Mostra-se agora que Ca (t0 ) 6= 0 implica Ca (t) 6= 0 para todo o t e, portanto, Ca (t0 ) 6= 0 implica que as soluções são linearmente independente não só para t0 como também para qualquer t. Suponha-se que Ca (t0 ) 6= 0 e existe um t1 tal que Ca (t1 ) = 0. Então o sistema S (t1 ) admite uma solução não nula, i.e., existe pelo menos um αi não nulo que satisfaz o sistema. Como 170 uj,t1 = F k uj,t0 , k = t1 − t0 , j = 1, ..., n (F é o operador de avanço - ver a definição 16) vem α1 u1,t1 + ... + αn un,t1 = 0 ¡ ¢ ⇔ F k α1 u1,t1 + ... + αn un,t1 = 0 ⇔ α1 u1,t1 + ... + αn un,t1 = 0 ⇒ α1 = ... = αn = 0 mas isto é uma contradição com o facto de α1 u1,t1 + ... + αn un,t1 = 0 implicar pelo menos um αi 6= 0. Logo Ca (t0 ) 6= 0 implica Ca (t) 6= 0 para todo o t.¥ © ª Exemplo 68 (cont.) Verifique-se pelo teorema anterior que 2t , 3t são soluções linearmente independentes. ¯ ¯ t ¯ 2 3t ¯ ¯ t+1 t+1 ¯ 2 3 ¯ ¯ ¯ ¯ = 2t 3t+1 − 2t+1 3t = 2t 3t . ¯ ¯ Por exemplo, para t = 0, o determinante vem igual a 1 e, assim, pelo teorema anterior as soluções são linearmente independentes. Sabe-se já verificar se determinada conjunto de soluções forma uma base do espaço das soluções de uma EDF linear homogénea (sublinhe-se, de coeficiente constantes). Importa agora estudar um método que permita obter a solução geral da EDF. Para o efeito, comece-se por introduzir o operador de avanço (forward ) F . Definição 16 O operador de avanço F sobre a variável yt define-se como F yt = yt+1 . Claro que F 2 yt = F (F yt ) = F yt+1 = yt+2 . Em geral, com k, n ∈ N F n yt+k = yt+k+n . Resulta óbvia a convenção F 0 yt = yt . O operador F aplicado a uma constante resulta na própria constante, F c = c. Com o operador de avanço podemos escrever an yt+n +an−1 yt+n−1 +...+a0 yt = 171 0 na forma an F n yt + an−1 F n−1 yt + ... + a0 F 0 yt = 0, ou ¡ ¢ an F n + an−1 F n−1 + ... + a0 F 0 yt = 0, ou ainda {z } | P (F ) P (F ) yt = 0. A expressão P (F ) designa-se por polinómio característico. Assim, a EDF de segunda ordem ¡ ¢ 5yt+2 + 3yt+1 − 2yt = 0 pode-se escrever na forma 5F 2 + 3F − 2 yt = 0. Existem vários outros operadores. Talvez o mais conhecido seja o operador de diferença ∆, cuja operação é ∆yt = yt − yt−1 . Bastante utilizado em Econometria é o operador de atraso L (lag), Lyt = yt−1 (na área das sucessões cronológicas prefere-se a letra B (backshift) para designar o mesmo operador de atraso). Naturalmente estes operadores podem utilizar-se conjuntamente, por exemplo, L∆yt = L (yt − yt−1 ) = yt−1 − yt−2 . Teorema 22 (EDF linear de ordem n = 1) Considere-se a EDF a1 yt+1 + a0 yt = 0, i.e., (a1 F + a0 ) yt = 0 ou ainda P (F ) yt = 0. Seja r a raíz do polinómio P (F ) = 0, i.e., r = −a0 /a1 . Então yt = c1 rt , c1 ∈ R é a solução geral da EDF. Dem. Atendendo ao teorema 20 a demonstração é simples e deixa-se como exercício.¥ Observe-se que a EDF a1 yt+1 + a0 yt = 0 é equivalente a yt+1 = (−a0 /a1 ) yt ou ainda a yt = φyt−1 , onde φ = (−a0 /a1 ) . É assim também aplicável a fórmula (6.3) com et ≡ 0, obtida no ponto anterior, yt = yt0 φt−t0 . A diferença entre yt = c1 rt , c1 ∈ R e yt = yt0 φt−t0 está em que nesta segunda expressão já se encontra definida a condição inicial yt0 . Teorema 23 (EDF linear de ordem n = 2) Considere-se a EDF a2 yt+2 +a1 yt+1 +a0 yt = 0, ¢ ¡ i.e. a2 F 2 + a1 F + a0 yt = 0 ou ainda P (F ) yt = 0. Sejam r1 e r2 as raízes de P (F ) . Tem-se: 1. se r1 e r2 são reais de distintas a solução geral é yt = c1 r1t + c2 r2t , 172 c1 , c2 ∈ R; 2. se r1 = r2 = r a solução geral é yt = c1 rt + c2 trt , c1 , c2 ∈ R; 3. se r1 , r2 = a + bi a solução geral é yt = ρt (c1 cos (wt) + c2 sen (wt)) onde ρ = √ a2 + b2 e w = arccos (a/ρ) = arcsen (b/ρ) = arctg (b/a) . Dem. Deixa-se como exercício mostrar que as soluções, em cada caso, satisfazem o teorema 20.¥ Teorema 24 (EDF linear de ordem n) Considere-se a EDF an yt+n + an−1 yt+n−1 + ... + a1 yt+1 + a0 yt = 0 ⇔ P (F ) yt = 0. (6.11) Suponha que as n raízes de P (F ) = an F n + an−1 F n−1 + ... + a1 F + a0 são constituídas por k raízes reais distintas, r1 , r2 , ..., rk , s raízes reais iguais a r (r tem multiplicidade s) e 2z raízes complexas distintas do tipo a1 ± b1 i, ..., az ± bz i. Então, a solução geral da EDF é yt = yt1 + yt2 + yt3 onde yt1 = A1 r1t + ... + Ak rkt é a parte da solução associada às raízes r1 , r2 , ..., rk raízes, yt2 = B1 rt + B2 trt + ... + Bs ts−1 rt é a parte da solução associada às s raízes reais iguais a r (r tem multiplicidade s) e yt3 = ρt1 (C1 cos w1 t + C2 sen w1 t) + ... ¢ ¡ +ρtz C2(z−1) cos wz t + C2z sen wz t ; 173 onde ρi = q a2i + b2i e wi = arccos (ai /ρi ) é a parte da solução associada às 2z raízes complexas distintas do tipo a1 ± b1 i, ..., az ± bz i. Exemplo 69 Considere-se a EDF de ordem 5, P (F ) yt = 0 onde µ³ ¶ √ ´2 2 P (F ) = (F − 4) (F − 2) F − 3 + 1 . 2 É fácil ver que as raízes do polinómio P (F ) são o n √ 2, 4, 4, 3 ± i . Pelo teorema anterior a solução geral é yt = c1 2t + c2 4t + c3 t4t + ρt (c4 cos (wt) + c5 sen (wt)) q¡√ ¢ 2 onde ρ = 3 + 12 = 2 e w = arcsen (b/ρ) = arcsen (1/2) = π/6. 6.2.2 Equação Não Homogénea Estuda-se a seguir a equação a EDF P (F ) yt = et . Definição 17 O polinómio em F , Q (F ) , designa-se polinómio aniquilador (PA) da função et se Q (F ) et = 0. Exemplo 70 É fácil ver que Q (F ) = F − 1 é o PA de et ≡ c (constante). Com efeito, Q (F ) et = (F − 1) c = F c − c = c − c = 0. Por seu turno, o PA da função et = 3 + 4t é Q (F ) = (F − 1)2 . Com efeito, ¡ ¢ Q (F ) et = (F − 1)2 (3 + 4t) = F 2 − 2F + 1 (3 + 4t) = F 2 3 + F 2 4t − 2F 3 − 2F 4t + 3 + 4t = 3 + 4 (t − 2) − 6 − 8 (t − 1) + 3 + 4t = 0. 174 A tabela seguinte auxilia na procura do PA para certas funções de et . Polinómios Aniquiladores et Q (F ) c (constante) F −1 (F − 1)j+1 ¡ ¢ F − mk ¡ ¢j+1 F − mk cj tj + cj−1 tj−1 + ... + c1 t + c0 c mkt ¡ j ¢ cj t + cj−1 tj−1 + ... + c1 t + c0 mkt (F − a)2 + b2 ρt (c1 cos wt + c2 sen wt) , c1 , c2 ∈ R c, cj 6= 0, cj−1 ∈ R, cj−2 ∈ R, ..., c0 ∈ R Teorema 25 Se Q1 (F ) é PA de et e Q2 (F ) é PA de ht então Q (F ) = Q1 (F ) Q2 (F ) é PA de et + ht . Dem. Vem Q (F ) (et + ht ) = Q1 (F ) Q2 (F ) (et + ht ) = Q1 (F ) Q2 (F ) et + Q1 (F ) Q2 (F ) ht = Q2 (F ) Q1 (F ) et + Q1 (F ) Q2 (F ) ht = 0.¥ | {z } | {z } 0 0 Expõe-se a seguir o método do polinómio aniquilador para a resolução de EDF lineares não homogéneas de coeficientes constantes, P (F ) yt = et . Suponha-se então: • P (F ) um polinómio de ordem n; • Q (F ) um polinómio de ordem m e tal que Q (F ) et = 0 e, • yth a solução da EDF homogénea P (F ) yth = 0. Multiplique-se ambos os termos da EDF P (F ) yt = et pelo PA de et , Q (F ) . Vem Q (F ) P (F ) yt = Q (F ) et = 0. 175 A expressão Q (F ) P (F ) yt = 0 representa uma EDF linear de ordem n+m (soma das ordem dos polinómios P e Q). Esta EDF resolve-se facilmente considerando o teorema 24 (naturalmente as raízes do polinómio Q (F ) P (F ) correspondem às raízes de P (F ) mais as de Q (F )). A solução geral da EDF Q (F ) P (F ) yt = 0 deve possuir n+m soluções linearmente independentes (teorema 20). Vem assim, yt = c1 u1 + ... + cn un + b1 v1 + ... + bm vm | {z } | {z } = sol. assoc. a P (F ) yth + ytp . (6.12) sol. assoc. a Q(F ) onde ci e bj são constantes e ui e vj são funções em t. A solução yth deve obrigatoriamente estar presente em yt , pois yth também satisfaz Q (F ) P (F ) yt = 0 (basta verificar que P (F ) yth = 0 ⇒ Q (F ) P (F ) yth = 0). Resta analisar a natureza de ytp = b1 v1 + ... + bm vm . Ora ´ ³ P (F ) yt = et ⇔ P (F ) yth + ytp = et ⇔ P (F ) yth + P (F ) ytp = et ⇔ P (F ) ytp = et . | {z } 0 Donde, ytp é solução da EDF não homogénea pois P (F ) ytp = et ; mas, como ytp não pode ser solução geral, pois esta é da forma da equação (6.12), conclui-se que ytp é solução particular da EDF não homogénea. Como consequência, a relação P (F ) ytp = et permite determinar os coeficientes bi definidos na solução ytp = b1 v1 + ... + bm vm ; de facto, existe apenas um conjunto de valores bi tais que a relação P (F ) ytp = et é válida. Estes valores determinam-se através do método dos coeficientes indeterminados, como se apresenta no próximo exemplo. Em suma, para resolver a EDF P (F ) yt = et pode-se proceder da seguinte forma: 1. Determinar as raízes de P (F ) e, a partir de delas, determinar yth . 2. Determinar o polinómio aniquilador Q (F ) (ver tabela) e as suas raízes. 3. A partir das raízes de P (F ) e de Q (F ) determinar a solução de Q (F ) P (F ) yt = 0, identificando a parte da solução que diz respeito a yth e a parte que diz respeito a yt0 (ter em atenção as raízes comuns a P (F ) e a Q (F )). 4. Determinar as constantes associadas à solução yt0 pelo método dos coeficientes indetermi176 nados a partir da relação P (F ) yt0 = et 5. Estabelecer a solução geral, y = yth + yt0 , onde yth é a solução geral da equação homogénea P (F ) yth = 0 e yt0 é a solução particular da EDF, i.e., verifica P (F ) yt0 = et . Exemplo 71 Considere-se a EDF yt+2 −5yt+1 +6yt = 5+2t. Para resolver esta EDF procede-se da seguinte forma: 1. Determinar as raízes de P (F ) e, a partir de delas, determinar yth . As raízes de P (F ) = F 2 −5F +6 são {2, 3} pelo que a solução da EDF homogénea P (F ) yth = 0 é, pelo teorema 23, yth = c1 2t + c2 3t . 2. Determinar o polinómio aniquilador Q (F ) (ver tabela) e as suas raízes. Pela tabela conclui-se que Q (F ) = (F − 1)2 é um PA de et = 5 + 2t. As raízes de Q (F ) são {1, 1} . 3. A partir das raízes de P (F ) e de Q (F ) determinar a solução de Q (F ) P (F ) yt = 0, identificando a parte da solução que diz respeito a yth e a parte que diz respeito a yt0 . Atendendo a que as raízes de Q (F ) P (F ) são {2, 3} ∪ {1, 1} a solução da EDF Q (F ) P (F ) yt = 0 é, pelo teorema 24, yt = c1 2t + c2 3t + b1 1t + b2 t1t = c1 2t + c2 3t + b1 + b2 t. | {z } | {z } yth ytp 4. Determinar as constantes b1 e b2 associadas à solução yt0 pelo método dos coeficientes indeterminados a partir da relação P (F ) yt0 = et . Tem-se P (F ) ytp = 5 + 2t ¡ 2 ¢ F − 5F + 6 (b1 + b2 t) = 5 + 2t ... (2b1 − 3b2 ) + 2b2 t = 5 + 2t. 177 Relativamente à última equação, o lado esquerdo é igual ao lado direito sse b1 = 4 2b1 − 3b2 = 5 ⇔ b = 1. 2b = 2 2 2 Em suma, a solução geral da EDF não homogénea yt+2 − 5yt+1 + 6yt = 5 + 2t é yt = yth + ytp = c1 2t + c2 3t + 4 + t. 6.3 Equações Linearizáveis Considere-se uma EDF de primeira ordem não linear yt = f (yt−1 , yt−2 , ..., yt−n ) . Embora os valores de yt possam ser obtidos recursivamente não é geralmente possível obter fórmulas explícitas para a solução. No entanto, num certo número de casos especiais é possível transformar a EDF não linear numa EDF linear através de uma mudança de variáveis. Por exemplo, a EDF não linear β α yt−2 yt = yt−1 pode ser linearizada através da mudança de variável zt = log (yt ). Com efeito, zt = αzt−1 + βzt−2 . Uma vez obtida a solução zt , a solução yt obtém-se facilmente tendo em conta que yt = ezt . A equação yt yt−1 + a1 yt + a2 yt−1 = et (6.13) (de Riccati com coeficientes constantes), pode ser transformada numa EDF linear através da mudança de variável yt = zt+1 − a1 . zt 178 (6.14) Com efeito, representando a EDF (6.13) usando yt = µ zt+1 − a1 zt ¶µ zt zt−1 ¶ − a1 + a1 µ zt+1 zt − a1 vem ¶ µ ¶ zt+1 zt − a1 + a2 − a1 = et zt zt−1 isto é, zt+1 + (a2 − a1 ) zt + (−et − a1 a2 ) zt−1 = 0. Exemplo 72 Considere-se yt yt−1 + 2yt + 4yt−1 = −9. Com a mudança de variável (6.14) resulta zt+1 + 2zt + zt−1 = 0. Esta EDF tem solução geral (ver o teorema 23) zt = c1 (−1)t + c2 t (−1)t , c1 , c2 ∈ R. A solução geral da EDF de Riccati é yt = c1 (−1)t+1 + c2 (t + 1) (−1)t+1 − 2. c1 (−1)t + c2 t (−1)t Apresenta-se a seguir um método mais sistemático para a determinação da mudança de variável que permite linearizar uma EDF. Restringe-se a análise à EDF de primeira ordem yt = f (yt−1 ) . (6.15) Suponha-se que é conhecida a expressão g (y) que satisfaz a expressão δg (f (y)) = g (y) df (y) dy (6.16) onde δ é uma constante conhecida. Defina-se a transformação z (f (y)) = Z f (y) 1 du g (u) (6.17) para y pertencente a um intervalo aberto no qual g (y) é diferente de zero. Mostre-se que a solução da equação precedente define a mudança de variável que lineariza a EDF (6.15). Isto 179 é, mostre-se que z (f (y)) = δz (y) + C, (C é uma constante). Com efeito, atendendo à equação (6.16) e ao teorema fundamental do cálculo vem dz (f (y)) dy = = = 1 df (y) g (f (y)) dy δg (f (y)) 1 g (f (y)) g (y) δ g (y) e integrando obtém-se z (f (y)) = δz (y) + C i.e., z (yt ) = δz (yt−1 ) + C. Note-se que a solução de zt = δzt−1 + C é Aδ t + C 1−δ zt = Ct + C δ 6= 1 δ = 1. Exemplo 73 Considere-se a EDF yt = ayt−1 (1 − yt−1 ) , f (y) = ay (1 − y) . A equação (6.16) vale δg (ay (1 − y)) = g (y) a (1 − 2y) A função g não é conhecida a priori mas a expressão anterior sugere que se tente g (y) = d + cy onde d e c são parâmetros a determinar. Assim, δg (ay (1 − y)) = g (y) a (1 − 2y) δ (d + acy (1 − y)) = a (d + cy) (1 − 2y) dδ + acyδ − acy 2 δ = ad + acy − 2ady − 2acy 2 (2ac − acδ) y 2 + (acδ − ac + 2ad) y + (dδ − ad) = 0. Pelo método dos coeficientes indeterminados obtém-se δ = a = 2 e c = −2d (um grau de liberdade). Escolha-se, por exemplo, c = −1. Logo uma escolha válida para g é g (y) = 1/2 − y. 180 Resolva-se agora a equação (6.17) para g (y) = 1/2 − y, dz 1 = . dy 1/2 − y Tem-se z = − log( 12 −y) ou y = 12 −e−z . Substitua-se agora esta expressão em yt = ayt−1 (1 − yt−1 ) , i.e. 1 − e−zt = 2 2 µ 1 − e−zt 2 ¶µ ¶ 1 −zt−1 1− +e 2 ou e−zt = 2e−zt−1 ou zt = 2zt−1 − log 2. Donde zt = A2t + log 2 e finalmente yt = ´ 1 1³ t 1 − B2 − e−zt = 2 2 onde B é uma constante arbitrária. Especificando previamente uma dada função g é possível descobrir famílias de funções f para as quais existe uma transformação linearizante. Concretamente, dada uma função g, resolve-se a equação (6.16) em ordem à função incógnita f, função de y. A transformação linearizante obtém-se depois a partir de (6.17). Exemplo 74 Escolha-se g (y) = δ p y (1 − y). A equação (6.16) fica p p df f (1 − f ) = y (1 − f ) . dy Esta é uma ED com variáveis separáveis (em y e f ) cuja solução é √ f (y) = sen2 (δ arcsen ( y) + C) . 181 Escolha-se, por exemplo, δ = 2 e C = 0. Resulta, depois de algumas simplificações, f (y) = 4y (1 − y) . Assim, a EDF yt = 4yt−1 (1 − yt−1 ) é linearizável. A transformação linearizante obtém-se a ¡√ ¢ partir de (6.17) e vem z = 2 arcsen y ou y = sen2 (z/2) . Esta mudança de variável produz sen2 ³z ´ t 2 = 4 sen2 ³z t−1 2 ´ cos2 ³z t−1 2 ´ = sen2 (zt−1 ) ou zt = 2zt−1 cuja solução é zt = A.2t e, portanto, ¡ ¢ yt = sen2 B.2t , (B é uma constante arbitrária). 182 Exercícios 1. Determine a solução (considere como valor inicial y0 ) e calcule limt→+∞ yt nos seguintes casos: (a) yt = t 1+t yt−1 +e (b) yt = φyt−1 + t (c) yt = φyt−1 + λt−1 (considere os casos φ 6= λ e φ = λ) 2. Obtenha a solução da EDF com a condição inicial y0 = c. αyt−1 + a, t ≤ t∗ yt = βy t > t∗ t−1 + b 3. Suponha que |c1,t | ≤ r |c1,t−1 | , c1,0 = 1 |c2,t | ≤ r |c2,t−1 | + |c1,t−1 | , c2,0 = 0. Mostre que |c1,t | ≤ rt |c2,t | ≤ trt−1 . 4. Use a mudança de variável zt = 1/yt para resolver o PVI tyt+1 yt + yt+1 − yt = 0, y0 = 1 5. Use a mudança de variável yt = sen zt para resolver yt+1 = 2yt 6. Use uma transformação logarítmica para resolver 183 p 1 − yt2 . √ (a) yt /yt−1 = 2 −t yt−1 , y1 = 1. (b) yt+2 = yt+1 yt2 . 7. Considere a sequência de Fibonacci 1, 1, 2, 3, 5, 8, 13, 21, ... (cada elemento é a soma dos dois últimos elementos). Defina um PVI para a sequência de Fibonacci e resolva-a. 8. Seja Dn o valor do determinante da seguinte matriz quadrada de ordem n a b c a 0 c 0 0 . . .. .. 0 0 0 0 0 0 0 0 ··· b 0 ··· a b ··· c a ··· .. .. . . . . . 0 0 ··· 0 0 ··· 0 0 ··· 0 0 0 0 0 0 0 0 0 0 0 0 . .. .. .. . . . a b 0 c a b 0 c a Fazendo um desenvolvimento Laplaceano ao longo da primeira linha obtenha uma EDF de ordem 2 para Dn . Estabeleça um PVI e resolva-o. 9. Resolva as seguintes EDF (a) yt + 12 yt−1 − 12 yt−2 = 1. (b) yt+2 − 4yt+1 + 4yt = 2t . (c) yt+2 − yt+1 + 12 yt = t2 . (d) ∆2 yt = t + et . 184 Capítulo 7 Sistemas de Equações Lineares Não Homogéneas Com Coeficientes Constante Neste capítulo vamos considerar o seguinte sistema de equações lineares (SEDF) de primeira ordem y1,t = a11 y1,t−1 + ... + a1n yn,t−1 + g1,t y2,t = a21 y1,t−1 + ... + a2n yn,t−1 + g2,t .. . yn,t = an1 y1,t−1 + ... + ann yn,t−1 + gn,t (nota: quando não haja possibilidade de confusão yi,t escreve-se na forma yit e yi,t−1 na forma yit−1 ) ou, compactamente yt = Ayt−1 + gt . A EDF de ordem n zt = α1 zt−1 + ... + αn zt−n + et 185 (7.1) é caso particular de (7.1). Com efeito, considerem-se as mudanças de variável y1,t = zt y2,t = zt−1 ... yn,t = zt−n+1 . Tem-se y1,t = α1 y1,t−1 + ... + αn yn,t−1 + et y2,t = y1,t−1 .. . yn,t = yn−1,t. De forma compacta, o SEDF escreve-se yt = Ayt−1 + gt onde A= α1 α2 · · · αn−1 αn 1 .. . 0 .. . ··· .. . 0 .. . 0 .. . 0 0 ··· 1 0 , gt = et 0 .. . 0 . Teorema 26 Considere-se o PVI yt = Ayt−1 +gt , yt0 = ζ e assuma-se que gt está bem definido para t = t0 , t0 + 1, ... Então existe uma solução única definida para t = t0 , t0 + 1, ... que é dada por t−t0 yt = A ζ+ t X s=t0 +1 186 At−s gs . (7.2) Dem. Sem perda de generalidade assuma-se t0 = 0. Prove-se em primeiro lugar que qualquer solução tem a forma (7.2). Tem-se, resolvendo o sistema iterativamente, y0 = ζ y1 = Aζ + g1 y2 = Ay1 + g2 = A (Aζ + g1 ) + g2 = A2 ζ + Ag1 + g2 ... t yt = A ζ + t X At−s gs . s=1 Reciprocamente, verifica-se facilmente que qualquer expressão da forma (7.2) é solução da equação (7.1). Com efeito, (7.2) satisfaz o SEDF yt = Ayt−1 + gt : à t−1 Ayt−1 + gt = A A = At ζ + ζ+ t−1 X t−1−s A gs s=1 t X ! t + gt = A ζ + t−1 X At−s gs + gt s=1 At−s gs = yt .¥ s=1 7.1 Caso Homogéneo No caso gt ≡ 0 vem yt = Ayt−1 . Pelo teorema 26 a solução do PVI yt = Ayt−1 , y0 = (y1,0 , y2,0 , ..., yn,0 )T é yt = At y0 . Exemplo 75 Suponha-se y1t = αy1t−1 y2t = βy2t−1 e y0 = 1 2 187 . Na forma compacta, o SEDF escreve-se yt = Ayt−1 onde α 0 α 0 A= Note-se At = | α 0 0 β ... 0 β 0 β {z t vezes A solução do SEDF com a condição inicial y0 é yt = At y0 = αt 0 0 βt . = } 1 2 αt 0 0 β t αt 2β t = . . No caso em que A não é uma matriz diagonal a expressão de At é mais difícil de obter (não é exequível multiplicar-se t vezes a matriz A, sobretudo para valores altos de t. Obviamente o estudo de limt→+∞ At exige que se escreva At através de funções elementares). 7.1.1 Caso Geral Recorda-se o Lema 15 (Cayley-Hamilton) Seja A uma matriz quadrada e p (λ) = |A − λI| = 0 a respectiva equação característica. Então p (A) = 0. Exemplo 76 Verique-se o lema anterior para A= 2 2 0 4 . A equação característica é p (λ) = |A − λI| = (2 − λ) (4 − λ) = 0 188 Agora, p (A) = (2I − A) (4I − A) = 0 −2 0 −2 2 −2 0 0 = 0 0 0 0 tal como o lema anterior estabelece. Note-se: (1) neste exemplo poderíamos ter escrito p (A) = (A − 2I) (A − 4I) = 0; (2) se C e D são matrizes e CD = 0 não se segue que C = 0 ou D = 0. Observe-se, com efeito (A − 2I) 6= 0 e (A − 4I) 6= 0 mas (A − 2I) (A − 4I) = 0. Teorema 27 Seja A uma matriz quadrada de ordem n. Então At = n−1 X ci+1,t Mi , i=0 onde M0 = I Mi = (A − λi I) Mi−1 e ci,t , i = 1, ..., n, satisfazem o sistema de equações às diferenças c1,t . . . = cn,t com a condição inicial Dem. λ1 0 0 ··· 1 λ2 0 ··· 0 .. . 1 .. . λ3 · · · .. . . . . 0 ··· c1,0 c2,0 .. . cn,0 0 1 = 1 0 .. . 0 0 0 c1,t−1 .. 0 . .. . cn,t−1 λn (7.3) . (7.4) (Introdução) Como o polinómio característico de uma matriz quadrada de ordem n estabelece, pelo lema 15, uma relação entre I, A, A2 , ..., An segue-se que An pode ser escrita como uma combinação linear das matrizes I, A, A2 , ..., An−1 , i.e., An = cn−1 An−1 + ... + c0 I, 189 onde ci são constantes1 ). Resulta também que An+k com k ∈ N pode ser escrita como uma combinação linear das matrizes I, A, A2 , ..., An−1 . De facto, considere-se k = 1. Tem-se ¡ ¢ An+1 = An A = cn−1 An−1 + cn−2 An−2 + ... + c0 I A = cn−1 An + cn−2 An−1 + ... + c0 A ¢ ¡ = cn−1 cn−1 An−1 + cn−2 An−2 + ... + c0 I + cn−2 An−1 ... + c0 A = (cn−1 cn−1 + cn−2 ) An−1 + (cn−1 cn−2 + cn−3 ) An−2 + ... + cn−1 c0 I e, portanto, An+1 pode ser escrita como uma combinação linear das matrizes I, A, A2 , ..., An−1 . Por indução, conclui-se An+k com k ∈ N pode ser escrita como uma combinação linear das matrizes I, A, A2 , ..., An−1 (cujos coeficientes dependem do expoente n + k). Naturalmente, a mesma conclusão se aplica a At (interpretando t = n + k). Os ci acima definidos dependem o índice t, em At . Desta forma, o lema 15 permite escrever At = n−1 X ci+1,t Mi = c1,t M0 + c2,t M1 + ... + cn,t Mn−1 i=0 onde M0 = I Mi = (A − λi I) Mi−1 . Note-se que Mn = (A − λ1 I) (A − λ2 I) ... (A − λn I) = p (A) = 0, pelo lema 15. As funções ci,t determinam-se como se segue. Tendo em conta, At+1 = AAt , AMi = AMi − λi+1 Mi + λi+1 Mi = (A − λi+1 I) Mi + λi+1 Mi = Mi+1 + λi+1 Mi (7.5) 1 Por exemplo, vimos no exemplo 76 que (2I − A) (4I − A) = A2 − 6A + 8I = 0. Logo A2 = 6A − 8I, i.e., A2 pode-se escrever como uma combinação linear entre I e A. 190 e Mn = 0 vem At+1 = n−1 X ci+1,t+1 Mi (7.6) i=0 At+1 = AAt n−1 X = A ci+1,t Mi = = i=0 n−1 X ci+1,t (Mi+1 + λi+1 Mi ) i=0 n−1 X ci+1,t Mi+1 + i=0 n−1 X (7.7) ci+1,t λi+1 Mi i=0 = c1,t M1 + ... + cn−1,t Mn−1 + cn Mn + c1,t λ1 M0 + ... + cn,t λn Mn−1 = c1,t λ1 M0 + n−1 X (ci,t + ci+1,t λi+1 ) Mi . (7.8) i=1 A partir das equações (7.6) e (7.8) vem c1,t+1 M0 + c2,t+1 M1 + ... + cn,t+1 Mn−1 = c1,t λ1 M0 + (c1,t + c2,t λ2 ) M1 + ... + (cn−1,t + cn,t λn ) Mn−1 . Igualando os coeficientes homólogos resulta c 1,t+1 .. . cn,t+1 = λ1 0 0 ··· 0 1 λ2 0 ··· 0 0 .. . 1 .. . λ3 · · · .. . . . . 0 .. . 0 ··· 0 1 λn c1,t .. . cn,t . Este sistema é equivalente ao sistema (7.3). A condição inicial obtém-se a partir da igualdade A0 = I = c1,0 I + ... + cn,0 Mn−1 .¥ Pelo teorema 27 a solução do sistema yt = Ayt−1 , com a condição inicial é dada pela expressão yt = At y0 = n−1 X i=0 191 ci+1,t Mi y0 . (7.9) A fórmula (7.9) é válida qualquer que seja a natureza dos valores próprios da matriz A. 7.1.2 Sistema de Duas Equações (n = 2) Vamos considerar o caso particular importante do sistema y1t y2t = A y1t−1 . y2t−1 Sejam λ1 , λ2 os valores próprios de A. Vamos estudar os seguintes casos: Valores Próprios Reais e Distintos Suponha-se λ1 , λ2 ∈ R e λ1 6= λ2 . Resolvendo (7.3) com a condição (7.4) obtém-se c1t = λt1 , c2t = λt1 − λt2 . λ1 − λ2 Tem-se yt = 1 X ci+1,t Mi y0 = (c1,t M0 + c2,t M1 ) y0 i=0 = (c1,t I + c2,t (A − λ1 I)) y0 ¶ µ λt1 − λt2 t (A − λ1 I) y0 . = λ1 I + λ1 − λ2 (7.10) (7.11) Exemplo 77 Resolva-se o PVI onde y1t y2t = A y1t−1 y2t−1 A= , 0 1 −2 −3 192 y0 = . 1 1 Figura 7-1: Trajectórias y1t , y2t (traço grosso) y1 y2 750 500 250 2 -250 4 6 8 t 10 -500 -750 -1000 Os valores próprios são λ1 = −2, λ2 = −1. Utilizando a fórmula (7.11) e considerando 2 A − λ1 I = 1 −2 −1 vem 1 0 t t 2 1 1 + (−2) − (−1) (−2) − (−1) −2 −1 0 1 1 −2 (−2)t + 3 (−1)t . = t t 4 (−2) − 3 (−1) yt = (−2)t Na figura 7-1 apresentam-se as trajectórias y1t , y2t . Note-se que ambas as trajectórias se afastam cada vez mais do valor inicial à media que t aumenta. Observação 15 Pode-se provar que a solução do sistema yt = Ayt−1 , no caso em que os valores próprios λi , i = 1, 2, ..., n são reais e distintos, pode apresentar-se como uma combinação linear de soluções independentes do tipo λti ui onde ui é o vector próprio associado ao valor próprio λi . Deixa-se como exercício mostrar: (a) se Aui = λi ui então λti ui é uma solução do sistema h i yt = Ayt−1 ; (b) escrevendo P = u1 · · · un e Λ = diag [λ1 , ..., λn ] então At = P Λt P −1 e, portanto, yt = P Λt P −1 y0 . 193 Valores Próprios Complexos Suponha-se que os valores próprios são α ± βi. Usa-se novamente a fórmula (7.11) µ ¶ λt1 − λt2 t (A − λ1 I) y0 yt = λ1 I + λ1 − λ2 com λ1 = α + βi e λ2 = α − βi. O valor próprio λ1 na forma trigonométrica é λ1 = ρ (cos θ + i sen θ) onde q ρ = α2 + β 2 e θ = arcsen β/ρ = arccos α/ρ. Na forma exponencial tem-se λ1 = ρeiθ . Consequentemente, ´t ³ λt1 = (α + βi)t = ρeiθ = ρt eitθ = ρt (cos tθ + i sen tθ) . Por outro lado, λt1 i = ρt (cos tθ + i sen tθ) i = ρt (− sen tθ + i cos tθ) . Relativamente ao conjugado λ2 , vem λ2 = (α − βi) = ρ (cos θ − i sen θ) , λt2 = (α − βi)t = ρt (cos tθ − i sen tθ) , λt2 i = (α − βi)t i = ρt (sen tθ + i cos tθ) . Desta forma, escrevendo, ¶ µ ¶ µµ t ¶ λt1 − λt2 λt1 − λt2 λ1 λ2 − λ1 λt2 t yt = λ1 I + I+ (A − λ1 I) y0 = A y0 λ1 − λ2 −λ1 + λ2 λ1 − λ2 194 (7.12) tem-se λt1 λ2 − λ1 λt2 −λ1 + λ2 λt1 − λt2 λ1 − λ2 1α 1 1α 1 i (α + iβ)t + (α + iβ)t − i (α − iβ)t + (α − iβ)t 2β 2 2β 2 ¢ 1¡ t ¢ 1α ¡ t = ρ (− sen tθ + i cos tθ) + ρ (cos tθ + i sen tθ) 2β 2 ¡ ¢ 1α t 1 − ρ (sen tθ + i cos tθ) + ρt (cos tθ − i sen tθ) 2β 2 β cos tθ − α sen tθ = ρt β = 1 1 i (α + iβ)t + i (α − iβ)t 2β 2β ¢ ¢ 1 ¡ t 1 ¡ t = − ρ (− sen tθ + i cos tθ) + ρ (sen tθ + i cos tθ) 2β 2β sen tθ = ρt β = − Assim, yt ¶ ¶ λt1 − λt2 λt1 λ2 − λ1 λt2 I+ = A y0 −λ1 + λ2 λ1 − λ2 ¶ µ sen tθ t β cos tθ − α sen tθ I+ A y0 . = ρ β β µµ (7.13) Observação 16 Seguindo o raciocínio apresentado na observação 15 vem que se A possui 2n raízes complexas distintas do tipo λ1 , λ̄1 , λ2 , λ̄2 , ..., λn , λ̄n a solução virá na forma n ³ ´ X t cj λtj zj + c2j λ̄j z̄j yt = j=1 onde cj (j = 1, ..., 2n) são constantes arbitrárias, zj é o vector próprio complexo associado ao vector próprio λj e z̄j é o vector conjugado de zj . Para concretizar suponha-se que A é de tipo 2 × 2 (caso de duas raízes complexas). Tem-se t yt = c1 λt z + c2 λ̄ z̄ 195 ou, com λ = α + βi e z = z 1 + z 2 i (z 1 e z 2 são vectores reais de tipo 2 × 1), ¢ ¢ ¡ ¡ yt = c1 (α + βi)t z 1 + z 2 i + c2 (α − βi)t z 1 − z 2 i . Usando coordenadas polares (ver as relações apresentadas a partir da página ) pode-se escrever (com A1 e A2 constantes arbitrárias) ¢ ¢ ¡ ¡ yt = c1 (α + βi)t z 1 + z 2 i + c2 (α − βi)t z 1 − z 2 i = c1 (α + iβ)t z 1 + c1 (α + iβ)t iz 2 + c2 (α − iβ)t z 1 − c2 (α − iβ)t iz 2 = c1 ρt (cos tθ + i sen tθ) z 1 + c1 ρt (− sen tθ + i cos tθ) z 2 +c2 ρt (cos tθ − i sen tθ) z 1 − c2 ρt (sen tθ + i cos tθ) z 2 ¡ ¢ = ρt c1 (cos tθ + i sen tθ) z 1 + c1 (− sen tθ + i cos tθ) z 2 ¡ ¢ +ρt c2 (cos tθ − i sen tθ) z 1 − c2 (sen tθ + i cos tθ) z 2 ¡¡ ¢ ¡ ¢ ¢ = ρt c1 z 1 + c1 iz 2 + c2 z 1 − c2 iz 2 cos tθ + c1 iz 1 − c1 z 2 − c2 iz 1 − c2 z 2 sen tθ = ρt ((c1 + c2 )z 1 + (c1 − c2 ) iz 2 ) cos tθ + ((c1 − c2 ) iz 1 + (−c1 − c2 )z 2 ) sen tθ | {z } | {z } | {z } | {z } A1 A2 A2 ¡¡ ¢ ¡ ¢ ¢ = ρ A1 z 1 + A2 z 2 cos tθ + A2 z 1 − A1 z 2 sen tθ t −A1 (7.14) Exemplo 78 Resolva-se o PVI y1t y2t = A y1t−1 y2t−1 , A= 1 1 −2 3 , y0 = 1 0 . A partir de |A − λI| = 0 sai λ1 = 2 + i e λ2 = 2 − i. Consequentemente, ρ = 196 √ √ 22 + 12 = 5, θ = arcsen √15 . Se utilizarmos a fórmula (7.13) vem yt ¶ sen tθ β cos tθ − α sen tθ I+ A y0 = ρ β β ³ ´ ³ ´ √1 √1 cos t arcsen − 2 sen t arcsen 0 5 5 ´ ³ ´ ³ = ρt 1 1 √ √ 0 cos t arcsen 5 − 2 sen t arcsen 5 ³ ´ ³ ´ sen t arcsen √15 sen t arcsen √15 1 ´ ³ ´ ³ + 3 sen t arcsen √15 −2 sen t arcsen √15 0 ´ ³ ´´ ¡√ ¢t ³ ³ 5 cos t arcsen √15 − sen t arcsen √15 . ´ ³ = ¡√ ¢t 1 −2 5 sen t arcsen √5 t µ Note-se arcsen √15 = . 463 65. Utilize-se agora a fórmula (7.14). O vector próprio associado a λ = 2 + i resulta da solução do sistema v1 1 (A − (2 + i) I) Tem-se z= Assim, yt = y1t y2t 1−i 2 v2 = 0 0 −1 i. + 0 2 | {z } | {z } = z1 z2 µ ¶ ³√ ´t 1 −1 cos t arcsen √1 5 A1 + A2 = 5 2 0 ¶ µ 1 −1 1 √ . + A2 − A1 sen t arcsen 5 2 0 197 8< Figura 7-2: Soluções do PVI. Traço Grosso y1t , Traço Fino y2t y1t y2t 5´ 106 12 14 16 18 20 22 24 t -5´ 106 -1´ 10 7 Para a condição inicial resulta y0 = A1 1 2 + A2 pelo que A1 = 0, A2 = −1. Assim yt y0 = −1 0 1 0 = A1 − A2 2A1 = 1 0 ¶ ¶ µ µ ³√ ´t −1 1 1 sen t arcsen √1 + = 5 cos t arcsen √ 5 5 −2 0 ¡√ ¢t ³ ³ ´ ³ ´´ cos t arcsen √15 − sen t arcsen √15 5 . ³ ´ = ¡√ ¢t 1 √ −2 5 sen t arcsen 5 Na figura 7-2 apresentam-se as trajectórias y1t , y2t . É importante notar que não é forçoso saber-se a solução para traçar as trajectórias. De facto as trajectórias podem ser obtidas muito facilmente usando-se um qualquer algoritmo de recorrência. Por exemplo, um programa do tipo Excel gera facilmente trajectórias de sistemas dinâmicos discretos. 198 Raízes Iguais Suponha-se que os valores próprios são λ, λ (λ tem multiplicidade 2). Considere-se a fórmula (7.9) 1 X yt = ci+1,t Mi y0 = (c1,t M0 + c2,t M1 ) y0 i=0 = (c1,t I + c2,t (A − λ1 I)) y0 . Não é possível utilizar a fórmula (7.11) dado que o sistema (7.3) é diferente. Com efeito, pela fórmula (7.3) tem-se c1,t c2,t = λ 0 1 λ c1,t−1 c2,t−1 cuja solução com a condição inicial c1,0 = 1, c2,0 = 0, é c1,t = λt , c2,t = tλt−1 . Assim a solução do sistema yt = Ayt−1 com a condição inicial y0 é ¡ ¢ yt = λt I + tλt−1 (A − λI) y0 . (7.15) Observação 17 No caso geral de n equações, yt = Ayt−1 , com a condição inicial y0 , se λ valor próprio de multiplicidade n então é fácil concluir, depois de se resolver (7.3), com λ = λ1 = ... = λn , que a solução é yt = n−1 X ci+1,t Mi y0 i=0 ´ ³ c1,t I + c2,t (A − λI) + ... + cn,t (A − λI)n−1 y0 µ 1 = λt I + tλt−1 (A − λI) + t (t − 1) λt−2 (A − λI)2 2 ¶ 1 n−1 t−n+1 (t (t − 1) ... (t − n + 2)) λ y0 . +... + (A − λI) (n − 1)! = 199 7.2 Caso Não Homogéneo No caso gt 6= 0, basta atender ao teorema 26. Assim, a solução do PVI yt = Ayt−1 + gt , dada a condição yt0 = ζ vem yt = At−t0 ζ + t X At−s gs . (7.16) s=t0 +1 Exemplo 79 Resolva-se o PVI yt = Ayt−1 + g, y0 = ζ onde A= 1 0 2 1 , g= 1 1 , ζ= 0 1 . Uma vez que os valores próprios de A são {1, 1} vem ¡ ¢ 1 0 At = λt I + tλt−1 (A − λI) = 2t 1 e yt = At ζ + t X s=1 1 0 = 2t 1 = t2 At−s g t +1 0 1 + t X s=1 . 200 1 0 2 (t − s) 1 1 1 Exercícios 1. Resolva os seguintes SEDF lineares yt = Ayt−1 onde −1 2 −1 2 (a) A = (b) A = (c) A = 0 3 −1 1 1 1 , y0 = , y0 = −1 2 0 −1 2 0 , y0 = 1 1 2. Resolva o SEDF yt = Ayt−1 onde A= −1 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 −1 2 0 0 , 0 −1 1 0 0 0 0 0 −1 2 0 0 0 0 −1 3 y0 = 1 2 1 0 1 1 (aproveite o facto de A ser diagonal por blocos e considere os resultados já obtidos no exercício 1). 3. Resolva as seguintes EDF: (a) zt + 1/2zt−1 − 1/2zt−2 = 0; (b) zt+3 − 6zt+2 + 11zt+1 − 6zt = 0 201 Capítulo 8 Estabilidade Considere-se o sistema autónomo yt = f (yt−1 ) onde y é um vector de tipo n × 1 e f é uma função real f : Rn → Rn . O domínio de f poderá ser S ⊂ Rn mas neste caso devemos exigir que S ⊆ f (S) (suponha-se que esta condição não se verifica - então poderia suceder que ξ ∈ S e / S e não seria possível agora continuar com y2 = f (y1 ) = f (f (ξ)) pois f (ξ) ∈ / S). y1 = f (ξ) ∈ 8.1 8.1.1 Pontos Fixos Definições Definição 18 (Ponto Fixo de f ) Um vector ȳ é designado por ponto fixo de f se f (t, ȳ) = ȳ, para todo o t. No ponto fixo o sistema dinâmico discreto não varia (está em equilíbrio). Com efeito, se yt−1 = ȳ e ȳ é um ponto fixo, a variação da solução, ∆yt , é nula, i.e., ∆yt = yt − yt−1 = f (yt−1 )−yt−1 = ȳ − ȳ = 0. Observe-se a analogia com as soluções de equilíbrio (no contexto das equações diferenciais). Por exemplo, considere-se y0 = 2 e a EDF yt = (1/2) yt−1 + 1. Iterando a equação é fácil verificar que y1 = 2, y2 = 2, ... Logo ȳ = 2 é o ponto fixo de f (x) = (1/2) x + 1. Para calcular o ponto fixo de f basta resolver a equação (1/2) ȳ + 1 = ȳ em ordem a ȳ. Exemplo 80 Considere-se yt = 2yt−1 (1 − yt−1 ) . Tem-se f (x) = 2x (1 − x) . Os pontos fixos (de f ) calculam-se a partir da relação f (ȳ) = ȳ, i.e., 2ȳ (1 − ȳ) = ȳ. Os pontos fixos são portanto ȳ = 0 e ȳ = 1/2. 202 Exemplo 81 Considere-se o sistema não linear Tem-se, portanto com domínio x1 y1t = y2t f x2 y2t−1 y2t−1 y1t−1 = . x2 x2 x1 x1 ∈ R2 : x1 6= 0 . x 2 Determinem-se os pontos fixos de f. Para o efeito, resolve-se f (x) = x, i.e., x2 x2 x1 = x1 x2 . É fácil verificar que o único ponto fixo é 1 1 . Teorema 28 Seja S um intervalo fechado e f : S → R uma função contínua. Se S ⊆ f (S) então f tem um ponto fixo em S. Dem. Seja S = [a, b]. Sob as condições do teorema existe um c e um d em S tal que f (c) = a e f (d) = b. Se c = a ou d = b então segue-se o resultado do teorema. Caso contrário verifica-se a < c < b e a < d < b. Defina-se g (x) = f (x) − x. Tem-se g (c) = f (c) − c < 0 pois f (c) = a < c e g (d) = f (d) − d > 0 pois f (d) = b > d. Dado que g (c) < 0 e g (d) > 0 e g é uma função contínua, segue-se, pelo teorema de Bolzano, que existe um e tal que g (e) = 0. Como consequência f (e) = e. A figura 8-1 ilustra o teorema anterior.¥ Quando n = 1 e a EDF é autónoma é muito útil no estudo da estabilidade o gráfico teia de aranha. Para ilustrar a interpretação do gráfico representa-se na figura 8-2 o gráfico teia de aranha associado ao PVI, yt = 0.5yt−1 , y0 = 4 (ponto a). No momento 1 tem-se y1 = 0.5×4 = 2 203 Figura 8-1: Ilustração do Teorema 28 450 b f (S ) a f (x) ponto fixo a c b (ponto b ou c). Este valor, y1 = 2, pode ser interpretado como o valor inicial com respeito a y2 ; assim, poderíamos colocar y1 = 2 no eixo das abcissas. Em alternativa, o valor y1 ”parte” da linha de 450 (ponto c) e o procedimento é repetido iterativamente. Assim, no momento 2 tem-se y2 = 0.5 × 2 = 1 (ponto e) e assim sucessivamente. O gráfico mostra que lim→+∞ yt = 0. Os retratos de fases em R1 podem também ser traçados juntamente com os gráficos teia de aranha. A sua interpretação é, no essencial, idêntica aos retratos de fases definidos para equações diferenciais. O retrato de fases consiste, portanto, num diagrama onde se representam possíveis valores iniciais e setas que indicam o movimento da solução à medida que t percorre o conjunto N. Na figura 8-3 representa-se o gráfico teia de aranha da EDF yt = yt−1 e na figura 8-4 o correspondente retrato de fases. Seja yt = yt (y0 ) a solução da EDF (ou do sistema de EDF) yt = f (t, yt−1 ) , dada a condição inicial y0 (para simplificar admite-se, sem perda de generalidade, que t0 = 0). A expressão yt (y0 ) define a solução como uma função explícita da condição inicial y0 . No caso da EDF autónomas é usual considerar-se a notação yt = f t (y0 ) em lugar de yt = yt (y0 ) onde f t (x) := f (...f (f (x))). | {z } t vezes 204 Figura 8-2: Gráfico Teia de Aranha do PVI yt = 0.5yt−1 , y0 = 4 yt Linha 45º 4 b c 2 e d a -4 f(x) -2 2 4 yt-1 -2 -4 Figura 8-3: Gráfico Teia de Aranha da Aplicação f (x) = x2 (estão traçadas duas órbitas com valores inicias -1.1 e 0.9) 2 1.5 1 0.5 -1 -0.5 0.5 -0.5 -1 205 1 1.5 Figura 8-4: Retrato de Fases de f (x) = x2 1 -1 A expressão f t (y0 ) neste contexto não significa f "levantado" a t.1 Definição 19 (Ponto Fixo Estável, Assintoticamente Estável e Instável) O ponto fixo ȳ diz-se estável se para cada ε > 0 existe um δ = δ (t0 , ε) tal que, para cada qualquer solução yt (y0 ) a desigualdade ky0 − ȳk ≤ δ implica kyt (y0 ) − ȳk < ε para todo o t ≥ t0 . O ponto fixo ȳ diz-se assimptoticamente estável se é estável e se existe um δ 0 > 0 tal que a desigualdade ky0 − ȳk ≤ δ 0 implica kyt (y0 ) − ȳk → 0 quando t → +∞. O ponto fixo ȳ diz-se instável se não é estável.2 Grosso modo, um ponto fixo ȳ é estável se yt = yt (y0 ) permanecer "perto" de ȳ para todo o t sempre que y0 se encontrar "perto" de ȳ. O ponto fixo ȳ é assimptoticamente estável se for 1 Por exemplo, se f (x) = Dada a EDF yt = 1 , 1+x então 1 1+x f 2 (x) = f (f (x)) = f f 3 (x) = f (f (f (x))) = f 1 , 1+yt−1 f = 1 1 , 1 + 1+x 1 1+x 1 1 1 + 1+x =f = 1 1+ o valor y3 dado y0 = 1 é f 3 (1) = 1 1+ = 1 1 1+ 1+1 3 . 5 Naturalmente, podemos obter este valor considerando o procedimento iterativo, y1 = 1 1 = , 1+1 2 y2 = 1 1+ 1 2 = 2 , 3 A expressão f t (y0 ) representa o valor de yt dada a condição y0 . 2 Se a EDF é autónoma leia-se f t (y0 ) em lugar de yt (y0 ) . 206 y3 = 1 1+ 2 3 = 3 . 5 1 1 1+ 1+x . estável e toda a solução inicializada perto de ȳ converge para ȳ. Exemplo 82 Considere-se yt = φyt−1 + e, com e 6= 0. Tem-se f (x) = φx + e. Resolvendo f (ȳ) = ȳ, i.e., φȳ + e = ȳ conclui-se que o (único) ponto fixo é ȳ = e/ (1 − φ). No caso φ = 1 não existe ponto fixo (a equação x + e = x é impossível, com e 6= 0). A estabilidade do ponto fixo ȳ pode, no caso presente, ser discutida directamente a partir f t (na generalidade dos casos não lineares não é possível obter f t ). De acordo com a equação (6.6), p. 168, tem-se, com a t condição inicial y0 , yt = f t (y0 ) = y0 φt + e 1−φ 1−φ . Assim ¶ µ e 1 − φt e t f (y0 ) − ȳ = y0 φ + e − = φ y0 − 1−φ 1−φ 1−φ ¯ ¯ ¯ t ¯ ¯ ¯ ¯f (y0 ) − ȳ ¯ = |φ|t ¯y0 − e ¯ = |φ|t |y0 − ȳ| . ¯ 1 − φ¯ t t ¯ ¯ Impondo ¯f t (y0 ) − ȳ ¯ < ε vem |φ|t |y0 − ȳ| < ε. Se |φ| < 1 então ȳ é estável. Basta considerar ¯ ¯ um δ tal que |y0 − ȳ| ≤ δ < ε. Nestas condições tem-se ¯f t (y0 ) − ȳ ¯ < ε para todo o t > 0. ¯ ¯ Se |φ| > 1 o termo ¯f t (y0 ) − ȳ ¯ tende para +∞ o que significa que não existe um δ > 0 nos termos da definição de ponto fixo estável; logo ȳ é instável. Analise-se a estabilidade assintótica. Tem-se para φ 6= 1 µ t¶ 1 − φ = lim f t (y0 ) = lim y0 φt + e t→+∞ t→+∞ 1−φ e 1−φ = ȳ se |φ| < 1 ±∞ se |φ| > 1 Assim, se |φ| < 1 o ponto fixo ȳ é assimptoticamente estável; se |φ| > 1, ȳ é instável. Exemplo 83 Retome-se o exemplo 80 (yt = 2yt−1 (1 − yt−1 )). Vimos que os pontos fixos são ȳ = 0 e ȳ = 1 2. Discute-se agora a estabilidade a partir do gráfico teia de aranha - ver a figura 8-5. Estão representados três valores iniciais. É fácil concluir que qualquer ponto que se encontre numa vizinhança do ponto fixo 1/2 (por exemplo ponto A ou B) não só não se afasta de 1/2 como também converge para ȳ = 1/2. Este ponto fixo é portanto assimptoticamente estável. O ponto fixo zero é instável. Basta observar o que sucede quando y é inicializado no ponto C. 207 Figura 8-5: Gráfico Teia de Aranha da equação yt = 2yt−1 (1 − yt−1 ) (representados três valores iniciais). 0.6 0.4 0.2 C -0.5 A -0.25 0.25 0.5 B 0.75 1 -0.2 -0.4 8.1.2 Estabilidade de Sistemas Lineares Considere-se um sistema de n equações lineares yt = Ayt−1 com a condição inicial y0 e seja r = max {|λi | : λi é um valor próprio de A (i = 1, ..., n)} . (8.1) Teorema 29 (a) Se r < δ < 1 então existe uma constante C > 0 tal que kyt k ≤ Cδ t ky0 k para t ≥ 0, para qualquer y0 ∈ R. Além disso verifica-se limt→+∞ kyt k = 0.(b) Se r > 1 então algumas soluções do sistema tendem para +∞. (c) Se r ≤ 1 e se a multiplicidade algébrica de todos os valores próprios que verificam |λ| = 1 for igual a um então existe uma constante C > 0 tal que kyt k ≤ C ky0 k para t ≥ 0. 208 Dem. (a) Pelo teorema 27 a solução do SEDF é Ãn−1 X t yt = A y0 = ! ci+1,t Mi y0 . i=0 Desta forma, kyt k ≤ ≤ n−1 X i=0 n−1 X i=0 |ci+1,t | kMi y0 k |ci+1,t | D ky0 k (8.2) com kMi k ≤ D < +∞ (D é escalar)3 . Mostra-se agora que existe uma constante B tal que |ci,t | ≤ Bδ t com r < δ < 1, para i = 1, 2, ..., n. Tem-se, atendendo à equação (7.3) e a |λi | < r, i = 1, ..., n, |c1,t | ≤ rt ; |c2,t | ≤ trt−1 (ver exercícios). De igual forma, deixa-se como exercício mostrar que |c3,t | ≤ t (t − 1) t−2 r . 2 Em geral, pode-se mostrar, |ci,t | ≤ pi−1 (t) rt−i+1 onde pi−1 (t) é um polinómio de grau i − 1 em t. Nestas condições existe uma constante B > 0 tal que |ci,t | ≤ Bδ t com r < δ < 1. Retomando a equação (8.2), vem kyt k ≤ ≤ n−1 X i=0 n−1 X i=0 t |ci+1,t | D ky0 k Bδ t D ky0 k ≤ Cδ ky0 k , 3 Note-se que M1 , ..., Mn−1 são matrizes de escalares e, portanto, a sua norma é majorável por qualquer constante D apropriada. 209 com C = nBD. É imediato agora verificar que limt→+∞ kyt k = 0 (pois 0 < δ < 1). (b) No caso r > 1, existe pelo menos um valor próprio λ tal que |λ| > 1. Seja v o corre° ° spondente vector próprio. Então φt = λt v é uma solução do SEDF (verifique) e °λt v ° t → +∞ quando t → +∞. (c) Suponha-se, sem perda de generalidade, que todos os valores próprios são tais que |λ1 | = |λ2 | = ... = |λn | = 1. Por hipótese, não há dois valores próprios iguais (pois a multiplicidade algébrica de cada valor próprio é igual a um). É válida, assim, a expressão dada observação 17, yt = P Λt P −1 y0 . Vem ° ° kyt k = °P Λt P −1 y0 ° ° ° ≤ C °Λt ° ky0 k ª © = C max |λ1 |t , ..., |λn |t ky0 k = C ky0 k .¥ Notar que se λ é número complexo então |λ| = |α + βi| = p α2 + β 2 . Resulta do teorema anterior que o ponto fixo ȳ = 0 é, assintonticamente estável se r < 1, instável se r > 1, e estável se r ≤ 1 e se a multiplicidade algébrica de todos os valores próprios que verificam |λ| = 1 for igual a um. Exemplo 84 Estude-se a estabilidade do sistema y1t y2t = Os valores próprios são ± 12 i. Logo r = 1 −5 0.25 −1 1 2. y1t−1 y2t−1 . Como r < 1 conclui-se que o ponto fixo ȳ = 0 é assimptoticamente estável. Nas figuras seguintes analisa-se graficamente a dinâmica do sistema admitindo y0 = (10, 1)T . Na figura 8-6 apresentam-se as trajectórias y1t e y2t . Na figura 8-7 representa-se no plano os pontos (y1t , y2t ) com t = 0, 1, ..., 10. Ambas as figuras 8-6 e 8-7 são ilucidativas quanto à estabilidade do sistema. Em ambos os casos se observa y1t → 0, y2t → 0 quanto t → 0. 210 Figura 8-6: Trajectórias y1t e y2t (traço grosso) y1 y2 3 2 1 2 4 6 8 t 10 -1 -2 Figura 8-7: Órbita (y1t , y2t ) (t = 0, 1, ..., 10) com valor inicial (10, 1) y2 5 4 3 2 1 -2 2 4 -1 211 6 8 10 y1 Exemplo 85 Considere-se o sistema de EDF yt = cos θ sen θ − sen θ cos θ yt−1 . Os valores próprios são λ = cos θ±i sin θ e |cos θ − i sin θ| = |cos θ + i sin θ| = p cos2 θ + sin2 θ = 1. Como a multiplicidade algébrica de todos os valores próprios que verificam |λ| = 1 é igual a um conclui-se que o ponto fixo ȳ = 0 é estável. 8.1.3 Estabilidade de Sistemas Não Lineares Linearização O teorema seguinte fornece um método para analisar a estabilidade assimptótica no caso escalar (EDF autónomas). Teorema 30 Suponha-se que f : R→R tem derivada de primeira ordem contínua num intervalo aberto contendo o ponto fixo ȳ. Então (a) se |f 0 (ȳ)| < 1, ȳ é assimptoticamente estável; (b) se |f 0 (ȳ)| > 1, ȳ é instável. Dem. (a) Dado que, por definição, ¯ |f (x) − f (ȳ)| |f (x) − ȳ| ¯¯ 0 = lim = f (ȳ)¯ x→ȳ x→ȳ |x − ȳ| |x − ȳ| lim então existe uma vizinhança Vε (ȳ) de raio ε > 0, tal que, para |f 0 (ȳ)| < α < 1, |f (x) − ȳ| < α |x − ȳ| , x ∈ Vε (ȳ) . Resulta que x ∈ Vε (ȳ) ⇒ f (x) ∈ Vε (ȳ) (pela desigualdade anterior, constata-se que f (x) está mais "perto"de ȳ do que x está de ȳ, por um factor de ordem α < 1). É imediato verificar que f (x) ∈ Vε (ȳ) ⇒ f 2 (x) ∈ Vε (ȳ) . Repetindo o argumento conclui-se f t (x) ∈ Vε (ȳ) . Logo, ¯ 2 ¯ ¯f (x) − ȳ ¯ = |f (f (x)) − ȳ| < α |f (x) − ȳ| < α2 |x − ȳ| . 212 ¯ ¯ Por indução, conclui-se ¯f t (x) − ȳ ¯ < αt |x − ȳ|. Como αt → 0 segue-se que ȳ é assimptoti- camente estável. (b) Utilizando argumentos idênticos conclui-se que f t (x) se afasta cada vez mais de ȳ à medida que t → +∞.¥ Exemplo 86 Retome-se os exemplos 80 e 83. Com f (x) = 2x (1 − x) tem-se f 0 (x) = 2 − 4x e, portanto, pelo teorema 30, o ponto fixo 0 é instável pois |f 0 (0)| = 2 > 1 e o ponto 1/2 é assimptoticamente estável pois |f 0 (1/2)| = 0 < 1. Analise-se agora a estabilidade de sistemas de EDF. Tal como procedemos para o caso de sistemas de equações diferenciais, uma forma de abordar a estabilidade de sistemas de EDF consiste em linearizar f (x) em torno do ponto fixo ȳ (o caso escalar apresentado atrás baseia-se também no método da linearização). Suponha-se que f (x) possui derivadas de segunda ordem contínuas. Então, pela fórmula de Taylor vem fi (x) = fi (ȳ) + 2 ∂fi (ȳ) 1 T ∂fi (z) (x − ȳ) (x − ȳ) + (x − ȳ) , ∂xT 2 ∂x∂xT i = 1, ..., n ou, mais compactamente, f (x) = f (ȳ) + f 0 (ȳ) (x − ȳ) + g (x) (8.3) Note-se que f 0 (ȳ) é o Jacobiano de f no ponto ȳ (é uma matriz de constantes). Reescreva-se a equação (8.3) na forma f (x) = Ax + g (x) onde A = f (ȳ) = 0 ∂f1 (ȳ) ∂x1 .. . ∂fn (ȳ) ∂x1 g (x) = f (ȳ) − f 0 (ȳ) ȳ + 1 2 (note-se que z varia com x). Tem-se agora: 213 ··· .. . ∂f1 (ȳ) ∂xn ··· ∂fn (ȳ) ∂xn .. . , (x − ȳ)T ∂f12 (z) ∂x∂xT (x − ȳ)T ∂fn2 (z) ∂x∂xT .. . (x − ȳ) (x − ȳ) (8.4) Teorema 31 Suponha-se que f : Rn →Rn tem derivadas de segunda ordem contínuas num conjunto aberto contendo o ponto fixo ȳ. Dado r = max {|λi | : λi é um valor próprio de A (i = 1, ..., n)} e A é dada pela equação (8.4) tem-se, (a) se r < 1 então ȳ é assimptoticamente estável; (b) se r > 1 então ȳ é instável. Dem. Kelley e Peterson, (1991), p. 180. Obviamente este teorema generaliza o teorema 30. Exemplo 87 Considere-se o seguinte modelo presa-predador, y1t−1 y2t−1 1 + 0.0001y1t−1 y1t−1 y2t−1 = (1 − δ) y2t−1 + 0.00003 1 + 0.0001y1t−1 y1t = (1 + ρ) y1t−1 − 0.001 y2t onde y1t e y2t representa, respectivamente, o número de presas e o número de predadores no momento t, ρ é a diferença entre a taxa de nascimento e a taxa de mortalidade das presas e δ é a taxa de mortalidade dos predadores. Suponha-se que ρ = 0.1 e δ = 0.01. Tem-se f (x1 , x2 ) := f1 (x1 , x2 ) = f2 (x1 , x2 ) x1 x2 1.1x1 − 0.001 1+0.0001x 1 x1 x2 0.99x2 + 0.00003 1+0.0001x 1 . Os pontos fixos resultam da resolução do sistema f (x1 , x2 ) = (x1 , x2 ) . Obtém-se dois pontos fixos, ȳ1 = 0 0 ȳ2 = , 344.828 103.448 . Estude-se a estabilidade do ponto fixo ȳ2 , recorrendo-se ao teorema 31. Para o efeito determinase A = f 0 (ȳ2 ) = ∂f1 (ȳ2 ) ∂x1 ∂fn (ȳ2 ) ∂x1 ∂f1 (ȳ2 ) ∂xn ∂fn (ȳ2 ) ∂xn Depois de alguns cálculos obtém-se A= 1.003 −0.3333 0.0029 1 214 . . Figura 8-8: Trajectórias y1t e y2t (t = 0, 1, ..., 800) y1 400 380 360 340 320 200 400 600 200 400 600 800 t y2 108 106 104 102 100 800 t Os valores próprios são λ1 , λ2 = 1.00167 ± 0.0310466i. Donde p 1.001672 + 0.03104662 = 1. 002, p |λ1 | = |1.00167 − 0.0310466i| = 1.001672 + 0.03104662 = 1. 002, |λ1 | = |1.00167 + 0.0310466i| = pelo que r = 1.002 > 1 e, portanto, o ponto fixo ȳ2 é instável. As figuras 8-8 e 8-9 ilustram o comportamento dinâmico do sistema. Método Directo de Liapunov Considere-se um sistema de EDF yt = f (yt−1 ) com a condição inicial y0 e seja ȳ um ponto fixo de f . Considere-se uma função real V de n variáveis nas seguintes condições: V é contínua numa vizinhança Vε (ȳ) , V (x) > 0 se x 6= ȳ em Vε (ȳ) e V (ȳ) = 0. Uma função nestas condições designa-se por função Liapunov. Defina-se ∆V (x) := V (f (x)) − V (x) 215 Figura 8-9: Órbita (y1t , y2t ) com valor incial y10 = 344, y20 = 104 (a órbita expande-se à medida que t aumenta) y2 108 106 104 102 100 320 340 360 380 400 y1 em Vε (ȳ) (não confundir a função V com a vizinhança de z de raio ε, Vε (z)). Teorema 32 Seja ȳ um ponto fixo de f e assuma-se que f é contínua numa certa vizinhança de ȳ. Se (a) ∆V (x) ≤ 0 para todo o x ∈ Vε (ȳ) então a solução ȳ é estável; se (b) ∆V (x) < 0 para todo o x ∈ Vε (ȳ) e x 6= ȳ então a solução ȳ é assimptoticamente estável; se (c) ∆V (x) > 0 para todo o ε > 0 e x ∈ Vε (ȳ) e x 6= ȳ então a solução ȳ é instável. Dem. Uma demonstração formal segue as linhas gerais da demonstração do teorema análogo para sistemas de equações diferenciais (teorema 18). Apresenta-se em alternativa uma explicação heurística do resultado. Imagine-se a função V (x) como uma distância entre x e ȳ com x ∈ Vε (ȳ) . Considere-se 0 < δ < ε. Por hipótese y0 ∈ Vδ (ȳ) e, como, V (f (y0 )) ≤ V (y0 ) o ponto y1 = f (y0 ) não se afasta de ȳ (y1 não está mais distante de ȳ do que y0 está de ȳ). Logo y1 ∈ Vδ (ȳ) . Seguindo o mesmo raciocínio tem-se que V (f (y1 )) ≤ V (y1 ) implica y2 ∈ Vδ (ȳ) . Iterando, conclui-se que yt ∈ Vδ (ȳ) ⊂ Vε (ȳ) . Logo a solução ȳ é estável. Suponha-se agora a desigualdade estrita V (f (x)) < V (x) . Por hipótese y0 ∈ Vε (ȳ) e V (f (y0 )) < V (y0 ) implica kf (y0 ) − ȳk < α ky0 − ȳk, 0 < α < 1. Por seu lado, a desigualdade V (f (y1 )) < V (y1 ) implica ky2 − ȳk = kf (y1 ) − ȳk < α kf (y0 ) − ȳk < α2 ky0 − ȳk . Iterando, conclui-se kyt − ȳk < αt kf (y0 ) − ȳk → 0 quando t → +∞. ¥ 3 . O único ponto fixo é ȳ = 0. O teorema 30 é Exemplo 88 Considere-se yt = yt−1 − yt−1 inconclusivo, pois com f (x) = x − x3 , tem-se |f 0 (0)| = 1. Considere-se a função V (x) = x2 . 216 Vem ¢ ¡ ¢2 ¡ ∆V (x) = x − x3 − x2 = x6 − 2x4 = x4 x2 − 2 < 0 √ ª © no conjunto x : |x| < 2 = V√2 (ȳ) . Logo o ponto fixo ȳ = 0 é assimptoticamente estável. Exemplo 89 Retome-se o exemplo 85, yt = cos θ − sen θ cos θ com ponto fixo, ȳ = Defina-se sen θ V x1 x2 0 0 yt−1 . = x21 + x22 . Facilmente se verifica V (ȳ) = 0 e V (x) > 0 para x 6= ȳ. Tem-se ∆V (x) = V x1 cos θ + x2 sen θ −x1 sen θ + x2 cos θ − V x1 x2 = (x1 cos θ + x2 sen θ)2 + (−x1 sen θ + x2 cos θ)2 − x21 − x22 = 0. Consequentemente o ponto fixo é estável. 8.1.4 Bacia do Escoadouro Na literatura é usual designar-se um ponto fixo assimptoticamente estável como um escoadouro (sink ) e um ponto fixo instável como fonte (source). A designação escoadouro sugere que o sistema dinâmico inicializado numa vizinhança do escoadouro converge para o escoadouro. Utiliza-se também a designação bacia do escoadouro (basin of the skin) para definir o conjunto de pontos W tal que se y0 ∈ W então yt = f t (y0 ) → ȳ (onde ȳ é um escoadouro). Analitica- 217 © ª mente escreve-se: W (ȳ) = y0 ∈ Rn : f t (y0 ) → ȳ 4 . No exemplo 83, onde f (x) = 2x (1 − x) , vimos que o ponto 1/2 é um escoadouro: qualquer ponto na vizinhança de 1/2 converge para 1/2. Uma inspecção da figura 8-5 sugere que a bacia do escoadouro é o conjunto (0, 1) , i.e., W (1/2) = (0, 1) . O teorema seguinte tem aplicação no caso de EDF autónomas (não lineares). Teorema 33 Seja E = {x : |f (x) − ȳ| ≤ δ |x − ȳ| , 0 < δ < 1} . Se existe um ε1 > 0 tal que Vε1 (ȳ) ⊂ E então yt = f t (y0 ) → ȳ para todo o y0 ∈ Vε1 (ȳ) . Dem. Se y0 ∈ Vε1 (ȳ) então f (y0 ) ∈ Vε1 (ȳ) e, por indução, conclui-se f t (y0 ) ∈ Vε1 (ȳ) . Vem |f (y0 ) − ȳ| ≤ δ |y0 − ȳ| ¯ 2 ¯ ¯f (y0 ) − ȳ ¯ = |f (f (y0 )) − ȳ| ≤ δ |f (y0 ) − ȳ| ≤ δ 2 |f (y0 ) − ȳ| . Por indução, ¯ ¯ t ¯f (y0 ) − ȳ¯ ≤ δ t |y0 − ȳ| ¯ ¯ e como 0 < δ < 1 conclui-se que ¯f t (y0 ) − ȳ¯ → 0 quando t → +∞.¥ A figura 8-10 ilustra o teorema 33. O conjunto E corresponde ao intervalo (a, d) - trata-se do conjunto de pontos x tais que |f (x) − ȳ| < |x − ȳ| ; nas regiões II e V a função satisfaz esta desigualdade. Existem pontos y0 de E que não implicam yt = f t (y0 ) → ȳ. O ponto c é um desses casos. Verifique-se que f (c) ∈ / E. No entanto, todos os pontos pertencentes a Vε1 (ȳ) convergem para ȳ. O teorema 33 não fornece toda a bacia do escoadouro. Na figura 8-11 a função f (x) , com ponto fixo ȳ = 1, está definida na região V para x < 1 e na região III para x > 1. Apenas 4 No caso não autónomo deve ler-se W (ȳ) = {y0 ∈ Rn : yt (y0 ) → ȳ} . 218 Figura 8-10: Ilustração do Teorema 33 x E = (a, d ) 2y − x Vε1 ( y ) = (a, b ) V II y 3 123 a 12 b cd ε ε 1 1 os pontos x pertencentes ao intervalo (A, 1) verificam |f (x) − ȳ| < |x − ȳ| . Concretamente, E = {x : |f (x) − ȳ| < δ |x − ȳ| , 0 < δ < 1} = (A, 1) mas não existe um ε > 0 tal que Vε (ȳ) = Vε (1) ⊂ E e, portanto, o teorema 33 não é aplicável. Também o teorema 30 não é aplicável, pois |f 0 (1)| = 1 (admitindo que f 0 (x) existe numa vizinhança de 1). Verifica-se, no entanto, por simples inspecção gráfica, que o sistema dinâmico definido por f (x) converge para ȳ = 1 se o valor inicial pertencer a (A, 1) . Além disso, qualquer ponto do intervalo (1, B) tem como aplicação um ponto de (A, 1) . Ou seja, embora não se verifique |f (x) − ȳ| < |x − ȳ| quando x ∈ (1, B) , os ponto de (1, B) movem-se para (A, 1) onde aqui se tem |f (x) − ȳ| < |x − ȳ| para x ∈ (A, 1) . Assim, a bacia do escoadouro é (A, 1) ∪ (1, B) ∪ {1} = (A, B) . A discussão precedente sugere uma forma de se determinar a bacia do escoadouro. Suponhase que E1 é um conjunto de pontos y0 tais que f t (y0 ) → ȳ e y0 ∈ E1 (este conjunto pode determinar-se através do teorema 33). Num segundo passo determina-se o conjunto E2 = {x : f (x) ∈ E1 } e, por recorrência, Ei+1 = {x : f (x) ∈ Ei } . Se em dado momento Ek+1 = Ek então a bacia do escoadouro é dado pela união dos conjuntos Ei0 s. ¢ ¡ Exemplo 90 Considere-se f (x) = 3x − x3 /2 (figura 8-12). Os pontos fixos são −1, 0, 1. √ ¢¢ ¡ ¡ Analise-se o ponto 1. É fácil verificar que E1 = (0, b) = 0, 1/2 −1 + 17 ⊂ W (1) (o 219 Figura 8-11: Bacia do Escoadouro 2.5 I VI 2 1.5 1 V II 0.5 A -0.5 0.5 IV III 1 B 1.5 f(x) 2 2.5 -0.5 teorema 33 é aplicável: numa vizinhança do ponto 1, a função f (x) encontra-se nas regiões II e V; no entanto, o teorema fornece um primeiro conjunto contido em E1 ). Tem-se agora E2 = {x : f (x) ∈ E1 } = {x : 0 < f (x) < b} = (e, c) ∪ (b, d) ⊂ W (1) √ √ onde e = −2, 11569, c = − 3, d = 3. Este procedimento pode ser continuado com E3 = {x : f (x) ∈ E2 }, E4 , etc. Exemplo 91 Considere-se f (x) = tan x, −π/2 < x < π/2. O ponto fixo é ȳ = 0 (pois f (0) = 0). Na figura 8-13 verifica-se que a função f (x) não se encontra nem na região II nem na região V (neste caso concreto, qualquer que seja o valor inicial, o sistema dinâmico afasta-se cada vez mais de ȳ = 0). Assim, ȳ = 0 não é escoadouro. Exemplo 92 Considere-se f (x) = 3x (1 − x) . Verifica-se que os pontos fixo são 0 e 2/3. Na figura 8-14 analisa-se o ponto fixo 2/3 (tendo-se representado para o efeito as curvas x e −x + 2ȳ = −x+4/3). O teorema 30 não esclarece a natureza do ponto fixo ȳ = 2/3 pois |f 0 (2/3)| = 1. Também o teorema 33 não é aplicável pois embora E = {x : |f (x) − 2/3| < |x − 2/3|} = (0, 2/3) não existe um ε > 0 tal que Vε (2/3) ⊂ E. Também não se pode concluir imediatamente que o 220 ¢ ¡ Figura 8-12: Bacia do Escoadouro da Aplicação f (x) = 3x − x3 /2 VI I V II 1 a e c b d III IV Figura 8-13: f (x) = tg x 1.5 I VI 1 0.5 V -1 II -0.5 0.5 -0.5 -1 III IV -1.5 221 1 Figura 8-14: f (x) = 3x (1 − x) 1.5 I VI 1 V II 0.5 IV 0.2 0.4 0.6 III 0.8 1 -0.5 intervalo (0, 2/3) pertence à bacia do escoadouro (verifique-se isso através de inspecção gráfica). Este exemplo mostra as limitações dos teoremas 30 e 33. Pode-se provar que o ponto 2/3 não é de facto um escoadouro5 (i.e. um ponto fixo assimptoticamente estável) pelo que não há lugar à determinação da bacia do escoadouro. Na figura representa-se a trajectória yt com t = 1, ..., 50 Um resultado que ultrapassa, em certas circunstâncias, as limitações apontadas aos teoremas 30 e 33 e, além disso, é directamente aplicável a sistemas de equações às diferenças consiste no seguinte. Teorema 34 Admitam-se as condições do teorema 32 e suponha-se ∆V (x) < 0 para todo o x ∈ Vε (ȳ) e x 6= ȳ. Se y0 ∈ Vε (ȳ) então f t (y0 ) → ȳ quando t → +∞. Logo Vε (ȳ) ⊆ W (ȳ) . 5 Prova-se que não existe um ε > 0 tal que f (2/3 − ε) − 2/3 > 2/3 − f 2 (2/3 − ε) . 222 Figura 8-15: Trajectória de yt = 3yt−1 (1 − yt−1 ), y0 = 0.5 (t = 1, ..., 50) y 0.75 0.7 0.65 0.6 0.55 10 20 30 40 50 t Exemplo 93 Considere-se ¡ 2 ¢ 2 + y2t−1 y1t = y2t−1 − y2t−1 y1t−1 ¡ 2 ¢ 2 + y2t−1 . y2t = y1t−1 − y1t−1 y1t−1 Estude-se a estabilidade do ponto fixo ȳ = (0, 0)T e determine-se a respectiva bacia do escoadouro. Para o efeito tome-se a função V (x1 , x2 ) = x21 + x22 . Vem ∆V (x) = ¡ ¡ ¢¢2 ¡ ¡ ¢¢2 ¡ 2 ¢ x2 − x2 x21 + x22 + x1 − x1 x21 + x22 − x1 + x22 = ... ¢2 ¡ ¡ ¢¢ ¡ −2 + x21 + x22 = x21 + x22 < 0 no conjunto n p √ o (x1 , x2 ) : x21 + x22 < 2 = V√2 (ȳ) ⊆ W (ȳ) . 3 . Resulta óbvio que V√ (ȳ) ⊆ W (ȳ) . Exemplo 94 Retome-se o exemplo 88, yt = yt−1 − yt−1 2 ¡ ¢ 2 Exemplo 95 Retome-se o exemplo 90, yt = 3yt−1 − yt−1 /2. Analise-se a bacia do escoad- 223 Figura 8-16: Gráfico da função ∆V (x) = 1 4 (x − 4) (x − 1)2 x 2 1 1 2 3 4 -1 -2 -3 ouro do ponto ȳ = 1 e, para o efeito, considere-se V (x) = (x − 1)2 . Tem-se ∆V (x) = = = ¢ ¢2 3x − x2 /2 − 1 − (x − 1)2 9 2 3 1 x − x − x3 + x4 4 2 4 1 (x − 4) (x − 1)2 x. 4 ¡¡ A função ∆V (x) está representada na figura 8-16, a qual permite concluir que V1 (1) = {x : |x − 1| < 1} ⊆ W (1) . No exemplo 90 foi-se um pouco mais longe. De facto, observou-se que V1 (1) ⊂ W (1). A terminar esta secção mostra-se que se um ponto pertence a uma certa bacia de escoadouro então esse ponto não pode pertencer a outra bacia de escoadouro. Assim, Teorema 35 Se ȳ1 e ȳ2 são escoadouros e ȳ1 6= ȳ2 então W (ȳ1 ) ∩ W (ȳ2 ) = ∅. Dem. Mostra-se que W (ȳ1 ) ∩ W (ȳ2 ) 6= ∅ ⇒ ȳ1 = ȳ2 . Seja y0 ∈ W (ȳ1 ) ∩ W (ȳ2 ) . Então ° ° para cada ε > 0 existe um n1 ∈ N tal que t ≥ n1 implica °f t (y0 ) − ȳ1 ° < ε/2 e existe um ° ° n2 ∈ N tal que t ≥ n2 implica °f t (y0 ) − ȳ2 ° < ε/2. Logo as duas desigualdades verificam-se simultaneamente para o maior dos n0 s, i.e. definindo n3 = max {n1 , n2 } tem-se que t ≥ n3 ° ° ° ° implica °f t (y0 ) − ȳ1 ° < ε/2 e °f t (y0 ) − ȳ2 ° < ε/2. Utilizando a desigualdade triangular para 224 t ≥ n3 vem ° ¡ ¢° kȳ1 − ȳ2 k = °ȳ1 − f t (y0 ) − ȳ2 − f t (y0 ) ° ° ° ° ° ≤ °ȳ1 − f t (y0 )° + °ȳ2 − f t (y0 )° ε ε + = ε. < 2 2 Como a distância entre ȳ1 e ȳ2 é menor do que ε para cada ε > 0, deverá ter-se ȳ1 = ȳ2 .¥ 8.2 8.2.1 Pontos Periódicos Definições Definição 20 Um vector p ∈ Rn é um ponto periódico de período k se f k (p) = p (8.5) e k é o menor inteiro positivo tal que (8.5) se verifica (i.e., f s (p) 6= p para s = 1, 2, ..., k − 1). A órbita de valor inicial p diz-se uma órbita periódica de período k. Note-se que se p é um ponto periódico de período 2 então p é um ponto fixo de f 2 . O recíproco não é verdade. Por exemplo, um ponto fixo de f 2 pode ser também um ponto fixo de f e, neste caso, de acordo com a definição, este ponto tem período 1. ª © Considere-se uma órbita de valor inicial p, i.e., p, f (p) , f 2 (p) , ... . Se p é um ponto perióª © dico de período 3, p deve repetir-se de três em três iterações. Por exemplo, p, f (p) , f 2 (p) , p, ... . © ª Mas f (p) e f 2 (p) também se repetem de três em três iterações, .., p, f (p) , f 2 (p) , p, f (p) , f 2 (p) , p... . ª © Neste exemplo, é suficiente identificar a órbita de período 3 através dos três elementos p, f (p) , f 2 (p) (se p é ponto fixo de f e, portanto, ponto periódico de período 1, então a órbita periódica de período 1 é constituída apenas pelo elemento {p}). Naturalmente, b = f (p) e c = f 2 (p) são também pontos periódicos de período 3. O teorema seguinte estabelece este resultado. Teorema 36 Seja p um ponto periódico de f de período k. Então f (p) , f 2 (p) , ..., f k−1 (p) são também pontos periódicos de período k. 225 © ª Dem. Considere-se um ponto genérico do conjunto f (p) , f 2 (p) , ..., f k−1 (p) , pi = f i (p) , com i = 1, 2, ..., k − 1. Mostra-se em primeiro lugar que pi não é um ponto fixo de f s com s < k, caso contrário pi não poderia ser candidato a ponto periódico de período k (definição 20). Suponha-se no entanto que pi é ponto fixo de f s . Viria ¡ ¢ f s (pi ) = pi ⇔ f s f i (p) = f i (p) ⇔ f s+i (p) = f i (p) o que significa que p repete de s em s iterações, ou seja que p é ponto fixo de f s . Esta conclusão contradiz a hipótese de p ser ponto periódico de período k > s (i.e., a primeira vez que p se repete é após k interacções). Basta agora ver que pi = f i (p) é ponto fixo de f k . Vem ´ ³ ¢ ¡ f k (pi ) = f k f i (p) = f i f k (p) = f i (p) = pi .¥ Exemplo 96 Considere-se a equação yt = ayt−1 (1 − yt−1 ) . Tem-se portanto f (x) = ax (1 − x) . Investigue-se se existem pontos periódicos de período 2. Determine-se f 2 (x) f 2 (x) = f (f (x)) = a (f (x)) (1 − f (x)) = a (ax (1 − x)) (1 − ax (1 − x)) . Poderíamos também obter f 2 (x) considerando yt = ayt−1 (1 − yt−1 ) = a (ayt−2 (1 − yt−2 )) (1 − (ayt−2 (1 − yt−2 ))) o que permitiria deduzir f 2 (x) = a (ax (1 − x)) (1 − ax (1 − x)) . Para determinar eventuais pontos peródicos resolve-se a equação f 2 (x) = x em ordem a x. Factorizando f 2 (x) − x obtémse ¢ ¡ −x (1 − a + a x) 1 + a − a x − a2 x + a2 x2 = 0 pelo que se conclui que os pontos fixos de f 2 são −1 + a , x3 = x1 = 0, x2 = a 1 2 + 12 a + 1 2 p (−3 − 2a + a2 ) , x4 = a 226 1 2 + 12 a − 1 2 p (−3 − 2a + a2 ) . a (8.6) Figura 8-17: Trajectória de yt = 3.3yt−1 (1 − yt−1 ) , y0 = 0.1 y 0.8 0.6 0.4 0.2 10 20 30 40 50 t Estes valores serão pontos periódicos de período 2 se não forem pontos fixos de f . Ora resolvendo f (x) = x sai ȳ = 0 e ȳ = −1+a a . Retome-se os pontos fixos apresentados em (8.6). Conclui-se que os pontos 0 e (−1 + a) /a não são pontos peródicos de período 2 pois eles são pontos fixos de f (e, portanto são pontos peródicos de período 1). Relativamente a x3 conclui-se que 1 2 + 12 a + 1 2 p (−3 − 2a + a2 ) −1 + a = a a se a = 1, e 1 2 + 12 a + 1 2 p (−3 − 2a + a2 ) =0 a se a = −1. Logo x3 é ponto periódico de período 2 se a 6= 1 e a 6= −1. Seguindo o mesmo raciocínio conclui-se que x4 é ponto periódico de período 2 se a 6= 3 e a 6= −1. Para concretizar suponha-se que a = 3.3. Tem-se ȳ = 0, ȳ = −1+a a = . 696 97, x3 = . 823 6 e x4 = . 479 43. Na figura 8-17 é evidente que {0. 823 6, 0.47943} forma uma órbita de período 2. Outra forma (embora pouco eficiente) de confirmarmos as conclusões emergentes da figura 8-17 consiste em se calcular iterativamente a trajectória y. A tabela seguinte fornece os valores de yt ao longo do tempo, com y0 = 0.1. É óbvio, a partir de certo valor de t (digamos, a partir de t = 20) yt repete os valores .8236 e .4794 de duas em duas iterações. 227 Figura 8-18: Sucessão yt = 3.3yt−1 (1 − yt−1 ) , y0 = 0.1, t = 1, ..., 41 t: 0 1 2 3 4 5 6 7 8 9 10 11 12 13 yt: 0.1000 0.2970 0.6890 0.7071 0.6835 0.7139 0.6740 0.7251 0.6577 0.7429 0.6303 0.7690 0.5863 0.8004 t: 14 15 16 17 18 19 20 21 22 23 24 25 26 27 yt: 0.5271 0.8226 0.4816 0.8239 0.4788 0.8235 0.4796 0.8236 0.4794 0.8236 0.4794 0.8236 0.4794 0.8236 t: 28 29 30 31 32 33 34 35 36 37 38 39 40 41 yt: 0.4794 0.8236 0.4794 0.8236 0.4794 0.8236 0.4794 0.8236 0.4794 0.8236 0.4794 0.8236 0.4794 0.8236 Figura 8-19: Gráfico Teia de Aranha da equação yt = 3.3yt−1 (1 − yt−1 ) 0.8 0.6 0.4 0.2 -0.5 -0.25 0.25 0.5 0.75 1 -0.2 -0.4 É também interessante confirmarmos que . 823 6 e .47943 são pontos periódico de período 2 a partir do gráfico teia de aranha, figura 8-19. Exemplo 97 Retome-se o exemplo 81. Tem-se f 2 (x) = f f x1 x2 = f 228 x2 x2 x1 = x2 x1 x2 x1 x2 = x2 x1 1 x1 e f 3 (x) = f f f x1 x2 = f x2 x1 1 x1 = 1 x1 1 x1 x2 x1 = 1 x1 1 x2 . Deixa-se como exercíco verificar que não existem ponto periódicos de período 2 e existem três pontos periódicos de período 3. Um modelo que pode gerar pontos periódico é o modelo linear por troços (ou, simplesmente, modelo limiar). Assume-se um comportamento diferenciado do sistema dinâmico consoante o estado do sistema no momento t−1, concretamente, consoante yt−1 se encontre abaixo ou acima de certo limiar L. No caso mais simples o modelo corresponde a c1 + φ yt−1 , yt−1 < L 1 yt = c +φ y , y 2 t−1 ≥ L. 2 t−1 Para concretizar considere-se o exemplo 1 + 0.5yt−1 , yt−1 < 0 yt = −1 − 0.5y , y t−1 t−1 ≥ 0. A função f (x) representa-se na forma 1 + 0.5x x < 0 f (x) = −1 − 0.5x x ≥ 0. A função f (x) pode não ser contínua (no limiar L), como o exemplo precedente mostra. O modelo seguinte, com c1 = L (φ2 − φ1 ) + c2 , define uma função contínua no ponto L. L (φ − φ ) + c2 + φ yt−1 , yt−1 < L 2 1 1 yt = c +φ y , yt−1 ≥ L. 2 2 t−1 229 Figura 8-20: Gráfico Teia de Aranha. Os valores 0.4 e -1.2 são pontos periódicos de período 2 4 2 -4 -2 2 yt = 1 + 0.5 yt −1 -2 4 yt = −1 − 0.5 yt −1 -4 A função f (x) é portanto L (φ − φ ) + c2 + φ x, x < L 2 1 1 f (x) = c + φ x, x ≥ L. 2 2 Logo f (L) = c2 + φ2 L e limx↑L f (x) = L (φ2 − φ1 ) + c2 + φ1 L = c2 + Lφ2 . Podemos ainda exigir a existência de um ponto fixo no ponto L fazendo L (φ2 − φ1 ) + c2 + φ1 x = x, Solução: x = c2 + φ2 x = x, Solução: x = − e, agora resolvendo, −Lφ2 +Lφ1 −c2 φ1 −1 −Lφ2 + Lφ1 − c2 φ1 − 1 c2 φ2 − 1 2 = − φ c−1 , sai c2 = L (1 − φ2 ) . Assim, tem-se 2 L (φ − φ ) + L (1 − φ ) + φ x, x < L 2 1 2 1 f (x) = L (1 − φ ) + φ x, x ≥ L. 2 2 230 ou Veja-se que L (1 − φ ) + φ x, x < L 1 1 f (x) = L (1 − φ ) + φ x, x ≥ L. 2 2 f (L) = L (1 − φ2 ) + φ2 L = L e lim f (x) = L (1 − φ1 ) + φ1 L = L. x↑L 8.2.2 Estabilidade dos Pontos Periódicos Tal como no caso dos pontos fixos de f, pontos periódicos podem ser estáveis ou instáveis. Intuitivamente, um ponto periódico de período k é estável se qualquer trajectória iniciada numa vizinhança desse ponto não se afasta desse ponto de k em k iterações, para todo o t (da mesma forma se interpreta ponto periódico assimptoticamente estável e instável). O facto essencial é que um ponto periódico de f de período k é um ponto fixo de f k . Desta forma, a definição de estabilidade para pontos periódicos pode basear-se na definição 19, sendo que agora deverá ler-se f k em lugar de f (f t deverá ler-se f kt ). Em geral são aplicáveis os teoremas precedentes, desde que se procedam às necessárias adaptações. Por exemplo, o teorema 30 estabelece que ȳ é assimptoticamente estável se |f 0 (ȳ)| < 1 e instável no caso contrário. Se as condições do teorema 30 se aplicarem, e fazendo g (x) = f k (x) , podemos estabelecer que o ponto periódico p de período k é assimptoticamente estável se |g 0 (p)| < 1 e instável no caso contrário. Vimos no teorema 36 que, se p é ponto periódico de período k então a aplicação f admite adicionalmente k − 1 pontos periódicos. Se p exibe uma certa característica qualitativa que conclusões podemos tirar para os demais pontos periódicos? O teorema e a demonstração seguintes mostra que todos os pontos periódicos partilham das mesmas propriedades qualitativas. Desta forma pode-se falar de órbitas periódicas estáveis e instáveis (em alternativa a pontos periódicos estáveis e instáveis). Teorema 37 Seja f uma aplicação de classe C 1 em R e seja {p1 , p2 , ..., pk } uma órbita periódica 231 de período k. Então {p1 , ..., pk } é assimptoticamente estável (escoadouro) se e instável (fonte) se ¯ 0 ¯ ¯f (pk ) ...f 0 (p1 )¯ < 1 ¯ ¯ 0 ¯f (pk ) ...f 0 (p1 )¯ > 1. Dem. Seja g (x) = f k (x). O ponto pi (i = 1, ..., k) é um ponto periódico de período k assimptoticamente estável (ou escoadouro se pi é um ponto fixo assimptoticamente estável (ou escoadouro) de g. De forma análoga, o ponto pi é um ponto periódico de período k instável (ou fonte) se pi é um ponto fixo instável (ou fonte) de g. De acordo com o teorema 30, se |g 0 (pi )| < 1 então pi é um escoadouro de g e se |g 0 (pi )| > 1 então p1 é uma fonte de g. O teorema fica demonstrado se mostrarmos ser válida a equação |g 0 (pi )| = |f 0 (pk ) ...f 0 (p1 )| para i = 1, ..., k. Vem agora, pela derivação de funções composta, ³ ³ ´0 ´ ³ ´ g 0 (x) = f k (x) = (f (...f (f (x))))0 = f 0 f k−1 (x) f 0 f k−2 (x) ...f 0 (f (x)) f 0 (x) . (8.7) Com x = p1 tem-se ³ ´ ³ ´ g 0 (p1 ) = f 0 f k−1 (p1 ) f 0 f k−2 (p1 ) ...f 0 (f (p1 )) f 0 (p1 ) . (8.8) Naturalmente, p2 = f (p1 ) , p3 = f 2 (p1 ) , ..., pk = f k−1 (p1 ) , pelo que, a equação (8.8) pode escrever-se na forma g 0 (p1 ) = f 0 (pk−1 ) f 0 (pk−1 ) ...f 0 (p2 ) f 0 (p1 ) . (8.9) (Assim, |g 0 (p1 )| < 1 é equivalente a |f 0 (pk−1 ) f 0 (pk−1 ) ...f 0 (p2 ) f 0 (p1 )| < 1). Estude-se agora p2 . Vem, pela fórmula (8.7) no ponto x = p2 , ´ ³ ´ ³ g 0 (p2 ) = f 0 f k−1 (p2 ) f 0 f k−2 (p2 ) ...f 0 (f (p2 )) f 0 (p2 ) . Naturalmente, p3 = f (p2 ) , p4 = f 2 (p2 ) ..., pk = f k−2 (p2 ) . Por outro lado, f k−1 (p2 ) = f k−1 (f (p1 )) = f k (p1 ) = p1 . Assim, g 0 (p2 ) é igual ao lado direito da equação (8.9). Considere-se agora um 232 ponto pi genérico. Vem, pela fórmula (8.7) no ponto x = pi , ´ ³ ´ ³ g 0 (pi ) = f 0 f k−1 (pi ) f 0 f k−2 (pi ) ...f 0 (f (pi )) f 0 (pi ) . Naturalmente, pi+1 = f (pi ) , pi+2 = f 2 (pi ) ..., pk = f k−i (pi ) . Por outro lado, f k−i+1 (pi ) = ¢ ¡ f f k−i (pi ) = f (pk ) = p1 , f k−i+2 (pi ) = ... = p2 , f k−i+(i−1) (pi ) = pi−1 . Assim, g 0 (pi ) é igual ao lado direito da equação (8.9).¥ Conclui-se da demonstração anterior que se pi é um ponto periódico assimptoticamente estável (instável) da órbita {p1 , ...pk } então pj é também um ponto periódico assimptoticamente estável (instável). Exemplo 98 Considere-se a EDF yt = 3.5x (1 − x) . Utilizando-se um programa de Matemática obtiveram-se os seguintes resultados: k Pontos Fixos de f k (os pontos periódicos estão em negrito) 1 {0, 0.714286} 2 {0, 0.714286, 0.428571, 0.857143} 3 {0, 0.714286} 4 {0, 0.714286, 0.428571, 0.857143, 0.38282, 0.500884, 0.826941, 0.874997} Analisa-se agora a estabilidade dos pontos periódicos na tabela seguinte. k Análise da Estabilidade dos Pontos Periódicos (teorema 37) 1 |f 0 (0)| = 3.5, |f 0 (0, 0.714286)| = 1.5 ¯ ¯ 0 ¯f (0.428571) f 0 (0.857143)0 ¯ = 1.25 2 3 4 − |f 0 (0.38282) f 0 (0.500884) f 0 (0.826941) f 0 (0.874997)| = 0.03 Os resultados apresentados na tabela anterior podem também ser obtidos da seguinte forma ¯¡ ¢0 ¯¯ ¯¯¡ 2 ¢0 ¯¯ ¯ 2 f = f (0.428571) (0.857143) ¯ ¯ ¯ = 1.25 ¯ ¯¡ ¢0 ¯¯ ¯¯¡ ¢0 ¯¯ ¯¯¡ ¢0 ¯¯ ¯¯¡ ¢0 ¯¯ ¯ 4 ¯ f (0.38282) ¯ = ¯ f 4 (0.500884) ¯ = ¯ f 4 (0.826941) ¯ = ¯ f 4 (0.874997) ¯ = 0.03. 233 Figura 8-21: Gráfico Teia de Aranha da equação yt = 3.5yt−1 (1 − yt−1 ) f 1 0.8 0.6 0.4 0.2 0.2 0.4 0.6 0.8 1 x Naturalmente esta segunda alternativa é bastante mais trabalhosa. Conclui-se que todos os pontos periódicos de período k = 4 são assimptoticamente estáveis; todos os outros pontos em análise são instáveis. O gráfico 8-21 permite identificar um comportamento periódico de período k = 4.Tem interesse ainda observar o gráfico teia de aranha do modelo f 4 (x) - ver figura 822. Observe-se (talvez com alguma dificuldade) que a função f 4 corta o eixo de 45o oito vezes (considerando também o ponto zero). Este facto corrobora a primeira tabela deste exemplo (última linha). 8.3 Aplicação I (Problema de Afectação de Turmas) Com a entrada do plano de estudos 2002/2003 os alunos da licenciatura de Gestão estão sujeitos às seguintes regras: 1) as disciplinas de Matemática I e II funcionam nos dois semestres; 2) um aluno só pode frequentar Matemática II se concluir Matemática I com nota positiva; 3) um aluno que não conclua Matemática I no primeiro semestre poderá frequentar Matemática I no segundo semestre; caso não conclua Matemática I no segundo semestre, deverá frequentar Matemática I no primeiro semestre do ano seguinte; 4) um aluno que não conclua Matemática II no segundo semestre poderá frequentar Matemática II no primeiro semestre do ano seguinte. 234 Figura 8-22: Gráfico Teia de Aranha do Modelo f 4 (x) f 1 0.8 0.6 0.4 0.2 0.2 0.4 0.6 0.8 1 x O problema que se coloca nesta aplicação consiste em determinar (aproximadamente) o número de alunos que irão frequentar Matemática I e II nos próximos anos. Para o efeito, admita-se o seguinte: todos os anos entram E alunos no primeiro ano do curso de gestão; a taxa de aprovação a Matemática I é α e a taxa de aprovação a Matemática II é β. Seja, yij,t o número de alunos que frequentam Matemática i (i = I, II) no semestre j (j = 1, 2) no ano lectivo t. As quatro variáveis são agrupadas no vector yt yt = (y11,t , y12,t , y21,t , y22,t )T . Convencione-se que t = 1 corresponde ao ano lectivo de arranque do novo plano de estudos (englobando os dois semestres lectivos) e seja M1 e M2 o número de alunos do antigo plano de estudos inscritos, respectivamente, em Matemática I e Matemática II no ano lectivo 2002/2003. 235 A condição inicial y1 é então y11,1 = E + M1 y12,1 = (1 − α) (E + M1 ) y21,1 = M2 y22,1 = α (E + M1 ) + (1 − β) M2 . É fácil verificar as seguintes relações dinâmicas entre as variáveis y11,t = E + (1 − α) y12,t−1 y12,t = (1 − α) y11,t y21,t = (1 − β) y22,t−1 y22,t = αy11,t + (1 − β) y21,t . Por exemplo, a equação y11,t = E + (1 − α) y12,t−1 estabelece que o número de alunos em Matemática I no primeiro semestre é igual ao número de alunos que entram no instituto mais os alunos que reprovaram em Matemática I no segundo semestre do ano lectivo anterior. A equação y22,t = αy11,t + (1 − β) y21,t estabelece que o número de alunos em Matemática II no segundo semestre é igual ao número de alunos aprovados em Matemática I (primeiro semestre) mais o número de alunos que reprovaram em Matemática II no primeiro semestre. O sistema anterior pode (e deve) escrever-se na forma habitual yt = Ayt−1 + g. Assim, y11,t = E + (1 − α) y12,t−1 y12,t = (1 − α) (E + (1 − α) y12,t−1 ) {z } | y11,t y21,t = (1 − β) y22,t−1 y22,t = α(E + (1 − α) y12,t−1 ) + (1 − β) (1 − β) y22,t−1 {z } | {z } | y11,t y21,t 236 ou seja y11,t y12,t y21,t y22,t | {z yt 0 1−α 0 0 0 (1 − α)2 0 0 = 0 0 0 1−β 0 α (1 − α) 0 (1 − β)2 } | {z A y11,t−1 y12,t−1 y21,t−1 y22,t−1 }| {z E (1 − α) E + 0 αE } | {z yt−1 g . } A solução do SED yt = Ayt−1 + g dada a condição inicial acima estabelecida pode obter-se a partir da fórmula (7.16). A solução é todavia demasiadamente extensa para ser apresentada. Representa-se a seguir apenas as soluções respeitantes às duas primeiras linhas do vector yt , y11,t = ´ ³ −1 + (−1 + α)2t (−1 + α)2 E + (−2 + α) (−1 + α)2t α M1 y12,t = − (−2 + α) (−1 + α)2 α ´ ³ −1 + (−1 + α)2t (−1 + α)2 E + (−2 + α) (−1 + α)2t α M1 (−2 + α) (−1 + α) α . Note-se, para α > 0, lim y11,t = t→+∞ E , α (2 − α) lim y12,t = t→+∞ E (1 − α) α (2 − α) Em particular, se α = 1 (100% de aprovações) então limt→+∞ y11,t = E e limt→+∞ y12,t = 0. Determine-se agora os pontos fixos, i.e., os pontos ȳ : Aȳ + g = ȳ. Tem-se −1 0 −1 ȳ = (A − I) (−g) = 0 0 = E α(2−α) E(1−α) α(2−α) (1−β)E (2−α)(2−β)β E (2−β)(2−α)β −α + 1 0 0 (−α + 1)2 − 1 0 0 0 −1 −β + 1 α (−α + 1) 0 . (−β + 1)2 − 1 −1 −E − (1 − α) E 0 −αE (8.10) 237 © ª Os valores próprios da matriz A são 0 (raiz dupla), α2 − 2α + 1, β 2 − 2β + 1 ; assim, ¯ ¯ ¯ª ¯ © r = max |0| , ¯α2 − 2α + 1¯ , ¯β 2 − 2β + 1¯ . É fácil verificar que r < 1 se α > 0 e β > 0 e, nestas circunstâncias, o ponto de equilíbrio ȳ (equação (8.10)) é assimptoticamente estável (teorema 29). No caso α = 0 ou β = 0 não existe ponto fixo e verifica-se kyt k → +∞ quando t → +∞ para qualquer valor inicial. Supondo α, β e E fixos (ano após ano) e α, β > 0 então o número de alunos nas duas disciplinas de matemática, primeiro e segundo semestre, tenderá para o vector de constantes (8.10). Vejam-se alguns cenários: suponha-se α = .8, β = .8 e E = 180. Neste caso, yt converge para o vector h 187. 5 37. 5 31. 25 156. 25 iT (para calcular estes valores utilizou-se a expressão (8.10) e o facto de que yt é assimptoticamente estável quando α > 0 e β > 0). O número de turmas a constituir (supondo que cada turma comporta 30 estudantes) é a seguinte: 6 turmas de Matemática I no primeiro semestre, entre uma a duas turmas de Matemática I no segundo semestre, uma turma de Matemática II no primeiro semestre e 5 turmas de Matemática II no segundo semestre. Se as taxas de aprovação forem de apenas 0.5 em ambas as cadeiras yt converge para o vector h 240 120 80 160 iT . Várias generalizações são possíveis: 1) a taxa de aprovação em Matemática I no primeiro semestre pode diferir da taxa de aprovação de Matemática I do segundo semestre; 2) a taxa de aprovação em Matemática II no primeiro semestre pode diferir da taxa de aprovação de Matemática II do segundo semestre e 3) o número de novos alunos que entram todos os anos no instituto, E, pode variar ao longo do tempo. 8.4 Aplicação II (Método Newton-Raphson) Vários problemas lidam com a questão da determinação das raízes da equação g (x) = 0, i.e., {x : g (x) = 0} (por exemplo, num problema de optimização, para se determinarem os pontos de 238 críticos de uma função f de classe C 1 , é necessário resolver-se o sistema fx0 i (x) = 0 em ordem às variáveis xi ; a determinação dos pontos de estacionaridade no âmbito do estudo da estabilidade também exige a resolução da equação f (x) = 0; etc.). Obviamente a resolução da equação h1 (x) = h2 (x) + c em ordem a x pode ser encarada como um problema do tipo {x : g (x) = 0} onde g (x) := h1 (x) − h2 (x) − c. Para a equação quadrática, g (x) = ax2 + bx + c = 0 é bem conhecida a fórmula x= −b ± √ b2 − 4ac . 2a Também para polinómios de ordem 3 e 4 existem fórmulas resolventes (neste último caso, bastante complicada). Está provado que para polinómios gerais de ordem 5 não existe fórmula resolvente. De igual forma, não existem fórmulas que permitam encontrar as raízes da generalidade de equações envolvendo funções transcendentais, como por exemplo, cos x = x ou ex + x = 1. Nestas circunstâncias devem-se usar métodos numéricos. O mais conhecido é o método de Newton ou Newton-Raphson. O método de Newton baseia-se na observação de que a linha tangente é uma boa aproximação local ao gráfico de uma função. Seja (x0 , g(x0 )) um ponto do gráfico da função g ∈ C 1 . Como se sabe a linha tangente (equação da recta tangente à curva g no ponto x0 ) é dada pela expressão y − g(x0 ) = g 0 (x0 )(x − x0 ) Esta recta intercepta o eixo das abcissas quando y = 0; o correspondente valor para x é x = x0 − g(x0 ) . g 0 (x0 ) Assim, a ideia subjacente ao método consiste em propor um valor x0 como uma aproximação para o valor que anula a função g. O valor que se obtém da equação precedente constitui uma nova aproximação (presumivelmente melhor) para esse valor; designe-se esse valor por x1 (i.e., x1 = x0 − g(x0 ) ). g 0 (x0 ) 239 Este procedimento pode ser continuando da seguinte forma: x2 = x1 − g(x1 ) g 0 (x1 ) Em geral, dada a aproximação xn−1 para o zero da função g, a linha tangente no ponto (xn−1 , g (xn−1 )) cruza o eixo das abcissas no ponto (xn , 0) onde xn = xn−1 − g(xn−1 ) . g 0 (xn−1 ) Assim, o método de Newton propõe como zero da função g (x) o limite lim xn . Utilizando a notação habitual, o método de Newton consiste em obter o limite lim yn onde yn = f (yn−1 ) , f (x) = x − g (x) . g 0 (x) Observe que se g (x) = 0 admite pelo menos uma solução então f (x) admite pelo menos um ponto fixo (verifique). Exemplo 99 Considere-se g (x) = x − x3 = 0. As raízes de g são: −1, 0 e 1. Vejamos se o método de Newton consegue detectar estas raízes. Tem-se f (x) = x − A EDF é portanto yn = 3 2yn−1 . 2 3yn−1 −1 2x3 x − x3 . = 1 − 3x2 3x2 − 1 Se iniciarmos a órbita com o valor 0.44, obtém-se a seguinte sequência {0.44, −0.406, 0.266, −0.047, 0.00022, −2.15 × 10−11 , 0, 0, 0}. Na figura 8-23 mostra-se a aplicação do método de Newton. Observem-se as sucessivas linhas tangentes. Na figura 8-24 mostra-se o correspondente gráfico teia de aranha. Em ambos os gráficos8-23 e 8-24 é possível confirmar a órbita {0.44, −0.406, 0.266, −0.047, 0.00022, −2.15 × 10−11 , 0, 0, 0}.Assim, quando o valor inicial é 0.44 o método de Newton propõe como zero da função g o valor 0. No entanto, como a tabela seguinte mostra, se o valor inicial for 0.75 o método propõe o valor 1, e se o valor for 0.45 o método propõe −1. Deixa-se ao cuidado do leitor verificar que o método de Newton √ √ não se aplica quando o valor inicial é y0 = 1/ 3 ou y0 = −1/ 3 (veja-se a figura 8-23). 240 Figura 8-23: Método de Newton (função g (x) = x − x3 ) y 0.4 0.2 0 -1 -0.5 0 0.5 1 x -0.2 -0.4 Figura 8-24: Gráfico Teia de Aranha da EDF yn = 3 2yn−1 , 2 3yn−1 −1 0.4 0.2 -0.4 -0.2 0.2 -0.2 -0.4 241 0.4 y0 = 0.44 Órbitas da EDF yn = 3 2yn−1 2 3yn−1 −1 com valores de inicialização Distintos n yn yn yn 0 0.4400000 0.7500000 0.4500000 1 -0.4064122 1.2272727 -0.4643312 2 0.2661215 1.0507126 0.5668991 3 -0.0478628 1.0034499 -10.1563782 4 0.0002208 1.0000177 -6.7928698 5 0.0000000 1.0000000 -4.5615319 6 0.0000000 1.0000000 -3.0905310 7 0.0000000 1.0000000 -2.1348584 8 0.0000000 1.0000000 -1.5355449 9 0.0000000 1.0000000 -1.1922426 10 0.0000000 1.0000000 -1.0383176 11 0.0000000 1.0000000 -1.0020218 12 0.0000000 1.0000000 -1.0000061 13 0.0000000 1.0000000 -1.0000000 Um resultado importante é o seguinte. Teorema 38 Se g é uma função diferenciável então todo o ponto fixo de f (x) = x−g (x) /g 0 (x) é assimptoticamente estável e raíz de g. Se um ponto é raíz de g e f está definida nesse ponto, então o ponto é um ponto fixo de f assimptoticamente estável. Naturalmente, o teorema não garante a convergência da sequência yn = f (yn−1 ) dado um qualquer valor inicial y0 , mesmo que f esteja definida no ponto y0 (y0 pode não pertencer a nenhuma bacia de escoadouro). 242 Exercícios 1. Usando a definição, estude a estabilidade dos pontos fixos das seguintes EDF: α k, k > 0 (considere a transformação z = log y ) (a) yt = yt−1 t t (b) yt = e−t yt−1 , t ≥ 0 (c) P (F ) yt = 0 onde P (F ) é um polinómio de grau dois em F (faça o estudo em função das raízes do polinómio P (F )). 2. Represente o gráfico teia de aranha, identifique os pontos fixos e estude a estabilidade dos pontos fixos a partir do gráfico teia de aranha e do teorema 30 (quando tal for possível) nos seguintes casos: (a) f (x) = x1/3 (b) f (x) = 2 arctg x (note que −π/2 < arctg x < π/2;pontos fixos −2. 331, 0 e 2. 331 1) (c) f (x) = 1/x (discuta a estabilidade também a partir da definição) (d) f (x) = cos x (ponto fixo: 0.739 09) (e) f (x) = x + e−5 (e−x − ex ). Considere a figura seguinte 7.5 5 2.5 -a -7.5 -5 -2.5 2.5 5 7.5 a -2.5 -5 -7.5 3 . A função f (x) = x3 é repre3. (Exame) Considere a equação às diferenças finitas yt = yt−1 sentada na figura seguinte. 243 f(x) 1.5 1 0.5 0 -1.5 -1 -0.5 0 -0.5 0.5 1 1.5 x -1 -1.5 (a) Obtenha a solução da equação às diferenças dada a condição inicial y0 = ξ. (b) Determine os três pontos fixos e classifique-os quanto à estabilidade. (c) Recorrendo a métodos gráficos determine a bacia do(s) escoadouro(s). 4. Suponha que f : R→R tem derivada de primeira ordem contínua num intervalo aberto contendo o ponto fixo ȳ. Mostre que se f 0 (ȳ) < 0 então existe um intervalo aberto I contendo ȳ tal que se x ∈ I, f (x) e x encontram-se em lados opostos face a ȳ. 5. Determine a bacia dos escoadouros dos modelos definidos no exercício 2. 6. (Exame) Considere f (x) = x + sen x. (a) Determine os pontos fixos de f e classifique-os quanto à estabilidade. (b) Determine a bacia dos escoadouros utilizando o teorema 33 e o gráfico seguinte onde se representam as curvas x + sen x, x e 2 (kπ) − x com k = −1, 0, 1, 2, 3, 4. 244 f 30 25 20 15 10 5 - 2 p- p p 2 p 3 p 4p x -5 -10 ¡ ¢ 2 7. Considere a EDF yt = yt−1 / 1 + yt−1 . (a) Determine o único ponto fixo. (b) Mostre que o ponto fixo é assimptoticamente estável (verifique que o teorema 30 não é aplicável). (c) Mostre que W (0) = R usando i. o teorema 33, ii. o teorema 34. ¢ ¡ 8. Considere a EDF yt = f (yt−1 ), onde f (x) = −x log 1 + x2 . (a) Determine o único ponto fixo. (b) Mostre que o ponto fixo é assimptoticamente estável. (c) Determine a bacia do escoadouro usando o gráfico da função f (x) 245 2 1.5 1 0.5 -3 -2 -1 -0.5 1 2 3 -1 -1.5 -2 (d) Determine a bacia do escoadouro usando o teorema 34. 9. Mostre que ȳ = (0, 0)T é um ponto assimptoticamente estável dos sistema y1t = y2t = αy2t−1 2 1 + y1t−1 βy1t−1 2 1 + y2t−1 se α2 , β 2 < 1 usando, (a) o teorema 31 (b) o teorema 32 (c) No caso α2 , β 2 < 1 determine a bacia do escoadouro. 10. Considere a função f (x) = 2x2 − 5x. (a) Determine os pontos fixos e estude a sua estabilidade. √ √ ª © (b) Sabe-se que as soluções da equação f (f (x)) = x são 0, 3, 1 + 2, 1 − 2 . Deter- mine os pontos periódicos de período 2 e escreva a respectiva órbita de período 2. Estude a sua estabilidade. 11. Considere um sistema de duas equações às diferenças yt = Ayt−1 246 com valor inicial y0 . Suponha que A é uma matriz triangular possuindo dois valores próprios iguais a λ 6= 0. Como se sabe a solução do PVI neste caso é ¡ ¢ yt = λt I + tλt−1 (A − λI) y0 . (*) (a) Admitindo que existem dois vectores próprios independentes associados a λ, simplifique a expressão (*). (b) Determine todos os pontos fixos. (c) Estude a estabilidade do ponto fixo ȳ = 0 no caso em que |λ| ≤ 1 (considere t ≥ 0). Utilize a definição de estabilidade. 247 Bibliografia Abell, M. & J. Braselton (1997) Differential Equations with Mathematica, Academic Press. Alligood, K. & T. Sauer & J. Yorke (1997) Chaos. An Introduction to Dynamical Systems, Springer-Verlag. Braun, M. (1993) Differential Equations and their Applications, Springer-Verlag. Brock, W. & A. Malliaris (1989) Differential Equations, Stability and Chaos in Dynamic Economics, Elsevier Science Publishers. Costa, F. (1998) Equações Diferenciais Ordinárias, Instituto Superior Técnico. Gandolfo, G. (1997) Economic Dynamics, Springer-Verlag, Berlin. Glendinning, P. (1999) Stability, Instability and Chaos: An Introduction to the Theory of Nonlinear Differential Equations, Cambridge University Press. Holmgren, R. (1996) A First Course in Discrete Dynamical Systems, Springer-Verlag. Kelley, W. & A. Peterson (1991) Difference Equations - An Introduction with Applications, Academic Press. Perko, L. (2001) Differential Equations and Dynamical Systems, Springer-Verlag. Piskounov, N. (1992) Cálculo Diferencial e Integral, Vol. II, Edições Lopes da Silva. Rao, M. (1981) Ordinary Differential Equations, Edward Arnold. Schwalbe, D. & S. Wagon (1997) VisualDSolve. Visualizing Differential Equations with Mathematica, Springer-Verlag. St’Aubyn, A. Apontamentos de Equações Diferenciais, Faculdade de Ciências de Lisboa. 248