Capı́tulo 2 Teoria qualitativa dos sistemas dinâmicos 2.1 Conjuntos limite e recorrência Seja a equação diferencial ẋ = f (x), ou o sistema dinâmico discreto xn+1 = f (xn ), com x, xn 2 Rn . As definições desta secção são válidas para estas duas classes de sistemas dinâmicos, com as adaptações necessárias. Definição 2.1. Um ponto y do espaço de fases Rn está no conjunto w-limite de x, y 2 w(x), se existir uma sucessão {tn }n 0 , com tn ! +•, tal que, lim ftn (x) = y n!• em que ft (x) é uma solução da equação diferencial ẋ = f (x). Substituindo, tn ! +• por tn ! •, e w(x) por a(x), então a(x) é o conjunto a-limite do ponto x. Do igual modo, definem-se conjuntos w-limite e a-limite para equações às diferenças. Os conjuntos w(x) e a(x) contêm os pontos fixos e as órbitas periódicas de um sistema dinâmico. Pontos fixos e órbitas periódicas são simultâneamente conjuntos a- e w-limite. Os pontos assintoticamente estáveis das equações diferenciais lineares são os conjuntos w-limite das trajectórias vizinhas. No oscilador harmónico de frequência incomensurável com 2p, os conjuntos a-limite e w-limite de um ponto no espaço de fases coincidem e são a curva 135 136 2. Teoria qualitativa dos sistemas dinâmicos de fase fechada (S1 ) que passa por esse ponto. Num sistema de dois osciladores harmónicos não acoplados e de frequências racionalmente independentes, os conjuntos w-limite e a-limite são toros T 2 . Os conjuntos w-limite podem ter uma estrutura bastante complicada. Por exemplo, no caso do atractor de Lorenz (secção 1.8), não se conhece a estrutura topológica do conjunto w-limite associado às trajectórias no atractor estranho. Lema 2.2. Seja uma equação diferencial ou uma equação às diferenças em Rn . Seja ft a solução definida para todo o t 0, e sejam w(x) e a(x) os conjuntos w- e a-limite de x 2 Rn . Então tem-se: a) w(x) [resp. a(x)] é fechado. b) Se x e z estão na mesma trajectória, w(x) = w(z) [resp. a(x) = a(z)]. c) Um conjunto fechado e limitado D, positivamente invariante para o fluxo de fase (ft (D) ✓ D, para todo o t 0) [ resp. negativamente invariante para o fluxo de fase (f t D ◆ D, para todo o t 0)] contem os conjuntos w-limite [resp. a-limite] de todos os seus pontos e w(x) é compacto, com x 2 D. d) O conjunto w-limite de uma órbita é um conjunto invariante. Demonstração. a) Que w(x) é fechado decorre da definição de conjunto wlimite, pois w(x) contem todos os pontos de acumulação da trajectória de x no espaço de fases. b) Suponha-se que, y 2 w(x) e que z = fr (x). Se , ftn (x) ! y quando tn ! +•, então, ftn r (z) = ftn (f r (z)) = ftn (x) ! y e w(z) = w(x). c) Seja x 2 D, com D positivamente invariante. Como, ftn ! y 2 w(x), para tn > 0, ftn (x) 2 D e portanto y 2 D̄ = D. Como w(x) é fechado e limitado, w(x) é compacto. d) Seja g uma órbita de um sistema dinâmico, x 2 w(g) e ft (x) = y. Seja a sequência ftn (z) ! x com z 2 g. Então, ftn +t (z) = ft (ftn (z)) ! ft (x) 2 w(g) pois, z 2 g. 2.1. Conjuntos limite e recorrência 137 Os conjuntos a- e w-limite de um sistema dinâmico contêm as soluções assimptóticas das equações diferenciais e às diferenças e são conjuntos invariantes. No caso em que w(x) está contido num conjunto positivamente invariante do espaço de fases, w(x) é compacto e a restrição da dinâmica a w(x) fornece, em muitos casos, sistemas dinâmicos mais simples. As propriedades de recorrência de um sistema dinâmico podem ser estudadas através do conceito de conjunto não-errante. Definição 2.3. Um ponto x 2 Rn do espaço de fases de um sistema dinâmico é não-errante ou recorrente para o fluxo de fases ft , se, para qualquer vizinhança V (x) de x e qualquer t0 > 0 , existe um t > t0 tal que, ft (V (x)) \ V (x) 6= 0. / Designa-se por W o conjunto dos pontos não-errantes de um sistema dinâmico. Por exemplo, pontos fixos estáveis e órbitas periódicas estáveis de equações diferenciais são conjuntos não-errantes. No caso do oscilador harmónico, W = R2 . Inversamente, se um ponto x 2 Rn não é não-errante, então x é errante. Definição 2.4. Um ponto x 2 Rn do espaço de fases de um sistema dinâmico é errante para o fluxo de fases ft , se existe uma vizinhança V (x) de x e um t0 > 0, tal que, se t > t0 , então ft (V (x)) \ V (x) = 0. / Lema 2.5. Seja uma equação diferencial ou uma equação às diferenças em Rn . Então, a) O conjunto não-errante W é fechado. b) Sejam La e Lw as famı́lias dos conjuntos a- e w-limite de um sistema dinâmico. Estão, La [ Lw ⇢ W. Demonstração. a) Vamos supor que o conjunto dos pontos errantes NW de um sistema dinâmico é fechado (W é aberto). Nestas condições existem pontos x 2 NW para os quais, qualquer vizinhança V (x) contem pontos de W. Ora, V (x) é também vizinhança de pontos y 2 W. Como isto é válido para qualquer vizinhança V (x), existem pontos y 2 W que têm vizinhanças arbitrariamente pequenas que intersectam NW. Assim, W não pode ser aberto, contradizendo a hipótese inicial. b) Vamos supor que x 2 Lw . Nestas condições, tem de existir uma sucessão de tempos {tn } tal que, ftn (x) ! x e x é não-errante. Caso contrário, x não poderia pertencer a um conjunto w-limite. 138 2. Teoria qualitativa dos sistemas dinâmicos Do lema anterior decorre que os pontos dos conjuntos w-limite de um sistema dinâmico são recorrentes ou não errantes. Isto sugere, que todos os pontos dos atractores estranhos são recorrentes. Definição 2.6. Um conjunto invariante L de um sistema dinâmico é hiperbólico se é possı́vel decompor o espaço tangente em cada ponto x 2 L na forma Tx = E s E u , em que E s e E u são os espaços tangentes gerados pelos vectores próprios associados aos valores próprios cujas partes reais são estritamente negativas e estritamente positivas, respectivamente. Se esta propriedade é valida em todo o espaço de fases, então o sistema dinâmico é hiporbólico. Por exemplo, uma equação diferencial linear com um ponto sela é um sistema dinâmico hiperbólico. O sistema dinâmico do Exemplo 1.48 é (uniformemente) hiperbólico. O oscilador harmónico não é um sistema dinâmico hiperbólico. Pode-se mostrar facilmente que a equação de Lorenz é um sistema dinâmico (não uniformemente) hiperbólico. Definição 2.7. Um sistema dinâmico discreto é de Axioma A se o seu conjunto não-errante W é hiperbólico e W contem um conjunto denso de órbitas periódicas. Por exemplo o sistema dinâmico xn+1 = f (xn ), em que, f (x) = 2|x| 1 e x 2 [ 1, 1] é um sistema de Axioma A. Este sistema dinâmico é globalmente expansivo (| f 0 | = 2) e contem um conjunto denso de órbitas periódicas (instáveis). Em muitas situações, um atractor estranho tem propriedades semelhantes aos sistemas uniformemente hiperbólicos de Axioma A, [Ruelle, 2006]. No caso particular em que um sistema dinâmico deixa invariante uma medida, a recorrência das trajectóras no espaço de fases é genérica. Teorema 2.8 (recorrência de Poincaré). Seja gt o fluxo de fase de um sistema dinâmico e suponha-se que o espaço de fases, ou um subconjunto invariante do espaço de fases, tem medida finita. Se o fluxo de fase deixa invariante essa medida (definição 1.36), então quase todos os pontos do espaço de fases são recorrentes. Demonstração. Seja B o conjunto de pontos não recorrentes e admita-se que este conjunto tem medida positiva no espaço de fases. Assim, como a medida 2.1. Conjuntos limite e recorrência 139 é preservada pelo fluxo, os conjuntos gnt0 B têm todos a mesma medida. Como os pontos de B não são recorrentes, tem de existir um valor de t = t0 para o qual gnt0 B não intersecta g(n+1)t0 B. Assim, o espaço de fases não pode ter medida finita. Chegámos assim a uma contradição pelo facto de termos assumido que B tinha medida positiva. Um exemplo de um sistema dinâmico dissipativo em que quase todos os pontos do seu espaço de fases são recorrentes é a aplicação do intervalo xn+1 = 4xn (1 xn ), com xn 2 [0, 1], estudada anteriormente. O conceito de recorrência generaliza o conceito de perı́odo. Por exemplo, podemos definir o tempo de recorrência de um ponto como o tempo que a órbita de um ponto demora a regressar a uma vizinhança suficientemente pequena do ponto. No caso de órbitas periódicas, o tempo de recorrência é o perı́odo da órbita. Este tempo de recorrência pode ser estimado numericamente para alguns sistemas com comportamento caótico. Num sistema caótico, o tempo de recorrência vai para infinito quando o raio da vizinhança do ponto inicial da órbita tende para zero. A transformação do toro do Exemplo 1.48 é uniformemente hiperbólica e o conjunto não-errante é todo o espaço de fases. Este sistema dinâmico é de Axioma A, pois contém um conjunto denso de órbitas periódicas, todas instáveis: Lema 2.9. Seja o difeomorfismo do toro T 2 ✓ ◆ ✓ ◆✓ ◆ ✓ ◆ xn+1 1 1 xn x F: = =A n yn+1 1 2 yn yn (mod.1). Então, F : [0, 1] ⇥ [0, 1] ! [0, 1] ⇥ [0, 1] tem órbitas periódicas de todos os perı́odos e todas instáveis. O conjunto dos pontos periódicos de F são densos em [0, 1] ⇥ [0, 1]. p p Demonstração. Sejam l1 = (3 + 5)/2 > 1 e l2 = (3 5)/2 < 1 os valores próprios da matriz A. Com as novas variáves, zn = xn + (l1 1)yn e wn = xn + (l2 1)yn , a transformação do toro reduz-se à forma diagonal zn+1 = l1 zn e wn+1 = l2 wn . Como zn = z0 l1n (mod. 1) e wn = w0 l2n (mod. 1), os pontos fixos de perı́odo n têm coordenadas z = k/(l1n 1) (mod. 1) e z = m/(l2n 1) (mod. 1) em que k e m são inteiros. Como l1 e l2 não são raı́zes da unidade, a aplicação F tem pontos fixos de todos os perı́odos. Os pontos fixos são todos instáveis pois o sistema é uniformemente hiperbólico (l1 > 1 e l2 < 1). Como a transformação F é conservativa, o conjunto dos pontos fixos é denso no toro, caso contrário contrariaria o teorema da recorrência de Poincaré. 140 2. Teoria qualitativa dos sistemas dinâmicos O sistema dinâmico do lema anterior é o protótipo de um sistema caótico com comportamento estocástico. Por um lado, o sistema dinâmico deixa invariante a medida de Lebesgue, por outro, não tem órbitas periódicas estáveis e quase todos os pontos do toro são recorrentes. O atractor deste sistema é o toro, com dimensão fractal 2. 2.1) Faça uma estimativa numérica do tempo de recorrência para p a rotação pura do cı́rculo, qn+1 = qn + w (mod. 1), para w = 1/3 e w = ( 5 1)/2). Faça este estudo em função do diâmetro de uma bola centrada num ponto do espaço de fases. 2.2 Funções de Poincaré As funções de Poincaré são sistemas dinâmicos discretos obtidos por redução de dimensão do espaço de fases de uma equação diferencial. A redução de dimensão, passagem de um sistema contı́nuo de dimensão n para um sistema discreto de dimensão n 1, é importante nos casos em que as equações diferenciais têm órbitas periódicas isoladas, assim como no estudo de equações diferenciais não autónomas com dependência periódica no tempo. Vamos considerar a equação diferencial, ẋ = f (x), com x 2 Rn , e vamos supor que existe no espaço de fases uma solução periódica isolada g (figura 2.1). Seja S uma secção transversal ao fluxo de fase. Isto é, se n(x) é a normal a S e se f (x).n(x) 6= 0, então S é transversal ao fluxo de fase. Seja x 2 g \ S e seja VS (x) uma vizinhança aberta de x contida em S. γ x V Σ Figura 2.1: Secção de Poincaré S de uma solução periódica isolada g de uma equação diferencial. 2.2. Funções de Poincaré 141 Quando S é transversal ao campo de vectores, define-se a função P : VS ⇢ S ! S através de P(y) = ft (y), em que y 2 S e t é o tempo que a órbita leva a voltar a S. Em geral, o perı́odo t é dependente do ponto y 2 VS (x), t ⌘ t(y). Quando y = x e t = T , em que T é o perı́odo de g, x 2 VS ⇢ S é ponto fixo da função de Poincaré P. Assim, a função de Poincaré define um sistema dinâmico discreto, yn+1 = P(yn ). Por construção, órbitas periódicas de equações diferenciais estão associadas a pontos fixos de funções de Poincaré. A pontos fixos estáveis da função de Poincaré estão associadas órbitas periódicas do fluxo de fases. Se um ponto fixo de P é estável, a órbita periódica g é também estável — estabilidade orbital. Se um ponto fixo de P é hiperbólico, g é uma órbita periódica hiperbólica. Note-se que toda a construção da função de Poincaré é apenas local. Isto é, a secção transversal está definida apenas numa vizinhança de g contida em S. No entanto, podem existir secções transversais definidas globalmente. Exemplo 2.10. Cálculo de uma função de Poincaré. Seja a equação diferencial não linear ⇢ ẋ = x y x x2 + y2 (2.1) ẏ = x + y y x2 + y2 p Com a transformação para coordenadas polares, r = x2 + y2 e q = arctg(y/x), obtém-se ⇢ ṙ = r 1 r2 q̇ = 1 (mod. 2p) . Integrando esta equação diferencial por quadraturas, obtém-se a solução ! ✓ ✓ ◆ ◆ 1/2 1 2t ft (r0 , q0 ) = 1+ 2 1 e ,t + q0 (mod. 2p) . r0 Introduzindo a secção transversal S = {(r, q ) : r > 0, q = 2pn}, com T = 2p, a aplicação de Poincaré, tomada na secção tranversal S , é ✓ ✓ 1 rn+1 = P(rn ) = 1 + 2 rn ◆ 1 e 4p ◆ 1/2 . (2.2) O sistema dinâmico rn+1 = P(rn ) tem um ponto fixo para rn = 1, a que n) 4p < corresponde uma órbita periódica isolada de (2.1). Como dP(r drn rn =1 = e 142 2. Teoria qualitativa dos sistemas dinâmicos 1, o ponto fixo de rn = 1 é estável e g é uma órbita periódica hiperbólica. A solução periódica isolada g da equação (2.1) designa-se por ciclo limite. Na figura 2.2 estão representadas algumas trajectórias de fase da equação (2.1) e o gráfico da função de Poincaré (2.2). ��� �) ����� ������ ��� � ��� -��� -��� -��� -��� ��� � ��� ��� ��� �) ��� ��� � ��� ��� ��� ��� ��� ��� �(�)=� ��� ��� � ��� ��� ��� Figura 2.2: a) Ciclo limite no espaço de fases do sistema de equações (2.1). b) Aplicação de Poincaré (2.2). A função de Poincaré foi calculada ao longo da linha y = 0, com x 0. ⌅ Definição 2.11. Um ciclo limite g é uma órbita periódica isolada de uma equação diferencial, para a qual, g ⇢ w(x) ou g ⇢ a(x), em que x é um ponto de uma vizinhança aberta de g. O ponto fixo estável de uma função de Poincaré está associado a um ciclo limite estável. Neste caso, diz-se que se tem um w-ciclo limite. Quando o ponto fixo da função de Poincaré é instável, tem-se um a-ciclo limite. Se um ciclo limite é estável para órbitas interiores e instável para órbitas exteriores, ou vice-versa, a função de Poincaré não pode ter derivada contı́nua no ponto fixo. Neste último caso, diz-se que o ciclo limite é semi-estável. Veja-se outra construção de uma função de Poincaré. Seja uma equação diferencial com dependência explı́cita no tempo, ẋ = f (x,t), com x 2 Rn e t 2 R, e vamos supor que f (x,t) = f (x,t + T ), para todo o t 2 R. Como f (x,t) é periódica de perı́odo T , vamos tomar, T = 2p/w. Seja a nova variável 2.2. Funções de Poincaré 143 independent t = wt. Então, a equação anterior escreve-se na forma, ⇢ ẋ = f¯(x, t) ṫ = w (mod. 2p) . Assim, reduziu-se uma equação diferencial não autónoma em dimensão n a uma equação diferencial autónoma em dimensão n + 1. Seja S a secção transversal ⇣ ⌘definida por S = {(x, t) : t = 2pn} (figura 2.3). A normal a S é n(x, t) = ~0, 1 e portanto f¯(x, t).n(x, t) = w 6= 0. Assim, S é uma secção transversal e a função de Poincaré é definida por P (x, t0 ) := (f (x, t0 ), t0 + 2p) . Assim, pontos fixos de perı́odo k da função de Poincaré P correspondem a órbitas periódicas de perı́odo kT da equação diferencial não-autónoma (figura 2.3). θ Σ θ=4π P Σ θ=2π P y x Σ Figura 2.3: Secção de Poincaré S e aplicação de Poincaré P para uma equação diferencial não autónoma. Exemplo 2.12. Cálculo de uma função de Poincaré para uma equação diferencial não autónoma. Seja a equação do oscilador harmónico forçado, ẍ + w02 x = B sin(wt) (2.3) 144 2. Teoria qualitativa dos sistemas dinâmicos em que w0 6= w. Ora, a solução geral desta equação é 8 y0 B > > sin w0t + 2 sin wt < x(t) = x0 cos w0t + w0 w0 w 2 Bw > > x0 w0 sin w0t + y0 cos w0t + 2 cos wt . : y(t) = w0 w 2 Como o termo não-autónomo da equação diferencial tem perı́odo T = 2p/w, a aplicação de Poincaré ao fim do tempo T é o mapa afim do plano ! ✓ ◆ ✓ w0 ◆ ✓ ◆ 1 0 sin 2p cos 2p ww0 xn+1 x n w w 0 = + . Bw yn+1 yn w0 sin 2p ww0 cos 2p ww0 w2 w2 0 Este mapa afim tem um ponto fixo de perı́odo 1 de coordenadas, ✓ ◆ 1 w0 1 (x, y) = Bw sin 2p , Bw . w 2w0 (w02 w 2 )(1 cos 2p ww0 ) 2(w02 w 2 ) Assim, a única órbita periódica de perı́odo T da equação diferencial é a órbita que gera o ponto fixo de perı́odo 1 da função de Poincaré (figura 2.4). Se w0 /w é irracional e se a condição inicial não está sobre o ponto fixo, diz-se que a solução da equação diferencial é quasi-periódica, sendo uma rotação pura do cı́rculo de ângulo 2pw0 /w (figura 2.4a)). Se w0 /w é um número racional da forma p/q, todos os pontos do espaço de fases são órbitas periódicas de perı́odo q (figura 2.4b)). ⌅ 2.2) Calcule a aplicação de Poincaré para a equação diferencial ẋ + kx = A cos wt, em que k, w e A são constantes positivas. Determine os pontos fixos de todos os perı́odos da função de Poincaré e analise a sua estabilidade. 2.3) Seja a equação diferencial do pêndulo com atrito, q̈ +2l q̇ +w 2 sin q = 0, com q 2 [ p/2, pi/2] e w e l parâmetros positivos. Esboce qualitativamente a função de Poincaré deste sistema dinâmico, tomada ao longo da linha q̇ = 0, e para l no intervalo [ e, e], com e > 0. 2.3 O Teorema de Poincaré-Bendixon Nesta secção, consideram-se apenas equações diferenciais no plano R2 . Vãose encontrar condições que garantam a existência de órbitas periódicas isoladas no espaço de fases. Este resultado baseia-se no seguinte teorema intuitivo, mas de demonstração delicada: 2.3. O Teorema de Poincaré-Bendixon 1.0 145 1.0 a) 0.5 0.5 y 0.0 y 0.0 -0.5 -0.5 -1.0 -1.0 -0.5 0.0 x 0.5 1.0 b) -1.0 -1.0 -0.5 0.0 x 0.5 1.0 Figura 2.4: Órbitas da aplicação de Poincarépdo oscilador harmónico forçado (2.3). Os parâmetros são: a) w0 = 1.0, w p = 2 = 1.4142 e B = 1.0; b) w0 = 1.0, w = 1.4 e B = 1.0. Em a), w0 /w = 1/ 2 é irracional. Em b), w0 /w = 5/7 é um número racional. Teorema 2.13 (Jordan). Uma curva fechada divide o plano em duas regiões desconexas. Seja g uma curva de fase de uma equação diferencial. Diz-se que a sequência xt1 , xt2 , . . . é monótona ao longo da curva g se, t1 t2 . . . tn . . . (figura 2.5). xt1 xt2 xt3 xt4 Figura 2.5: Sequência monótona sobre uma órbita de uma equação diferencial. Lema 2.14. Seja S uma secção transversal ao fluxo de fase de uma equação diferencial em R2 , e sejam {yi } pontos de uma curva de fase g. Suponha-se que o campo de vectores é contı́nuo. Se {yi } é monótona ao longo de g, então {yi } é monótona ao longo de S. Demonstração. Sejam y0 , y1 , 2 S (figura 2.6). Seja C o arco de g que liga c é uma curva fechada do y0 a y1 e B o segmento de S que une y0 a y1 . CB plano. Como S é transversal ao fluxo de fase, o campo de vectores em y0 e y1 apontam para o mesmo lado de S, caso contrário, devido à continuidade 146 2. Teoria qualitativa dos sistemas dinâmicos de f , existiria um ponto de B em que o campo de vectores seria nulo e S não seria transversal. Assim, jt (y1 ), com t > 0 está sempre no interior de D, e se existir uma intersecção de jt (y1 ) = y2 com S, y1 2 (y0 , y2 ), e portanto, {yn } é monótona ao longo de S. y1 B C y0 D γ Figura 2.6: Curva de fase g e secção de Poincaré S. Lema 2.15. O conjunto w-limite de uma trajectória g intersecta uma secção transversal no máximo num ponto. Demonstração. Suponha-se que w(g) tem dois pontos y1 e y2 em S. Então existem subsequências que convergem para y1 e y2 . Pelo lema 2.14, isto contraria o facto de qualquer sequência ser monótona ao longo de S. Teorema 2.16 (Poincaré-Bendixon). Se o conjunto w-limite de uma trajectória limitada g não tem singularidades, então, w(g) é uma órbita periódica. Demonstração. Como g é limitada, w(g) 6= 0. / Queremos mostrar que, se q 2 w(g), então existe um tempo t tal que, ft (q) = q. Seja x 2 w(q). Como w(g) não tem singularidades, x não é uma singularidade. Seja S uma secção transversal que passa por x. Ora como existe uma sequência monótona {qti } que intersecta S e tal que qti ! x. Como qti 2 w(g) e o conjunto w-limite é invariante, pelo lema 2.15, todos os qti intersectam S no mesmo ponto, isto é, qti = x para todo o i. Então, como, ft1 (q) = ft2 (q), ft2 t1 (x) = ft (q) = q. Corolário 2.17 (Poincaré-Bendixon). Um conjunto compacto K, estritamente positivamente invariante [resp. negativamente invariante], e que não contem 2.3. O Teorema de Poincaré-Bendixon 147 pontos de equilı́brio, contem no seu interior pelo menos um w-ciclo limite [resp. a-ciclo limite].1 Exemplo 2.18. A equação de Lienard-van der Pol. Seja a equação diferencial de segunda ordem ẍ + f (x)ẋ + x = 0, (2.4) em que f (x) é uma função par, negativa na vizinhança da origem, e limx!±• f (x) = +•. A equação (2.4) descreve o movimento de um oscilador linear com atrito negativo para pequenas amplitudes e, para grandes amplitudes, com amortecimento ou atrito positivo. Escolhendo a função par, f (x) = a(x2 1), em que a é um parâmetro real, figura 2.7, introduz-se a função impar ✓ ◆ Z x 1 3 F(x) = f (s)ds = a x x . 3 0 Introduzindo a nova variável, y = ẋ + F(x) em (2.4), tem-se que ⇢ � ẋ = y F(x) d ẏ = ẍ + dtd F(x) = ẍ + dx F(x)ẋ = ẍ + f (x)ẋ = x . � � � � � � � -� -� (2.5) � -� -� -� � � � � -� -� � � � � Figura 2.7: Gráfico das funções f (x) = a(x2 1) e F(x) = a(x3 /3 equação de Lienard-van der Pol, em que a = 1. x) da A equação diferencial (2.5) tem como único ponto fixo, a origem (0, 0). Vejamos agora que (2.5) tem pelo menos uma órbita periódica isolada ou ciclo limite. Para isto, vamos mostrar que existe, no espaço de fases de (2.5), um 1 Um conjunto K é estritamente positivamente invariante para o fluxo de fase, se f K ⇢ K, t para todo o t > 0. 148 2. Teoria qualitativa dos sistemas dinâmicos conjunto compacto K, estritamente positivamente invariante para o fluxo de fase. Com, r = (x2 + y2 )/2, tem-se que dr = xẋ + yẏ = xF(x). dt Para x suficientemente pequeno, dr 0, e portanto, o campo de vecdt = xF(x) tores (2.5) é transversal a uma coroa circular de raio suficientemente pequeno e no sentido exterior (figura 2.8). � �(�) �� γ γ� � �� Figura 2.8: Construção geométrica para a demonstração da existência de um ciclo limite no oscilador de Lienard-van der Pol (2.5). Seja o ponto y1 sobre o eixo dos yy (figura 2.8). Quere-se agora demonstrar que, se y1 é suficientemente grande, existe uma trajectória g que sai do ponto (0, y1 ) e intersecta x = 0 para valores negativos de y (figura 2.8). A equação das curvas integrais do sistema (2.5) é dy = dx y x F(x) (2.6) e portanto, sobre a recta y = y1 e para x 6= 0, o campo de vectores aponta no sentido negativo do eixo dos yy, dy/dx < 0. Nos pontos y = F(x), o campo de vectores aponta no sentido negativo do eixo dos yy. Se a trajectória g não cruza a linha y = F(x), existem outros pontos fixos que não são a origem, o que contraria o facto de o sistema (2.5) ter apenas um ponto fixo. 2.3. O Teorema de Poincaré-Bendixon 149 Para valores negativos de y, e x suficientemente pequeno, o campo de vectores aponto na direcção de valores negativos de x. Então, a trajectória g ou cruza o eixo x = 0 ou vai para y = •. No último caso, por (2.6), teria que dy existir um ponto x⇤ 0 para o qual dx |x⇤ = •, o que é falso. Então, a curva g tem que cruzar o eixo x = 0 (figura 2.8). Com as novas variáveis z = x e w = y a equação (2.5) é invariante, e portanto existe uma solução g1 , semelhante a g, simétrica em relação à reflexão simultânea nos eixos dos xx e dos yy, figura 2.8. A região delimitada por g, g1 e pelas linhas que as unem formam uma região fechada e positivamente invariante do espaço de fases. Na figura 2.8, a região delimitada por g, g1 e pelas linhas verticais que unem ambas as curvas e pela circunferência centrada na origem e de raio suficientemente pequeno, é estritamente positivamente invariante, não contendo nenhum ponto fixo no seu interior. Pelo corolário ao teorema de PoincaréBendison, o oscilador de Lienard-van der Pol tem pelo menos um ciclo limite no espaço de fases. Embora numericamente seja possı́vel verificar que o sistema de Van der Pol só tem um ciclo limite para a > 0, a demonstração deste facto é elaborada, [Cesary, 1963]. Figura 2.9: Ciclos limites da equação de Lienard-van der Pol (2.5), em que f (x) = a(x2 1), para vários valores do parâmetro a. Na figura 2.9, estão representados alguns ciclos limites do oscilador de Lienard-van der Pol (2.5), em que f (x) = a(x2 1) com a > 0. Para a < 0, o sistema (2.5) não tem ciclos limites. Para a > 0 e condições iniciais (x0 , y0 ) tais que (x0 , y0 ) 6= (0, 0), o conjunto w-limite das trajectórias de fase é o ciclo limite. Neste caso, a restrição do campo de vectores (2.5) ao conjunto w-limite é um difeomorfismo do cı́rculo (secção 1.6). Na figura 2.10 está representada a evolução temporal da coordenada x(t), para vários valores do parâmetro a. 150 2. Teoria qualitativa dos sistemas dinâmicos Figura 2.10: Evolução temporal da coordenada x(t) do oscilador de Lienardvan der Pol (2.5). Para valores de a < 1, as oscilações comportam-se aproximadamente como num oscilador linear. Quando a aumenta, em cada ciclo de oscilação existe uma fase rápida e uma fase lenta. Este tipo de comportamento temporal é muitas vezes designado por oscilação de relaxação, a = 10. ⌅ Quando um campo de vectores tem componentes polinomiais de grau n, não de conhece o número de ciclos limites que uma equação diferencial do plano pode ter. Se n = 2, conjectura-se que o número máximo de ciclos limites é 4. Este problema designa-se por 16o problema de Hilbert. 2.4) Faça o estudo qualitativo completo no espaço de fases (x, y) do sistema de equações diferenciais ⇢ ṙ = r(1 r) q̇ = sin2 q2 , em que r e q são coordenadas polares. Encontre os conjuntos a- w-limite no plano (x, y), assim como os conjuntos não-errantes e errantes. 2.4 Dinâmica na variedade central Na vizinhança de um ponto fixo elı́ptico, nem sempre é possı́vel estabelecer uma equivalência topológica entre as órbitas da dinâmica de um sistema não linear e as órbitas da dinâmica linear associada. Por anologia com o caso hiperbólico, se existir uma variedade central W c tangente a E c , não é possı́vel através da análise de primeira ordem, determinar as direcções do fluxo de fase em W c (não existe teorema de Grobman-Hartman 2.4. Dinâmica na variedade central 151 para os pontos fixos elı́pticos). No entanto, sobre certas condições, é possı́vel fazer o estudo da dinâmica restringida à variedade central, ou mesmo analisar o comportamento local em torno do ponto fixo elı́ptico. A existência de uma variedade central W c associada a E c é garantida pelo teorema da variedade central. Teorema 2.19 (variedade central, [Arrowsmith et al., 1990]). Seja E c o espaço tangente central associado a um ponto fixo da equação diferencial ẋ = f (x). Se f é de classe Cr , existe uma variedade central W c , tangente a E c , e de classe Cr 1 . A variedade W c é invariante para o fluxo. Se f é de classe C• então, podem-se encontrar variedades centrais de classe Cr , para cada r < •. Exemplo 2.20. Não unicidade da variedade central. Seja o sistema de equações diferenciais ⇢ ẋ = x2 (2.7) ẏ = y. Os valores próprios da matriz da aproximação linear em torno do ponto fixo (0, 0) são l1 = 0 e l2 = 1. A estes valores próprios estão associados os espaços tangentes E c e E s . Por (2.7), W s = E s , sendo E s gerado pelo vector próprio ~ey . Integrando a equação diferencial (2.7), e eliminando a variável independente, a equação das curvas integrais que passam pelo ponto (x0 , y0 ) é y = y0 e 1/x0 e1/x := h(x). Como, no limite quando x converge para zero por valores negativos, a derivada de y em ordem a x é zero, independentemente de (x0 , y0 ), a função y = h(x) é tangente em zero a E c . Conclui-se assim que existem uma infinidade de variedades centrais tangentes ao vector próprio e1 = (1, 0). A expressão geral das variedades centrais é então c W ((0, 0)) = ⇢ y = y0 e 1/x0 e1/x se x 0 y = 0 se x > 0 . Na figura 2.11 estão representadas algumas variedades centrais associadas ao ponto fixo (0, 0). ⌅ Em casos simples, é possı́vel calcular o fluxo na vizinhança de pontos fixos não-hiperbólicos. Seja o sistema de equações diferenciais ⇢ ẋ = Cx + f (x, y) com (x, y) 2 Rn ⇥ Rm , (2.8) ẏ = By + g(x, y) 152 2. Teoria qualitativa dos sistemas dinâmicos Figura 2.11: Não unicidade da variedade central para o sistema de equações (2.7). em que C e B são matrizes de n ⇥ n e m ⇥ m, respectivamente. Suponha-se por hipótese que os valores próprios de C têm partes reais nulas e os valores próprios de B têm partes reais negativas. Suponha-se ainda que, f (0, 0) = g(0, 0) = ∂x f = ∂x g = 0. Assim, pelo ponto fixo (x, y) = (0, 0), passam um espaço tangente central E c , de dimensão n, e um espaço tangente estável E s , de dimensão m. No caso particular em que f = g = 0, no limite em que t ! •, as soluções do sistema de equações (2.8) convergem para as soluções do sistema linear ẋ = Cx. Restrinja-se o sistema não-linear (2.8) a W c . Para isso, suponha-se que, na vizinhança de (x, y) = (0, 0), W c é tangente a E c e que existe uma função local y = h(x) (h : Rn ! Rm ) tal que W c = {(x, y) : y = h(x)} . Nestas condições, como W c é invariante, na vizinhança de (0, 0), a equação diferencial restringida a W c é ẋ = Cx + f (x, h(x)), (2.9) em que h(0) = 0 e ∂x h(0) = 0. Teorema 2.21 (Henry-Carr, [Carr, 1991]). Se a origem de (2.9) é localmente assintoticamente estável [resp. instável], então a origem de (2.8) é localmente assintoticamente estável [resp. instável]. 2.4. Dinâmica na variedade central 153 No sistema de equações (2.8), a estabilidade do ponto fixo na origem é decidida pela dinâmica em W c pois, no complementar de W c , a dinâmica é dominada por W s . Exemplo 2.22. Seja a equação diferencial ⇢ ẋ = xy ẏ = y + ax2 . (2.10) Esta equação tem um único ponto fixo em x = (0, 0). O sistema linear na vizinhança de (0, 0) é ✓ ◆ ✓ ◆✓ ◆ ẋ 0 0 x = , ẏ 0 1 y e a matriz da aproximação linear é degenerada. O espaço tangente E c coincide com o eixo dos xx e o espaço tangente E s coincide com o eixo dos yy. No sistema não-linear, W s é o eixo dos yy e W s = E s . Vamos então seguir a construção do teorema de Henry-Carr. Seja a aproximação a Wc y = h(x) = a2 x2 + a3 x3 + a4 x4 + . . . , em que a2 , a3 , a4 , . . . são constantes a determinar. Como, dy dh = ẋ = y + ax2 , dt dx vem que, (a2 x2 + a3 x3 + a4 x4 + . . .) + ax2 = x(2a2 x + 3a3 x2 + 4a4 x3 + . . .)(a2 x2 + a3 x3 + a4 x4 + . . .) . Resolvendo a equação anterior em ordem às constantes ai , obtém-se a solução h(x) = ax2 2a 2 x4 + ... e portanto a equação local restringida à variedade central W c é ẋ = xy = xh(x) = ax3 2a 2 x5 + . . . . Assim, sobre W c e na vizinhança da origem, o sistema é instável para a > 0 e estável para a < 0 (figura 2.12). Neste exemplo, a estabilidade do ponto fixo foi determinada pelos termos de ordem 3 do campo de vectores. ⌅ 154 2. Teoria qualitativa dos sistemas dinâmicos Figura 2.12: Variedades estável e central na vizinhança da origem do sistema não-linear (2.10), para a < 0 e a > 0. Nem todos os problemas de variedade central podem ser analisados com as técnicas descritas até aqui. Por exemplo, a técnica do blow-up de DumortierTakens permite determinar o comportamento das órbitas de sistemas não-lineares degenerados em torno de pontos fixos não hiperbólicos. Neste caso, através de uma substituição de variáveis de modo a fazer uma mudança de escala, tenta-se recuperar a hiperbolicidade do ponto fixo. Vejamos como proceder através de um exemplo. Exemplo 2.23. Seja a equação diferencial ⇢ ẋ = x2 2xy ẏ = y2 2xy . (2.11) Esta equação tem um único ponto fixo em (x, y) = (0, 0) e o espaço tangente na origem à variedade central tem dimensão 2. Seja a substituição de variáveis para coordenadas polares, x = r cos(q ), y = r sin(q ). Nas novas variáveis, a equação anterior escreve-se ⇢ ṙ = r2 (cos3 q 2 cos2 q sin q 2 cos q sin2 q + sin3 q ) = r2 R(r, q ) q̇ = r(3 cos q sin q (sin q cos q )) = rQ(r, q ) . (2.12) Como as curvas integrais no espaço de fases obedecem à equação ṙ dr r2 R(r, q ) rR(r, q ) = = = , dq rQ(r, q ) Q(r, q ) q̇ (2.13) 2.4. Dinâmica na variedade central 155 as curvas de fase do sistema (2.12) são topologicamente equivalentes às curvas de fase do sistema ⇢ = rR(r, q ) = r(cos3 q 2 cos2 q sin q 2 cos q sin2 q + sin3 q ) = Q(r, q ) = 3 cos q sin q (sin q cos q ), (2.14) pois ambos os sistemas (2.12) e (2.14) têm a mesma equação (2.13) para as curvas integrais. Assim, as curvas de fase de (2.14), são topologicamente equivalentes às curvas de fase de (2.12) e de (2.11). O sistema (2.14) tem seis pontos fixos em r = 0: q1 = 0, q2 = p/4, q3 = p/2, q4 = p, q5 = 5p/4 e q6 = 3p/2. Linearizando (2.14) em torno destes pontos fixos obtêm-se seis sistemas de equações diferenciais lineares, em que as respectivas matrizes da aproximação linear são, ṙ q̇ ✓ 1 A1 = A3 = A4 = A6 = 0 ◆ 0 , 3 A2 = A5 = p1 2 p 0 2 0 p3 2 ! . (2.15) Calculando os vectores próprios de todas estas matrizes, decorre que os seis pontos fixos em r = 0 são todos hiperbólicos. Então, pelo teorema de GrobmanHartman, a estrutura da órbitas de fase de (2.14) em torno de r = 0 é determinada pelos vários sistemas lineares obtidos de (2.15). Na figura 2.13a) representa-se a circunferência de raio r = 0 com os seis pontos fixos. Na figura 2.13b), está representada a estrutura de fase de (2.14) e (2.11), em que se contraiu para a origem de coordenadas a circunferência de raio r = 0 da figura 2.13a). Como se viu, a técnica do blow-up consistiu em fazer uma substituição de variáveis de modo a ampliar “infinitamente” as trajectórias de fase em torno do ponto fixo elı́ptico. Em geral, no primeiro blow-up, quando nem todos os pontos fixos são hiperbólicos, podem-se fazer ampliações sucessivas em torno dos pontos fixos não hiperbólicos de modo a levantar a degenerescência do ponto fixo. ⌅ As dinâmicas sobre a variedade central podem ainda estar associadas a problemas de bifurcação. Por exemplo, quando uma equação depende de um parâmetro µ, pode-se aumentar a dimensão da equação diferencial introduzindo a nova equação, µ̇ = 0. Assim, os problemas de bifurcação podem ser estudados à custa das técnicas da variedade central. 156 2. Teoria qualitativa dos sistemas dinâmicos aL bL Figura 2.13: Blow-up para o sistema não-linear degenerado (2.11). a) Blowup no ponto fixo r = 0. b) Estrutura local do campo de vectores no ponto fixo degenerado r = 0. Exemplo 2.24. Seja a equação de Lienard-van der Pol, 8 < ẋ = y ẏ = x a(x2 1)y : ȧ = 0 (2.16) em que se considera o parâmetro a como uma variável de fase. O sistema (2.16) tem uma linha contı́nua de pontos fixos, (x, y, a) = (0, 0, a), e a matriz da aproximação linear em torno da linha de pontos fixos é 0 1 0 1 0 A = @ 1 a 0A . 0 0 0 p Os valores próprios de A são l1,2 = (a ± a 2 4)/2 e l3 = 0. Se a < 0, os valores próprios l1,2 têm parte real negativa e a origem é do tipo nó ou foco estável. Assim, todas as órbitas do sistema não-linear (2.16) convergem para o ponto fixo (0, 0, a). Neste caso, os planos (x, y, a = constante < 0) são variedades estáveis: W s (0, 0, a) (figura 2.14). Se a > 0, os valores próprios l1,2 têm parte real positiva e a origem é do tipo nó ou foco, ambos instáveis, e existe um ciclo limite. Assim, o gráfico dos conjuntos w-limite de (2.16) é o diagrama de bifurcações do oscilador de Lienard-van der Pol (figura 2.14). Neste exemplo, se a > 0 ou a < 0, existe uma variedade central de dimensão 1. Se a = 0, a variedade central tem 2.5. Bifurcações de equações diferenciais 157 Figura 2.14: Diagrama de bifurcações do oscilador de Lienard-van der Pol (2.16). dimensão 3. Assim, conclui-se que problemas de bifurcação ou de alteração da estrutura topológica das órbitas no espaço de fases poderão ser estudados através de técnicas de variedade central. ⌅ 2.5) Usando a técnica do blow-up, estude o comportamento perto da origem das órbitas do sistema de equações diferenciais ⇢ ẋ = x2 + ay2 ẏ = bxy para os dois casos: a) a > 0 e b < 1. b) a < 0 e b > 1. 2.5 Bifurcações de equações diferenciais A teoria das bifurcações estuda as modificações topológicas no espaço de fases das órbitas de um sistema dinâmico. Estas alterações são controladas por parâmetros, induzindo alterações locais ou globais nas trajectórias de fase. Quando se variam parâmetros, são exemplos de bifurcações locais as alterações de estabilidade de um ponto fixo ou a criação de um ciclo limite. A criação ou destruição de órbitas homoclı́nicas ou de órbitas heteroclı́nicas em equações às diferenças e em equações diferenciais são exemplos de bifurcações globais. 158 2. Teoria qualitativa dos sistemas dinâmicos A existência de uma bifurcação está associada à variação de um ou mais parâmetros. Num sistema dinâmico com vários pontos fixos, é natural considerar que a posição no espaço de fases e a estabilidade dos pontos fixos depende dos parâmetros. Se, quando se variam os parâmetros, não existe coalescência de pontos fixos ou simetrias diz-se que se está numa situação genérica. Como se verá mais à frente, pelo teorema da estabilidade estrutural de Andronov-Pontryagin, a existência de uma bifurcação de um ponto fixo está sempre associada à não hiperbolicidade desse ponto fixo. Em termos simples, o número de relações funcionais que determinam uma bifurcação é a codimensão da bifurcação. No que se segue, vamos analisar as bifurcações de equações diferenciais, genéricas, locais, dependentes de um parâmetro (bifurcações de codimensão 1) : bifurcação fold ou sela-nó, e bifurcação de Hopf. Existem ainda bifurcações não genéricas de codimensão 1; são as bifurcações transcrı́tica e pitchfork. Todas estas bifurcações surgem também em equações às diferenças. Vamos considerar equações diferenciais da forma ẋ = f (x, a), (2.17) em que x 2 Rn e a 2 R é um parâmetro. Seja f (t, x0 , a) uma solução de (2.17), definida numa vizinhança U (x0 ) de x0 . Se existir um homeomorfismo h : U ⇢ Rn ! Rn que aplique f (t, x0 , a0 ) em f (t, x0 , a1 ), preservando o sentido em que o tempo é percorrido, e a1 está numa vizinhança de a0 , então a equação diferencial (2.17) é estruturalmente estável. Se (2.17) não é estruturalmente estável na vizinhança de a0 , então a0 é um ponto de bifurcação para a equação diferencial. Para equações diferenciais em dimensão 2, a estabilidade estrutural é determinada pelo teorema de Andronov-Pontryagin. Teorema 2.25 (Andronov-Pontryagin, [Arrowsmith et al., 1990]). O sistema dinâmico ẋ = f (x), x 2 R2 é estruturalmente estável numa região D0 ⇢ R2 , se: a) Tem um número finito de pontos fixos ou ciclos limites em D0 e são todos hiperbólicos. b) Em D0 , não existem conexões homoclı́nicas ou heteroclı́nicas ligando pontos fixos. 2.5. Bifurcações de equações diferenciais 159 Exemplo 2.26. Sistema não estruturalmente estável. Seja a equação diferencial do pêndulo simples, ẍ + w 2 sin x = 0. Esta equação não é estruturalmente estável pois tem trajectórias heteroclı́nicas que ligam os pontos fixos (np, 0), em que n 2 Z. No entanto, introduzindo um novo parâmetro l , podemos perturbar esta equação diferencial do seguinte modo, ⇢ ẋ = y (2.18) ẏ = 2l y w 2 sin x . Se l = 0, o sistema (2.18) é Hamiltoniano e não é estruturalmente estável. Se l 6= 0, o sistema (2.18) não conserva a energia e não tem trajectórias heteroclı́nicas a ligar os pontos fixos. Assim, se l 6= 0, o sistema (2.18) é estruturalmente estável. Na figura 2.15 mostra-se a estrutura de bifurcação das trajectórias heteroclı́nicas. Para l = 0, tem-se uma bifurcação não-local ou global. l=-0.01 3 l=0 3 2 2 2 1 1 1 0 0 0 -1 -1 -1 -2 -2 -2 -3 -3 -2 -1 0 1 2 3 -3 -3 -2 -1 0 l=0.01 3 1 2 3 -3 -3 -2 -1 0 1 2 3 Figura 2.15: Bifurcação heteroclı́nina não-local da equação (2.18), com w = 1. A bifurcação global ocorre para l = 0 e, neste caso, a equação (2.18) não é estruturalmente estável. Se l = l ⇤ 6= 0, a equação (2.18) é estruturalmente estável numa vizinhança aberta e suficientemente pequena de l ⇤ . ⌅ Quando se varia um parâmetro de uma equação diferencial de segunda ordem, a única possibilidade de existirem bifurcações locais é quando surge um ponto fixo, ou quando um ponto fixo que já existe deixa de ser hiperbólico. Se A é a matriz da aproximação linear em torno de um ponto fixo e li um valor próprio de A, o ponto fixo deixa de ser hiperbólico se, (a) para algum i, li = 0, ou, (b) para um par i e j, li = l̄ j , com Re(li ) = 0. Assim, podem-se ter os três 160 2. Teoria qualitativa dos sistemas dinâmicos casos, i) det A = 0, TrA 6= 0 (sela-nó ou fold) ii) det A > 0, TrA = 0 (Hopf) iii) det A = 0, TrA = 0. As condições i) e ii) correspondem a bifurcações de codimensão 1 e a bifurcação iii) é uma bifurcação de codimensão igual ou maior do que 2. A razão deste distinção está relacionada com a teoria das formas normais de Poincaré. O objectivo da teoria das formas normais é eliminar o maior número possı́vel de termos não-lineares do campo de vectores através de uma transformação de variáveis analı́tica. Do ponto de vista técnico, a eliminação dos termos nãolineres depende do número de condições de degenerescência, por exemplo, det A = 0, ou seja da codimensão da bifurcação. No que se segue, iremos estudar apenas as bifurcações genéricas de codimensão 1, em geral, desenvolvidas com um único parâmetro. Exemplo 2.27. Bifurcação sela-nó ou fold. Seja a equação diferencial x2 , ẋ = a (2.19) com x 2 R e a um parâmetro real. Se a < 0 a equação diferencial (2.19) não tem pontos fixos. Se a >p 0, a equação diferencial (2.19) tem dois pontos ⇤ = ± a. A bifurcação sela-nó ocorre para a = 0. fixos de coordenadas x p Como D f |x⇤ = ± a, um dos pontos fixos é estável e o outro instável. Na figura 2.16a) está representado o diagrama de bifurcações da bifurcação selanó supercrı́tica. 1.5 1.0 1.5 a) 0.5 0.5 x x 0.0 0.0 -0.5 -0.5 -1.0 -1.0 -1.5 0.0 b) 1.0 0.5 1.0 α 1.5 2.0 -1.5 -2.0 -1.5 -1.0 -0.5 0.0 β Figura 2.16: a) Diagrama de bifurcações da bifurcação sela-nó supercrı́tica ou fold. b) Diagrama de bifurcações da bifurcação sela-nó subcrı́tica.O traço contı́nuo é a coordenada do ponto fixo estável. A coordenada do ponto fixo instável está representada a tracejado. ⌅ 2.5. Bifurcações de equações diferenciais 161 As condições de ocorrência da bifurcação de sela-nó são as seguintes: Teorema 2.28 (bifurcação de sela-nó ou fold, [Kuznetsov, 1998]). Seja a famı́lia de equações diferenciais ẋ = f (x, a), (2.20) em que x, a 2 R. Suponha-se que a equação diferencial tem um ponto fixo para x = 0 e a = 0 e que ∂f (0, 0) = 0 , ∂x ∂2 f (0, 0) 6= 0 ∂ x2 e ∂f (0, 0) 6= 0. ∂a Então, existe uma transformação de variáveis que transforma a equação diferencial (2.20), na vizinhança da origem, na equação diferencial ẋ = b ± x2 , (2.21) em que b é uma constante. Nas condições do teorema 2.28, na vizinhança de x = 0 e de a = 0, a equação diferencial (2.21) é a forma normal da equação (2.20). Quando a forma normal é ẋ = b x2 , estamos na presença de uma bifurcação sela-nó supercrı́tica (figura 2.16a)). Quando a forma normal é ẋ = b + x2 , temos uma bifurcação sela-nó subcrı́tica (figura 2.16b)). Exemplo 2.29. Bifurcação de Hopf supercrı́tica. Seja a equação diferencial ⇢ ẋ = nx b y + (x2 + y2 )(ax by) (2.22) ẏ = b x + ny + (x2 + y2 )(bx + ay) . Em coordenadas polares, esta equação escreve-se na forma ⇢ ṙ = r(n + ar2 ) q̇ = b + br2 . (2.23) Como se verifica facilmente, através de (2.23), se a < 0, b 6= 0 e b 6= 0, para n > 0, a equação diferencial (2.22) tem um ciclo limite e um foco instável na origem. Se n < 0, a origem da equação diferencial (2.22) é um foco estável. Assim, n é um parâmetro de bifurcação e a bifurcação de Hopf supercrı́tica ocorre para n = 0. Para n = 0, tem-se que Tr(D f ) = 0 e det D f = b > 0. Na 162 2. Teoria qualitativa dos sistemas dinâmicos figura 2.17 está representado o diagrama de bifurcações da bifurcação de Hopf supercrı́tica. Se a > 0, b 6= 0 e b 6= 0, para n = 0 ocorre uma bifurcação de Hopf subcrı́tica, em que um ciclo limite instável desaparece quando n passa por zero no sentido positivo, como se pode ver facilmente através de (2.23). Neste caso, se n < 0, existe um ciclo limite instável em torno da origem no espaço de fases. Se n > 0, a origem é um foco instável e, para n < 0, a origem é um foco estável. Figura 2.17: Diagrama de bifurcações da bifurcação de Hopf supercrı́tica da equação diferencial (2.22). A bifurcação de Hopf supercrı́tica ocorre para n = 0. ⌅ Teorema 2.30 (Hopf supercrı́tico, [Kuznetsov, 1998]). Seja a famı́lia de equações diferenciais ẋ = f (x, n), (2.24) com x 2 R2 e n 2 R. Suponha-se que a equação diferencial tem um ponto fixo em (0, 0), independentemente de n. Se para n = 0, os valores próprios l (n) de D f são imaginários puros e d Re(l (n))|n=0 > 0, dn então tem-se: a) Para n < 0, o ponto fixo (0, 0) da equação diferencial (2.24) é um foco estável. 2.5. Bifurcações de equações diferenciais 163 b) O ponto fixo (0, 0) da equação diferencial (2.24) é assintoticamente estável para n = 0. c) Se n > 0, o ponto fixo (0, 0) da equação diferencial (2.24) é um foco instável. Op ponto fixo (0, 0) é rodeado por um ciclo limite estável de raio proporcional a n. Em sistemas de equações diferenciais em dimensão superior a dois, as bifurcações genéricas de codimensão 1 reduzem-se às duas bifurcações estudadas anteriormente. Este facto baseia-se no que se designa por princı́pio da redução, [Kuznetsov, 1998]. Como na vizinhança de um ponto fixo podemos fazer uma decomposição do espaço de fases na forma Rn = E s E u E c , o comportamento de bifurcação fica reduzido ao comportamento local do campo de vectores restringido a W c . Se W c existir, a sua dimensão mı́nima só pode ser 1 ou 2, pelo que a bifurcação fica reduzida ao comportamento local na variedade central. Claro está que, se a dimensão de W c é superior a 2, a bifurcação nunca poderá ser de codimensão 1, pois neste caso vão existir mais do que dois valores próprios com parte real nula. Existem outras bifurcações de codimensão 1 não genéricas. É o caso da bifurcação transcrı́tica e da bifurcação pitchfork. Na bifurcação pitchfork, quando se varia um parâmetro do campo de vectores, o ponto fixo muda a sua estabilidade e surgem, no ponto de bifurcação, mais dois pontos fixos. Na bifurcação transcrı́tica, quando se varia um parâmetro, existem dois pontos fixos que colidem no ponto de bifurcação e trocam de estabilidade. As formas normas destas bifurcações são ẋ = x(a ⌥ x2 ) bifurcação pitchfork ẋ = x(a x) bifurcação transcrı́tica em que a é o parâmetro de bifurcação e o sinal “ ”refere-se à bifurcação pitchfork supercrı́tica e o sinal “+”à bifurcação pitchfork subcrı́tica. 2.6) Faça os diagramas de bifurcação da bifurcação pitchfork e da bifurcação transcrı́tica de campos de vectores. 2.7) Determine os valores dos parâmetros r, para os quais ocorrem bifurcações locais de codimensão 1 no sistema de equações de Lorenz 8 < ẋ = s (y x) ẏ = rx y xz : ż = bz + xy . 164 2. Teoria qualitativa dos sistemas dinâmicos Escolha s = 10 e b = 8/3. Classifique as bifurcações. 2.8) Determine os valores dos parâmetros a, b e c para os quais ocorrem bifurcações locais de codimensão 1 no sistema de equações de Rössler 8 (y + z) < ẋ = ẏ = x + ay : ż = b cz + xz . Classifique as bifurcações. Escolhendo a = b = 1/5, faça um estudo numérico das órbitas no espaço de fases em função do parâmetro c. 2.9) Faça o diagrama de bifurcações dos pontos fixos do campo de vectores ẋ = µ2 4 x2 , em que µ é um parâmetro. Classifique as bifurcações. 2.10) Classifique as bifurcações dos pontos fixos do sistema Hamiltoniano 1 H(x, y; e) = y2 2 1 4 x + e(x2 + y2 ), 4 em função do parâmetro e. 2.11) Considere o sistema de equações ⇢ ṙ q̇ = r r2 = a + sin q , em que a é uma constante positiva e r e q são as usuais coordenadas polares do plano. Comece por determinar os valores de a para os quais o sistema de equações tem bifurcações. Em seguida, faça o estado da estrutura das órbitas de fase para todos os casos topologicamente distintos. 2.12) Estude as bifurcações dos pontos fixos do sistema Hamiltoniano 1 1 H(x, y; l ) = y2 + x3 2 3 l x, em função do parâmetro l (bifurcação de codimensão 2 do tipo centro-sela). 2.6. Bifurcações de equações às diferenças 2.6 165 Bifurcações de equações às diferenças Em sistemas dinâmicos discretos em dimensão 1, as bifurcações genéricas de codimensão 1 são a bifurcação sela-nó e a bifurcação flip ou de duplicação de perı́odo. A bifurcação pitchfork e a bifurcação transcrı́tica não são genéricas. As formas canónicas ou formas normais destas bifurcações são: xn+1 xn+1 xn+1 xn+1 = = = = µ xn2 , µ = 1/4 (fold ou sela-nó) µ xn2 , µ = 3/4 (flip ou duplicação de perı́odo) µxn (1 xn ) , µ = 1 (transcrı́tica) µxn xn3 , µ = 1 (pitchfork) . Em sistemas dinâmicos discretos de dimensão 2, a bifurcação de Hopf em coordenadas polares tem a forma canónica ⇢ rn+1 = |n|rn + arn3 qn+1 = qn + b + brn2 . Na figura 2.18 estão representados os diagramas de bifurcação das bifurcações transcrı́tica e pitchfork, ambas não genéricas, e da bifurcação flip ou de duplicação de perı́odo. Figura 2.18: Diagrama de bifurcações das bifurcações transcrı́tica, pitchfork (supercrı́tica) e flip ou de duplicação de perı́odo. As linhas contı́nuas representam pontos fixos estáveis e as linhas a tracejado representam pontos fixos instáveis. 2.13) Classifique as bifurcações dos pontos fixos de perı́odos 1 e 2 do sistema dinâmico xn+1 = 4µxn (1 xn ), com µ 2 [0, 1]. 166 2.7 2. Teoria qualitativa dos sistemas dinâmicos Perturbações singulares e patos Seja a equação diferencial, e dx dt dy dt = y x3 (2.25) = y 3x3 (2.26) em que e é um pequeno parâmetro. Fazendo e = 0 em (2.25), tem-se que y x3 = 0, obtendo-se para (2.26) dy = 2y . dt (2.27) A equação (2.27) é a equação singular associada às equações (2.25) e (2.26). A equação singular é facilmente integrável e é importante determinar em que condições é que as soluções das equações (2.25) e (2.26) estão próximas das soluções da equação (2.27). Figura 2.19: a) Variedade lenta do problema singular associado à equação (2.28). b) Soluções da equação diferencial (2.28) com e = 0.001 e condições iniciais, x(0) = 10 e y(0) = 0.5. Veja-se o significado geométrico da condição de e ser um pequeno parâmetro. Escrevendo (2.25) e (2.26) na forma dx dt dy dt = x3 y = y e (2.28) 3 3x , podemos analisar qualitativamente o fluxo no espaço de fases de (2.28). Como dy e é muito pequeno, dx dt é muito grande quando comparado com dt , desde que 2.7. Perturbações singulares e patos 167 y 6= x3 (figura 2.19a)). Assim, longe da curva y x3 = 0, a componente do campo de vectores segundo a direcção x é muito grande e o fluxo de fases faz-se na direcção da curva y x3 = 0. Diz-se então que a direcção horizontal é a variedade rápida do problema singular, e a curva y x3 = 0 define uma variedade lenta. Isto significa que, para qualquer condição inicial longe de y x3 = 0, o movimento tem duas componentes dinâmicas: uma componente rápida que faz o fluxo de fases aproximar-se da curva y = x3 , seguido de um movimento lento ao longo da mesma curva (figura 2.19b)). Veja-se detalhadamente a solução assimptótica da equação (2.25)-(2.26) ou (2.28). Como e é muito pequeno, é de esperar que a solução de (2.25)-(2.26) coincida com a solução da equação singular (2.27). A equação (2.25)-(2.26) tem um ponto fixo estável em y = 0 e todas as soluções do problema singular convergem para zero. Contudo, se analisarmos o campo de vectores (2.28) para e > 0, existe um único ponto fixo em (x, y) = (0, 0) e a matriz Jacobiana tem valores próprios l1 = 0 e l2 = 1, pelo que o ponto fixo na origem é instável. Na figura 2.20 está representado uma órbita no espaço de fases do sistema não-singular (2.28). Como se vê, depois de eliminado o movimento rápido, a estrutura das órbitas no espaço de fases convergem para um ciclo limite. Quando e ! 0, o raio do ciclo limite converge para zero, e as órbitas do sistema não-singular convergem para as órbitas do sistema singular (2.27). Figura 2.20: Ciclo limite na vizinhança da origem do sistema de equações nãosingulares (2.25)-(2.26) para e = 0.001. Quando e ! 0, o raio do ciclo limite converge para zero, e as órbitas do sistema não-singular convergem para as órbitas do sistema singular (2.27). Conclui-se assim que os estados assimptóticos do problema singular e nãosingular podem não coincidir. No entanto, as soluções do problema singular e não-singular convergem uma para a outra no limite em que e ! 0. Isto é garantido pelo teorema de Michenko e Rozov (1980). 168 2. Teoria qualitativa dos sistemas dinâmicos Em geral os problemas de perturbações singulares podem estar na origem de soluções de equações diferenciais com comportamento rápido-lento, com oscilações de relaxação e soluções do tipo “canard” ou pato. Vamos analisar agora a singularização de um sistema com um ciclo limite. O exemplo clássico mais simples de oscilador não-linear com soluções de relaxação é o oscilador de Lienard-van der Pol, já estudado anteriormente. A equação de Lienard-van der Pol com uma massa infinitesimal é e ẍ + a(x2 1)ẋ + x = 0, (2.29) R em que e é um pequeno parâmetro. Introduzindo a função F(x) = 0x a(x2 1)dx e a nova variável y = e ẋ + F(x), a equação de Lienard-van der Pol (2.29) tem a forma ⇢ e ẋ = y a(x3 /3 x) (2.30) ẏ = x. A equação (2.30) tem um único ponto fixo na origem e os valores próprios p da matriz Jacobiana calculada no ponto (x, y) = (0, 0) são l1,2 = (a/e ± (a/e)2 Se e > 0 e a > 0, o ponto fixo na origem é instável. Se e > 0 e a < 0, o ponto fixo é estável. Quando a = 0, existe uma bifurcação de Hopf supercrı́tica e quando a se torna positivo é criado um ciclo limite no espaço de fases. Veja-se agora qual a estrutura no espaço de fases do problema singular de Lienard-van der Pol. Por (2.30), a variedade lenta é definida pela equação y a(x3 /3 x), figura 2.21a). Assumindo e muito pequeno, a fluxo de fases longe da variedade lenta é praticamente horizontal e, depois de eliminado o transiente, o fluxo de fase segue um ciclo limite próximo da variedade lenta. Devido ao salto brusco na vizinhança dos extremos locais da função y = a(x3 /3 x), diz-se que se tem uma oscilação de relaxação, figura 2.21b). Nas oscilações de relaxação, as soluções da equação não-singular seguem alternadamente as direcções rápidas e lentas. Neste tipo de sistemas, perto da bifurcação de Hopf, quando as equações das nulclinas apresentam um comportamento não simétrico no espaço de fases, é possı́vel surgirem outro tipo de soluções singulares, os patos ou “canards”. No entanto, este fenómeno não é genérico e muitas vezes é possı́vel simetrizar a equação com uma transformação linear de coordenadas de modo a eliminar o efeito “canards”. 2.14) Estude o sistema dinâmico. 4/e)/2. 2.7. Perturbações singulares e patos 169 Figura 2.21: Ciclo limite na vizinhança da origem do sistema de equações nãosingulares (2.30) para e = 0.05 e a = 1. b) Oscilações de relaxação associadas ao sistema não-singular (2.30).