Curso de Controle Discreto 2 Pe. Pedro M. Guimarães Ferreira S.J. http://www.fplf.org.br/pedro_varios/ (Texto básico deste curso: Katsuiko Ogata, Discrete-time Control Systems. PrenticeHall, Second Edition, 1995) CAPÍTULO 4: SÍNTESE DE SISTEMAS DE CONTROLE DE TEMPO DISCRETO ATRAVÉS DE MÉTODOS CONVENCIONAIS 4-1 Introdução Os métodos apresentados neste capítulo têm sido bem dominados desde os anos 1950’s. O primeiro método é baseado no “root locus” já estudado nos sistemas de tempo contínuo, uma ferramenta ainda muito útil, pois nos dá uma visualização do que acontece com os pólos da função de transferência quando o ganho do sistema em malha fechada varia. O segundo método é baseado na resposta no domínio da frequência. O terceiro método, ao contrário dos dois primeiros, que são gráficos, é um método analítico, no qual tentamos obter um certo comportamento do sistema em malha fechada, manipulando a função de transferência de pulso do controlador digital. 4-2 Mapeamento entre o plano s e o plano z Como se sabe, tanto a estabilidade absoluta como a relativa de um sistema de tempo contínuo depende da localização de seus pólos no plano s. Tendo em vista que as variáveis s e z são relacionadas por z = eTs , é claro que os pólos e zeros no plano z estão relacionados aos do plano s. Consequentemente, a estabilidade dos sistemas lineares de tempo discreto também fica determinada pela localização dos pólos no plano z. Ora, definindo as partes real e imaginária: s = σ + jω , (*) T (σ + jω ) T σ jT ω T σ j ( T ω + 2π k ) temos z = e =e e =e e . (**) Consequentemente, para cada s, há uma infinidade de valores de z, pois k = 0; ±1; ±2; ±3;... Se o sistema de tempo contínuo for estável, temos σ < 0 e se o sistema de tempo discreto for estável, temos z = eTσ < 1 . Observe-se que o eixo dos imaginários no plano s corresponde a z = 1 . Ou seja, o eixo imaginário ( σ = 0 ) corresponde ao círculo unitário no plano z, e o semi-plano aberto da esquerda para os sistemas de tempo contínuo corresponde ao interior do círculo unitário para os sistemas de tempo discreto. Faixas primárias e complementares Considere os pontos no eixo imaginário do plano s. Seja ωs a frequência de amostragem. Consideremos (*) e (**) acima; quando um ponto se move no eixo imaginário do plano 1 1 s de − j ωs a j ωs , no plano z nós temos z = 1 e arg( z ) varia de −ωsT = −π a 2 2 ωsT = π no sentido trigonométrico, isto é, no sentido anti-horário, percorrendo todo o 1 1 1 círculo unitário, pois quando ω varia de − j ωs a j ωs , passa por ω = 0, o que 2 2 corresponde a ω T = 0. Consequentemente, quando s percorre o eixo imaginário de −∞ a +∞ , o círculo unitário no plano z é percorrido um número infinito de vezes. Isto implica que o semiplano da esquerda no plano s pode ser dividido em um número infinito de faixas de largura ωs , conforme a figura 4-1abaixo. A faixa central é chamada primária, enquanto que as outras são chamadas complementares. Considere a faixa primária. Se traçarmos a sequência de pontos 1-2-3-4-5-1 no plano s, conforme a figura 4-2(a) abaixo, esta trajetória é mapeada no plano z conforme a figura 4-2(b). Observe-se que os pontos 3 e 4 abaixo na figura (a) estão em - ∞ , sendo mapeados na origem no plano z. 2 Na figura abaixo as imagens nos planos s e z para dois valores de σ . Observe-se que quando a abacissa no plano s é menor que zero, o círculo correspondente tem raio menor que 1; se estiver à direita, é maior, resultado da expressão z = eTs . -Uma reta no plano s paralela ao eixo dos reais, com ordenada ω1 é mapeada no plano z como uma linha radial que parte da origem e com ângulo ω1T no sentido trigonométrico, como se pode ver na figura 4-5 abaixo. -Uma região retangular no plano s é mapeada no plano z por uma região limitada por duas linhas radiais e dois arcos circulares, conforme a figura 4-6 abaixo, observando-se que o círculo no exterior da figura tem raio unitário. 3 -Uma linha radial no plano s, que corresponde, conforme sabido pela teoria de sistemas de tempo contínuo, a uma taxa de amortecimento, é mapeada no plano z em uma espiral que termina na origem. Para demonstrarmos este fato, seja s = −ςωn + jωn 1 − ς 2 = −ςωn + jωd , onde ωd = ωn 1 − ς 2 : ver figura 4-7(a) abaixo. No plano z esta linha se torna z = eTs = exp(−ςωnT + jωd T ) . E tendo em vista a expressão de T em função da frequência de amostragem, vem ⎛ ⎛ ω ⎞ ω 2πς ωd 2πς ωd ⎞ ⎟ e arg( z ) = 2π d . + j 2π d ⎟ , donde z = exp ⎜ − z = exp ⎜ − ⎜ 1 − ς 2 ωs ⎜ 1 − ς 2 ωs ⎟ ωs ωs ⎟⎠ ⎝ ⎝ ⎠ Por conseguinte, a magnitude de z diminui e a sua fase aumenta à medida que ωd cresce, mantidos ς e T constantes, donde que z descreve uma espiral logarítmica, como mostrado na figura 4-7(b) abaixo. 4 Note-se que para uma dada relação constante ωd / ωs , a magnitude de z torna-se uma função somente de ς e a fase de z se torna constante. Por exemplo, se a taxa de amortecimento for 0,3 e se ωd / ωs = 0,25, temos ⎛ 2π × 0,3 ⎞ × 0, 25 ⎟ = 0, 61 e arg( z ) = 2π × 0, 25 = 900 . z = exp ⎜ − ⎜ 1 − 0,32 ⎟ ⎝ ⎠ ⎛ 2π × 0,3 ⎞ × 0,5 ⎟ = 0,3725 e Com ωd / ωs = 0,5 , temos z = exp ⎜ − ⎜ 1 − 0,32 ⎟ ⎝ ⎠ 0 arg( z ) = 2π × 0,5 = 180 . Assim, a espiral pode ser parametrizada em função de ωd / ωs (ver fig. 4-7(b)). 4-3 Análise da estabilidade de sistemas em malha fechada no plano z Considere o seguinte sistema em malha fechada de tempo discreto dado pela sua C ( z) G( z) transformada z: = . (4-3) R( z ) 1 + GH ( z ) É fácil verificar (faça!) que este sistema em malha fechada (SMF) tem G ( z ) no canal direto e H ( z ) no canal de realimentação. A estabilidade, como sabemos, pode ser analisada a partir da equação característica: P ( z ) = 1 + GH ( z ) = 0 . Analogamente aos sistemas de tempo contínuo, temos: - Para que o sistema seja estável, as raízes da eq. característica devem estar no interior do círculo unitário no plano z. (As raízes da eq. característica são os pólos do SMF). Qualquer pólo fora do círculo unitário torna o SMF instável. - Se existir um pólo simples em z = 1, o sistema é criticamente estável (também se diz marginalmente estável). O sistema é também criticamente estável se existir um par de pólos conjugados, com grau de multiplicidade um sobre o círculo unitário. Qualquer pólo múltiplo no círculo unitário torna o sistema instável. OBSERVACÃO: A estabilidade e a estabilidade crítica (marginal) são chamadas na literatura especializada de BIBO estabilidade e BIBO estabilidade crítica, respectivamente, a palavra BIBO significando “bounded input – bounded output”. Ou seja, se a entrada do SMF for limitada (“bounded”), a saída também o será se o sistema for BIBO estável, e analogamente para os outros dois casos. Exemplo 4-2: Considere o SMF da figura 4-13 abaixo. Determine a estabilidade do sistema quando K = 1. O canal direto, a partir do ganho K tem função de transferência 1 − e− s 1 . G ( s) = s s ( s + 1) 5 Solução: Vimos na eq. (3-58) que obtemos ⎡1 − e − s 1 ⎤ 0,3679 z + 0, 2642 (4-4) G( z) = Z ⎢ ⎥= ⎣ s s ( s + 1) ⎦ ( z − 0,3679)( z − 1) Donde que a eq. característica é: 1 + G ( z ) = 0 ∴ ( z − 0,3679)( z − 1) + 0,3679 z + 0, 2642 = 0 , ou seja, z 2 − z + 0, 6321 = 0 . Acham-se as raízes desta eq.: z1 = 0,5 + j 0, 6181 e z2 = 0,5 − j 0, 6181 . Donde, z1 = z2 < 1 , e, portanto o SMF é estável. Métodos para testar a estabilidade absoluta Há três métodos para determinar a estabilidade de um sistema sem ter que resolver sua eq. característica. Estudaremos dois deles. Observe-se que com o progresso dos computadores e programas confiáveis como MATLAB, MAPPLE e MATHEMATICA, as raízes de um polinômio podem ser calculadas com facilidade, o que torna menos importante os métodos a seguir, os quais, entretanto ainda têm valor analítico, permitindo, por exemplo, estabelecer relações entre coeficientes de um polinômio. O método de Jury Seja o polinômio característico P ( z ) = a0 z n + a1 z n −1 + ... + an −1 z + an , a0 > 0 (Se a0 < 0 , multiplica-se a eq. por -1, o que não lhe altera as raízes). Constrói-se a Tabela 4-1 abaixo (4-5) onde bk = an an −1− k a0 ak +1 , k = 0;1; 2;...; n − 1 6 ck = bn −1 bn − 2− k b0 bk +1 , k = 0;1; 2;...; n − 2 .......................................................... p p2 − k , k = 0;1; 2 qk = 3 p0 pk +1 O critério de estabilidade de Jury nos diz que o polinômio característico dado em (4-5) é estável se as seguintes condições forem satisfeitas: 1. an < a0 2. P ( z ) z =1 > 0 ⎧ > 0 se n for par 3. P ( z ) z =−1 ⎨ ⎩< 0 se n for impar 4. bn −1 > b0 , cn − 2 > c0 , ..., q2 > q0 (Observe-se que o teorema de Jury nos dá condição suficiente, mas não necessária). Exemplo 4-3: Utilizando o critério de Jury, estabelecer as condições de estabilidade da seguinte eq. característica: P ( z ) = a0 z 4 + a1 z 3 + a2 z 2 + a3 z + a4 = 0 , a0 > 0 . Solução: As quatro condições acima nos dão imediatamente: a4 < a0 , P(1) = a0 + a1 + a2 + a3 + a4 > 0, P (−1) = a0 − a1 + a2 − a3 + a4 > 0, b3 > b0 , c2 > c0 Claro que b3 , b0 , c2 e c0 têm que ser calculados de acordo com as fórmulas acima. (Faça-o!) Exemplo 4-4: Examinar a estabilidade da seguinte equação característica: P ( z ) = z 4 − 1, 2 z 3 + 0, 07 z 2 + 0,3z − 0, 08 = 0 Solução: Claro que a primeira condição -0,08 < 1 é satisfeita. Quanto à segunda condição, P (1) = 1 − 1, 2 + 0, 07 + 0, 4 − 0, 08 = 0, 09 > 0 , também é satisfeita. Terceira condição: P (−1) = 1 + 1, 2 + 0, 07 − 0,3 − 0, 08 = 1,89 > 0, também é satisfeita. 0,3 1 Quarta condição: = −1, 024 , 1 −0, 08 −0, 08 −0, 03 b0 = = −0, 096 + 0, 03 = −0, 066 , a condição sendo satisfeita, pois temos 1 1, 2 b3 > b0 . Etc... Conclui-se que o sistema é estável. Análise de estabilidade utilizando transformação bilinear e o critério de estabilidade de Routh s +1 Considere a transformação bilinear z = . Esta transformação é dita bilinear, porque s −1 ela nos dá zs − z = s + 1 , ou seja, uma equação linear em z quando s é constante e linear 7 em s quando z é constante. Desta última obtemos imediatamente s = z +1 , uma relação z −1 simétrica, como se vê. Veremos agora que esta transformação mapeia o interior do círculo unitário no semiplano da esquerda e vice versa. Seja s = σ + jω . O interior do círculo unitário no plano z é dado, portanto por s + 1 σ + jω + 1 (σ + 1) 2 + ω 2 z = = < 1 , ou seja, < 1 ∴ (σ + 1) 2 + ω 2 < (σ − 1) 2 + ω 2 s − 1 σ + jω − 1 (σ − 1) 2 + ω 2 ∴ 2σ < −2σ ∴σ < 0 , comprovando que o interior do círculo unitário no plano z é efetivamente mapeado no semi-plano da esquerda no plano s. A demonstração da recíproca pode ser feita simplesmente revertendo os passos da prova acima, ou então, por processo mais trabalhoso, fazendo z = z e jθ com z < 1 , e substituindo na expressão de s acima, para demonstrar que sua parte real é menor que zero. Em vista deste resultado, para sabermos se um sistema de tempo discreto é estável, podemos mapear z em s e daí verificar se as raízes da equação característica mapeada tem suas raízes no semi-plano da esquerda. Com efeito, seja P ( z ) = a0 z n + a1 z −1 + ... + an −1 z + an = 0. Utilizando a transformação bilinear, temos n −1 ⎛ s +1⎞ ⎛ s +1⎞ ⎛ s +1⎞ a0 ⎜ ⎟ + a1 ⎜ ⎟ + ... + an −1 ⎜ ⎟ + an = 0. ⎝ s −1 ⎠ ⎝ s −1 ⎠ ⎝ s −1 ⎠ Multiplicando ambos os lados da eq. por ( s − 1) n , obtemos uma equação do tipo Q( s ) = b0 s n + b1s n −1 + ... + bn −1s + bn = 0 . Agora aplicamos o critério de Routh ou o de Hurwitz, estudados em sistemas de tempo contínuo para concluir sobre a estabilidade, ou não, do sistema. Observe-se que o critério de Routh, apesar de ser mais trabalhoso do que o de Hurwitz, permite concluir o número de raízes no semi-plano da direita. n 4-4 Análise da resposta nos regimes transitório e permanente Considere-se a figura 4-14 abaixo Suponha que a entrada seja um degrau unitário. Resposta típica de uma entrada em degrau em sistemas de tempo contínuo é a que aparece na figura 4-16 abaixo, na qual são definidos os seguintes parâmetros: 8 - Tempo de retardo (“delay time”) td : definido como o tempo para que a resposta atinja a metade do valor em regime permanente. - Tempo de subida (“rise time”) tr : definido como o tempo para que a resposta atinja de 10% a 90% do seu valor final, ou de 5% a 95%, ou de 0% a 100%, dependendo da situação. Para sistemas sub-amortecidos, a faixa de 10% a 90% é usada comumente. - Tempo de pico t p : definido como o tempo para que a resposta atinja o pico da primeira ultrapassagem do valor final. - Ultrapassagem (“overshoot”) máxima M p : medida acima do valor final, correspondendo ao pico máximo atingido pela resposta. - Tempo de assentamento (“settling time”) t s : é o tempo necessário para que a resposta atinja e permaneça dentro de uma faixa, para mais ou para menos, em torno do valor final, usualmente 2%. O tempo de assentamento é relacionado à maior constante de tempo do sistema de controles. Os parâmetros, ou especificações, acima são importantes, pois não basta apenas saber se o valor final desejado é atingido. Assim, por exemplo, se M p é muito grande, o sistema pode “queimar”. Mas algumas das especificações acima não se aplicam a alguns sistemas: por exemplo, se o sistema for super-amortecido, o tempo de pico e a ultrapassagem máxima não se aplicam. E, por outro lado, outras especificações podem se aplicar, como por exemplo, se houver um erro em regime permanente, é desejável que ele se mantenha dentro de limites aceitáveis. A resposta de um sistema a um delta de Kronecker, a um degrau, a uma rampa, etc. podem ser facilmente obtidas utilizando o MATLAB, como veremos no exemplo seguinte: Exemplo 4-8: Seja o sistema de controle de tempo discreto definido por C ( z) 0, 4673 z − 0,3393 = 2 . R( z ) z − 1,5327 z + 0, 6607 Obter, utilizando o MATLAB, a resposta do sistema a um degrau unitário. Abaixo os comandos do MATLAB Program 4-1. (4-10) 9 O resultado obtido está na Figura 4-17 abaixo. Análise do erro em regime permanente No que se segue, investigaremos um tipo de erro em regime permanente, resultado da incapacidade do sistema de seguir alguns tipos de entrada. Assim, por exemplo, um sistema pode não apresentar erro em regime permanente quando a entrada é um degrau, mas sim, se a entrada for uma rampa. Seja um sistema de tempo contínuo cuja função de transferência em malha aberta é: K (T s + 1)(Tb s + 1)...(Tm s + 1) . G(s) H (s) = N a s (T1s + 1)(T2 s + 1)...(Tp s + 1) (Este sistema é dito do tipo N porque tem um pólo na origem com grau de multiplicidade N). Como se viu no curso de sistemas de tempo contínuo, um sistema de tipo 0 (zero) dará uma resposta com erro finito, diferente de zero em regime permanente a um degrau de entrada, supondo que o sistema seja estável. Sistemas de tipo 1 darão resposta com erro nulo em regime permanente a um degrau de entrada e erro finito, diferente de zero a uma rampa de entrada. Aumentar o tipo do sistema pode criar dificuldade na estabilização do mesmo. Estas idéias podem ser estendidas para sistemas de tempo discreto da seguinte maneira: 10 Os sistemas de tempo discreto podem ser classificados igualmente conforme seu “tipo” de acordo com o número de pólos em z = 1 na sua função de transferência em malha aberta. Suponha, com efeito, que a função de transferência em malha aberta de um sistema de 1 B( z ) B( z ) tempo discreto seja dada por , onde não contêm zero ou pólo em z N ( z − 1) A( z ) A( z ) = 1. Então o sistema pode ser classificado de tipo 0;1;2;..., de acordo com o valor de N. E o sentido é o mesmo do de tempo contínuo no que se refere à resposta em regime permanente do SMF a entradas em degraus, rampas, parábolas, etc., todas em tempo discreto. Seja o sistema da figura 4-18 abaixo. Suponhamos que o mesmo seja estável de modo que o teorema do valor final possa ser aplicado para achar o valor da resposta em regime permanente. Do diagrama de blocos, temos e(t ) = r (t ) − b(t ) . Ora, do teorema do valor final (tabela 2-2, entrada 17), temos (4-11) lim e(kT ) = lim[(1 − z −1 ) E ( z )] k →∞ z →1 ⎡ G ( s) ⎤ Definamos G ( z ) = (1 − z −1 )Z ⎢ p ⎥ e ⎣ s ⎦ ⎡ G p ( s) H ( s) ⎤ GH ( z ) = (1 − z −1 )Z ⎢ ⎥. s ⎣ ⎦ C ( z) GH ( z ) = e Então, do diagrama de blocos, R( z ) 1 + GH ( z ) 1 E( z) = R( z ) . (4-12) 1 + GH ( z ) Substituindo-se esta em (4-11), obtemos a expressão do erro em regime permanente ⎡ ⎤ 1 (4-13) R( z ) ⎥ . (steady-state): ess = lim ⎢ (1 − z −1 ) z →1 1 + GH ( z ) ⎣ ⎦ Tal como no caso de sistemas de tempo contínuo, é comum considerar-se especialmente três tipos de entradas: degrau unitário, rampa unitária e aceleração unitária. Degrau unitário: r (t ) = 1(t ) (trata-se de degrau unitário aplicado em t = 0). 1 . Da tabela 2-1 temos R( z ) = 1 − z −1 11 ⎡ 1 1 ⎤ 1 Substituindo isto em (4-13), vem: ess = lim ⎢ (1 − z −1 ) = lim . −1 ⎥ z →1 z → 1 1 + GH ( z ) 1 − z ⎦ 1 + GH ( z ) ⎣ (4-14) Define-se a constante de erro de posição estática como K p = lim z →1 GH ( z ) . Consequentemente, o erro em regime permanente devido a uma entrada em degrau 1 . (4-15) unitário é ess = 1+ K p É claro que este erro em regime permanente se anula se só se K p = ∞ , o que implica que GH ( z ) tenha um pólo em z = 1. Rampa unitária: r (t ) = t1(t ) , cuja transformada z é (ver Tabela 2-1): Tz −1 R( z ) = . Substituindo esta expressão em (4-13), temos: (1 − z −1 ) 2 ⎡ Tz −1 1 Tz −1 ⎤ −1 ess = lim ⎢(1 − z ) ⎥ = lim z →1 (1 − z −1 )(1 + GH ( z )) z →1 1 + GH ( z ) (1 − z −1 ) 2 ⎦ ⎣ T 1 (1 − z −1 )(1 + GH ( z )) ∴ = = lim lim z →1 (1 − z −1 )(1 + GH ( z )) ess z →1 T Define-se a constante de erro de velocidade (1 − z −1 )(1 + GH ( z )) K v = lim . (4-16) z →1 T 1 Por conseguinte, ess = . (4-17) Kv Se K v = ∞ , então o erro em regime permanente é nulo. Mas de (4-16) é claro que isto implica que GH ( z ) tenha um pólo duplo em z = 1. Parábola unitária: 1 1 é definida usualmente como r (t ) = t 21(t ) ; o fator é colocado de modo que a sua 2 2 derivada seja a rampa unitária. A transformada z (ver Tabela 2-1) é: T 2 (1 + z −1 ) z −1 . Substituindo esta em (4-13), temos R( z ) = 2(1 − z −1 )3 ⎡ ⎡ ⎤ 1 T 2 (1 + z −1 ) z −1 ⎤ T2 = lim ess = lim ⎢ (1 − z −1 ) ⎥ ⎢ ⎥ 1 3 − − 1 2 z →1 1 + GH ( z ) 2(1 − z ) ⎦ z →1 ⎣ (1 − z ) (1 + GH ( z )) ⎦ ⎣ ⎡ (1 − z −1 ) 2 (1 + GH ( z )) ⎤ 1 ∴ = lim ⎢ ⎥ . Definindo analogamente, como nos casos anteriores, ess z →1 ⎣ T2 ⎦ (1 − z −1 ) 2 (1 + GH ( z )) , z →1 T2 a constante de erro de aceleração K a = lim (4-18) 1 . (4-19) Ka O erro em regime permanente se torna nulo se só se K a = ∞ , o que implica, de acordo com (4-18), que GH ( z ) tenha um pólo triplo em z = 1. temos ess = 12 A Tabela 4-5 abaixo tem as três constantes de erros em regime permanente para diversos tipos de configuração. O primeiro e o segundo caso são diferentes, porque, como já vimos, em geral, GH ( z ) ≠ G ( z ) H ( z ) ; e o 3º. e o 4º. caso são diferentes porque HG2 ( z ) ≠ H ( z )G2 ( z ) . Resposta a distúrbios Até agora estudamos a resposta da planta a sinais de referência que se deseja rastreados em regime permanente com regime transitório satisfatório. Passemos agora ao estudo da resposta do sistema a distúrbios. Considere a figura 4-19 abaixo. Na figura (a) o sinal de referência é suposto nulo, conforme indicado no próprio diagrama de blocos. E, portanto o diagrama de blocos pode ser redesenhado como na figura (b). 13 Então, C ( z) G( z) = . N ( z ) 1 + GD ( z )G ( z ) (*) Ora, se GD ( z )G ( z ) 1 para z < 1 , que é a região de estabilidade, então temos C ( z) 1 ≅ . (**) N ( z ) GD ( z ) Ora, remetendo-nos à figura (a), temos E ( z ) = R ( z ) − C ( z ) = −C ( z ) . Disto e da 1 expressão anterior, temos E ( z ) ≅ − N ( z) . GD ( z ) Portanto, quanto maior o ganho de GD ( z ) , tanto menor o erro E ( z ) . Se GD ( z ) inclui um integrador (o que significa que GD ( z ) tem um pólo em z = 1), então o erro em regime permanente devido a um distúrbio constante é nulo. Com efeito, A . um distúrbio constante tem transformada z igual a N ( z ) = 1 − z −1 G ( z ) , onde G D ( z ) Ora, se GD ( z ) tem um pólo em z = 1, podemos escrever GD ( z ) = D z −1 não tem zero em z = 1 (isto é, seu numerador não tem raiz em z = 1). Então, o erro em ⎡ − N ( z) ⎤ regime permanente é: ess = lim[(1 − z −1 ) E ( z )] = lim ⎢(1 − z −1 ) ⎥ z →1 z →1 GD ( z ) ⎦ ⎣ ⎛ Az ⎞ ⎜ z −1 ⎟ z − 1 ⎟ = lim ⎛ z − 1 Az ⎞ = 0. = lim ⎜ ⎜ ⎟ z →1 ⎜ z G D ( z ) ⎟ z →1 ⎝ z G D ( z ) ⎠ ⎜ ⎟ ⎝ z −1 ⎠ Na realidade, podemos chegar a esta conclusão sem precisar supor a aproximação (**) acima. Com efeito, de (*), se GD ( z ) inclui um integrador e supondo que ele não seja cancelado pelo numerador de G ( z ) , obtém-se a mesma conclusão. E note-se que não cancelamento de raízes instáveis no produto GD ( z )G ( z ) é condição necessária para a estabilidade do SMF, como é sabido do curso de sistemas de tempo contínuo. 14 Recordamos aqui, da teoria geral de sistemas lineares, que se um sistema é submetido simultaneamente a um sinal de referência e a um distúrbio, a resposta vai ser a superposição das duas respostas. Considere o sistema da figura 4-20(a) abaixo, em que o distúrbio é aplicado na saída da planta. C( z) E ( z) 1 =− = . N ( z) N ( z ) 1 + GD ( z )G ( z ) Consequentemente, para minimizar o efeito do distúrbio sobre o erro, o ganho de GD ( z )G ( z ) deve ser tão grande quanto possível. É fácil verificar que GD ( z )G ( z ) C( z) E( z) =− =− , N ( z) N ( z) 1 + GD ( z )G ( z ) e neste caso, para minimizar o efeito do distúrbio, o ganho de GD ( z )G ( z ) deve ser tão pequeno quanto possível. Entretanto, para a figura (b), temos É claro então que deve haver um compromisso, quando se trata de minimizar ambos os efeitos. Usualmente, procura-se o compromisso principalmente na banda de frequências que interessa. Ou então, se as freqüências correspondentes ao sinal de referência e ao distúrbio forem suficientemente disjuntas, as duas condições, isto é, ganhos de GD ( z )G ( z ) pequeno e grande podem ser satisfeitas satisfatoriamente. 15 4-5 Projeto baseado no lugar das raízes (“root locus”) O método do root locus para sistemas de tempo contínuo, já estudado no curso anterior, pode ser aplicado sem alteração, a não ser o fato de que a fronteira entre a parte “boa” (estável) no plano complexo é o interior do círculo unitário e não o semi plano aberto da esquerda. Seja o sistema da figura 4-21 abaixo. A equação característica do sistema é 1 + G ( z ) H ( z ) = 0. O MATLAB fornece o root locus, de modo que não precisaremos gastar tempo e energia nos cálculos. Entretanto, é bom que dominemos o conceito, de resto simples, da idéia do root locus, de modo a podermos interpretar os resultados obtidos no computador. Definindo F ( z ) = G ( z ) H ( z ) , a eq. característica é re-escrita 1 + F ( z) = 0 . (*) Observe-se que F ( z ) é a função de transferência em malha aberta. Da eq. acima, temos F ( z ) = −1 , o que implica F ( z) = 1 , arg[ F ( z )] = ±(2k + 1)π = ± (2k + 1)1800 , k = 1; 2;3;... Recorda-se que os pólos e zeros de F ( z ) aparecem aos pares conjugados; como conseqüência, o root locus é sempre simétrico com relação ao eixo real. Portanto, basta construir a parte superior (acima do eixo dos reais) do root locus, a parte inferior sendo simétrica. Regras gerais para construir o lugar das raízes de um SMF 1ª. A partir da eq. (*) acima, escrevemos K ( z + z1 )( z + z2 )...( z + zm ) 1+ = 0. (**) ( z + p1 )( z + p2 )...( z + pn ) Suporemos, como habitual no root locus, que K > 0. A partir da forma fatorada acima do numerador e do denominador, plotamos no plano z os zeros e pólos de F ( z ) . 2ª. Os pontos do root locus correspondentes a K = 0 são os pólos do sistema em malha aberta, enquanto que os pontos do root locus correspondentes a K = ∞ são os zeros do sistema em malha aberta. O root locus terá tantos ramos quantas são as raízes da eq. característica. Cada ramo começa num pólo do sistema em malha aberta e termina num zero do mesmo. A quase totalidade dos sistemas em controles são próprios, isto é, o grau do numerador de F ( z ) é menor ou igual ao do denominador. E a maioria deles são estritamente próprios, ou seja, o grau do numerador é estritamente menor do que o grau 16 do denominador de F ( z ) . Como consequência, neste caso, F ( z ) tem zero(s) no infinito. E isto significa que o(s) ramo(s) correspondente(s) partindo do(s) respectivo(s) pólo(s) vai (vão) para o infinito. Ou seja, olhando para a eq. (**) acima, vemos que n – m ramos do root locus vão para o infinito. 3ª. Determinar os ramos do root locus no eixo dos reais; eles são constituídos por pólos e zeros do sistema em malha aberta sobre o dito eixo. Para que um ponto do eixo real pertença a um ramo do root locus, é necessário (e suficiente), que o número total de zeros e pólos do sistema em malha aberta à sua direita seja ímpar. 4ª. Como dito acima, sendo n > m, há ramos que vão para o infinito; para determinar os ângulos das assíntotas a estes ramos, usa-se a fórmula ±(2 N + 1) × 1800 Ângulo das assíntotas = , N = 0;1; 2;...; n − m . n−m É claro que cada par de assíntotas é simétrico com relação ao eixo dos reais. O ponto em que elas se interceptam no dito eixo é dado por p + p + ... pn − ( z1 + z2 + ...zm ) . (4-21) σa = 1 2 n−m 5ª. A seguir, calculam-se os pontos “breakaway” e “break-in”, os quais ou estão no eixo real ou ocorrem em pares de complexos conjugados. Se existe um ramo do root locus entre dois pólos no eixo real, então existe um ponto breakaway no dito eixo entre os dois pólos. E de modo semelhante, se existe um ramo do root locus entre dois zeros no eixo real (um deles podendo estar no infinito), então existe pelo menos um ponto de break-in entre os dois zeros. KB( z ) A( z ) Seja F ( z ) = . Da eq. (*) acima temos K = − , (4-22) A( z ) B( z ) e os pontos breakaway e break-in são as raízes da eq. dK A '( z ) B( z ) − A( z ) B '( z ) =− =0 (4-23) dz B2 ( z) onde (') indica derivada com relação a z. Todas as raízes de (4-23) correspondentes a valores positivos de K são pontos breakaway ou break-in. 6ª. Em seguida, determinam-se os ângulos de partida e de chegada dos pontos complexos do root locus. Conforme mostrado na figura 4-22, abaixo, o ângulo de partida (ou de chegada) de um pólo (ou zero) do root locus é igual a 1800 menos a soma dos ângulos dos vetores que ligam os outros pólos e zeros ao dito pólo (zero). Na figura, temos um ponto de partida de um pólo indicado com um × no 2º. quadrante; no caso, o sistema tem três pólos (indicados com × ) e um zero (indicado com uma bolinha). Esta é a indicação universal para pólos e zeros no root locus. 7ª. A seguir, acham-se os pontos em que o root locus cruza o círculo unitário, o que é resolvido facilmente fazendo z = 1 na eq. característica (*) ou (**), igualando-se as partes real e imaginária, obtendo duas eqs. a partir das quais se podem obter z e o respectivo valor de K. 17 8ª. Como diz o próprio nome, o “root locus” é o lugar das raízes da eq. característica do SMF, ou seja, é o lugar dos pólos do SMF quando K varia de zero a infinito. Observe-se que dado um certo K, para que ele satisfaça à eq. característica, terá que valer a relação, ( z + z1 )( z + z2 )...( z + zm ) 1 de acordo com (**): = . Para um dado K, é possível ( z + p1 )( z + p2 )...( z + pn ) K localizar os pólos do SMF pelo método de tentativa-e-erro. Cancelamento de pólos e zeros no produto G ( z ) H ( z ) É importante observar que os pólos que forem cancelados no produto G ( z ) H ( z ) não aparecem no root locus. Assim, por exemplo, seja o SMF da figura 4-21 acima. Se z+a z+c z+c , e é a partir G( z) = e H ( z) = , obtemos G ( z ) H ( z ) = ( z + a)( z + b) ( z + b)( z + d ) z+d desta expressão que se constrói o root locus. Os pólos são obtidos da eq. característica K ( z + c) 1 + G( z) H ( z) = 1 + = 0, donde ( z + b)( z + d ) + K ( z + c) = 0 nos dão os ( z + b)( z + d ) pólos que aparecem no root locus quando K varia de zero a infinito. Entretanto, note-se que a função de transferência do SMF é K ( z + c) G( z) K ( z + c)( z + d ) ( z + a )( z + b) = = 1 + G ( z ) H ( z ) 1 + K ( z + c) z + a ( z + a )( z + b)( z + d ) + K ( z + a )( z + c) ( z + a )( z + b) z + d K ( z + c)( z + d ) , donde se vê que z = -a é um pólo do SMF, foi o = ( z + a )[( z + b)( z + d ) + K ( z + c)] pólo cancelado no produto G ( z ) H ( z ) . Root locus de controle de sistemas digitais No que se segue, investigaremos o efeito do ganho K e do período de amostragem T na estabilidade de um SMF tal como o da figura 4-23 abaixo. 18 K z =K . −1 1− z z −1 Vamos construir o root locus para três valores do período de amostragem T: 0,5; 1 e 2 segundos. Vamos determinar também o valor crítico de K para cada caso. E, finalmente, vamos calcular os valores críticos dos pólos do SMF (isto é, a partir dos quais o SMF se torna instável), para K = 2 em cada um dos três casos. Calculemos primeiramente a transformada z de Gh ( s )G p ( s ) : Suponha que o controlador digital é do tipo integral, ou seja, GD ( z ) = ⎡1 − e −Ts 1 ⎤ ⎡ 1 ⎤ 1 ⎤ ⎡1 −1 −1 Z[Gh ( s )G p ( s )] = Z ⎢ ⎥ = (1 − z )Z ⎢ s ( s + 1) ⎥ = (1 − z )Z ⎢ s − s + 1 ⎥ = ⎣ ⎦ ⎣ ⎦ ⎣ s s + 1⎦ −T −T z −1 ⎛ z z ⎞ z −1 z − e − z +1 1− e = = . − = 1− ⎜ −T ⎟ −T z−e z − e −T z − e −T z ⎝ z −1 z − e ⎠ Donde que a função de transferência de pulso do canal direto, que é a do sistema em z 1 − e −T malha aberta, é: G ( z ) = GD ( z )Z[Gh ( s )G p ( s )] = K . (4-25) z − 1 z − e −T z 1 − e −T A equação característica é 1 + G ( z ) = 0 , ou seja, 1 + K =0 (4-26) z − 1 z − e −T - Consideremos primeiramente T = 0,5 seg. A eq. (4-25) nos dá 0,3935 Kz G( z) = . ( z − 1)( z − 0, 6065) Para construirmos o root locus, que está na figura 4-24 (a) abaixo, plotamos primeiramente os pólos e zeros de G ( z ) . 19 Os pólos são indicados com × e o zero com um pequeno círculo, todos, neste caso, no eixo dos reais. Usualmente se indica no root locus a evolução dos pólos, à medida que K aumenta, setas indicando esta evolução, o que não é feito na figura. Com K = 0, os pólos do SMF são os pólos de G ( z ) . O root locus tem dois ramos, porque tem dois pólos. O ramo que começa em z = 1 caminha para a esquerda quando K aumenta, enquanto que o ramo que começa em z = 0,6065 caminha para a direita encontrando o outro no ponto “breakaway”, que é calculado, como vimos da eq. (4-22). Os dois ramos se afastam simetricamente em relação ao eixo dos reais e se encontram no ponto “break-in”, ambos estes pontos sendo obtidos pela mesma maneira: ( z − 1)( z − 0, 6065) K =− (4-27) 0,3935 z e igualando a zero a derivada com relação a z: dK 0,3935 z ( z − 0, 6065 + z − 1) − 0,3935( z − 1)( z − 0, 6065) =− = dz (0,3935 z ) 2 2 z 2 − 1, 6065 z − z 2 + 1, 6065 z − 0, 6065 z 2 − 0, 6065 = = 0 , donde obtemos z = ±0, 7788 ; 0,3935 z 2 0,3935 z 2 o valor positivo é o ponto breakaway, enquanto que o negativo é o ponto “break-in”. 20 Substituindo estes valores em (4-27), achamos K = 0,1244 e K = 8.041, respectivamente. O root locus neste caso tem uma parte circular, como mostra a figura; na realidade, para chegarmos a esta conclusão, precisamos levantar ponto por ponto, isto é, para cada valor de K, determinar os pólos do SMF. Mas que esta curva seja um círculo, também pode ser demonstrado analiticamente. (Tente!). Como se vê na figura (a), o ramo da esquerda sobre o eixo real vai para o infinito, saindo fora do círculo unitário, ou seja, o sistema torna-se instável a partir de um certo valor de K. Para determinar este valor de K, utilizamos a eq. (4-26), que repetimos: z 1 − e −T ( z − 1)( z − 0, 6065) 1+ K = 0 ; substituindo T = 0,5 , obtemos K = − e com z −T z −1 z − e 0,3935 z (−2)(−1, 6065) = -1, temos K = − = 8,165. −0,3935 - Vejamos agora o root locus quando T = 1. Reportamo-nos à figura (b) acima. Neste 0, 6321Kz caso, da eq. (4-25), temos G ( z ) = . ( z − 1)( z − 0,3679) Calculando como no caso anterior a partir da eq., mas com os valores diferentes, achamse os pontos breakaway e break-in, a saber, z = 0,6065 e z = - 06065, respectivamente, ou seja, simétricos com relação à origem. Os valores correspondentes de K são K = 0,2449 e 4,083. Como se poderia esperar, tendo em vista o caso anterior, ele é circular. Utilizando o mesmo método que no caso anterior, calcula-se o valor crítico de K a partir do qual o SMF se torna instável, obtendo-se K = 4,328. - Passemos finalmente ao caso em que T = 2, reportando-nos à figura (c) acima. Neste 0,8647 Kz caso, a eq. (4-25) nos dá: G ( z ) = . Calculando os pontos de ( z − 1)( z − 0,1353) breakaway e de break-in, temos (ver figura(c)) z = 0,3678 e z = -0,3678, respectivamente, simétricos com relação à origem. Obtém-se o valor crítico de K a partir do qual o SMF se torna instável: K = 2,626. Observe-se que os root loci diminuem de diâmetro quando se aumenta o período T de amostragem. E verifica-se que, quanto maior o período de amostragem, menor se torna também o valor de K a partir do qual o SMF se torna instável, ou seja, quanto menor a frequência de amostragem, menor a margem de estabilidade do SMF. Uma “receita de bolo” que se usa para o valor do período de amostragem é a seguinte: o período de amostragem deve ser 8 ou 10 vezes menor do que o das oscilações na resposta do sistema, se o sistema for sub-amortecido. Se o sistema for super-amortecido, o período de amostragem deve ser 8 ou 10 vezes menor do que o do tempo de subida no caso de resposta a um degrau. Efetivamente, fazendo-se o tempo de amostragem cada vez menor, o que se torna sempre mais possível com a “lei de Moore” (até quando?), o sistema de tempo discreto tem um comportamento que se aproxima do de tempo contínuo. Efeitos do período de amostragem T nas características do regime transitório: Se o fator de amortecimento do SMF é ς , então o pólo correspondente no plano s acima do eixo real é s = −ςωn + jωn 1 − ς 2 e sendo z = eTs , temos ( ) z = exp T (−ςωn + jωn 1 − ς 2 ) , (4-29) 21 donde z = e −T ςωn e arg[ z ] = T ωn 1 − ς 2 = T ωd = θ (em radianos). (4-30) Assim, se T = 0,5 e K = 2, é fácil verificar que o pólo do SMF com parte imaginária positiva é: z = 0,4098 +j0,6623. Portanto, z = 0, 40982 + 0, 66232 = 0,7788, donde e −T ςωn = 0,7788, ou seja, T ςωn = 0,25. 0, 6623 = 58, 25D = 1, 0167 rad . 0, 4098 T ςωn 0, 25 = , donde Desta, de (4-30) e de (4-31), vem 2 1, 0167 T ωn 1 − ς nos dá ς = 0,2388. (4-31) Por outro lado, arg[ z ] = arctg (4-32) ς 1− ς 2 = 0, 2459 , que Voltemos à figura 4-23, cuja função de transferência de pulso do canal direto é G ( z ) e G( z) cuja função de transferência de pulso do SMF é , onde G ( z ) é dado pela eq. 1 + G( z) G( z) Kz (1 − e −T ) (4-25), ou seja, . = 1 + G ( z ) ( z − 1)( z − e −T ) + Kz (1 − e −T ) Com T = 0,5 e K = 2, temos a transformada da resposta a um degrau unitário de 0,3935 × 2 z entrada: C ( z ) = R( z ) . Dividindo-se numerador e ( z − 1)( z − 0, 6065) + 0,3935 × 2 z denominador da expressão por z 2 e tendo em vista a tabela 2-1 para a transformada do 0, 787 z −1 1 . A figura 4-26 (a) degrau unitário, temos C ( z ) = −1 −2 1 − 0,8195 z + 0, 6065 z 1 − z −1 abaixo dá a resposta do sistema. 22 Quando T = 1 e o mesmo K (= 2), temos a resposta ao degrau unitário: 1, 2642 z −1 1 , o resultado sendo mostrado na fig. (b) acima. C ( z) = −1 −2 1 − 0,1037 z + 0,3679 z 1 − z −1 Quando T = 2, com o mesmo K, temos: C ( z ) = 1, 7294 z −1 1 ,o −1 −2 1 + 0,5941z + 0,1353 z 1 − z −1 resultado estando na fig. (c). Nas três figuras (a), (b) e (c), os pontos escuros correspondem a c(kT) e o tracejado é uma interpolação. Comparando-se as figs. (a) e (c), fica evidente que a primeira é muito mais precisa, ou seja, quanto menor o período de amostragem, melhor será a fidelidade da resposta em tempo discreto. Se T → 0 , temos a resposta em tempo contínuo, da qual nos aproximamos à medida que os processadores se tornam mais rápidos. Nos três casos acima o teorema da amostragem (Shannon) é satisfeito, mas a terceira resposta (c) é pouco satisfatória. Isto mostra, que não basta satisfazer ao dito teorema. A “receita de bolo” aqui é a mesma já enunciada antes: 8 a 10 amostras por ciclo, se o sistema é sub-amortecido, como é o caso acima, pois apresenta oscilação na resposta. A seguir, investigaremos o efeito do período de amostragem no erro em regime permanente. Consideraremos a rampa unitária como entrada nos três casos tratados. De (4-25) com T = 0,5 e K =2, temos a função de transferência de pulso do canal direto: 0, 787 z G( z) = . Portanto a constante de erro de velocidade é dada por ( z − 1)( z − 0, 6065) 23 0, 787 z ⎡ z −1 ⎤ = lim ⎢ ⎥ = 4; portanto, o erro em regime z → 1 T ⎣ 0, 5 z ( z − 1)( z − 0, 6065) ⎦ 1 = 0, 25 . permanente é: ess = Kv 1, 2642 z Com T = 1 e K =2, temos G ( z ) = , donde que a constante de erro de ( z − 1)( z − 0,3679) K v = lim (1 − z −1 )G ( z ) z →1 1, 2642 z ⎡ z −1 ⎤ = lim ⎢ ⎥=2 z →1 z →1 T ⎣ z ( z − 1)( z − 0, 3679) ⎦ e, portanto, o erro em regime permanente é igual a 0,5. velocidade é K v = lim (1 − z −1 )G ( z ) 1, 7294 z e pelo mesmo ( z − 1)( z − 0,1353) procedimento nos casos anteriores obtemos o erro em regime permanente igual a 1. A figura 4-27 abaixo mostra as três situações e, de novo, quanto menor o período de amostragem, melhor a resposta. Finalmente, com T = 2 e o mesmo K, temos G ( z ) = Exemplo 4-9: Considere o SMF da figura 4-28 abaixo. Projetar um controlador digital tal que os pólos dominantes no SMF tenham um fator de amortecimento ς = 0,5 e um 24 tempo de assentamento igual a 2 segundos. O período de amostragem é T = 0,2 seg. Obter a resposta do sistema a um degrau de amplitude unitária, bem como a constante de velocidade K v do sistema. Solução: para sistemas padrão com um par de pólos dominantes, temos, conforme estudado no curso de sistemas de tempo contínuo: tempo de assentamento = 2 = 4 4 = . ςωn 0,5ωn (Aqui o tempo de assentamento está sendo definido como o tempo a partir do qual o erro da resposta, em valor absoluto, é inferior a 2% . Se se quisesse ficar dentro de 5%, o numerador da expressão acima seria igual a 3). Donde que ωn = 4, que é a frequência natural não amortecida. Mas a frequência natural real é a amortecida, isto é, ωd = ωn 1 − ς 2 = 4 1 − 0,52 = 3,464. 2π 2π Já a frequência de amostragem é dada por ωs = = = 31,42. 0, 2 T Observe-se que dividindo este número pelo anterior, isto é, 31,42/3,464 , obtemos aproximadamente 9,07, ou seja, cerca de 9 amostragem por ciclo de oscilação amortecida, um número que satisfaz à “regra de bolo” antes mencionada, o que nos leva a concluir que o período de amostragem igual a 0,2 é satisfatório. (( Repetimos aqui a eq. (4-29): z = exp T −ςωn + jωn 1 − ς 2 )) ; tendo em vista as expressões de ωn e ωs , dadas logo acima, temos: ⎛ 2π ⎛ ωd ⎞ 2π 2πς ωd ⎞ ωd . ⎟ = exp ⎜ − ⎟ e arg[ z ] = T ωd = z = e −T ςωn = exp ⎜ − ς 2 ⎟ ⎜ ωs ⎜ 1 − ς 2 ωs ⎟ ω ς − 1 s ⎝ ⎠ ⎝ ⎠ Ora, do enunciado do problema temos que ς = 0,5 e, como vimos, ωd = 3,464 e ωs = 31,42 . Substituindo-se estes valores acima, temos: ⎛ 2π × 0,5 3, 464 ⎞ z = exp ⎜ − ⎟ = e −0,4 = 0,6703 e ⎜ 1 − 0,52 31, 42 ⎟ ⎝ ⎠ 2π × 3, 464 = 0,6927 rad. = 39, 69D . arg[ z ] = 31, 42 Portanto, z = 0, 6703arg[39, 69D ] = 0,5158 + j 0, 4281 . A função de transferência de pulso da planta precedida do segurador é ⎡1 − e −0,2 s ⎡ ⎤ 1 1 ⎤ −1 G( z) = Z ⎢ ⎥ = (1 − z )Z ⎢ s 2 ( s + 2) ⎥ . Decompondo em frações parciais s ( s + 2) ⎦ ⎣ ⎦ ⎣ s 25 o que está entre colchetes, usando a Tabela 2-1 e calculando, obtemos: 0, 01758( z + 0,876) G( z) = . Vamos, tentativamente, escolher um compensador GD ( z ) ( z -1)( z - 0, 6703) K ( z + b) . Ora, se G ( z ) tiver um pólo estável, ele pode ser para o sistema. Seja GD ( z ) = z+a K ( z − 0, 6703) . Então a eq. característica do cancelado. Então escolhamos GD ( z ) = z+a SMF será ( z − 1)( z + a) + 0, 01758 K ( z + 0,876) . Os parâmetros a e K serão escolhidos de modo a obtermos uma resposta satisfatória. Com efeito, sejam -c e -d os pólos desejados, de modo que o polinômio. característico desejado seja ( z + c)( z + d ) = z 2 + (c + d ) z + cd . (*) Com a escolha de GD ( z ) acima, o polinômio característico do sistema é ( z − 1)( z + a) + 0, 01758K ( z + 0,876) = z 2 + (a − 1 + 0, 01758 K ) z − a + 0, 01758 × 0,876 K = z 2 + (a − 1 + 0, 01758 K ) z − a + 0, 0154 K . Igualando os coeficientes deste com os de (*) acima, temos a − 1 + 0, 01758K = c + d , −a + 0, 0154 K = cd . Somando membro a membro estas duas eqs., temos c + d + cd + 1 0, 03298K − 1 = c + d + cd ∴ K = e, por conseguinte, a = 0, 0154 K − cd . É 0, 03298 claro que c e d devem ser escolhidos de modo que as raízes de (*) fiquem no interior do círculo unitário. Se escolhermos, por exemplo, um pólo duplo na origem, temos de (*), c = d = 0 e, portanto, K = 1/ 0,03298 = 30,32 e a = 0,0154K = 0,4669. Com isto, temos o controlador definido e o cálculo da resposta a um degrau unitário é rotina. Observe-se que G(z) tem um pólo em 1 e, portanto, aplicando o teorema do valor final, obteremos erro nulo em regime permanente. 4-6 Projeto com o método da resposta em frequência Os conceitos da resposta em frequência têm a mesma importância em sistemas de tempo discreto que em sistemas de tempo contínuo. Supõe-se neste curso que o aluno já esteja familiarizado com os métodos de resposta em frequência dos sistemas de tempo contínuo. Sabemos que a resposta de um sistema linear a um sinal senoidal preserva a frequência e modifica somente a amplitude e a fase do sinal de entrada. Resposta de um sistema de tempo discreto a uma função senoidal de entrada. A resposta em frequência de G ( z ) pode ser obtida substituindo-se z = e jωT em G ( z ) . Seja o sistema de tempo discreto, que suporemos estável na figura 4-31abaixo: O sinal de entrada é u (t ) = senωt , conforme indicado acima. 26 Então o sinal amostrado é u (kT ) = sen(kωT ) , cuja transformada z é: zsenωT U ( z ) = Z[ senkωT ] = , conforme a entrada 14 da tabela 2-1. Então, a jωT ( z − e )( z − e − jωT ) zsenωT . resposta do sistema é dada por X ( z ) = G ( z )U ( z ) = G ( z ) jωT ( z − e )( z − e − jωT ) az az + termos devidos aos pólos Obtemos uma expressão do tipo X ( z ) = + jωT z −e z − e − jωT de G ( z ) , onde a e a são complexos conjugados. (4-34) jωT Multiplicando ambos os lados desta eq. por ( z − e ) / z , obtemos senωT a ( z − e jωT ) z − e jωT = a + + [termos devidos aos pólos de G ( z ) ]. z − e − jωT z z − e − jωT Ora, quando z tende para e jωT , a segunda e a terceira parcelas do lado direito acima tendem para zero, tendo em vista que G ( z ) é estável. senωT senωT Donde, a = G ( z ) = G ( jωT ) jωT − jωT z −e e − e − jωT z = e jωT G( z) senωT G (e jωT ) G (e − jωT ) e, portanto, a = − . = cos ωT + jsenωT − cos ωT + jsenωT 2j 2j Definamos G (e jωT ) = Me jθ ∴ G (e − jωT ) = Me − jθ . Consequentemente, a eq. (4-34) pode ser escrita como Me jθ z Me − jθ z − + termos devidos aos pólos de G ( z ) , ou ainda, X ( z) = jωT 2 j z −e 2 j z − e − jωT = G ( jωT ) M ⎛ e jθ z e − jθ z ⎞ − ⎜ ⎟ + termos devidos aos pólos de G ( z ) . 2 j ⎝ z − e jωT z − e − jωT ⎠ A transformada inversa desta última é: M jkωT jθ (e e − e − jkωT e − jθ ) + Z−1[ termos devidos aos pólos de G ( z ) ] . x(kT ) = 2j O último termo do lado direito representa o regime transitório; sendo G ( z ) estável, estes termos tenderão a zero. Portanto a resposta em regime permanente é: M jkωT jθ M j ( kωT +θ ) − j ( kωT +θ ) −e (4-35) xss (kT ) = e e − e − jkωT e− jθ ) = ( (e ) 2j 2j M = ( cos(kωT + θ ) + jsen(kωT + θ ) − cos(kωT + θ ) + jsen(kωT + θ ) ) 2j = Msen(kωT + θ ) , (4-36) onde, como vimos, M é o ganho do sistema de tempo discreto quando submetido a uma entrada senoidal e é dado por M = M (ω ) = G (e jωT ) e X ( z) = ( ) θ = θ (ω ) = arg G ( e jωT ) . Portanto, a eq. (4-36) pode ser escrita como ( ( )) xss (kT ) = G (e jωT ) sen kωT + arg G ( e jωT ) . Acabamos de provar que G (e jωT ) dá a magnitude e a fase da resposta em frequência de G ( z ) . Portanto, para obter a resposta em frequência de G ( z ) , basta substituir z por 27 e jωT em G ( z ) . A função G (e jωT ) é comumente chamada de função de transferência de pulso senoidal. Observe-se que e j (ω + (2π / T ))T = e jωT e j 2π = e jωT , donde se conclui que a função G (e jωT ) é periódica, com período igual a T. Exemplo 4-10: Considere o sistema dado por x(kT ) = u (kT ) + ax((k − 1)T ) com 0 < a < 1 . Obter a resposta em regime permanente quando a entrada u (kT ) é a senoide amostrada, ou seja, u (kT ) = Asen(kωT ) . Solução: A transformada z da eq. que define o sistema é: X ( z ) = U ( z ) + az −1 X ( z ) . 1 Definindo G ( z ) = X ( z ) / U ( z ) , temos G ( z ) = . Substituindo z por e jωT em −1 1 − az 1 1 G ( z ) , temos G (e jωT ) = = . Donde, − jωT 1 − ae 1 − a cos ωT + jasenωT 1 asenωT G (e jωT ) = M = . e arg[G (e jωT )] = θ = − arctg 1 − a cos ωT 1 + a 2 − 2a cos ωT E, portanto, a resposta em regime permanente é: A asenωT ⎞ ⎛ xss (kT ) = AMsen( kωT + θ ) = sen ⎜ kωT − arctg ⎟ 2 1 − a cos ωT ⎠ ⎝ 1 + a − 2a cos ωT Transformação bilinear para o plano z A fim de aplicar os métodos de frequência a sistemas de tempo discreto, uma transformação de variável se faz necessária. Com efeito, tendo em vista que no plano z temos z = e jωT , se tratarmos da resposta em frequência, a simplicidade dos diagrama de Bode, que é logarítmico será perdida. Mais ainda, como o semi-plano da esquerda é mapeado no interior do círculo unitário, os métodos frequenciais, que tratam do semiplano inteiro, não se aplicam ao plano z . Tendo em vista isto, uma mudança de variável se impõe se quisermos usar o diagrama de Bode para sistemas de tempo discreto. A transformação usada é: 1 + (T / 2) w z= , (4-37) 1 − (T / 2) w onde T é o período de amostragem. Da eq. acima, temos imediatamente 2 z −1 w= . (4-38) T z +1 2 z −1 são mostrados na figura 4-32 abaixo. Os mapeamentos z = eTs e w = T z +1 28 Observe-se que na figura (a), temos uma faixa no semi-plano da esquerda, ao passo que na figura (c), temos todo o semi-plano da esquerda. Na figura (b) o círculo é o unitário. Através do mapeamento (4-38), G ( w) pode ser tratada como uma função de transferência em w. Substituindo w por jν , técnicas convencionais de resposta em frequência podem ser usadas para traçar o diagrama de Bode. Faremos agora uma breve revisão do diagrama de Bode nesta seção, usando a frequência ν como variável. A frequência fictícia ν e a frequência atual ω são 2 z −1 2 e jωT − 1 2 e jωT / 2 e jωT / 2 − 1 relacionadas por: w w= jν = jν = = = ; dividindo T z + 1 z =e jωT T e jωT + 1 T e jωT / 2 e jωT / 2 + 1 numerador e denominador por e jωT / 2 , temos: jν = 2 e j (1/ 2)ωT − e − j (1/ 2)ωT 2 ωT = jtg , ou − j (1/ 2)ωT j (1/ 2)ωT Te +e T 2 2 ωT , (4-39) tg 2 T que dá a relação entre a frequência atual ω e a frequência fictícia ν . Observe-se de (439) e também da figura 4-32 que, enquanto ω varia de -0,5 ωs a 0, a frequência fictícia ν varia de −∞ a 0, e enquanto a primeira varia de 0 a 0,5 ωs , a segunda varia de 0 a ∞ . A figura 4-33 abaixo mostra a relação entre a frequência fictícia ν multiplicada por T/2 e a frequência atual ω , quando esta varia de 0 a 0,5 ωs . seja, ν = 29 Seja observado que quando ω T é pequeno, então tg ωT ≅ ωT e, de (4-39), temos 2 2 ν ≅ ω . Isto mostra que, para ω T pequeno, as funções de transferência G ( s) e G ( w) se parecem. Note-se que esta é uma consequência da introdução do fator de escala 2/T em (4-37). Isto significa que a função de transferência no plano w se aproxima da no plano s quando T se aproxima de zero, algo sempre mais realista à medida que avança a micro-eletrônica, de acordo com a lei de Moore. Exemplo 4-11: Considere a função de transferência da figura 4-34 abaixo. O período de amostragem é 0,1 seg. Calcular G ( w) . ⎡ 10 ⎤ ⎡1 − e −Ts 10 ⎤ = (1 − z −1 )Z ⎢ Solução: A transformada z de G ( s ) é G ( z ) = Z ⎢ ⎥ ⎥ ⎣ s s + 10 ⎦ ⎣ s ( s + 10) ⎦ 0, 6321 = . Substituindo z dado por (4-37), obtemos, com T = 0,1 z − 0,3679 0, 6321 0, 6321(1 − 0, 05w) (1 − 0, 05w) G ( w) = = = 9, 241 . 1 + 0, 05w 0, 6321 + 0, 0684 w w + 9, 241 − 0,3679 1 − 0, 05w Observe-se que a planta G ( s) tem um pólo em s = -10, enquanto que no plano w, o pólo está em -9,241, não muito distante; quanto ao ganho, o da planta é 10 e o no plano w é também 9,241, de novo não muito distante. Mas, em compensação, em G ( w) aparece um zero em 20 = 2/T, o que não ocorre na planta. Mas, efetivamente, quando T tende a zero, o zero em w = 2/T, se aproxima do infinito, que é um zero da planta G ( s) . Diagramas de Bode O diagrama de Bode, que nos dá o ganho e a fase, é largamente usado em sistemas escalares (uma entrada e uma saída) de tempo contínuo, sendo de mais fácil aplicação quando a função de transferência é dada na forma fatorada. Tal como nos sistemas de tempo contínuo, o diagrama relativo nos dá o logaritmo de G ( jν ) versus o logaritmo de ν . Como o logaritmo de um produto é a soma dos logaritmos de fatores, a construção do diagrama de Bode fica simplificada se a função de transferência for dada de forma fatorada. Usando-se o diagrama de Bode, o controlador digital pode ser projetado usando os métodos bem conhecidos usados em sistemas de tempo contínuo. Mas é importante observar que pode haver diferença entre as magnitudes de G ( w) e a de G ( jν ) para altas freqüências. 1 − 0, 05w . O ganho de Vejamos o exemplo anterior (4-11). Repetimos G ( w) = 9, 241 w + 9, 241 30 alta frequência é lim G ( jν ) = lim 9, 241 ν →∞ planta em alta frequência é ν →∞ lim 10 ω →∞ jω +10 1 − 0, 05 jν = 0,4621, enquanto que o ganho da jν + 9, 241 = 0. Há, portanto, uma diferença considerável. Mas é preciso não esquecer que ν = ∞ no plano w corresponde a ω = 0,5ωs no plano s. Vantagens do diagrama de Bode em projetos São as seguintes as vantagens do diagrama de Bode para fins de projeto: 1. No diagrama de Bode a assíntota em baixas freqüências da curva de ganho é indicativa de uma das constantes de erro estático K p , K v ou K a . 2. As especificações do regime transitório podem ser traduzidas na resposta em frequência em termos de margem de ganho, margem de fase, banda passante, etc. Estas especificações podem ser facilmente tratadas no diagrama de Bode. De modo particular, as margens de ganho e de fase podem ser medidas diretamente no diagrama de Bode. 3. O projeto de um compensador (ou controlador) digital para satisfazer às especificações de margem de ganho e margem de fase pode ser feito diretamente por meio do diagrama de Bode de uma maneira simples e imediata. Compensação por avanço de fase, atraso de fase e por avanço-atraso de fase. - Recorda-se que a compensação por avanço de fase (“lead compensator”) aumenta a banda passante do sistema, o sistema ficando com uma resposta mais rápida. Porém, tal sistema pode ficar sujeito a ruídos de alta frequência, devido ao seu alto ganho para freqüências maiores. - Por sua vez, o sistema com compensação de atraso de fase (“lag compensator”) reduz o ganho do sistema para altas freqüências, sem reduzir o ganho em baixas freqüências. A banda passante do sistema é reduzida, e assim o sistema tem uma resposta mais lenta. Em vista da redução do ganho em alta frequência, o ganho total do sistema pode ser aumentado e assim o ganho em baixa frequência pode ser aumentado, aumentando conseqüentemente a precisão do regime permanente. Além disso, qualquer ruído de alta frequência é atenuado. - Em algumas aplicações, um compensador de atraso de fase é colocado em cascata (“em série”) com um compensador de avanço de fase, obtendo-se o compensador “lead – lag”. Com este compensador, o ganho de baixa frequência pode ser aumentado (o que significa um aumento na precisão da resposta em regime permanente) ao mesmo tempo em que se consegue melhor banda passante e margens de estabilidade. Recorda-se também que o controlador PID é um caso especial de compensador “lead-lag” (ou “laglead”, como dizem alguns autores). Com efeito, o controlador PD tem o mesmo comportamento que o compensador “lead”, enquanto que o compensador PI se comporta como um controlador “lag”. Algumas observações a respeito do problema da quantização dos coeficientes Do ponto de vista da implementação de micro-processadores, os compensadores “lead” não apresentam problema especial de quantização, porque os pólos e zeros podem ser bem separados uns dos outros; mas este não é o caso nos controladores “lead-lag”, porque os zeros e pólos ficam perto uns dos outros, na realidade ficam próximos do ponto z = 1. Tendo em vista que os coeficientes do filtro devem ser realizados através de sistema binário, se o número de bits empregado for insuficiente, as localizações dos zeros e 31 pólos do filtro podem não ser realizadas como desejado e assim o filtro pode não ser realizado como desejado. Ora, pequenos desvios na localização de pólos e zeros podem acarretar diferenças significativas nas características da resposta em frequência do compensador e assim o compensador pode não se comportar como desejado. Para minimizar este efeito da quantização dos coeficientes, é necessário projetar o filtro de modo de modo que ele seja pouco sujeito a este efeito indesejável. Como a sensibilidade das raízes dos polinômios às variações dos parâmetros variam em proporção direta com o grau do polinômio, não é recomendável a realização direta de um filtro de ordem grande. (Lembra-se que a ordem de uma função de transferência é igual ao grau do seu denominador). É preferível usar elementos de ordem baixa em cascata ou em paralelo, como discutido na seção 3-6. Efetivamente, se escolhermos logo de saída os pólos e zeros do compensador separados uns dos outros, o problema pode ser evitado. Nos compensadores analógicos seus pólos e zeros podem ser posicionados com precisão. Ao convertermos o compensador analógico em digital, a versão digital do compensador “lag” pode envolver bastante imprecisão na localização dos pólos e zeros. (A coisa importante a ser lembrada é que os pólos e zeros do filtro no plano z devem permanecer em pontos bem separados uns dos outros). Procedimentos de projeto no plano w Reportemo-nos à figura 4-35 abaixo. Os procedimentos para um projeto no plano z são os seguintes: 1. Obter G ( z ) , que é a transformada z da planta precedida de um segurador (“hold”). A 1 + (T / 2) w , isto é, seguir, calcula-se G ( w) através da eq. (4-37): z = 1 − (T / 2) w G ( w) = G ( z ) z =[1+ (T / 2) w]/[1−(T / 2) w] . É fundamental que o período de amostragem T seja escolhido apropriadamente. Uma “regra de bolo” é amostrar com uma frequência 10 vezes maior do que a banda passante do sistema em malha fechada. Há que notar que embora o controle digital e o processamento de sinais usem procedimentos semelhantes na amostragem de sinais de tempo contínuo, as freqüências de amostragem são muito diferentes. No processamento de sinais, estas freqüências são muito altas, enquanto que em controle digital elas são, em geral, baixas. Esta diferença entre as freqüências de amostragem nas duas áreas se deve à diferença dos processos dinâmicos envolvidos e aos diferentes compromissos (“trade-offs”) nas duas áreas). 2. Fazer w = jν e obter o diagrama de Bode de G ( jν ) . 3. Medir, a partir do diagrama de Bode, as constantes de erro estático, a margem de fase e a margem de ganho. 4. Supondo que o ganho de baixa frequência do controlador de tempo discreto (ou 32 digital) seja igual a um, determinar o ganho do sistema, satisfazendo às exigências para se obter um erro estático dado. A seguir, usando técnicas convencionais de projeto para sistemas de tempo contínuo, determinar os pólos e zeros da função de transferência do controlador GD ( w) . A função de transferência em malha aberta (canal direto do SMF) é GD ( w)G ( w) . 5. Transformar a função de transferência GD ( w) em GD ( z ) através de (4-38), a saber, 2 z −1 w= . GD ( z ) é a função de transferência de pulso do controlador digital. T z +1 6. Realizar a função de transferência GD ( z ) através de um algoritmo computacional. Observações: - G ( w) é uma função de transferência de fase não mínima (isto é, tem pelo menos um zero na parte “ruim” do plano complexo). – O eixo horizontal no diagrama de Bode, o das freqüências, é distorcido no plano w. Exemplo 4-12: Considere o sistema de controle digital dado na figura 4-36 abaixo. Projete um controlador digital no plano w com margens de ganho de pelo menos 10 dB e margem de fase de 50 0 e uma constante de erro estático de velocidade K v = 2 / seg. O período de amostragem é T = 0,2. Solução: ⎡1 − e −0,2 s K ⎤ ⎡ K ⎤ K ( z + 0,9356) −1 = 0, 01873 G( z) = Z ⎢ ⎥ = (1 − z )Z ⎢ 2 ⎥ ( z − 1)( z − 0,8187) s ( s + 1) ⎦ ⎣ s ( s + 1) ⎦ ⎣ s K (0, 01873z + 0, 01752) = 2 . z − 1,8187 z + 0,8187 1 + (T / 2) w 1 + 0,1w , obtendo = A seguir, substituímos na expressão acima z = 1 − (T / 2) w 1 − 0,1w ⎡ ⎤ ⎛ 1 + 0,1w ⎞ + 0, 01752 ⎥ K ⎢ 0, 01873 ⎜ ⎟ ⎝ 1 − 0,1w ⎠ ⎣ ⎦ G ( w) = 2 ⎛ 1 + 0,1w ⎞ ⎛ 1 + 0,1w ⎞ ⎜ 1 − 0,1w ⎟ − 1,8187 ⎜ 1 − 0,1w ⎟ + 0,8187 ⎝ ⎠ ⎝ ⎠ K (−0, 000333w2 − 0, 09633w + 0,9966) = w2 + 0,9969 w (*) 33 w ⎞⎛ w⎞ ⎛ K ⎜1 + ⎟ ⎜1 − ⎟ 300 ⎠ ⎝ 10 ⎠ . Tentaremos um compensador “lead”; se ele não resolver o ≅ ⎝ w( w + 1) problema, tentaremos um outro de ordem maior. Suponhamos, para simplificar, que o controlador GD ( w) tenha ganho unitário para a faixa de freqüências baixas e tenha a 1+τ w , 0 < α < 1. seguinte forma: GD ( w) = (**) 1 + ατ w A função de transferência de malha aberta é então 1 + τ w K (−0, 000333w2 − 0, 09633w + 0,9966) . GD ( w)G ( w) = 1 + ατ w w2 + 0,9969 w Ora, quando z → 1 , w → 0 . Portanto, K v = lim wGD ( w)G ( w) , e da expressão acima, w→0 temos K v ≅ K. Mas do enunciado do problema, temos K = 2. Substituindo em (*) e na expressão subsequente, temos portanto w ⎞⎛ w⎞ ⎛ 2 ⎜1 + 1− ⎟ ⎟⎜ 2 2(−0, 000333w − 0, 09633w + 0,9966) 300 ⎠⎝ 10 ⎠ G ( w) = ≅ ⎝ . A figura 4-37 2 w( w + 1) w + 0,9969 w abaixo apresenta o diagrama de Bode para o sistema. Os ganhos, em decibéis, são marcados do lado esquerdo e as fases, em graus, do lado direito, como de costume. Os ganhos e fases de G ( jν ) são apresentados em linhas tracejadas. Recorda-se que a margem de ganho é o acréscimo de ganho, em decibéis, que se pode dar à malha aberta tal que o SMF se torne instável. E por outro lado, a margem de fase é o ângulo que pode ser acrescentado à fase do 34 sistema em malha aberta tal que o SMF se torne instável. A margem de ganho é obtida medindo a diferença de ganho, com relação a 0 dB, na frequência em que a assíntota do diagrama de fase atinge - 1800 e é, como se pode ver acima, igual a 14,5 dB. A margem de fase é obtida medindo a diferença de fase com relação a - 1800 na frequência em que a assíntota do diagrama de ganhos atinge 0 dB, sendo neste caso, igual a 30 0 . As duas frequências mencionadas acima são chamadas de frequências de “crossover”. O compensador deve ser tal, portanto, que aumente a margem de fase em 20 0 . Mas este aumento modifica a curva de ganho do diagrama de Bode, a respectiva frequência de “crossover” (que são as duas frequências mencionadas acima) sendo deslocada para a direita. Segue-se um processo de tentativa e erro. O que se segue, apresentado pelo livro texto deste curso, é um método um tanto sofisticado, que não precisa ser conhecido pelos alunos. O importante é que se chegue, por tentativa e erro, a um valor satisfatório. O método apresentado consiste no seguinte: vamos dar um aumento de fase de 28 0 , tentativamente. Seja então φm = = 280 . Sabemos da teoria estudada no curso anterior 1−α , o que dá α = 0, 361, onde este α é o da expressão (**). Da mesma que senφm = 1+ α expressão (**) temos as “frequências de esquina” (“corner frequencies”) ν = 1/ τ e ν = 1/(ατ ) . Sabemos também que φm ocorre na média geométrica das duas freqüências de esquina, ou seja, em ν = 1/( ατ ) . A modificação (aumento) na curva de ganho devida à inclusão do termo (1 + τ jν ) /(1 + ατ jν ) é 1 + τ jν 1 + ατ jν = ν =1/( ατ ) 1 α . A seguir, achamos a frequência onde o ganho do sistema sem compensador é igual a ⎛ 1 ⎞ ⎛ 1 ⎞ -20log ⎜ ⎟ = - 4,425dB. ⎟ = -20log ⎜ 0,361 ⎝ α⎠ ⎝ ⎠ Para achar a frequência onde o ganho é - 4,425dB, substitui-se w = jν na expressão de G ( w) , obtendo G ( jν ) = ⎛ ν ⎞ 2 1+ ⎜ ⎟ ⎝ 300 ⎠ 2 ⎛ν ⎞ 1+ ⎜ ⎟ ⎝ 10 ⎠ ν 1 +ν 2 2 . Por tentativa e erro, acha-se que com ν = 1,7 , o ganho é aproximadamente – 4,4 dB. Escolhemos, portanto esta frequência para a nova frequência de “crossover”, ν c . 1 1 , e, portanto, τ = = 0,979, donde ατ = 0,3534 . Ora, ν c = 1, 7 = ατ 1, 7 α 1+τ w Portanto o compensador “lead” é GD ( w) = . (4-40) 1 + ατ w As curvas de ganho e de fase tanto de GD ( jν ) como as da função de transferência de malha aberta GD ( jν )G ( jν ) aparecem no diagrama de Bode em linhas cheias. E do diagrama se conclui que a margem de fase é 500 e a margem de ganho é 14 dB, satisfazendo ao desejado no enunciado. 2 z −1 O controlador dado em (4-40) tem que ser re-escrito no plano z através de w = = T z +1 35 ⎛ z −1 ⎞ 1 + 0,979 ⎜ 10 ⎟ z −1 ⎝ z + 1 ⎠ = 2,3798 z − 1,9387 . 10 . Então, temos GD ( z ) = z +1 z − 0,5589 ⎛ z −1 ⎞ 1 + 0,3534 ⎜ 10 ⎟ ⎝ z +1⎠ Donde que a função de transferência em malha aberta é: 2,3798 z − 1,9387 0, 03746( z + 0,9356) GD ( z )G ( z ) = z − 0,5589 ( z − 1)( z − 0,8187) 0, 0891z 2 + 0, 0108 z − 0, 0679 = 3 . E a função de transferência do SMF é: z − 2,3776 z 2 + 1,8352 z − 0, 4576 C ( z) 0, 0891z 2 + 0, 0108 z − 0, 0679 = 3 R ( z ) z − 2, 2885 z 2 + 1,846 z − 0,5255 0, 089( z + 0,9357)( z − 0,8145) = . ( z − 0,8126)( z − 0, 7379 − j 0,3196)( z − 0, 7379 + j 0,3196) Observe-se que o zero em 0,8145 “quase” cancela o pólo em 0,8126 (um quase cancelamento que não preocupa, porque o modo é estável) e assim os pólos complexos conjugados atuam como pólos dominantes, o sistema comportando-se aproximadamente como um sistema de segunda ordem. Para obter a resposta no domínio do tempo, podemos usar o MATLAB. A resposta ao degrau unitário pode ser obtida com os comandos do MATLAB Program 4-2 abaixo. O resultado aparece na Figura 4-38 abaixo. Da figura, obtemos uma ultrapassagem (“overshoot”) de aproximadamente 20% e um tempo de assentamento (“settling time”) de cerca de 4 seg. 36 4-6 MÉTODO DE PROJETO ANALÍTICO A razão principal da desvantagem dos controladores analógicos é que todos eles, sejam pneumáticos, hidráulicos, etc., têm limitações físicas. Tais limitações podem ser quase completamente ignoradas quando se projetam controladores digitais. Assim, muitos esquemas de controle que eram impossíveis com controladores analógicos, tornaram-se possíveis com controladores digitais. Nesta seção estudaremos os controladores “deadbeat”, que fazem com que a resposta do SMF apresente erro nulo em regime permanente, tempo mínimo de assentamento e ausência de oscilações entre os instantes de amostragem depois que se atinge o regime permanente. Considere o sistema da Figura 4-39(a) abaixo. Deseja-se projetar um controlador digital GD ( z ) de modo que o SMF responda com o menor tempo de assentamento possível, com erro nulo em regime permanente, seja a entrada um degrau, uma rampa ou uma parábola. Mais ainda, deseja-se que não existam oscilações entre os instantes de amostragem depois que a resposta do sistema atingir o regime permanente. Definamos a transformada z da planta precedida do segurador de ordem zero: ⎡1 − e −Ts ⎤ G( z) = Z ⎢ G p ( s ) ⎥ . A função de transferência de malha aberta se torna ⎣ s ⎦ GD ( z )G ( z ) , conforme mostrado na figura 4-39(b). Suponhamos que se queira que a função de transferência em malha fechada seja F ( z ) , GD ( z )G ( z ) C ( z) dada. Então, temos: F ( z ) = = . (4-41) R( z ) 1 + GD ( z )G ( z ) a0 z N + a1 z N −1 + ... + aN , ou zN F ( z ) = a0 + a1 z −1 + ... + aN z − N , Seja F ( z ) = com N a determinar. De (4-41), temos: GD = (4-42) F ( z) . G ( z )[1 − F ( z )] (4-43) 37 O controlador deve ser fisicamente realizável, o que impõe certas condições: 1. O grau do numerador deve ser menor ou igual ao grau do denominador, pois do contrário, seria necessário conhecer as entradas futuras para produzir a resposta presente. 2. Se a planta G p ( s ) tiver algum retardo e − Ls , então o SMF deve ter, pelo menos, o mesmo retardo, pois do contrário, a saída do SMF teria que responder antes de uma entrada ser dada, o que é impossível para um sistema fisicamente realizável. 3. Se G ( z ) for expandido em uma série em z −1 , o termo de potência mais baixa da expansão de F ( z ) em z −1 deve ser pelo menos tão grande quanto a de G ( z ) : ver (441). Assim, por exemplo, se a expansão da série de G ( z ) começar com o termo em z −1 , então o primeiro termo da expansão de F ( z ) em (4-42) deve ser zero, ou seja, a0 = 0, isto é, a expansão de F ( z ) será a1 z −1 + a2 z −2 + ... + aN z − N , onde N ≥ n , sendo n a ordem da planta. Além das condições de realizabilidade física, é preciso prestar atenção à estabilidade do SMF. Como sabemos, estabilidade implica (condição necessária, mas não suficiente!) que não haja cancelamento de pólos e zeros instáveis no produto das funções de transferência da planta, segurador e controlador. Investiguemos agora o que acontece com F ( z ) quando G ( z ) tiver um pólo instável ou criticamente estável, isto é, um pólo fora ou sobre o círculo unitário. Seja α este pólo e G ( z) , sendo que G1 ( z ) não inclui termo que cancele z − α . definamos G ( z ) = 1 z −α Então a função de transferência do SMF é dada, tendo em vista (4-41), por G ( z) GD ( z ) 1 z −α . F ( z) = (4-44) G1 ( z ) 1 + GD ( z ) z −α 1 z −α Além disso, 1 − F ( z ) = = , ou seja, α é um zero da G1 ( z ) z − α + GD ( z )G1 ( z ) 1 + GD ( z ) z −α função de transferência do erro (diferença entre o sinal de entrada no SMF e a resposta da planta), fato bem conhecido do curso anterior. Observe-se ainda de (4-44) que se G ( z ) tiver um zero fora ou sobre o círculo unitário, ele não pode ser cancelado (pois isto desestabilizaria o SMF), o que significa que todo zero de G ( z ) que esteja fora ou sobre o círculo unitário, aparece em F ( z ) . Procedamos com o projeto. Da figura 4-39(b), temos: E ( z ) = R ( z ) − C ( z ) = R ( z )[1 − F ( z )] . (4-45) 1 Para uma entrada em degrau unitário, temos R( z ) = ; 1 − z −1 Tz −1 para uma entrada em rampa unitária, temos R( z ) = ; (1 − z −1 ) 2 e para uma entrada em parábola unitária, isto é, r (t ) = 0,5t 21(t ) , temos: T 2 z −1 (1 + z −1 ) . 2(1 − z −1 )3 E assim, em geral, a transformada z de entradas de forma polinomial é: R( z ) = 38 P( z ) , (4-46) (1 − z −1 ) q +1 onde P( z ) é um polinômio em z −1 . Note-se que para um degrau unitário, temos P( z ) = 1 e q = 0; para uma rampa unitária, temos P( z ) = T z −1 e q = 1 e para uma parábola unitária, temos P( z ) = 0,5T 2 z −1 (1 + z −1 ) e q = 2. P( z )[1 − F ( z )] Substituindo esta em (4-45), temos: E ( z ) = . (4-47) (1 − z −1 ) q +1 Para assegurar que a resposta do sistema atinja o regime permanente em número finito de passos, mantendo então o erro igual a zero, E ( z ) deve ser um polinômio em z −1 com um número finito de termos. Então, em vista de (4-47), escolhemos F ( z ) tal que 1 − F ( z ) = (1 − z −1 ) q +1 N ( z ) , (4-48) −1 onde N ( z ) é um polinômio em z com um número finito de termos. Consequentemente, E ( z ) = P ( z ) N ( z ) . (4-49) Finalmente, substituindo isto em (4-43), temos: F ( z) GD ( z ) = . (4-50) G ( z )(1 − z −1 ) q +1 N ( z ) Com este compensador, obtém-se erro nulo nos instantes de amostragem após um número finito de instantes. Quanto aos tempos entre os instantes de amostragem, para garantir que o erro também seja nulo, isto é, para que não haja “ondulações” entre os instantes de amostragem, é preciso que c(t ≥ nT ) = constante, para entrada em degrau; c(t ≥ nT ) = constante, para entrada em rampa; (4-50*) c(t ≥ nT ) = constante para entrada em parábola. Para garantir estas condições, observe-se que a planta é de tempo contínuo, portanto o controle que aciona a planta, isto é, u (t ) , deve ser ou constante ou monotonicamente crescente, ou decrescente, em regime permanente. Alguns comentários: 1. Tendo em vista que F ( z ) é um polinômio em z −1 , fica claro que todos os pólos do SMF estão em z = 0. Estes múltiplos pólos na origem são muito sensíveis à variação de parâmetros. Efetivamente, o sistema de controles “dead-beat” não é “robusto”, ou seja, a perturbação de parâmetros destrói a solução “dead-beat”, o erro tendendo a zero, mas assintoticamente, e não em número finito de passos. 2. Observe-se que um sistema que apresente ótimo tempo de assentamento e erro nulo para um certo tipo de entradas, pode revelar um desempenho muito ruim quando se muda o tipo de entrada. É neste contexto que se torna importante o estudo do chamado “controle ótimo”. Mas seja dito também que em número muito grande de processos industriais, a solução do controle ótimo é dispensável, precisamente porque o tipo de entrada é conhecido. 3. O período de amostragem, T, não entrou nos cálculos deste problema. Mas é claro que quanto menor T, mais rapidamente o erro atingirá o valor nulo. R( z ) = 39 Exemplo 4-13: Considere o problema da mesma figura 4-39(a) acima, onde 1 . Achar um compensador GD ( z ) tal que o SMF exiba uma resposta G p ( s) = s ( s + 1) “dead-beat” para um degrau de entrada. O período de amostragem é T = 1 seg. A seguir, usando este mesmo compensador, calcule a resposta do sistema a uma rampa de entrada. Solução: Seguindo os passos do estudo teórico acima, calculemos ⎡1 − e −Ts ⎡ 1 ⎤ 1 ⎤ −1 G( z) = Z ⎢ ⎥ = (1 − z )Z ⎢ 2 ⎥ ⎣ s ( s + 1) ⎦ ⎣ s s ( s + 1) ⎦ ⎡ z −1 ⎤ 0,3679(1 + 0, 7181z −1 ) z −1 1 1 = . (4.51) = (1 − z ) ⎢ − + −1 2 −1 1 − 0,3679 z −1 ⎥⎦ (1 − z −1 )(1 − 0,3679 z −1 ) ⎣ (1 − z ) 1 − z Passamos ao diagrama de blocos da figura (b), definindo a função de transferência do C ( z) GD ( z )G ( z ) = . Agora observe-se de (4-51) que se G ( z ) for SMF: F ( z ) = R( z ) 1 + GD ( z )G ( z ) −1 expandido em uma série em z −1 , o primeiro termo da série será 0,3679 z −1 . Portanto F ( z ) deve começar com um termo em z −1 . Reportemo-nos à eq. (4-42), lembrando que N ≥ n . Como a planta é de 2ª. ordem, tentemos: F ( z ) = a1 z −1 + a2 z −2 . (4-52) Como a entrada é um degrau, temos da eq. (4-48): 1 − F ( z ) = (1 − z −1 ) N ( z ) . (4-53) Como vimos, tendo G ( z ) um pólo em z = 1, a estabilidade do SMF exige que 1 − F ( z ) tenha um zero em z = 1. Mas de (4-53) vemos que esta condição já é satisfeita. Agora, observe-se que a saída de um segurador de ordem zero é constante entre os instantes de amostragem; em consequência, a 1ª. condição de (4-50*) é satisfeita. Donde que: U ( z ) = b0 + b1 z −1 . (4-53*) Ora, da figura (b) é claro que: U ( z ) = C ( z) G( z) = E tendo em vista (4-51), temos: U ( z ) = F ( z ) C ( z ) R( z ) R( z ) G ( z ) = F ( z) R( z ) G( z) . 1 (1 − z −1 )(1 − 0,3679 z −1 ) 1 − z −1 0,3679(1 + 0, 7181z −1 ) z −1 (1 − 0,3679 z −1 ) . (4-53**) 0,3679(1 + 0, 7181z −1 ) z −1 Ora, para que U ( z ) seja uma série com apenas dois termos, conforme (4-53*), é (4-54) preciso que F ( z ) = (1 + 0, 7181z −1 ) z −1 F1 , = F ( z) onde F1 é uma constante. Então, de (4-53**), U ( z ) = 2,1781(1 − 0,3679 z −1 ) F1 . (4-55) Agora vamos determinar N ( z ) , F ( z ) e F1 . Substituindo (4-52) em (4-53), temos 1 − a1 z −1 − a2 z −2 = (1 − z −1 ) N ( z ) . Ora, se dividirmos esta eq. por 1 − z −1 , o quociente do lado esquerdo é 1 + (1 − a1 ) z −1 = N ( z ) (4-56) e o resto é (1 − a1 − a2 ) z −2 . Ora, o resto deve ser nulo, o que implica 1 − a1 − a2 = 0. (4-57) 40 Mas das eqs. (4-52) e (4-54), temos F ( z ) = a1 z −1 + a2 z −2 = (1 + 0, 7181z −1 ) z −1 F1 . Portanto, a1 + a2 z −1 = (1 + 0, 7181z −1 ) F1 . Dividindo-se esta eq. por 1 + 0, 7181z −1 , obtém-se no lado esquerdo o quociente a1 e o resto (a2 − 0, 7181a1 ) z −1 . Igualando o quociente com F1 e zerando o resto, temos F1 = a1 e a2 − 0, 7181a1 = 0. Desta última e de (4-57), temos a1 = 0,582 e a2 = 0,418. Portanto, F ( z ) = 0,582 z −1 + 0, 418 z −2 e F1 = 0,582 , (4-58) (4-59) sendo que a eq. (4-56) nos dá N ( z ) = 1 + 0, 418 z −1 . (4-60) A função de transferência de pulso do controlador digital é determinada a partir de (4-50), com (4-51), (4-54) e (4-60): (1 + 0, 7181z −1 ) z −1 (0,582) F ( z) GD ( z ) = = G ( z )(1 − z −1 ) N ( z ) 0,3679(1 + 0, 7181z −1 ) (1 − z −1 )(1 + 0, 418 z −1 ) (1 − z −1 )(1 − 0,3679 z −1 ) 1,582 − 0,582 z −1 . 1 + 0, 418 z −1 Com este controlador digital, obtém-se a seguinte função de transferência de pulso do C ( z) 0,582( z + 0, 7181) SMF: = F ( z ) = 0,582 z −1 + 0, 418 z −2 = . R( z ) z2 E a resposta a um degrau unitário é obtida por 1 C ( z ) = F ( z ) R( z ) = (0,582 z −1 + 0, 418 z −2 ) = 0,582 z −1 + z −2 + z −3 + z −4 + .... . E, −1 1− z portanto, c(0) = 0; c(1) = 0,582; c(k ) = 1 para k = 2;3; 4;... = Por outro lado, de (4-55) com F1 = 0,582 , temos U ( z ) = 2,1781× 0,582(1 − 0,3679 z −1 ) = 1,582 − 0,582z −1 . Portanto, o controle u (k ) torna-se nulo para k ≥ 2 , como desejável e, consequentemente, não há ondulações entre os intervalos de amostragem na resposta, depois de atingido o regime permanente. A figura 4-40(a) abaixo mostra c(k ) e u (k ) versus k e c(t ) versus t no caso de a entrada ser um degrau unitário. 41 Vamos agora investigar, como requerido no enunciado, o comportamento da resposta do sistema a uma entrada em rampa unitária: z −1 C ( z ) = F ( z ) R ( z ) = (0,582 z −1 + 0, 418 z −2 ) (1 − z −1 ) 2 = 0,582 z −2 + 1,582 z −3 + 2,582 z −4 + 3,582 z −5 + ... Por sua vez, o controle é dado, em vista das eqs. (4-51) e (4-59) por: C ( z ) F ( z ) R( z ) F ( z ) z −1 0,582 z −1 + 0, 418 z −2 z −1 = = = U ( z) = G( z ) G( z ) G( z ) (1 − z −1 ) 2 0,3679(1 + 0, 7181z −1 ) z −1 (1 − z −1 ) 2 (1 − z −1 )(1 − 0,3679 z −1 ) z −1 = (1,582 − 0,582 z ) = 1,582 z −1 + z −2 + z −3 + z −4 + ... −1 2 (1 − z ) Ou seja, o sinal u (k ) torna-se constante a partir de k = 2, o que implica que a resposta em regime permanente não terá oscilações, depois de atingido o regime permanente. A figura 4-40(b) acima mostra c( k ) e u ( k ) versus k e c(t ) versus t para o caso de a entrada ser uma rampa unitária. Observe-se da primeira figura que há um erro na 1 resposta, mas que se mantém constante. E este erro é, como sabemos, ess = , onde Kv −1 ⎡1 − z −1 ⎤ ⎡ ⎤ F ( z) = K v = lim ⎢ GD ( z )G( z ) ⎥ = lim ⎢(1 − z −1 ) − 1 z →1 (1 − z ) N ( z ) ⎥⎦ ⎣ T ⎦ z →1 ⎣ 0,582 z −1 + 0, 418 z −2 lim = 0, 7052 , donde ess = 1, 418 , como indicado na 1ª. figura de 4z →1 1 + 0, 418 z −1 40(b). Exemplo 4-14: Considere o mesmo problema que o anterior, agora a constante de velocidade K v é especificada, igual a 4 seg −1 . (Por conta disto, como veremos, o tempo de assentamento será maior). Mas, além disso, desejamos que o tempo de assentamento seja o mínimo possível que satisfaça a estas especificações. O período de amostragem é T = 1. Projetar um controlador digital que satisfaça a estas especificações. 42 Solução: A transformada z da planta precedida pelo segurador de ordem zero já foi 0,3679(1 + 0, 7181z −1 ) z −1 obtida no exemplo anterior em (4-51): G( z ) = . E tal como no (1 − z −1 )(1 − 0,3679 z −1 ) GD ( z )G ( z ) C ( z) = . E como o primeiro termo da exemplo anterior, temos F ( z ) = R( z ) 1 + GD ( z )G ( z ) expansão de GD ( z ) é 0,3679z −1 , F ( z ) deve também começar com um termo em z −1 : F ( z ) = a1 z −1 + a2 z −2 + ... + aN z − N , onde N ≥ n = 2 . Em vista das restrições adicionais deste problema, vamos tentar N = 3. (No exercício anterior resolvemos o problema com N = 2). Então, seja F ( z ) = a1 z −1 + a2 z −2 + a3 z −3 . (4-61) (Se não obtivermos resultado satisfatório, tentaremos N > 3). Da equação (4-48), temos, em vista do fato que a entrada é um degrau: 1 − F ( z ) = (1 − z −1 ) N ( z ) . (4-62) Por outro lado, do final do problema anterior e do enunciado deste, temos ⎡1 − z −1 ⎤ ⎡ ⎤ F (1) F ( z) = K v = lim ⎢ =4. GD ( z )G( z ) ⎥ = lim ⎢(1 − z −1 ) −1 → z →1 1 z (1 − z ) N ( z ) ⎥⎦ N (1) ⎣ ⎣ T ⎦ Mas de (4-62) temos F (1) =1. 1 Disto e da expressão acima, temos K v = = 4. (4-63) N (1) Tendo em vista que se requer que a resposta do sistema não apresente oscilações entre os intervalos de amostragem depois de atingido o regime permanente, devemos ter U ( z ) = b0 + b1 z −1 + b2 z −2 + b( z −3 + z −4 + z −5 + ...) . Mas a planta tem um integrador, portanto b = 0, ou seja, U ( z ) = b0 + b1 z −1 + b2 z −2 . C ( z ) C ( z ) R( z ) R( z ) = = F ( z) Mas da fig. 4-39 (b), temos U ( z ) = G( z ) R( z ) G( z ) G( z ) 1 − 0,3679 z −1 = F ( z) . 0,3679(1 + 0, 7181z −1 ) z −1 Para que U ( z ) seja uma série em z −1 com três termos, F ( z ) deve ter a seguinte forma: F ( z ) = (1 + 0, 7181z −1 ) z −1 F1 ( z ) , (4-64) onde F1 ( z ) deve ser um polinômio do 1º. grau em z −1 . E, portanto de U ( z ) acima, temos U ( z ) = 2, 7181(1 − 0,3679 z −1 ) F1 ( z ) . (4-65) Ora, de (4-61) e (4-62), temos 1 − F ( z ) = 1 − a1 z −1 − a2 z −2 − a3 z −3 = (1 − z −1 ) N ( z ) . Se dividirmos esta eq. por 1 − z −1 , o quociente de 1 − a1 z −1 − a2 z −2 − a3 z −3 é 1 + (1 − a1 ) z −1 + (1 − a1 − a2 ) z −2 e o resto é (1 − a1 − a2 − a3 ) z −3 . Então, N ( z ) = 1 + (1 − a1 ) z −1 + (1 − a1 − a2 ) z −2 e o resto deve ser nulo, ou seja, 1 − a1 − a2 − a3 = 0. (4-66) (4-67) observando-se que de (4-63) devemos ter N (1) = 1/ 4 . Portanto, substituindo z −1 =1 em (4-68) (4-66), temos 2a1 + a2 = 2,75. Além disso, a eq. (4-64) pode ser re-escrita como F ( z ) = a1 z −1 + a2 z −2 + a3 z −3 = (1 + 0, 7181z −1 ) z −1 F1 ( z ) , ou seja, (4-68*) a1 + a2 z −1 + a3 z −2 = (1 + 0, 7181z −1 ) F1 ( z ) . A divisão desta última eq. por 1 + 0, 7181z −1 dá o quociente a1 + (a2 − 0, 7181a1 ) z −1 e o 43 resto igual a [a3 − 0, 7181(a2 − 0, 7181a1 )]z −2 . Ora, então, F1 ( z ) = a1 + (a2 − 0, 7181a1 ) z −1 e (4-68**) a3 − 0, 7181(a2 − 0, 7181a1 ) = 0. (4-69) As eqs. (4-67), (4-68) e (4-69) nos dão: a1 = 1, 26184 , a2 = 0, 22633 e a3 = −0, 48816 . E, portanto, de (4-68*), F ( z ) = 1, 26184 z −1 + 0, 22633z −2 − 0, 48816 z −3 , enquanto que de (4-68**), vem F1 ( z ) = 1, 26184 − 0, 67979 z −1 . E por outro lado, a eq. (4-66) nos dá N ( z ) = 1 − 0, 26184 z −1 − 0, 48817 z −2 . Com estes resultados, obtemos de (4-50): (1 − 0,5387 z −1 )(1 − 0,3679 z −1 ) GD ( z ) = 3, 4298 (1 − 08418 z −1 )(1 + 0,5799 z −1 ) e a resposta é: C ( z ) = 1, 2618 z −1 + 1, 4882 z −2 + z −3 + z −4 + ... , ou seja, c(1) = 1, 2628 , c(2) = 1, 4882 , c(k ) = 1 para k = 3; 4;5;... , donde se vê que a resposta ao degrau unitário tem uma ultrapassagem máxima de aproximadamente 50% e o tempo de assentamento é 3 seg. Observe-se que da eq. (4-65) nós temos: U ( z ) = 3, 4298 − 3,1096 z −1 + 0, 6798 z −2 , ou seja, o controle u (k ) torna-se nulo para k ≥ 3 , conforme a hipótese. Consequentemente, não há ondulações entre amostragens, depois de alcançado o regime permanente. A Figura 4-41 abaixo mostra c(k ) versus k , u (k ) versus k e u (t ) versus t para uma entrada em degrau unitário. Observe-se que a tentativa N = 3 na eq. (4-61) revelou-se satisfatória. 44 Vamos agora investigar a resposta do sistema a uma rampa unitária. Obtemos, depois de muitos cálculos: C ( z ) = 1, 2618 z −2 + 2, 75 z −3 + 3, 75 z −4 + ... , enquanto que: U ( z ) = 3, 4298 z −1 − 3, 202 z −2 + z −3 + z −4 + z −5 + ... , ou seja, o sinal de controle torna-se constante para k > 2, o que implica que a resposta do sistema não exibirá oscilações entre amostragens depois que o sistema atinge o regime permanente. A Figura 4-42 abaixo mostra a resposta do sistema e o controle, sendo que este é dado tanto nos instantes de amostragem, como em tempo contínuo. Seja notado ainda que o erro em regime permanente é ess = 1/ K v = 1/ 4 , como indicado na 1ª. figura. Comparando este exemplo, 4-14, com o anterior, 4-13, verificamos que o 2º. melhora a resposta à rampa unitária a expensas do tempo de assentamento, isto é, precisa-se de uma amostragem a mais para se atingir o regime permanente. Mas quanto à resposta ao degrau, o primeiro é melhor, pois tem um tempo de assentamento menor e não tem ultrapassagem. 45 Problema com soluções: Problema A-4-1: Mostre que a configuração dos pólos perto de z = 1 no plano z é similar à dos pólos perto de s = 0 no plano s. Solução: z = eTs . Perto da origem no plano s temos z = eTs = 1 + Ts + 0,5T 2 s 2 + .... , donde z − 1 ≈ Ts , provando o resultado. Problema A-4-2: Considere o sistema descrito por: y (k ) − 0, 6 y (k − 1) − 0,81y (k − 2) + 0, 67 y (k − 3) − 0,12 y (k − 4) = x(k ) , onde y é a resposta e x é a entrada. Estudar a estabilidade do sistema pelo método de Jury. Solução: A função de transferência de pulso do sistema é: z4 Y ( z) 1 = = . X ( z ) 1 − 0, 6 z −1 − 0,81z −2 + 0, 67 z −3 − 0,12 z −4 z 4 − 0, 6 z 3 − 0,81z 2 + 0, 67 z − 0,12 Portanto o polinômio característico é: P ( z ) = z 4 − 0, 6 z 3 − 0,81z 2 + 0, 67 z1 − 0,12 . Aplicando o critério de Jury para estabilidade, temos: 1. −0,12 < 1 . OK. 2. P (1) = 1 − 0, 6 − 0,81 + 0, 67 − 0,12 = 0,14 > 0 . OK. 3. P (−1) = 1 + 0, 6 − 0,81 − 0, 67 − 0,12 = 0 , a condição não sendo satisfeita, pois deveria ser > 0. Mas vemos que o sistema tem um pólo em z = -1. −0,12 1 −0,12 0, 67 4. b3 = = −0,9856 e b2 = = −0,598 . Donde b3 > b2 . OK. 1 −0,12 1 −0, 6 5. c2 = b3 b0 b0 b3 = −0,9856 −0,598 −0,598 −0,9856 = 0, 6138 , 46 b2 −0,9856 −0,5196 = = −0,5834 . Ora c2 > c0 . OK. b1 −0,598 −0,9072 Portanto concluímos que todas as condições de Jury, à exceção da 3ª, são satisfeitas. Pode-se verificar que o pólo em -1 tem grau de multiplicidade 1 e portanto o sistema é criticamente estável. c0 = b3 b0 Problema A-4-3: Considere a seguinte eq. característica P ( z ) = z 3 − 1,3z 2 − 0, 08 z + 0, 24 = 0 . Determine se alguma(s) raiz(es) da eq. está fora do círculo unitário. Usar a transformação bilinear e o critério de Routh. ⎛ w +1⎞ ⎛ w +1⎞ ⎛ w +1⎞ Solução: ⎜ ⎟ − 1,3 ⎜ ⎟ − 0, 08 ⎜ ⎟ + 0, 24 = 0 , ou seja, após as operações ⎝ w −1 ⎠ ⎝ w −1 ⎠ ⎝ w −1 ⎠ óbvias, temos: −0,14w3 + 1, 06w2 + 5,1w + 1,98 = 0 . Como os coeficientes do polinômio não têm o mesmo sinal, já podemos conclui que este polinômio não é Hurwitz, isto é, não tem todas as raízes na parte boa do plano complexo, isto é, não tem todas as raízes no semi-plano aberto da esquerda. Mas o critério de Routh permite determinar quantas são as raízes no semi-plano da direita. Dividindo toda a eq. acima por -0,14 , temos: w3 − 7,571w2 − 36, 43w − 14,14 = 0 , (4-71) 3 cujo tablóide de Routh é: 2 w3 w2 w w0 1 −36, 43 −7,571 −14,14 . 0 −38,3 0 −14,14 Recorda-se que o termo relativo a w é −7, 571 × ( −36, 43) + 14,14 −7, 571 = −38, 29 ≅ −38, 3 , ao −38,3 × (−14,14) = −14,14 −38,3 Como se vê, há uma troca de sinal na segunda coluna, donde se conclui que há uma raiz no semi-plano da direita do plano w, e, portanto uma raiz fora do círculo unitário no plano z. passo que o termo correspondente a w0 é Y ( z) 0, 787 z −1 Problema A-4-4: Considere o sistema dado por = = U ( z ) 1 − 0,8195 z −1 + 0, 6065 z −2 0, 787 z . O tempo de amostragem é T = 0,5 seg. Usando o MATLAB, 2 z − 0,8195 z + 0, 6065 plotar a resposta do sistema a uma rampa unitária até k = 20. Solução: ver o MATLAB Program 4-3 abaixo, seguido da resposta na Figura 4-43. 47 Problema A-4-5: Demonstrar que se a eq. característica de um SMF for KB( z ) 1+ = 0 , onde B( z ) e A( z ) são coprimos e não contêm K como fator, então os A( z ) pontos de “breakaway” e “break-in” podem ser determinados pelas raízes de dK A '( z ) B( z ) − A( z ) B '( z ) =− = 0 , onde ' indica derivada com relação a z. dz B2 ( z) (4-72) Prova: Re-escrevendo a eq. característica: f ( z ) = A( z ) + KB( z ) = 0 . Suponha que a eq. acima tenha uma raiz múltipla de ordem r. Seja z1 esta raiz. Então, temos: f ( z ) = ( z − z1 ) r ( z − z2 )...( z − z p ) . E é claro que df ( z ) = 0 . Isto significa que dz z = z1 48 as raízes múltiplas de f ( z ) satisfazem à eq. df ( z ) = 0 , ou seja, dz df ( z ) = A '( z ) + KB '( z ) = 0 , (4-73) dz A '( z ) . Este valor de K conduz a múltiplas raízes da eq. característica. donde K = − B '( z ) A '( z ) Substituindo este valor de K em (4-72), temos f ( z ) = A( z ) − B ( z ) = 0 , ou seja, B '( z ) A '( z ) B( z ) − A( z ) B '( z ) = 0. (4-74) Quando esta eq. é resolvida, obtêm-se os valores de z onde ocorrem múltiplas raízes. A( z ) , e, portanto, Por outro lado, da eq. (4-72), nós temos K = − B( z ) dK A '( z ) B( z ) − A( z ) B '( z ) =− . Mas quando igualamos isto a zero, obtemos a eq. dz B2 ( z) (4-74). Portanto, os pontos breakaway e break-in podem são determinados a partir de dK = 0 , concluindo aprova. Mas deve ser notado que nem todas as soluções desta eq. dz são pontos breakaway ou break-in. Será se o valor correspondente de K for real. Problema A-4-7: Obtenha o lugar das raízes (root locus) no plano z do diagrama de blocos na Figura 4-45 abaixo para os seguintes períodos de amostragem: T = 1; 2 e 4 seg. Solução: Reportando-nos ao exemplo 3-5, em que não havia K no numerador da planta, K [(T − 1 − e −T ) z −1 + (1 − e −T − Te −T ) z −2 temos G ( z ) = . (4-75) (1 − z −1 )(1 − e −T z −1 ) 1. Para T = 1, da eq. de cima, temos G ( z ) = K [(1 − 1 − e −1 ) z −1 + (1 − e −1 − e −1 ) z −2 (1 − z −1 )(1 − e −1 z −1 ) 0,3679 K ( z + 0, 7181) . (4-75*) ( z − 1)( z − 0,3679) Para a construção do root locus, utilizam-se as regras, (re)vistas depois de (4-20). Em primeiro lugar, plotam-se os pólos e os zeros da função de transferência, conforme a = 49 Figura 4-46(a) abaixo, observando-se que a função tem um zero no infinito. Consequentemente, o root locus tem dois ramos. Para K = 0, os pólos do SMF coincidem com os do sistema em malha aberta, que são os da função de transferência (4-75*). À medida que K aumenta, os pólos caminham um para a direita e o outro para a esquerda no eixo real, de acordo com a 3ª. regra, isto é, cada ponto sobre o eixo real, para pertencer a um ramo do root locus, deve ter à sua direita um número impar de pólos mais zeros, até se encontrarem no ponto breakaway, calculado de acordo com a 5ª. regra, deixando então o eixo real, numa curva que é simétrica com relação ao eixo real (pois os pólos ocorrem aos pares conjugados), até se encontrarem de novo no eixo real, no ponto break-in, também calculado de acordo com a 5ª. regra, caminhando um ramo para a direita até encontrar o zero finito e o outro para a esquerda, para o infinito, observando-se de novo a 3ª. regra, mencionada acima. Obtemos 0,6479 para o ponto de breakaway e – 2,0841 para o break-in. De acordo com a 6ª. regra, calculam-se os ângulos de partida (do breakaway) e de chegada (no break-in) no eixo real. Obtém-se 900 em ambos os casos. Observe-se ainda que, de acordo com a 8ª. regra, todo ponto 50 ( z − 1)( z − 0,3679) , a qual é obtida a 0,3679( z + 0, 7181) partir da eq. característica 1 + KG ( z ) = 0 , que também pode ser usada na construção do root locus. A partir disto pode-se verificar, ponto por ponto, que os pontos do root locus fora do eixo real formam um círculo. Seja z = x + jy . O círculo unitário tem por eq. x 2 + y 2 = 1 , enquanto o root locus, com centro em -0,7181 e raio igual a 0,7181 + 0,3679 = 1,086 tem por eq. ( x + 0, 7181) 2 + y 2 = 1,086 2 . Destas duas eqs. achamos os valores de x e y em que os círculos se interceptam e, substituindo no valor de K acima, encontramos K = 2,3925 , que é o ganho crítico de estabilidade conforme indicado na figura (a). Ou seja, para K > 2,3925 , o SMF é instável. 1,1353K ( z + 0,5232) 2. Para T = 2, temos de (4-75): G ( z ) = . O root locus é mostrado ( z − 1)( z − 0,1353) na fig. (b) acima. 3, 0183K ( z + 0,301) 3. Finalmente para T = 4, temos da eq. (4-75): G ( z ) = . O root ( z − 1)( z − 0, 0183) locus está na figura (c). Observe-se que, neste caso, o SMF é estável para todo K. do root locus satisfaz à eq. (4-24), , isto é, K = Problema A-4-8: Seja o sistema de controles da Figura 4-47 abaixo. O período de amostragem é T = 1 seg. Projetar um controlador PI tal que os pólos dominantes do SMF tenham um fator de amortecimento ς igual a 0,5 e o número de amostras por ciclo de oscilações senoidais amortecidas igual a 10. Obter a resposta do sistema a um degrau unitário de entrada. Solução: ⎡1 − e −Ts e −2 s ⎤ 1 ⎤ (1 − e −1 ) z −1 −1 −2 ⎡ −1 −2 = − = − G( z) = Z ⎢ (1 z ) z Z (1 z ) z ⎥ ⎢ s ( s + 1) ⎥ (1 − z −1 )(1 − e −1 z −1 ) ⎣ ⎦ ⎣ s s + 1⎦ 0, 6321z −3 0, 6321 = = 2 . O controlador digital PI tem, como sabemos, a −1 1 − 0,3679 z z ( z − 0,3679) K z − K p + KI z 1 seguinte função de transferência GD ( z ) = K p + K I = p −1 z −1 1− z Kp z− (K + KI )z − K p K p + KI = p = (K p + KI ) . (4-75**) z −1 z −1 51 E, portanto, a função de transferência em malha aberta é ⎛ Kp ⎞ (K p + KI ) ⎜ z − ⎟ ⎜ K p + K I ⎟⎠ 0, 6321 ⎝ . GD ( z )G ( z ) = 2 z −1 z ( z − 0,3679) (4-75***) A seguir plotamos no plano complexo os pólos do sistema de malha aberta, conforme (4-75***), na Figura 4-48 abaixo, o zero finito sendo desconhecido por enquanto, pois depende de K p e K I . Tendo em vista que queremos 10 amostras por ciclo de oscilações senoidais amortecidas, o pólo dominante em malha fechada no semi-plano superior deve ficar num ângulo de 360 (= 3600 ÷ 10 ) = 2π /10 , conforme indicado na figura. Re-escrevemos as eqs. (4-1) e (4-2): ⎛ −2πς ω ⎞ ω d ⎟ e arg[ z ] = 2π d . (4-1bis) e (4-2bis) z = exp ⎜ 2 ⎜ 1 − ς ωs ⎟ ω s ⎝ ⎠ Então desta última, temos, para o pólo dominante: 2π ωd ω = 2π /10 , ou seja, d = 0,1. ωs ωs ⎛ −2π (0,5) 1 ⎞ Visto que ς = 0,5, temos da eq. (4-1), repetida acima: z = exp ⎜ ⎟ ⎜ 1 − 0,52 10 ⎟ ⎝ ⎠ −0,3628 = 0,6958 , o que no permite plotar o pólo dominante P na figura, ou seja, =e z = 0, 6958arg(360 ) = 0,5629 + j 0, 409 . Ora, de acordo com a 6ª. regra, que se aplica a qualquer ponto do root locus, e não somente aos pontos complexos de partida (breakaway) e de chegada (break-in), a soma dos ângulos do ponto P aos pólos do sistema em malha aberta menos a soma dos ângulos aos zeros finitos deve somar 1800 . Então, tendo em vista que o pólo na origem é duplo, o ângulo ao zero finito do sistema em malha aberta é: 360 + 360 + 136,90 + 64, 620 − 1800 = 93,520 , conforme indicado na figura. E isto determina a posição do zero em 0,5881 sobre o eixo real. Por conseguinte, de (4- 52 75**), Kp K p + KI = 0,5881. (4-76) z − 0,5881 , onde K = K p + K I . O ganho K é z −1 z − 0,5881 0, 6321 = 1, determinado pela condição de magnitude: K 2 z − 1 z ( z − 0,3679) z =0,5629+ j 0,409 Então o controlador PI é: GD ( z ) = K o que nos dá K = 0,507, ou seja, K p + K I = 0,507 . (4-77) Desta eq. e de (4-76), chega-se a K p = 0, 2982 e K I = 0, 2088 . E, portanto o controlador PI é GD ( z ) = 0,507 1 − 0,5881z −1 e a função de transferência da malha 1 − z −1 aberta é: ⎛ 1 − 0,5881z −1 0, 6321z −3 ⎞ ⎛ 1 − 0,5881z −1 ⎞ z −3 = GD ( z )G ( z ) = 0,507 ⎜ 0,3205 ⎜ −1 −1 ⎟ −1 −1 ⎟ 1 − 0,3679 z ⎠ 1 − 0,3679 z ⎠ ⎝ 1− z ⎝ 1− z , a função de transferência do SMF sendo C ( z) 0,3205 z −3 − 0,1885 z −4 = . R( z ) 1 − 1,3679 z −1 + 0,3679 z −2 + 0,3205 z −3 − 0,1885 z −4 A resposta c(kT ) pode ser obtida facilmente conforme o MATLAB Program 4-4, que apresenta os comandos usados, o resultado aparecendo na Figura 4-49, logo a seguir. 53 Problema A-4-9: Considere o sistema da Figura 4-50 abaixo. Deseja-se projetar um controlador digital tal que os pólos dominantes do SMF tenham um fator de amortecimento ς = 0,5 . Queremos que o número de amostras por ciclo da oscilação senoidal amortecida seja igual a 8. O período de amostragem é T = 0,2 . Usando o método do lugar das raízes, determinar a função de transferência de pulso do controlador digital. Obter a resposta do sistema projetado a uma entrada em degrau unitário bem como a constante de erro de velocidade, K v . Solução: Repetimos as eqs. (4-1) e (4-2), que já foram repetidas no problema anterior: ⎛ −2πς ω ⎞ d ⎟, (4-78) z = e −T ωn = exp ⎜ ⎜ 1 − ς 2 ωs ⎟ ⎝ ⎠ arg[ z ] = T ωd = 2π ωd =θ . ωs (4-78*) Tendo em vista que queremos 8 amostras por ciclo na oscilação senoidal amortecida, o pólo dominante do sistema em malha fechada deve estar localizado sobre uma linha que passe pela origem e forme ângulo de 450 (= 3600 / 8) com o eixo dos reais. Então, temos ω ω 1 π arg[ z ] = 450 = = 2π d , o que dá d = . (4-79) ωs ωs 8 4 54 Tendo em vista que T = 0,2 , temos ωs = 2π 2π = = 10π , e portanto, T 0, 2 1 10π = 3,927 . Substituindo (4-79) em (4-78) e usando o valor dado do 8 8 amortecimento, obtemos z = e −0,4535 = 0, 6354 . Portanto o ponto P, que é o pólo ωd = ω s = dominante na parte superior do plano tem magnitude 0,6534 e ângulo de 450 , ou seja, o ponto P é dado por z = 0, 4493 + j 0, 4493 , tal como indicado na Figura 4-51 abaixo. A seguir, calculamos a função de transferência de pulso da planta precedida de um ⎡1 − e −Ts ⎡ 1 ⎤ 1 ⎤ amostrador de ordem zero: G ( z ) = Z ⎢ = (1 − z −1 )Z ⎢ 2 ⎥ ⎥ ⎣ s ( s + 1) ⎦ ⎣ s s ( s + 1) ⎦ ⎡ 0, 2 z −1 ⎤ 0, 01873(1 + 0,9356 z −1 ) z −1 1 1 = (1 − z ) ⎢ − + ⎥ = (1 − z −1 )(1 − 0,8187 z −1 ) −1 2 −1 1 − e −0,2 z −1 ⎦ ⎣ (1 − z ) 1 − z 0, 01873( z + 0,9356) = . ( z − 1)( z − 0,8187) −1 (4-79*) Plotamos os pólos e zero da figura 4-51, conforme (4-79*). Tendo em vista que o ponto P é o pólo dominante desejado do SMF, o ângulo com que o controlador deve contribuir é 140, 790 + 129, 430 − 17,970 − 1800 = 72, 250 , onde o primeiro ângulo do lado esquerdo da igualdade é o formado a partir do pólo z = 1, o segundo é o formado a partir do pólo z = 0,8187 e o terceiro a partir do zero z = -0,9356 , a soma das contribuições dos ângulos da planta e do compensador devendo ser igual a 1800 . s+a Seja o controlador da forma: GD ( z ) = K . s+b Escolhemos o zero do controlador de modo a cancelar o pólo z = 0,8187. A partir disto e da condição do ângulo vista acima, calculamos o pólo do compensador: z = 0,1595. E 55 assim, temos o compensador procurado, a menos de K ainda a ser determinado: 1 − 0,8187 z −1 . (4-79**) GD ( z ) = K 1 − 0,1595 z −1 Consequentemente, a função de transferência de pulso de malha aberta é: 1 − 0,8187 z −1 0, 01873(1 + 0,9356 z −1 ) z −1 GD ( z )G ( z ) = K . 1 − 0,1595 z −1 (1 − z −1 )(1 − 0,8187 z −1 ) K pode ser determinado a partir da condição de magnitude, a saber, tendo havido 0, 01873( z + 0,9356) cancelamento de pólo e zero: K = 1 , ou seja, ( z − 1)( z − 0,1595) z =0,4493+ j 0,4493 K = 13,934 . De (4-79**), temos o compensador procurado: 1 − 0,8187 z −1 , a função de transferência de pulso do SMF sendo GD ( z ) = 13,934 1 − 0,1595 z −1 GD ( z )G ( z ) 0, 261z −1 + 0, 2442 z −2 C ( z) = = facilmente calculável: . R( z ) 1 + GD ( z )G ( z ) 1 − 0,8985 z −1 + 0, 4073z −2 A Figura 4-52 abaixo mostra c(kT ) , a resposta do sistema no domínio do tempo a um degrau unitário. Finalmente, a constante de velocidade de erro K v é determinada por ⎡1 − z −1 ⎤ ⎡1 − z −1 0, 261(1 + 0, 9356 z −1 ) z −1 ⎤ K v = lim ⎢ GD ( z )G ( z ) ⎥ = lim ⎢ ⎥ = 3, 005 . −1 −1 z →1 ⎣ T ⎦ z →1 ⎣ 0, 2 (1 − 0,1595 z )(1 − z ) ⎦ Problema A-4-10: Considere o sistema da Figura 4-53 abaixo. Suponha que as especificações de desempenho são dadas em termos de margem de fase, margem de ganho, erro estático de velocidade, etc. Estabelecer os procedimentos para projetar compensadores “lead” e “lag” pelo método frequencial. 56 Solução: 1+τ w , com 1 + ατ w 0 < α < 1 . Consequentemente, a função de transferência em malha aberta é: 1+τ w 1+τ w GD ( w)G ( w) = K D G ( w) = G1 ( w) , onde G1 ( w) = K D G ( w) . Os passos 1 + ατ w 1 + ατ w seguintes não estão necessariamente na ordem que se deve seguir sempre. Esta depende dos dados do problema. Os passos seguintes nem sempre precisam ser usados, de novo dependendo dos dados do problema. Mas é bom tê-los presentes sempre que se faz um projeto. 1. Determinar o ganho K D para satisfazer a especificação a respeito da velocidade de erro, observando que z → 1 se só se w → 0 . 2. Plotar o diagrama de Bode de G1 ( w) = K D G ( w) com o ganho K D determinado acima. Medir a margem de fase. 3. Determinar o avanço necessário de fase φ a ser adicionado ao sistema. 1. Compensador “lead”. Como sabemos, ele tem a forma GD ( w) = K D 4. Acrescentar 50 a 120 a φ , tendo em vista o deslocamento da frequência de “crossover”. Definir este novo avanço de fase como φm . Determinar o efeito de 1−α . atenuação α a partir de senφm = 1+ α 5. Determinar a freqência onde a magnitude do sistema descompensado G1 ( jν ) é igual ( ) a 20 log 1/ α . Escolher esta frequência como a nova frequência de “crossover”. Esta ( ) frequência corresponde a ν m = 1/ ατ e o valor máximo do deslocamento (“shift”) da fase φm corresponde a esta frequência. 6. Determinar as frequências de canto (“corner frequencies”) do compensador “lead” do seguinte modo: zero do compensador “lead” igual a 1 τ ; pólo do compensador “lead” 1 . ατ 7. Conferir a margem de ganho para verificar se é satisfatória. Se não o for, repetir o processo, modificando os pólos e zeros do compensador até que um resultado satisfatório seja obtido. 1+τ w , onde 2. Compensador “lag”. O compensador tem agora a forma GD ( w) = K D 1 + βτ w β > 1 . A função de transferência do sistema em malha aberta é 1+τ w 1+τ w GD ( w)G ( w) = K D G ( jw) = G1 ( jw) , onde G1 ( w) = K D G ( w) . Valem aqui 1 + βτ w 1 + βτ w igual a 57 também as observações acima (compensador “lead”) sobre ordem e importância dos passos. 1. Determinar o ganho K D para satisfazer a especificação a respeito da velocidade de erro. 2. Se o sistema descompensado G1 ( w) não satisfizer às especificações de ganhos de margem e de fase, ache a frequência para a qual o ângulo de fase da função de transferência de malha aberta seja igual a - 1800 mais a margem de fase desejada. A esta deve-se somar 50 a 120 para compensar pela redução de fase do compensador “lag”. Escolha esta frequência como a nova frequência de “crossover”. 3. Para evitar prejuízos devidos à margem de fase em vista do compensador “lag”, o pólo e zero do compensador devem ser colocados bem abaixo da nova frequência de “crossover”. Portanto, escolha-se a frequência de “corner” ν = 1/ τ (correspondendo ao zero do compensador “lag”) uma década abaixo da nova frequência de “crossover”. 4. Determinar a atenuação necessária para trazer a curva de magnitude a 0 dB no novo ganho da frequência de “crossover”. Notando-se que esta atenuação é igual a -20 log β , determine o valor de β . E então a outra frequência de “corner”, correspondendo ao pólo do compensador “lag” é determinado por ν = 1/( βτ ) . 5. Uma vez que o compensador é projetado no plano w, ele deve ser transformado no compensador no plano z, GD ( z ) . Note-se que no plano z, o pólo e o zero do compensador estão próximos um do outro, e na realidade, próximos de z = 1. Note-se ainda que, tendo em vista que os coeficientes do filtro (compensador) devem ser realizados por palavras digitais, se o número de bits usado for insuficiente, a localização do zero e do pólo do filtro podem não ficar onde se deseja e o compensador terá um desempenho diferente do esperado. Problema A-4-11: Projetar um controlador digital para o sistema da Figura 4-54 abaixo. Usar o método do diagrama de Bode no plano w. As especificações do projeto são as seguintes: margem de fase de 550 , margem de ganho de pelo menos 10 dB e erro de velocidade de 5/seg., período de amostragem T = 0,1. Depois de projetar o compensador, construa o root locus, localize os pólos do SMF no root locus e determine o número de amostragens por ciclo de oscilações senoidais amortecidas. Solução: A transformada z da planta precedida pelo segurador de ordem zero é ⎡1 − e −Ts ⎡ ⎤ 1 1 ⎤ = (1 − z −1 )Z ⎢ 2 G( z) = Z ⎢ ⎥ ⎥= ⎣ s ( s + 2) ⎦ ⎣ s s ( s + 2) ⎦ 1 + 0,9355 z −1 z + 0,9355 0, 004683 z = 0, 004683 . Passamos para o −1 −1 (1 − z )(1 − 0,8187 z ) ( z − 1)( z − 0,8187) −1 58 1 + (Tw / 2) 1 + 0, 05w , obtendo, após = 1 − (Tw / 2) 1 − 0, 05w 0,5(1 + 0, 001666 w)(1 − 0, 05w) simplificações, G ( w) = . w(1 + 0,501w) O diagrama de Bode de G(w) está na Figura 4-55 abaixo com w = jν . w 1+ 1+τ w a , = KD Escolhemos um controlador da forma GD ( w) = K D w 1 + ατ w 1+ b onde a = 1/ τ e b = 1/(ατ ) . Então a função de transferência de malha aberta é 1 + ( w / a) 0,5(1 + 0, 001666 w)(1 − 0, 05w) GD ( w)G ( w) = K D . É dado do problema que w(1 + 0,501w) 1 + ( w / b) K v = 5/seg. Então, K v = lim[ wGD ( w)G ( w)] = 0,5 K D , donde K D = 10. plano w através da transformação z = w→0 Usando agora técnica convencional de projeto (passos 2 a 4 do compensador “lag”), achamos que a função de transferência do controlador é dada por w ⎞ ⎛ ⎜ 1 + 1,994 ⎟ (4-79**) GD ( w) = 10 ⎜ ⎟. ⎜ 1+ w ⎟ ⎜ 12,5 ⎟⎠ ⎝ Portanto, a função de transferência do sistema em malha aberta é: w ⎞ ⎛ ⎜ 1 + 1,994 ⎟ 0,5(1 + 0, 001666 w)(1 − 0, 05w) . GD ( w)G ( w) = 10 ⎜ ⎟ w(1 + 0,501w) ⎜ 1+ w ⎟ ⎜ 12,5 ⎟⎠ ⎝ Traçando o diagrama de Bode (abaixo), verificamos que esta função de transferência nos dá uma margem de fase de aproximadamente 550 e uma margem de ganho de aproximadamente 12,4 dB. Portanto, todas as especificações foram obtidas. 59 Só nos resta obter GD ( z ) através da transformação bilinear w = 2 z −1 . Substituindo T z +1 este valor em (4-79**) acima, obtemos, após alguns cálculos: ⎛ 1 − 08187 z −1 ⎞ . E a função de transferência em malha aberta é: GD ( z ) = 42, 423 ⎜ −1 ⎟ ⎝ 1 − 0, 2308 z ⎠ 0,1987( z + 0,9355) . ( z − 0, 2308)( z − 1) A Figura 4-56 abaixo mostra o root locus do sistema. GD ( z )G ( z ) = Foram traçados no root locus os lugares dos pólos quando ς = 0,5 e quando ς = 0, 6 , (fazendo variar a freqência ν ?). Dá para estimar que o fator de amortecimento ς é aproximadamente igual a 0,55. A linha que liga a origem ao pólo no plano superior pode ser medida no root locus, obtendo-se um ângulo de 370 . Portanto o número de amostragem por ciclo de oscilações senoidais amortecidas é 3600 / 370 = 9,73. Problema A-4-12: Seja o sistema de controle digital da Figura 4-57 abaixo. Projetar um controlador digital no plano w de modo que a margem de fase seja de 500 e a margem de ganho seja de pelo menos 10 dB. O período de amostragem é T = 0,1. Após projetar o controlador, obter a constante de erro de velocidade, K v . Obter também a resposta do sistema a uma entrada em degrau unitário. 2 −1 −1 ⎡1 − e −Ts 1 ⎤ ⎡1⎤ −1 −1 T (1 + z ) z = (1 − z )Z ⎢ 3 ⎥ = (1 − z ) , esta última Solução: G ( z ) = Z ⎢ 2⎥ 2(1 − z −1 )3 ⎣s ⎦ ⎣ s s ⎦ 60 0, 005( z + 1) . ( z − 1) 2 1 + 0, 05w A seguir, utilizando a transformação bilinear, temos z = , donde que 1 − 0, 05w 1 − 0, 05w 1 − 0, 05 jν , ou seja, G ( jν ) = . A partir disto, podemos obter o G ( w) = 2 ( jν ) 2 w diagrama de Bode para G ( jν ) , que se encontra na Figura 4-58 abaixo. expressão tendo sido obtida da Tabela 2-1. Donde G ( z ) = Observe-se que a margem de fase do sistema em malha aberta pode ser medida igual a aproximadamente - 20 . Então é necessário adicionar um controlador “lead” de modo a obter as margens de fase e ganho requeridas. Utilizando métodos convencionais de projeto (ver Problema A-4-10), pode-se verificar que o seguinte compensador lead satisfaz às especificações: 1+ w w +1 = 64 GD ( w) = 4 . Com a adição deste compensador, a frequência do w + 16 1 + w /16 ganho de crossover passa a ser ν = 4. Observe-se que o maior avanço de fase que este 1−α compensador pode produzir é dado por arcsenφm , sendo senφm = , onde α é a 1+ α relação dos termos independentes de z no numerador e denominador da função de transferência do compensador e neste caso é: 1 − 1/16 = arcsen(0,8824) = 61,930 . A margem de fase obtida do diagrama φm = arcsen 1 + 1/16 de Bode é 50,620 e a margem de ganho, como se pode ver, é de aproximadamente igual a 13 dB. Portanto, as especificações são satisfeitas. z − 0,9048 Agora, através da transformação bilinear, obtemos: GD ( z ) = 37,333 . (4-79) z − 0,1111 E a função de transferência de malha aberta é: 0,1867(1 − 0,9048 z −1 )(1 + z −1 ) z −1 GD ( z )G ( z ) = . (1 − 0,1111z −1 )(1 − z −1 ) 2 A constante de erro de velocidade é obtida através da fórmula: 61 ⎡1 − z −1 K v = lim ⎢ ⎤ GD ( z )G ( z ) ⎥ ; efetuando, obtém-se K v = ∞ , ou seja, o erro em regime ⎣ T ⎦ permanente quando a entrada é uma rampa é nulo, o que já seria de se esperar, tendo em vista que a planta tem um duplo integrador. A função de transferência de pulso do SMF é: C ( z ) 0,1867 z −1 + 0, 0178 z −2 − 0,1689 z −3 = . A Figura 4-59 abaixo mostra a resposta do 1 − 1,9244 z −1 + 1, 24 z −2 − 0, 28 z −3 R( z ) sistema a uma entrada em degrau unitário. z →1 Observe que de (4-79), o controlador tem um zero em 0,9048, portanto próximo ao duplo pólo em z = 1. Quando isto acontece, isto é, um zero próximo a um pólo, a resposta apresenta uma longa “cauda”, como se vê da fig. 4-59. Problema A-4-13: Seja o SMF da Figura 4-60 abaixo. Observe-se que a planta tem um retardo de 5 seg. Supõe-se que o tempo de amostragem T seja igual ao de retardo da planta. A resposta desejada do sistema a um degrau unitário de entrada é mostrada abaixo na Figura 4-61(a). 62 A resposta vai de 0 (no quinto segundo) ao valor final em 10 segundos, não havendo ultrapassagem nem erro em regime permanente. O tempo de assentamento é de 15 segundos (medido de t = 0 a t = 15 segundos). Deseja-se que não haja ondulações depois que o tempo de assentamento é alcançado. Projetar um controlador digital GD ( z ) . Solução: A transformada z da planta precedida do segurador de ordem zero é: ⎡1- eTs e −5 s ⎤ ⎤ 1 0,3935 z −2 −1 −1 ⎡ (1 ) Z − = z z = G( z) = Z ⎢ ⎥ ⎢ s (10 s + 1) ⎥ 1 − 0, 6065 z −1 . O sistema é ⎣ ⎦ ⎣ s 10 s + 1 ⎦ estável, com os pólos simples em z = 0 e z = 0,6065. A função de transferência de pulso C ( z) GD ( z )G ( z ) = = F ( z) . é: (4-80) R( z ) 1 + GD ( z )G ( z ) Da figura (a), vemos que h(1 − e −0,1(t −5) ) ; em t = 15 temos h(1 − e −1 ) = 1,582. Da figura (a), que mostra que o controle é “dead-beat”, temos nos instantes discretos: c(0) = 0 , c(1) = 0 , c(2) = h(1 − e−0,5 ) = 0,6225 , c(k ) = 1 para k = 3;4;5;... Disto, temos: 1 C ( z ) = 0, 6225 z −2 + z −3 + z −4 + z −5 + ... = 0, 6225 z −2 + z −3 = 1 − z −1 0, 6225 z −2 + 0,3775 z −3 . (4-80*) 1 − z −1 1 e em visa de (4-80*), temos: Mas de (4-80) temos C ( z ) = F ( z ) R( z ) = F ( z ) 1 − z −1 F ( z ) = 0, 6225 z −2 + 0,3775 z −3 . 63 F ( z) . (4-80**) G ( z )[1 − F ( z )] Mas de (4-48) lembra-se que 1 − F ( z ) = (1 − z −1 ) N ( z ) , onde N ( z ) é um polinômio em z −1 , ou seja, 1 − 0, 6225 z −2 − 0,3775 z −3 = (1 − z −1 ) N ( z ) , obtendo-se N ( z ) = 1 + z −1 + 0,3775 z −2 , donde que 1 − F ( z ) = (1 − z −1 )(1 + z −1 + 0,3775 z −2 ) . Utilizando (4-80**), obtemos, após alguns cálculos triviais: 1,582(1 − 0,3678 z −2 ) . GD ( z ) = (1 − z −1 )(1 + z −1 + 0,3775 z −2 ) C ( z) Vejamos o controle que aciona a planta U ( z ) = . Substituindo os resultados G( z) Ora, GD ( z ) = 1 − 0,3678 z −2 anteriores, obtemos, após alguns cálculos: U ( z ) = 1,582 1 − z −1 = 1,582 + 1,582 z −1 + z −2 + z −3 + z −4 + ... Donde se vê que o controle u (k ) é constante para k > 1, o que faz que não haja oscilacões entre as amostragens depois de atingido o regime permanente. u (k ) versus k é mostrado na figura 4-61(b) acima. Problema A-4-14: Seja o sistema na figura 4-62 abaixo. Projetar um controlador digital GD ( z ) tal que o SMF tenha um tempo de assentamento mínimo com erro em regime permanente nulo para uma entrada em rampa unitária. Além disso, não deve haver oscilacões entre os instantes de amostragem, depois de atingido o regime permanente. Dado T = 1 seg. Depois de projetado o controlador, verificar a resposta do sistema a uma entrada em delta de Kronecker e a um degrau unitário. −1 −1 ⎡1 − e −Ts 1 ⎤ ⎡ 1 ⎤ (1 + z ) z −1 (1 )Z − Solução: G ( z ) = Z ⎢ = z = 2⎥ ⎢⎣ s 3 ⎥⎦ 2(1 − z −1 ) 2 , ⎣ s s ⎦ esta última igualdade sendo obtida usando a Tabela 2-1. Definamos a função de C ( z) GD ( z )G ( z ) = = F ( z) . transferência de pulso: R( z ) 1 + GD ( z )G ( z ) Observe-se que se G ( z ) for expandido como uma série em z −1 , o primeiro termo da série será 0,5 z −1 . Consequentemente, F ( z ) é uma série que começa com z −1 : F ( z ) = a1 z −1 + a2 z −2 + ....aN z − N , ou seja, queremos um controle “dead-beat”, onde N ≥ n , n sendo a ordem do sistema. No caso presente, n = 2. Tendo em vista que a entrada é uma rampa, temos da eq. (4-48): 1 − F ( z ) = (1 − z −1 ) 2 N ( z ) . (4-81) Observe-se que G ( z ) tem um pólo duplo crítico em z = 1. Em virtude da estabilidade do SMF, então 1 − F ( z ) deve ter um duplo zero em z = 1 para cancelar este pólo da 64 planta e prover para o controle dead beat. Mas acontece que, de (4-81), esta condição já é satisfeita. Tendo em vista que não devem existir oscilacões na resposta em regime permanente, então U ( z ) deve ser uma série em z −1 com a seguinte característica: U ( z ) = b0 + b1 z −1 + b2 z −2 + ....bN −1 z − N +1 + b( z − N + z − N −1 + z − N − 2 + ....) Mas como N ≥ n e n = 2, e tendo a planta um integrador duplo, então b acima deve ser nulo, pois do contrário, a resposta cresceria parabolicamente, e não linearmente. Consquentemente, temos: U ( z ) = b0 + b1 z −1 + b2 z −2 + ....bN −1 z − N +1 . C ( z ) C ( z ) R( z ) R( z ) . Ora, do diagrama de blocos, temos U ( z ) = = = F ( z) G ( z ) R( z ) G ( z ) G( z) Mas da tabela 2-1 temos R( z ) = Tz −1 , com T = 1. Donde, (1 − z −1 ) 2 z −1 2(1 − z −1 ) 2 2 = F ( z) . −1 2 −1 −1 (1 − z ) (1 + z ) z 1 + z −1 Mas para que U ( z ) seja uma série em z −1 com um número finito de termos, F ( z ) tem que ser divisível por 1+ z −1 , ou seja, F ( z ) = (1 + z −1 ) F1 ( z ) , (4-82) U ( z) = F ( z) onde F1 ( z ) é um polinômio em z −1 com um número finito de termos. Donde, U ( z ) = 2 F1 ( z ) . (4-83) De (4-81) e (4-82) vemos que F ( z ) deve ter termos pelo menos de z −3 . Então, (4-83*) suporemos que F ( z ) = a1 z −1 + a2 z −2 + a3 z −3 . Esta expressão de F ( z ) envolve o número mínimo de termos, o transiente terminará em 3 amostragens. Para determinar os coeficientes de F ( z ) acima, temos da eq. (4-81): 1 − a1 z −1 − a2 z −2 − a3 z −3 = (1 − z −1 ) 2 N ( z ) . Dividindo o lado esquerdo da eq. acima por (1 − z −1 ) 2 , o resto deve ser nulo. Obtemos: N ( z ) = 1 + (2 − a1 ) z −1 (4-83**) e o resto nulo, a saber, [2(2 − a1 ) − (1 + a2 )]z −2 − (2 − a1 + a3 ) z −3 = 0 para todo z, o que implica: 2(2 − a1 ) − (1 + a2 ) = 0 e (4-84) 2 − a1 + a3 = 0. (4-85) Por outro lado, de (4-82), nós temos a1 z −1 + a2 z −2 + a3 z −3 = (1 + z −1 ) F1 ( z ) . Dividindo o lado esquerdo desta eq. por 1 + z −1 , o resto deve ser nulo. Obtemos então F1 ( z ) = a1 z −1 + (a2 − a1 ) z −2 , (4-85*) a1 − a2 + a3 = 0 . (4-86) Resolvendo as eqs. (4-84), (4-85) e (4-86), temos: a1 = 1, 25 ; a2 = 0,5 e a3 = −0, 75 . (4-86*) Portanto, obtemos de (4-83**): N ( z ) = 1 + 0, 75 z −1 e de (4-85*): F1 ( z ) = 1, 25 z −1 (1 − 0, 6 z −1 ) . −1 −2 (4-86**) −3 −1 −1 De (4-83*) e de (4-86*): F ( z ) = 1, 25 z + 0,5 z − 0, 75 z = 1, 25 z (1 + z )(1 − 0, 6 z −1 ) . 65 De (4-50), através de cálculo rotineiro: GD ( z ) = 2,5(1 − 0, 6 z −1 ) . (1 + 0, 75 z −1 ) Então, por cálculos simples: C ( z ) = F ( z ) R( z ) = 1, 25 z −2 + 3z −3 + 4 z −4 + 5 z −5 + ... , ou seja, c(0) = 0 ; c(1) = 0 ; c(2) = 1, 25 ; c(k ) = k para k = 3;4;5;... Note-se que de (4-83) e de (4-86**), temos U ( z ) = 2,5 z −1 − 1,5 z −2 . Ou seja, o controle torna-se nulo para k > 2. Consequentemente, não há oscilacões entre as amostragens no regime permanente. A Figura 4-63 abaixo mostra a resposta e o controle plotados contra o tempo, sendo que quanto ao controle, ele é mostrado também depois de passar pelo segurador de ordem zero. Investiguemos agora as respostas deste sistema a uma entrada que seja um delta de Kronecker e a um degrau unitário. Ora, quando a entrada é um delta de Kronecker, temos: C ( z ) = F ( z ) = 1, 25 z −1 + 0,5 z −2 − 0, 75 z −3 . F ( z) E o controle é, efetuando cálculos simples: C ( z ) = = 2,5 − 6,5 z −1 + 5,5 z −2 − 1,5 z −3 . G( z) Note-se que o controle se torna nulo para k > 3. Portanto, não há oscilacões entre as amostragens a partir de t = 4T = 4. Quando a entrada é um degrau, temos: 1 C ( z ) = F ( z ) R( z ) = (1, 25 z −1 + 0,5 z −2 − 0, 75 z −3 ) = 1, 25 z −1 + 1, 75 z −2 + z −3 + z −4 + ... −1 1− z Observa-se que a ultrapassagem máxima é de 75%. Calculamos também R( z ) U ( z) = F ( z) = 2,5 − 4 z −1 + 1,5 z −2 , donde vemos que o controle se anula a partir de G( z) k = 3, instante a partir do qual não há oscilacões entre amostragens. 66 A Figura 4-64(a) abaixo mostra a resposta e o controle quando a entrada é um delta de Kronecker, enquanto que (b) mostra resposta e controle quando a entrada é um degrau unitário. 67 CAPÍTULO 5: ANÁLISE NO ESPACO DE ESTADO 5-1 Introdução Nos capítulos anteriores tratamos de sistemas invariantes no tempo com uma entrada e uma saída. Para tais sistemas, os métodos usados nos dois capítulos anteriores são bastante úteis. Os métodos usados não se aplicam, entretanto, a sistemas não lineares, exceto quando estes são muito simples (aos quais se aplicam as “funções descreventes”) e não se aplicam ao problema do controle ótimo e do controle adaptativo que são, geralmente, não lineares. Ora, os modernos sistemas de controle podem ter muitas entradas e respostas, as quais podem ser inter-relacionadas de um modo complicado. Os métodos do espaço de estado, que estudaremos neste capítulo, são apropriados, mas não exclusivos, para estudar tais sistemas. E têm também a vantagem de se aplicarem, com as devidas modificações, a sistemas não lineares. O método do espaço de estado Ele é baseado na descrição do sistema em n eqs. de diferença (ou diferencial, se se trata de sistemas de tempo contínuo) de 1ª. ordem, as quais podem ser agrupadas, dando lugar a uma eq. vetorial-matricial de 1ª. ordem. O uso da notação vetorial-matricial simplifica bastante a representação matemática do sistema de equações. Estado O estado de um sistema é o menor conjunto de variáveis (chamadas variáveis de estado) tais que, o conhecimento destas variáveis em t = t0 , juntamente com o conhecimento da entrada para t ≥ t0 , determina completamente o comportamento do sistema para t ≥ t0 . Variáveis de Estado As variáveis de estado de um sistema dinâmico são as variáveis constituindo o menor número de variáveis que determinam o estado do sistema, tal como referido acima. Se pelo menos n variáveis x1 ; x2 ; ....; xn são necessárias para descrever completamente o comportamento do sistema, então estas variáveis são um conjunto de variáveis de estado. É importante observar que as variáveis de estado não precisam ser quantidades fisicamente mensuráveis ou observáveis. Na prática, porém, é muitas vezes conveniente escolher quantidades facilmente mensuráveis, se isto for possível, quando se faz necessária a realimentação de variáveis mensuráveis. Vetor de estado Se n variáveis de estado são necessárias para descrever completamente o comportamento de um sistema, então estas n variáveis podem ser consideradas como as n componentes de um vetor x . Tal vetor é chamado vetor de estado. (Observe-se que doravante os vetores e matrizes são representados em negrito). Espaço de estado O espaço de dimensão n cujos eixos coordenados são constituídos por x1 ; x2 ; ....; xn é chamado um espaço de estado. Qualquer estado do sistema pode ser representado por um ponto no espaço de estado. Equações no espaço de estado Na análise do espaço de estado, nós trabalharemos com três tipos de variáveis que 68 integram a modelagem de um sistema dinâmico: variáveis de entrada (“inputs”), variáveis de saída ou resposta (“outputs”) e variáveis de estado. Para sistemas variantes no tempo (lineares ou não-lineares), de tempo discreto, as eqs. de estado podem ser escritas da seguinte forma: x(k + 1) = f [x(k ), u(k ), k ] , enquanto que a eq. da resposta é dada por y (k ) = g[x(k ), u(k ), k ] . Para sistemas lineares variantes no tempo, temos x(k + 1) = G (k )x(k ) + H (k )u(k ) y (k ) = C(k )x(k ) + D(k )u(k ) . Suporemos sempre que o estado x(k ) tem dimensão n, a resposta y (k ) tem dimensão m e a entrada u(k ) tem dimensão r e as matrizes têm as dimensões apropriadas. O fato de as matrizes G , H , C e D dependerem explicitamente de k indicam que o sistema é variante no tempo. Caso k não aparecesse explicitamente como argumento nestas matrizes, o sistema seria invariante no tempo. Ou seja, as eqs. de sistemas lineares invariantes no tempo, que nos ocuparão neste capítulo, são dadas por: x(k + 1) = Gx(k ) + Hu(k ) , (5-1) y (k ) = Cx(k ) + Du(k ) . (5-2) A Figura 5-1(a) acima apresenta o diagrama de blocos correspondentes às eqs. (5-1) e (5-2). A figura (b) se refere a sistemas de tempo contínuo, que deveria ter sido estudado no curso anterior. Note-se que as configurações são basicamente iguais, o retardo z −1 I no tempo discreto sendo substituído pela integral no caso do tempo contínuo. 69 5-2 Representação no espaço de estado de sistemas de tempo discreto Formas canônicas para equações de tempo discreto no espaço de estado Há muitas técnicas para obter representação em espaço de estado de sistemas de tempo discreto. Seja o sistema de tempo discreto descrito por y (k ) + a1 y (k − 1) + a2 y (k − 2) + ... + an y ( k − n) = b0u ( k ) + b1u (k − 1) + ... + bnu (k − n) . (5-5) Esta eq. pode ser escrita, equivalentemente, na forma de uma função de transferência de Y ( z ) b0 + b1 z −1 + ... + bn z − n = (5-6) pulso, a saber, U ( z ) 1 + a1 z −1 + ... + an z − n Y ( z ) b0 z n + b1 z n −1 + ... + bn = n . (5-7) U ( z) z + a1 z n −1 + ... + an Há muitas maneiras de realizar a representação em espaço de estado para o sistema de tempo discreto descrito pelas eqs. (5-5), (5-6) ou (5-7). Serão apresentadas aqui as seguintes representações: - Forma canônica controlável - Forma canônica observável - Forma canônica diagonal - Forma canônica de Jordan ou: Forma canônica controlável A representação de espaço de estado do sistema de tempo discreto dado pelas eqs. acima pode ser apresentada pelas seguintes eqs. vetoriais: 1 0 .... 0 ⎤ ⎡ x1 (k ) ⎤ ⎡ 0 ⎤ ⎡ x1 (k + 1) ⎤ ⎡ 0 ⎢ ⎥ ⎢ 0 1 .... 0 ⎥⎥ ⎢⎢ x2 (k ) ⎥⎥ ⎢ 0 ⎥ ⎢ x2 (k + 1) ⎥ ⎢ 0 ⎢ ⎥ ⎢ ..... ⎥ = ⎢ .... (5-8) .... .... .... .... ⎥ ⎢ .... ⎥ + ⎢....⎥ u (k ) ⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥ 0 0 .... 1 ⎥ ⎢ xn −1 (k ) ⎥ ⎢ 0 ⎥ ⎢ xn −1 (k + 1) ⎥ ⎢ 0 ⎢⎣ xn (k + 1) ⎥⎦ ⎢⎣ − an − an −1 − an − 2 .... −a1 ⎥⎦ ⎢⎣ xn (k ) ⎥⎦ ⎢⎣ 1 ⎥⎦ ⎡ x1 (k ) ⎤ ⎢ x (k ) ⎥ ⎢ 2 ⎥ (5-9) y (k ) = [bn − anb0 bn −1 − an −1b0 .... b2 − a2b0 b1 − a1b0 ] ⎢ .... ⎥ + b0u (k ) . ⎢ ⎥ ⎢ xn −1 (k ) ⎥ ⎢⎣ xn (k ) ⎥⎦ A prova deste resultado básico deveria ter sido vista no curso anterior. Se você está duvidando, faça um exemplo simples, de sistema de ordem 2, para se convencer. Agora, observe-se que se revertermos a ordem das variáveis, isto é, se definirmos: ⎡ xˆ1 (k ) ⎤ ⎡ 0 0 .... 0 1 ⎤ ⎡ x1 (k ) ⎤ ⎢ xˆ (k ) ⎥ ⎢ 0 0 .... 1 0 ⎥ ⎢ x (k ) ⎥ ⎢ 2 ⎥=⎢ ⎥⎢ 2 ⎥, (5-9*) ⎢ .... ⎥ ⎢... ... ... ... ...⎥ ⎢ .... ⎥ ⎢ ⎥ ⎢ ⎥ ⎥⎢ ⎣ xˆn (k ) ⎦ ⎣ 1 0 ... 0 0 ⎦ ⎣ xn (k ) ⎦ então as eqs. acima podem ser escritas da seguinte forma: 70 ⎡ xˆ1 (k + 1) ⎤ ⎡ −a1 ⎢ˆ ⎥ ⎢ ⎢ x2 (k + 1) ⎥ ⎢ 1 ⎢ xˆ3 (k + 1) ⎥ = ⎢ 0 ⎢ ⎥ ⎢ ⎢ .... ⎥ ⎢ ... ⎢⎣ xˆn (k + 1) ⎥⎦ ⎢⎣ 0 y (k ) = [b1 − a1b0 − a2 ... − an −1 0 ... 0 1 ... 0 ... ... ... 0 ... 1 b2 − a2b0 − an ⎤ ⎡ xˆ1 (k ) ⎤ ⎡ 1 ⎤ 0 ⎥⎥ ⎢⎢ xˆ2 (k ) ⎥⎥ ⎢⎢ 0 ⎥⎥ 0 ⎥ ⎢ xˆ3 (k ) ⎥ + ⎢ 0 ⎥ u (k ) ⎥ ⎢ ⎥ ⎥⎢ ... ⎥ ⎢ ... ⎥ ⎢...⎥ 0 ⎥⎦ ⎢⎣ xˆn (k ) ⎥⎦ ⎢⎣ 0 ⎥⎦ ⎡ xˆ1 (k ) ⎤ ⎢ xˆ (k ) ⎥ ... bn − an b0 ] ⎢ 2 ⎥ + b0u (k ) . ⎢ .... ⎥ ⎢ ⎥ ⎣ xˆn (k ) ⎦ (5-10) (5-11) Forma canônica observável O sistema dado pelas eqs. (5-5), (5-6) ou (5-7) pode ser posto na seguinte forma: ⎡ x1 (k + 1) ⎤ ⎡ 0 0 ... 0 −an ⎤ ⎡ x1 (k ) ⎤ ⎡ bn − anb0 ⎤ ⎢ x (k + 1) ⎥ ⎢ 1 0 ... 0 −a ⎥ ⎢ x (k ) ⎥ ⎢b − a b ⎥ n −1 ⎥ ⎢ 2 ⎢ 2 ⎥ ⎢ ⎥ ⎢ n −1 n −1 0 ⎥ ⎢ ..... ⎥ = ⎢.... .... ... .... .... ⎥ ⎢ .... ⎥ + ⎢ ⎥ u (k ) (5-12) .... ⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥ ⎢ xn −1 (k + 1) ⎥ ⎢ 0 0 ... 0 − a2 ⎥ ⎢ xn −1 (k ) ⎥ ⎢ b2 − a2b0 ⎥ ⎢⎣ xn (k + 1) ⎥⎦ ⎢⎣ 0 0 ... 1 − a1 ⎥⎦ ⎢⎣ xn (k ) ⎥⎦ ⎢⎣ b1 − a1b0 ⎥⎦ ⎡ x1 (k ) ⎤ ⎢ x (k ) ⎥ ⎢ 2 ⎥ y (k ) = [ 0 0 .... 0 1] ⎢ .... ⎥ + b0u (k ) , ⎢ ⎥ ⎢ xn −1 (k ) ⎥ ⎢⎣ xn (k ) ⎥⎦ a prova deste resultado também devendo ter sido vista no curso anterior. (5-13) Observe-se que a matriz da eq. de estado (5-12) é a transposta da matriz de (5-8). Mais ainda, os elementos do vetor que multiplica a resposta (entrada) em (5-8)- (5-9) são os mesmos que multiplica a e entrada (resposta) em (5-12) e (5-13). Dizemos então que o par ((5-8), (5-9)) é dual do par ((5-12), (5-13)), ou que os pares são duais um do outro. Note-se também que se a ordem das variáveis de estado for invertida tal como em (5-9*), então as eqs. (5-12) e (5-13) são transformadas em: 1 ... 0 0 ⎤ ⎡ xˆ1 (k ) ⎤ ⎡ bn − anb0 ⎤ ⎡ xˆ1 (k + 1) ⎤ ⎡ −a1 ⎢ xˆ (k + 1) ⎥ ⎢ − a 0 ... 0 0 ⎥⎥ ⎢⎢ xˆ2 (k ) ⎥⎥ ⎢⎢bn −1 − an −1b0 ⎥⎥ ⎢ 2 ⎥ ⎢ 2 ⎥ u (k ) ⎢ ..... ⎥ = ⎢ .... .... ... .... ....⎥ ⎢ .... ⎥ + ⎢ .... (5-14) ⎥ ⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎢ xˆn −1 (k + 1) ⎥ ⎢ − an −1 0 ... 0 1 ⎥ ⎢ xˆn −1 (k ) ⎥ ⎢ b2 − a2b0 ⎥ ⎢⎣ xˆn (k + 1) ⎥⎦ ⎢⎣ − an 0 ... 0 0 ⎥⎦ ⎢⎣ xˆn (k ) ⎥⎦ ⎢⎣ b1 − a1b0 ⎥⎦ 71 ⎡ xˆ1 (k ) ⎤ ⎢ xˆ (k ) ⎥ ⎢ 2 ⎥ y (k ) = [1 0 .... 0 0] ⎢ .... ⎥ + b0u (k ) . ⎢ ⎥ ⎢ xˆn −1 (k ) ⎥ ⎢⎣ xˆn (k ) ⎥⎦ (5-15) Forma canônica diagonal Se os pólos da função de transferência de pulso dada pelas eqs. (5-6) e (5-7) são todos distintos, então a representação em estado de estado pode ser posta na forma diagonal: 0 ⎤ ⎡ x1 (k ) ⎤ ⎡ 1 ⎤ ⎡ x1 (k + 1) ⎤ ⎡ p1 0 ... 0 ⎢ x (k + 1) ⎥ ⎢ 0 p ... 0 0 ⎥⎥ ⎢⎢ x2 (k ) ⎥⎥ ⎢ 1 ⎥ 2 ⎢ 2 ⎥ ⎢ ⎢ ⎥ ⎢ ..... ⎥ = ⎢.... .... ... .... .... ⎥ ⎢ .... ⎥ + ⎢....⎥ u (k ) , (5-16) ⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥ ⎢ xn −1 (k + 1) ⎥ ⎢ 0 0 ... pn −1 0 ⎥ ⎢ xn −1 (k ) ⎥ ⎢ 1 ⎥ ⎢⎣ xn (k + 1) ⎥⎦ ⎢⎣ 0 0 ... 0 pn ⎥⎦ ⎢⎣ xn (k ) ⎥⎦ ⎢⎣ 1 ⎥⎦ ⎡ x1 (k ) ⎤ ⎢ x (k ) ⎥ ⎢ 2 ⎥ (5-17) y (k ) = [ c1 c2 ... cn −1 cn ] ⎢ .... ⎥ + b0u (k ) , ⎢ ⎥ ⎢ xn −1 (k ) ⎥ ⎢⎣ xn (k ) ⎥⎦ onde os pi ' s são os polos da função de transferência e os ci ' s são os resíduos da expansão da função de transferência em frações parciais, isto é, ⎛ Y ( z) ⎞ ( z − pi ) ⎟ . Este resultado também deveria ter sido provado no curso ci = lim ⎜ z → pi U ( z ) ⎝ ⎠ anterior. Forma canônica de Jordan Se a função de transferência de pulso tiver um pólo de ordem m em z = p1 e todos os outros pólos forem distintos, então obtemos as seguintes eqs. de estado e de resposta: ⎡ x1 (k + 1) ⎤ ⎡ p1 ⎢ x (k + 1) ⎥ ⎢ 0 ⎢ 2 ⎥ ⎢ ⎢ ⎥ ⎢ ... .... ⎢ ⎥ ⎢ ( 1) x k + m ⎢ ⎥=⎢0 ⎢ xm+1 (k + 1) ⎥ ⎢ 0 ⎢ ⎥ ⎢ .... ⎢ ⎥ ⎢ ... ⎢ x (k + 1) ⎥ ⎢ 0 ⎣ n ⎦ ⎣ 1 0 ... 0 p1 1 ... 0 ... ... ... ... 0 0 0 ... 0 ... p1 0 ... ... ... ... 0 0 0 0 0 0 ... ... ... ... 0 ... pm+1 ... ... 0 ... 0 0 ⎤ ⎡ x1 ( k ) ⎤ ⎡ 0 ⎤ 0 ⎥⎥ ⎢⎢ x2 ( k ) ⎥⎥ ⎢ 0 ⎥ ⎢ ⎥ ... ⎥ ⎢ .... ⎥ ⎢...⎥ ⎥⎢ ⎥ ⎢ ⎥ 0 ⎥ ⎢ xm (k ) ⎥ + ⎢ 0 ⎥ u (k ) , (5-18) 0 ⎥ ⎢ xm+1 (k ) ⎥ ⎢ 1 ⎥ ⎥⎢ ⎥ ⎢ ⎥ ... ⎥ ⎢ .... ⎥ ⎢ 1 ⎥ pn ⎦⎥ ⎢⎣ xn (k ) ⎥⎦ ⎢⎣ 1 ⎥⎦ onde a matriz acima tem quatro blocos: o primeiro superior à esquerda tem p1 ' s na diagonal e 1’s na primeira sobre-diagonal, os outros elementos nulos; o segundo bloco superior à direita tem todos os elementos nulos; o primeiro boco inferior à esquerda também tem todos os elementos nulos e finalmente o segundo bloco inferior à direita tem os outros pólos da função de transferência na diagonal e os outros elementos nulos. A eq. da resposta é, tal como no caso anterior: 72 ⎡ x1 (k ) ⎤ ⎢ x (k ) ⎥ ⎢ 2 ⎥ (5-19) y (k ) = [ c1 c2 ... cn −1 cn ] ⎢ .... ⎥ + b0u (k ) . ⎢ ⎥ ⎢ xn −1 (k ) ⎥ ⎢⎣ xn (k ) ⎥⎦ A matriz de (5-18) é uma forma canônica de Jordan. O bloco com 1’s na sobre-diagonal é chamado um bloco de Jordan. Se a função de transferência de pulso tiver q pólos com grau de multiplicidade maior que 1, a matriz terá q blocos de Jordan. Y ( z) z +1 = 2 . Achar as formas canônicas U ( z ) z + 1,3z + 0, 4 controlável, observável e diagonal (ou de Jordan, se for o caso) para este sistema. Solução: A forma canônica controlável é escrita por simples inspeção da função de transferência: 1 ⎤ ⎡ x1 (k ) ⎤ ⎡0 ⎤ ⎡ x1 ( k + 1) ⎤ ⎡ 0 ⎡ x1 (k ) ⎤ = + u k = ( ) y ( k ) 1 1 , [ ] ⎢ x (k + 1) ⎥ ⎢ −0, 4 −1,3⎥ ⎢ x (k ) ⎥ ⎢1 ⎥ ⎢ x (k ) ⎥ . ⎦⎣ 2 ⎦ ⎣ ⎦ ⎣ 2 ⎦ ⎣ ⎣ 2 ⎦ A forma canônica observável também é escrita por simples inspeção e é transposta da anterior: ⎡ x1 (k + 1) ⎤ ⎡0 −0, 4 ⎤ ⎡ x1 (k ) ⎤ ⎡1⎤ ⎡ x1 (k ) ⎤ ⎢ x (k + 1) ⎥ = ⎢1 −1,3 ⎥ ⎢ x (k ) ⎥ + ⎢1⎥ u (k ) , y (k ) = [ 0 1] ⎢ x (k ) ⎥ . ⎦⎣ 2 ⎦ ⎣ ⎦ ⎣ 2 ⎦ ⎣ ⎣ 2 ⎦ Exemplo 5-1: Seja o sistema Para escrever a forma canônica diagonal, precisamos achar os pólos e os respectivos resíduos da função de transferência. Neste caso, obtemos Y ( z) 5/3 −2 / 3 . Donde temos imediatamente: = + U ( z ) z + 0,5 z + 0,8 0 ⎤ ⎡ x1 (k ) ⎤ ⎡1⎤ ⎡ x1 (k + 1) ⎤ ⎡ −0,5 ⎡ x1 (k ) ⎤ , = + u k = − ( ) y ( k ) 5 / 3 2 / 3 [ ] ⎢ x (k + 1) ⎥ ⎢ 0 ⎢ x (k ) ⎥ . −0,8⎥⎦ ⎢⎣ x2 (k ) ⎥⎦ ⎢⎣1⎥⎦ ⎣ 2 ⎦ ⎣ ⎣ 2 ⎦ As representações no espaço de estado não são únicas Seja o sistema representado por x(k + 1) = Gx(k ) + Hu(k ) , (5-1bis) y (k ) = Cx(k ) + Du(k ) . (5-2 bis) Definamos um novo vetor xˆ (k ) por meio de x(k ) = Pxˆ (k ) , (5-22) onde P é uma matriz não singular, a saber, inversível e, consequentemente, com o determinante diferente de zero . Substituindo esta em (5-1bis), vem: Pxˆ (k + 1) = GPxˆ (k ) + Hu(k ) . (5-23) −1 Multiplicando ambos os lados desta última por P , vem xˆ (k + 1) = P −1GPxˆ (k ) + P −1Hu(k ) (5-24) ˆ , P −1H = H ˆ . Definamos P −1GPxˆ = G Então a eq. (5-24) pode ser escrita na forma ˆ ˆ (k ) + Hu ˆ (k ) . xˆ (k + 1) = Gx (5-25) Por outro lado, substituindo (5-22) em (5-2bis), temos y (k ) = CPxˆ (k ) + Du(k ) . (5-26) 73 ˆ e D=D ˆ , temos Definindo CP = C ˆ ˆ (k ) + Du ˆ (k ) , y (k ) = Cx (5-27) Então acabamos de mostrar que a realização (5-1bis) e (5-2bis) é equivalente à realização dada por (5-25) e (5-27), pois ambas correspondem ao mesmo par de entrada e saída u(k ) e y (k ) . Tendo em vista que a matriz P é qualquer (mas não singular), conclui-se que existe uma infinidade de realizações (ou representações) no espaço de estado de um mesmo sistema. 5-3 Resolvendo equações discretas no espaço de estado Nesta seção resolveremos a eq. (5-1bis) por dois métodos, recurrência e transformada z. Em geral, as eqs. de diferença são mais fáceis de serem resolvidas do que as eqs. diferenciais. Vejamos primeiramente o método da recurrência: Da eq. (5-1bis) temos imediatamente: x(1) = Gx(0) + Hu(0) , x(2) = Gx(1) + Hu(1) = G 2 x(0) + GHu(0) + Hu(1) , x(3) = Gx(2) + Hu(2) = G 3 x(0) + G 2 Hu(0) + GHu(1) + Hu(2) , .................................................................................................... A generalização é imediata: k −1 x(k ) = G k x(0) + ∑ G k − j −1Hu( j ) , k = 1;2;3;.... (5-30) j =0 E a resposta do sistema é dada por (5-2bis), ou seja, k −1 y (k ) = CG k x(0) + C∑ G k − j −1Hu( j ) + Du(k ) (5-31) j =0 Matriz de transição de estado Considere a eq. homogênea de (5-1bis): x(k + 1) = Gx(k ) (5-32) De (5-30) com u(k ) = 0, temos x(k ) = G k x(0) . A matriz G k é chamada matriz de transição de estado e também matriz fundamental e costuma ser representada por Ψ (k ) . (Há uma diferença entre matriz de transição de estado e matriz fundamental em sistemas variantes no tempo). Ou seja, temos, da eq. logo acima: x(k ) = Ψ(k )x(0) , (5-33) onde Ψ (k ) satisfaz evidentemente à condição Ψ (k + 1) = GΨ (k ) , com Ψ (0) = I (5-34) Em termos de matriz de transição de estado a eq. (5-30) pode ser escrita na seguinte forma: k −1 x(k ) = Ψ ( k )x(0) + ∑ Ψ (k − j − 1)Hu( j ) . (5-36) j =0 O somatório acima é uma convolução discreta, que também pode ser escrita na forma: k −1 x(k ) = Ψ ( k )x(0) + ∑ Ψ ( j )Hu(k − j − 1) . (5-37) j =0 74 Substituindo estas eqs. em (5-31), temos: k −1 y (k ) = CΨ (k )x(0) + C∑ Ψ (k − j − 1)Hu( j ) + Du(k ) (5-38) j =0 k −1 = CΨ (k )x(0) + C∑ Ψ ( j ) Hu( k − j − 1) + Du( k ) . (5-39) j =0 Método da transformada z para a solução de equações de estado discretas Consideremos de novo a eq. x(k + 1) = Gx(k ) + Hu(k ) . Tomando a transformada z de ambos os lados desta eq., temos zX( z ) − zx(0) = GX( z ) + HU( z ) , ou seja, ( zI − G ) X( z ) = zx(0) + HU( z ) . Donde, X( z ) = ( zI − G ) −1 zx(0) + ( zI − G ) −1 HU( z ) . Tomando a transformada inversa desta, temos x(k ) = Z-1[( zI − G ) −1 z ]x(0) + Z-1[( zI − G ) −1 HU( z )] . Comparando esta com (5-30), temos G k = Z-1[( zI − G ) −1 z ] k −1 e ∑G k − j −1 Hu( j ) = Z-1[( zI − G ) −1 HU( z )] , (5-1bis) (5-41) (5-42) (5-43) (5-44) j =0 onde k = 1; 2; 3;... Exemplo 5-2: Obter a matriz de transição de estado do sistema (5-1bis) e (5-2bis), com 1⎤ ⎡ 0 ⎡1⎤ G=⎢ , H = ⎢ ⎥ , C = [1 0] e D = 0 . A seguir, calcule o estado x(k ) e a ⎥ ⎣ −0,16 −1⎦ ⎣1⎦ ⎡ x (0) ⎤ ⎡ 1 ⎤ resposta y (k ) com u (k ) = 1 para k = 0;1;2;... e o estado inicial x(0) = ⎢ 1 ⎥ = ⎢ ⎥ . ⎣ x2 (0) ⎦ ⎣ −1⎦ Solução: De (5-43), temos Ψ (k ) = G k = Z-1[( zI − G ) −1 z ] . z +1 1 ⎡ ⎤ −1 ⎢ −1 ⎤ ( z + 0, 2)( z + 0,8) ( z + 0, 2)( z + 0,8) ⎥ ⎡ z ⎢ ⎥ = Ora, ( zI − G ) −1 = ⎢ ⎥ z −0,16 ⎢ ⎥ ⎣ 0,16 z + 1⎦ ⎢ ( z + 0, 2)( z + 0,8) ( z + 0, 2)( z + 0,8) ⎥ ⎣ ⎦ −1/ 3 ⎡ 4/3 + ⎢ z + 0, 2 z + 0,8 =⎢ ⎢ −0,8 / 3 0,8 / 3 ⎢ z + 0, 2 + z + 0,8 ⎣ 5/3 + z + 0, 2 −1/ 3 + z + 0, 2 −5 / 3 ⎤ z + 0,8 ⎥ ⎥ . Donde, 4/3 ⎥ z + 0,8 ⎥⎦ 1 z 5 z 5 z ⎡ 4 z ⎤ − ⎢ 3 z + 0, 2 − 3 z + 0,8 3 z + 0, 2 3 z + 0,8 ⎥ ⎥ Ψ (k ) = G k = Z-1[( zI-G ) −1 z ] = Z-1 ⎢ 0,8 z 1 z 4 z ⎥ ⎢ 0,8 z ⎢ − 3 z + 0, 2 + 3 z + 0,8 − 3 z + 0, 2 + 3 z + 0,8 ⎥ ⎣ ⎦ 75 1 5 5 ⎡ 4 ⎤ k k k ( 0, 2) ( 0,8) ( 0, 2) (−0,8) k ⎥ − − − − − ⎢ 3 3 3 3 =⎢ (5-45) ⎥ ⎢ − 0,8 (−0, 2) k + 0,8 (−0,8) k − 1 (−0, 2) k + 4 (−0,8) k ⎥ ⎢⎣ 3 ⎥⎦ 3 3 3 Agora vamos calcular o estado: X( z ) = ( zI − G ) −1 zx(0) + ( zI − G ) −1 HU ( z ) = ( zI − G ) −1[ zx(0) + HU ( z )] . É dado do enunciado do problema que 1 z . Ora, X( z ) = ( zI − G ) −1[ zx(0) + HU ( z )] ; mas = U ( z) = −1 1− z z −1 2 ⎤ ⎡ z ⎤ ⎡ z ⎢ ⎥ ⎢ ⎥ ⎡ z ⎤ z −1 z −1 ⎥ . zx(0) + HU ( z ) = ⎢ ⎥ + ⎢ ⎥=⎢ 2 ⎣− z ⎦ ⎢ z ⎥ ⎢ − z + 2 z ⎥ ⎣⎢ z − 1 ⎦⎥ ⎢⎣ z − 1 ⎦⎥ 22 25 ⎤ ⎡ 17 z z⎥ ⎢ − 6 z ⎡ ⎤ ( z 2 + 2) z 9 18 + + ⎢ ⎥ ⎢ ( z + 0, 2)( z + 0,8)( z − 1) ⎥ z + 0, 2 z + 0,8 z − 1 ⎥ ⎢ ⎢ ⎥ = E, portanto, X( z ) = ; donde, ⎢ 3, 4 ⎢ ⎥ 17, 6 7 ⎥ (− z 2 + 1,84 z ) z ⎢ 6 z − 9 z 18 z ⎥ ⎢ ⎥ z + z + z − ( 0, 2)( 0,8)( 1) ⎣ ⎦ + + ⎢ ⎥ ⎣ z + 0, 2 z + 0,8 z − 1 ⎦ 22 25 ⎤ ⎡ 17 − (−0, 2) k + (−0,8) k + ⎢ 6 9 18 ⎥ x(k ) = Z-1[ X( z )] = ⎢ ⎥, 3, 4 17, 6 7 k k ⎢ (−0, 2) − (−0,8) + ⎥ ⎢⎣ 6 9 18 ⎥⎦ 22 25 ⎤ ⎡ 17 k k ⎢ − 6 (−0, 2) + 9 (−0,8) + 18 ⎥ y (k ) = Cx(k ) = [1 0] ⎢ ⎥ ⎢ 3, 4 (−0, 2) k − 17, 6 (−0,8) k + 7 ⎥ ⎢⎣ 6 9 18 ⎥⎦ 17 22 25 = − (−0, 2) k + (−0,8) k + . 6 9 18 Cálculo de ( zI − G ) −1 Este cálculo consome usualmente, se for feito manualmente, bastante tempo. Há métodos analíticos e computacionais para calcular ( zI − G ) −1 . Como é bem sabido, ( zI − G ) −1 pode ser expresso como função da adjunta de zI − G e do determinante da mesma, a saber, adj ( zI − G ) (5-46) ( zI − G ) −1 = zI − G Note-se que o determinante zI − G pode ser expresso como zI − G = z n + a1 z n −1 + a2 z n − 2 + ...an Pode-se demonstrar que adj ( zI − G ) = Iz n −1 + H1 z n − 2 + H 2 z n −3 + ... + H n −1 , onde H1 = G + a1I H 2 = GH1 + a2 I (5-47) (5-48) 76 ....................... (5-49) H n −1 = GH n − 2 + an −1I H n = GH n −1 + an I = 0 . Os coeficientes ai ' s podem ser obtidos ou pelo cálculo do determinante (5-47) ou pelas fórmulas (lembrando que o traço de uma matriz é a soma dos elementos da sua diagonal principal): 1 1 1 a1 = −tr (G ) , a2 = − tr (GH1 ) , a3 = − tr (GH 2 ) ,..., an = − tr (GH n −1 ) , (5-50) n 2 3 Procedemos sequencialmente da seguinte forma: 1 a1 = −tr (G ) , H1 = G + a1I , a2 = − tr (GH1 ) , H 2 = GH1 + a2 I , etc. 2 Conhecidos os ai ' s e os H i ' s , calcula-se ( zI − G ) −1 , usando (5-46) - (5-48). 0 ⎤ ⎡ 0,1 0,1 ⎢ Exemplo 5-3: Determinar ( zI − G ) , onde G = ⎢0,3 −0,1 −0, 2 ⎥⎥ . Obter também G k . ⎢⎣ 0 −0,3 ⎥⎦ 0 Solução: Neste caso o determinante é de ordem 3 e pode ser obtido facilmente. Mas usaremos o método alternativo proposto, para treinar. Da primeira eq. de (5-50), temos a1 = −tr (G ) = -(0,1-0,1-0,3) = 0,3. −1 0 ⎤ ⎡ 0,1 0,1 ⎢ Da primeira eq. de (5-49), temos H1 = G + a1I = ⎢ 0,3 −0,1 −0, 2 ⎥⎥ + ⎢⎣ 0 −0,3 ⎥⎦ 0 0 ⎤ ⎡ 0,3 0 ⎢ 0 0,3 0 ⎥ ⎢ ⎥ ⎢⎣ 0 0 0,3⎥⎦ 0 ⎤ ⎡ 0, 4 0,1 = ⎢⎢ 0,3 0, 2 −0, 2 ⎥⎥ . ⎢⎣ 0 0 0 ⎥⎦ 1 Da 2ª. eq. de (5-50), temos a2 = − tr (GH1 ) = 2 ⎧ ⎡ 0,1 0,1 0 ⎤ ⎡0, 4 0,1 0 ⎤⎫ ⎡ 0, 07 0, 03 −0, 02 ⎤ 1 ⎪⎢ 1 ⎢ ⎪ ⎥ ⎢ ⎥ − tr ⎨ ⎢0,3 −0,1 −0, 2 ⎥ ⎢ 0,3 0, 2 −0, 2 ⎥ ⎬ = − tr ⎢ 0, 09 0, 01 0, 02 ⎥⎥ = -0,04. 2 ⎪ 2 ⎪ ⎢ ⎥ ⎢ ⎥ ⎢⎣ 0 0 0 ⎥⎦ 0 0 − 0,3 0 0 0 ⎣ ⎦ ⎣ ⎦ ⎩ ⎭ Mas da 2ª. eq. (5-49), temos H 2 = GH1 + a2 I ; substituindo os valores obtidos, temos: ⎡ 0, 03 0, 03 −0, 02 ⎤ H 2 = ⎢⎢ 0, 09 −0, 03 0, 02 ⎥⎥ . E então, de novo de (5-50), temos a3 = -0,012. ⎢⎣ 0 0 −0, 04 ⎥⎦ Com estes elementos, já podemos calcular ( zI − G ) −1 . Mas é bom conferir a última eq. (5-49), a saber, GH 2 − 0, 012I = 0 . De (5-46)-(5-48), vem: 77 z + 0,1 0,1 −0, 02 ⎡ ⎤ ⎢ ( z + 0, 2)( z − 0, 2) ( z + 0, 2)( z − 0, 2) ( z + 0, 2)( z − 0, 2) ⎥ ⎢ ⎥ z z ⎢ 0,3 − 0,1 − 0, 2( − 0,1) ⎥ ( zI − G ) −1 = ⎢ . Expandindo ( z + 0, 2)( z − 0, 2) ( z + 0, 2)( z − 0, 2) ( z + 2)( z − 2) ⎥ ⎢ ⎥ ⎢ ⎥ 1 0 0 ⎢ ⎥ z + 0,3 ⎣ ⎦ cada uma das funções racionais e usando a Tabela 2-1, se for necessário, achamos G k = Z-1[( zI − G ) −1 z ] ⎡ 0, 25(−0, 2) k + 0, 75(0, 2) k ⎢ = ⎢ −0, 75(−0, 2) k + 0, 75(0, 2) k ⎢⎣ 0 −0, 25(−0, 2) k + 0, 25(0, 2) k 0, 5(−0, 2) k − 0,1(0, 2) k − 0, 4( −0, 3) k ⎤ 0, 75(−0, 2) k + 0, 25(0, 2) k −1, 5( −0, 2) k − 0,1(0, 2) k + 1, 6(−0, 3) k ⎥ 0 ⎥ ⎥⎦ ( −0, 3) k 5-4 MATRIZ DE TRANFERÊNCIA DE PULSO Consideremos novamente as eqs. de estado x(k + 1) = Gx(k ) + Hu(k ) , y (k ) = Cx(k ) + Du(k ) . De (5-42), com x(0) = 0 , obtemos (5-1bis) (5-2bis) X( z ) = ( zI − G ) −1 HU( z ) , Y( z ) = [C( zI − G ) −1 H + D]U( z ) = F ( z ) , onde F( z ) = C( zI − G ) −1 H + D (5-60) é a chamada matriz de função de transferência de pulso. Trata-se evidentemente de uma matriz m × r, lembrando as dimensões das matrizes em questão. adj ( zI − G ) . Donde que, Mas sabemos que ( zI − G ) −1 = zI − G F( z ) = Cadj ( zI − G )H +D. zI − G É claro que os pólos de F( z ) são as raízes de zI − G = 0, esta sendo então a eq. característica do sistema de tempo discreto, ou seja, z n + a1 z n −1 + a2 z n − 2 + ...an −1 z + an = 0. Transformações de similaridade Na seção 5.2 vimos que há um número infinito de representações em estado de estado de um mesmo sistema, ou seja, se definirmos x(k ) = Pxˆ (k ) , sendo P uma matriz não singular, obtemos o sistema ˆ ˆ (k ) + Hu ˆ (k ) xˆ (k + 1) = Gx (5-61) ˆ ˆ (k ) + Du ˆ (k ) , y (k ) = Cx (5-62) onde, como vimos, ˆ ; P −1H = H ˆ e D = D̂ . ˆ ; CP = C P −1GPx = G Ora, a função de transferência de pulso de (5-61) e (5-62) é ˆ ( zI − G ˆ ) −1 H ˆ +D ˆ. Fˆ ( z ) = C 78 Mas substituindo os valores acima, temos Fˆ ( z ) = CP( zI − P −1GP) −1 P −1H + D = C( zI − G ) −1 H + D = F( z ) . Ou seja, acabamos de demonstrar que a matriz de transferência não se altera quando fazemos uma transformação de similaridade, ou seja, transformação de estado da forma x(k ) = Pxˆ (k ) , com P não singular, um resultado já esperado, uma vez que a entrada e a resposta do sistema não se alteram quando fazemos transformação de estado. E é fácil verificar que o polinômio característico não se altera, pois ˆ = P −1 zI − G P = zI − G , ou seja, os auto-valores de G são invariantes sob zI − G transformação de similaridade. 5-5 Discretização de equações de espaço de estado de tempo contínuo Recordamos que ∞ 1 1 Ak t k . e At = I + At + A 2t 2 + .... + A k t k + .... = ∑ 2! k! k =0 k ! A série convergindo, pode ser diferenciada termo a termo, dando: d At A 3t 2 A k t k −1 + .... + + ... e = A + A 2t + 2! (k − 1)! dt (*) ⎛ ⎞ 1 A k t k −1 = A ⎜ I + At + A 2t 2 + .... + + ... ⎟ = Ae At 2! (k − 1)! ⎝ ⎠ ⎛ ⎞ 1 A k t k −1 = ⎜ I + At + A 2t 2 + .... + + ... ⎟ A = e At A . 2! (k − 1)! ⎝ ⎠ A seguinte propriedade, bem conhecida das funções exponenciais, também vale para exponenciais de matrizes: e At e As = e A (t + s ) . Com efeito, At As e e ⎛ ∞ A k t k ⎞⎛ ∞ A k s k = ⎜∑ ⎟⎜ ∑ ⎝ k =0 k ! ⎠⎝ k =0 k ! ⎞ ∞ k ⎛ k t i s k −i ⎞ ∞ k (t + s ) k = e A (t + s ) . ⎟ = ∑A ⎜∑ ⎟ = ∑A k! ⎠ k =0 ⎝ i =0 i !(k − i )! ⎠ k =0 (Verificar a segunda e terceira igualdades, usando (*) acima). É claro que se tivermos s = -t, vem imediatamente e At e − At = e− At e At = e A ( t −t ) = e A 0 = e0 = I . É fácil provar também que e( A + B )t = e At eBt se AB = BA e, em geral, e( A + B ) t ≠ e At eBt se AB ≠ BA . Passemos ao problema desta seção, isto é, a discretização do sistema de tempo contínuo. O sinal de tempo contínuo é amostrado a cada T unidades de tempo e mantido o seu valor até a próxima amostragem, ou seja, trata-se de um amostrador de ordem zero, seguido de um segurador (holder). Neste ponto recorda-se que no caso de sistemas de tempo contínuo, temos: x (t ) = Ax(t ) + Bu(t ) , (5-63) a solução sendo dada por: t x(t ) = e At x(0) + ∫ e A (t −τ ) Bu(τ )dτ , (5-64) 0 onde x(0) é obviamente o estado inicial. Temos então 79 u(t ) = u(kT ) para kT ≤ t < kT + T . Ora, de (5-64) com t = (k + 1)T e t = kT vem, respectivamente: ( k +1)T ∫ x((k + 1)T ) = e A ( k +1)T x(0) + e A ( k +1)T e− Aτ Bu(τ )dτ , (5-69) (5-70) 0 kT e x(kT ) = e AkT x(0) + e AkT ∫ e − Aτ Bu(τ )dτ . (5-71) 0 Multiplicando esta última eq. por e AT e subtraindo de (5-70), temos, tendo em vista os limites de integração das integrais: ( k +1)T x((k + 1)T ) = e AT x(kT ) + e A ( k +1)T ∫ e − Aτ Bu(τ )dτ . kT Mas em vista de (5-69), u(τ ) = u(kT ) = constante no integrando desta última equação. Donde, fazendo t = τ − kT , temos T x((k + 1)T ) = e AT x(kT ) + e AT ∫ e − At Bu(kT )dt . 0 Definindo agora λ = T − t , vem: 0 T T 0 x((k + 1)T ) = e AT x(kT ) − ∫ e Aλ Bu(kT )d λ = e AT x(kT ) + ∫ e Aλ Bu(kT )d λ . Definamos G (T ) = e AT (5-72) (5-73) ⎛T ⎞ (5-74) H (T ) = ⎜ ∫ e Aλ d λ ⎟ B , ⎝0 ⎠ com o que a eq. (5-72) se torna: x((k + 1)T ) = G (T )x(kT ) + H (T )u(kT ) . (5-75) E, claro, y (kT ) = Cx(kT ) + Du(kT ) . (5-76) Finalmente, observe-se que se a matriz A for não singular, então de (5-74) temos também: ⎛T ⎞ H (T ) = ⎜ ∫ e Aλ d λ ⎟ B = A −1 (e AT − I )B = (e AT − I ) A −1B . ⎝0 ⎠ A eq. de estado (5-75) é dita equivalente com amostrador de ordem zero à eq. de estado original (5-63). Note-se ainda de (5-73) que se T 1 , então G (T ) ≈ G (0) = e A 0 = I . e Y ( s) 1 = . Obter a representação de U ( s) s + a estado deste sistema e em seguida discretize-o, isto é, obtenha a representação de estado discreta do sistema, bem como a função de transferência. Solução: Obtemos imediatamente x = −ax + u e y = x . (Neste caso as formas canônica controlável, observável e diagonal coincidem). Ora, das eqs. (5-73) e (5-74), temos Exemplo 5-4: Seja o sistema dado por G ( s ) = G (T ) = e − aT T e H (T ) = ∫ e 0 − aλ 1 − e − aT . dλ = a Portanto a versão discreta das eqs. de estado é: 80 x(k + 1) = e − aT x(k ) + 1 − e − aT u (k ) , a y (k ) = x(k ) . E em vista de (5-60), a função de transferência de pulso para este sistema é: 1 − e − aT (1 − e − aT ) z −1 . F ( z ) = C ( zI − G ) −1 H = ( z − e − aT ) −1 = a a (1 − e − aT z −1 ) Podemos conferir este resultado calculando a função de transferência pelo método usado nos capítulos anteriores, a saber, calculando a função de transferência da planta precedida de um segurador de ordem zero: ⎛ 1 − e −Ts 1 ⎞ ⎛ 1 ⎞ (1 − e − aT ) z −1 −1 G( z) = Z ⎜ = F ( z ) , conferindo. ⎟ = (1 − z )Z ⎜ ⎟= − aT −1 ⎝ s ( s + a ) ⎠ a (1 − e z ) ⎝ s s+a⎠ Exemplo 5-5: Obter as eqs. de tempo discreto, a resposta do sistema e a função de transferência de pulso, com período de amostragem T = 1 do seguinte sistema de tempo Y ( s) 1 = . contínuo: G ( s ) = U ( s ) s ( s + 2) Solução: O sistema acima pode ser representado pelas seguintes eqs., como se pode ⎡ x ⎤ ⎡0 1 ⎤ ⎡ x1 ⎤ ⎡ 0 ⎤ ⎡x ⎤ verificar facilmente: ⎢ 1 ⎥ = ⎢ + ⎢ ⎥ u , y = [1 0] ⎢ 1 ⎥ . ⎢ ⎥ ⎥ ⎣ x2 ⎦ ⎣0 −2 ⎦ ⎣ x2 ⎦ ⎣1 ⎦ ⎣ x2 ⎦ A eq. de estado a ser obtida tem a forma: x((k + 1)T ) = G (T )x(kT ) + H (T )u (kT ) , onde G (T ) e H (T ) são dadas pelas eqs. (5-73) e (5-74). Obtém-se sem muita dificuldade: G (T ) = e H (T ) = (∫ T 0 ) AT ⎡1 0,5(1 − e −2T ) ⎤ =⎢ ⎥, e −2T ⎣0 ⎦ ⎛ T ⎡1 0,5(1 − e −2T ) ⎤ ⎞ ⎡0 ⎤ AT e dt B = ⎜ ∫ ⎢ ⎥dt ⎟⎟ ⎢ ⎥ = ⎜ 0 0 e −2T ⎦ ⎠ ⎣1 ⎦ ⎝ ⎣ ⎡ ⎛ e −2T − 1 ⎞ ⎤ + 0,5 T ⎢ ⎜ ⎟⎥ 2 ⎠ ⎥ . Então, ⎢ ⎝ ⎢⎣ 0,5(1 − e −2T ) ⎥⎦ ⎡ ⎛ e −2T − 1 ⎞ ⎤ ⎡ x1 ((k + 1)T ) ⎤ ⎡1 0,5(1 − e −2T ) ⎤ ⎡ x1 (kT ) ⎤ ⎢0,5 ⎜ T + ⎟⎥ 2 ⎠ ⎥ u (kT ) , ⎥⎢ ⎢ x ((k + 1)T ) ⎥ = ⎢ ⎥+⎢ ⎝ −2T x ( kT ) e ⎣ 2 ⎦ ⎣0 ⎦ ⎢ ⎦⎣ 2 −2T ⎣ 0,5(1 − e ) ⎥⎦ ⎡ x (kT ) ⎤ y (kT ) = [1 0] ⎢ 1 ⎥. ⎣ x2 (kT ) ⎦ Quando fazemos T = 1, estas eqs. se tornam ⎡ x1 (k + 1) ⎤ ⎡1 0, 4323⎤ ⎡ x1 (k ) ⎤ ⎡0, 2838⎤ ⎡ x1 (k ) ⎤ ⎢ x (k + 1) ⎥ = ⎢0 0,1353 ⎥ ⎢ x (k ) ⎥ + ⎢ 0, 4323⎥ u (k ) e y (k ) = [1 0] ⎢ x (k ) ⎥ . ⎦⎣ 2 ⎦ ⎣ ⎦ ⎣ 2 ⎦ ⎣ ⎣ 2 ⎦ A função de transferência de pulso é obtida da eq. (5-60): F ( z ) = C( zI − G ) −1 H + D 81 0, 4323 ⎡ 1 ⎤ ⎢ z − 1 ( z − 1)( z − 0,1353) ⎥ ⎡ 0, 2838⎤ ⎡ z − 1 −0, 4323 ⎤ ⎡ 0, 2838⎤ ⎢ ⎥⎢ = = [1 0] ⎢ 1 0 [ ] ⎥ ⎢ 0, 4323⎥ ⎥ z − 0 0,1353 1 ⎢ ⎥ ⎣ 0, 4323⎦ ⎣ ⎦ ⎣ ⎦ 0 ⎢ ⎥ z − 0,1353 ⎣ ⎦ −1 −2 0, 2838 z + 0,1485 0, 2838 z + 0,1485 z . = = ( z − 1)( z − 0,1353) (1 − z −1 )(1 − 0,1353 z −1 ) −1 Método de discretização de sistemas de tempo contínuo usando o MATLAB Dado o sistema de tempo contínuo x (t ) = Ax(t ) + Bu(t ) , trata-se de obter o sistema de tempo discreto correspondente x(k + 1) = Gx(k ) + Hu(k ) . O comando do MATLAB correspondente é: [G,H]=c2d(A,B,T) , onde T é o período de amostragem, o qual deve ser especificado em segundos. Se se quer quatro casas decimais, use-se o format short; caso se queira maior precisão, usar o format long. Se não se especifica o formato, o MATLAB usa o format short. Vejamos o exemplo em que o sistema de tempo contínuo é dado por 1 ⎤ ⎡ x1 ⎤ ⎡0 ⎤ ⎡ x1 ⎤ ⎡ 0 (5-77) ⎢ x ⎥ = ⎢ −25 −4 ⎥ ⎢ x ⎥ + ⎢1 ⎥ u ⎦⎣ 2⎦ ⎣ ⎦ ⎣ 2⎦ ⎣ Os comandos para obter G e H estão no retângulo abaixo: Como se vê no quadro acima, o tempo de amostragem usado foi T = 0,05 seg. Nos retângulos seguintes os períodos de amostragem são 0,2 e 1 seg., respectivamente. Como se verifica, as matrizes G e H mudam bastante quando se muda muito o tempo de amostragem. 1 0 0⎤ ⎡ 0 ⎡ 0 ⎤ ⎢ 20, 601 0 0 0 ⎥ ⎢ ⎥ ⎥ , B = ⎢ −1 ⎥ . Com o período Vejamos outro exemplo, em que A = ⎢ ⎢ 0 ⎢ 0 ⎥ 0 0 1⎥ ⎢ ⎥ ⎢ ⎥ ⎣ −0, 4905 0 0 0 ⎦ ⎣0,5⎦ 82 de amostragem T = 0,05, obtemos o seguinte resultado de acordo com o retângulo abaixo: Ao discretizarmos um sistema de tempo contínuo, obtemos o estado e a resposta nos instantes de amostragem. Ora, muitas vezes estamos também interessados no valor do estado e da resposta entre os instantes de amostragem. É disso que trataremos no final deste capítulo. Seja o sistema de tempo contínuo: x = Ax + Bu, y = Cx + Du . Suponhamos que a entrada u passe por um amostrador e um segurador de ordem zero. Vimos que u(τ ) = u(kT ) para kT ≤ τ < kT + T . Sabemos que a solução do sistema de tempo contínuo acima é: t x(t ) = e A (t −t0 ) x(t0 ) + ∫ e A (t −τ ) Bu(τ )dτ , onde t0 é o instante inicial. t0 Para obtermos o valor do estado entre os instantes de amostragem, façamos na expressão acima t = kT + ∆T , onde 0 < ∆T < T e t0 =kT. Obtemos: x(kT + ∆T ) = e A∆T x(kT ) + kT +∆T ∫ e A ( kT +∆T −τ ) Bu(kT )dτ . kT Definamos λ = kT + ∆T − τ . Donde que quando τ = kT , λ = ∆T e quando τ = kT + ∆T , λ = 0 ; por outro lado, d λ = − dτ . Portanto, temos x(kT + ∆T ) = e A∆T 0 x(kT ) − ∫e Aλ Bu(kT )d λ = e A∆T ∆T x(kT ) + ∆T Definimos: G (∆T ) = e A∆T , ⎛ ∆T ⎞ H (∆T ) = ⎜ ∫ e Aλ u(kT )d λ ⎟ B . ⎝0 ⎠ Obtemos, portanto x(kT + ∆T ) = G (∆T )x(kT ) + H (∆T )u(kT ) . Por sua vez, a resposta é: y (kT + ∆T ) = Cx(kT + ∆T ) + Du(kT ) , ou seja, y (kT + ∆T ) = CG (∆T )x(kT ) + [CH (∆T ) + D]u(kT ) . ∫e Aλ Bu(kT )d λ . 0 (5.78) (5-79) (5-80) (5-81) 83 Exemplo 5-6: Seja o sistema discutido no Exemplo (5-5). Obter a eq. de estado discretizada. Obter as expressões para T = 1 e ∆ T = 0,5 seg. Solução: Vimos no exemplo 5-5 que ⎡ ⎛ e −2T − 1 ⎞ ⎤ ⎡1 0,5(1 − e −2T ) ⎤ ⎢ 0,5 ⎜ T + ⎟⎥ G (T ) = ⎢ 2 ⎠ ⎥ . Então de (5-80) e (5-81). ⎥ e H (T ) = ⎢ ⎝ −2T e ⎣0 ⎦ ⎢⎣ 0,5(1 − e −2T ) ⎥⎦ temos ⎡ x1 (kT + ∆T ) ⎤ ⎡1 0,5(1 − e ⎢ x (kT + ∆T ) ⎥ = ⎢ e −2 ∆T ⎣ 2 ⎦ ⎣0 −2 ∆T ⎡ ⎛ e −2 ∆T − 1 ⎞ ⎤ ) ⎤ ⎡ x1 (kT ) ⎤ ⎢0,5 ⎜ ∆T + ⎟⎥ +⎢ ⎝ 2 ⎥⎢ ⎠ ⎥ u (kT ) , ⎥ ⎦ ⎣ x2 (kT ) ⎦ ⎢ −2 ∆T ) ⎥⎦ ⎣ 0,5(1 − e ⎡ ⎛ e −2 ∆T − 1 ⎞ ⎤ ∆ + 0,5 T ⎡1 0,5(1 − e −2 ∆T ) ⎤ ⎡ x1 (kT ) ⎤ ⎢ ⎜ ⎟⎥ + [1 0] ⎢ ⎝ y (kT + ∆T ) = [1 0] ⎢ 2 ⎥⎢ ⎠ ⎥ −2 ∆T ⎥ u (kT ) . x ( kT ) 0 e ⎦ ⎣ ⎦⎣ 2 ⎢⎣ 0,5(1 − e −2 ∆T ) ⎥⎦ Para T = 1 e ∆ T = 0,5 seg., temos ⎡ x1 (k + 0,5) ⎤ ⎡1 0,3161⎤ ⎡ x1 (k ) ⎤ ⎡ 0, 092 ⎤ ⎢ x (k + 0,5) ⎥ = ⎢0 0,3679 ⎥ ⎢ x (k ) ⎥ + ⎢ 0,3161⎥ u (k ) , ⎦⎣ 2 ⎦ ⎣ ⎦ ⎣ 2 ⎦ ⎣ ⎡ x (kT ) ⎤ y (k + 0,5) = [1 0,3161] ⎢ 1 ⎥ + 0, 092u (k ) . ⎣ x2 (kT ) ⎦ Problemas e soluções Problema 1: Achar a forma canônica controlável do seguinte sistema: Y ( z) z −1 + 5 z −2 . = U ( z ) 1 + 4 z −1 + 3z −2 Y ( z) z +5 = 2 . Solução: Multiplicando numerador e denominador por z 2 , temos U ( z) z + 4z + 3 ⎡ x (k + 1) ⎤ ⎡ 0 1 ⎤ ⎡ x1 (k ) ⎤ ⎡0 ⎤ Portanto, de (5-7)-(5-9), temos ⎢ 1 ⎥=⎢ ⎥ + ⎢ ⎥ u (k ) , ⎥⎢ ⎣ x2 (k + 1) ⎦ ⎣ −3 −4 ⎦ ⎣ x2 (k ) ⎦ ⎣1 ⎦ ⎡ x (k ) ⎤ y (k ) = [5 1] ⎢ 1 ⎥ . ⎣ x2 (k ) ⎦ Problema A-5-6: Obter uma representação de estado do sistema da Figura 5-4. O período de amostragem é T = 1 seg. 84 Solução: Primeiramente obtemos a transformada z da função de transferência em malha aberta (ou de “feedforward”, ou do canal direto) ⎛ 1 − e− s ⎛ ⎞ 0,3679( z + 0, 7181) 1 ⎞ 1 −1 . G( z) = Z ⎜ ⎟ = (1 − z )Z ⎜ 2 ⎟= ⎝ s ( s + 1) ⎠ ( z − 1)( z − 0,3679) ⎝ s s ( s + 1) ⎠ Expandindo esta em frações parciais, temos: 1 0, 6321 z −1 0, 6321z −1 − = − G( z) = . A Figura 5-5 abaixo mostra o z − 1 z − 0,3679 1 − z −1 1 − 0,3679 z −1 diagrama de blocos do sistema. Escolhemos a saída de cada unidade de retardo como variável de estado, conforme mostrado na figura. Do diagrama de blocos acima temos: zX 1 ( z ) = X 1 ( z ) − [ X 1 ( z ) − 0, 6321X 2 ( z )] + U ( z ) , zX 2 ( z ) = 0,3679 X 2 ( z ) − [ X 1 ( z ) − 0, 6321X 2 ( z )] + U ( z ) , Y ( z ) = X 1 ( z ) − 0, 6321X 2 ( z ) . E destas eqs. temos imediatamente: x1 (k + 1) = 0, 6321x2 (k ) + u (k ) , x2 (k + 1) = − x1 (k ) + x2 (k ) + u (k ) , y (k ) = x1 (k ) − 0, 6321x2 (k ) . Ou, em forma vetorial, ⎡ x1 (k + 1) ⎤ ⎡ 0 0, 6321⎤ ⎡ x1 (k ) ⎤ ⎡1⎤ ⎡ x (k ) ⎤ + ⎢ ⎥ u (k ) , y (k ) = [1 −0, 6321] ⎢ 1 ⎥ . ⎢ x (k + 1) ⎥ = ⎢ −1 ⎢ ⎥ ⎥ 1 ⎦ ⎣ x2 (k ) ⎦ ⎣1⎦ ⎣ 2 ⎦ ⎣ ⎣ x2 (k ) ⎦ Teorema A-5-9: Seja a eq. característica de uma matriz quadrada de dimensão n dada por λ I − A = λ n + a1λ n −1 + ... + an −1λ + an = 0 . Demonstre que a matriz A satisfaz á eq. característica, isto é, A n + a1A n −1 + ... + an −1A + an I = 0 . (Este é o teorema de Cayley-Hamilton, que deve ter sido dado no curso anterior ou no curso de Álgebra Linear). Definição: (Acontece que a eq. característica não é necessariamente a equação de menor grau satisfeita pela matriz A ). O polinômio de menor grau tal que A seja sua raiz é denominado polinômio mínimo. Seja φ (t ) este polinômio: 85 φ (λ ) = λ m + a1λ m−1 + .... + am−1λ + am , com m ≤ n . Então, por definição, φ ( A) = A m + a1A m −1 + .... + am −1A + am I = 0 . Propriedade A-5-10: Seja d (λ ) o maior divisor comum de todos os elementos de adj (λ I − A) e suponha que ele seja mônico, isto é, o coeficiente do seu termo de mais adj (λ I − A) . alto grau é 1. Então o polinômio mínimo é dado por: φ (λ ) = d (λ ) Propriedade A-5-11: Se os auto-valores de uma matriz são todos distintos, então o polinômio mínimo coincide com o polinômio característico da matriz. Se algum autovalor tiver grau de multiplicidade maior que 1 e houver um bloco de Jordan associado a ele, então o polinômio mínimo também coincide com o polinômio característico da matriz. Se, porém não houver bloco de Jordan associado ao auto-valor com grau de multiplicidade maior que 1, então o polinômio tem grau menor do que o polinômio característico da matriz. ⎡1 0 ⎤ Assim, por exemplo, no primeiro caso, se A1 = ⎢ ⎥ , então ⎣0 2⎦ λ −1 0 = (λ − 1)(λ − 2) = λ 2 − 3λ + 2 . É fácil verificar que A12 − 3A1 + 2I = 0 e é λ −2 0 claro que não existem números a e b tais que aA1 + bI = 0 , portanto o polinômio mínimo coincide com o polinômio característico da matriz. ⎡1 1⎤ 2 Seja agora o caso de um bloco de Jordan: A 2 = ⎢ ⎥ ∴ λ I − A 2 = (λ − 1) e é fácil 0 1 ⎣ ⎦ verificar que A 22 − 2 A 2 + I = 0 ; é fácil ver também que não existem números a e b tais que aA1 + bI = 0 . Finalmente seja o caso em que o auto-valor tem multiplicidade 2, mas não há bloco de ⎡1 0 ⎤ Jordan: A 3 = ⎢ ⎥ ; o polinômio característico é igual ao do caso anterior, ou seja, ⎣0 1 ⎦ (λ − 1) 2 ; mas neste caso, com a = 1 e b = -1, temos aA 3 + bI = 0 , ou seja, o polinômio mínimo é λ − 1 , com grau menor que o do polinômio característico. Y ( s) ω2 = 2 . Obtenha U ( s) s + ω 2 representação de estado deste sistema de tempo contínuo, discretize-o e obtenha a representação de estado de estado do sistema discretizado. Finalmente, obtenha também a função de transferência de pulso. Solução: Da definição do sistema temos imediatamente a eq. diferencial: y + ω 2 y = ω 2u . y Definamos as variáveis de estado x1 = y, x2 = . Ou seja, em forma vetorial: Problema A-5-14: Seja o seguinte sistema, um oscilador: ω ⎡ x1 ⎤ ⎡ 0 ω ⎤ ⎡ x1 ⎤ ⎡ 0 ⎤ ⎡ x1 ⎤ ⎢ x ⎥ = ⎢ −ω 0 ⎥ ⎢ x ⎥ + ⎢ω ⎥ u , y = [1 0] ⎢ x ⎥ . ⎦⎣ 2⎦ ⎣ ⎦ ⎣ 2⎦ ⎣ ⎣ 2⎦ Em vista de A e B dados acima, de (5-73) e (5-74) temos: G = e AT = L-1[( sI − A) −1 ] 86 ω ⎤ ⎡ s −1 2 2 2 ⎛ ⎞ ⎢ sen cos ωT ⎤ ⎡ s −ω ⎤ s + ω 2 ⎥ ⎡ cos ωT -1 s + ω ⎟ = L-1 ⎜ ⎢ L = , ⎢ ⎥=⎢ ⎥ ⎜ ⎣ω s ⎦ ⎟ −ω cos ωT ⎦⎥ s ⎥ ⎣ − sen cos ωT ⎢ ⎝ ⎠ ⎢⎣ s 2 + ω 2 s 2 + ω 2 ⎥⎦ T ⎛ T ⎡ cos ωT senωT ⎤ ⎞ ⎡ 0 ⎤ ⎡1 − cos ωT ⎤ H = ∫ e Aλ B = ⎜ ∫ ⎢ ⎥ dλ ⎟ ⎢ ⎥ = ⎢ ⎥. 0 0 ⎝ ⎣ − senωT cos ωT ⎦ ⎠ ⎣ω ⎦ ⎣ senωT ⎦ Temos então ⎡ x1 ((k + 1)T ) ⎤ ⎡ cos ωT senωT ⎤ ⎡ x1 (kT ) ⎤ ⎡1 − cos ωT ⎤ ⎢ x ((k + 1)T ) ⎥ = ⎢ − senωT cos ωT ⎥ ⎢ x (kT ) ⎥ + ⎢ senωT ⎥ u (kT ) , ⎦⎣ 2 ⎦ ⎣ 2 ⎦ ⎣ ⎦ ⎣ ( ) ⎡ x (kT ) ⎤ y (kT ) = [1 0] ⎢ 1 ⎥. ⎣ x2 (kT ) ⎦ A função de transferência de pulso é: −1 − senωT ⎤ ⎡1 − cos ωT ⎤ ⎡ z − cos ωT −1 F ( z ) = C( zI − G ) H + D = [1 0] ⎢ z − cos ωT ⎥⎦ ⎢⎣ senωT ⎥⎦ ⎣ senωT senωT ⎤ ⎡1 − cos ωT ⎤ ⎡ z − cos ωT 1 = 2 [1 0] ⎢ z − cos ωT ⎥⎦ ⎢⎣ senωT ⎥⎦ z − 2 z cos ωT + 1 ⎣ − senωT (1 − cos ωT )( z + 1) (1 − cos ωT )(1 + z −1 ) z −1 = . = 2 z − 2 z cos ωT + 1 1 − 2 z −1 cos ωT + z −2 Seja observado que se obtém o mesmo resultado achando a transformada z da função de transferência de tempo contínuo, ω2 precedida de um segurador de ordem zero. s2 + ω 2 Problema A-5-15: Seja o sistema da figura 5-8(a) abaixo, o qual tem polos complexos. Este sistema é marginalmente estável, como sabemos do primeiro curso. A figura 5-8(b) é uma versão discretizada do sistema de tempo contínuo. Este sistema também é marginalmente estável. Suponha que o sistema seja submetido a um degrau unitário na entrada. Mostre que o sistema discretizado pode ter oscilações ocultas quando o período de amostragem T assume certo valor. s2 1 s = 2 , ou seja, 2 s +4 s s +4 y(t)=cos2t . Esta resposta é mostrada na figura 5-9(a) abaixo. Solução: A resposta do sistema de tempo contínuo é Y ( s ) = 87 A função de transferência de pulso do sistema discretizado é: ⎛ 1 − e −Ts s 2 ⎞ Y ( z) 1 − z −1 cos 2T ⎛ s ⎞ −1 −1 . Portanto a = Z⎜ = − = − (1 z )Z (1 z ) ⎟ ⎜ 2 ⎟ 2 U ( z) 1 − 2 z −1 cos 2T + z −2 ⎝s +4⎠ ⎝ s s +4⎠ resposta do sistema ao degrau unitário será: (1 − z −1 ) 1 − z −1 cos 2T 1 = −1 −2 1 − 2 z cos 2T + z 1 − z −1 1 − z −1 cos 2T . 1 − 2 z −1 cos 2T + z −2 É claro da tabela 2-1, entrada 15, que a resposta é y (kT ) = cos 2kT , com ω = 2. 1 ⎛π ⎞ ⎛π ⎞ Se, por exemplo, T = π seg., temos y (kT ) = y ⎜ k ⎟ = cos ⎜ k ⎟ , ou seja, 4 ⎝2 ⎠ ⎝2 ⎠ y (0) = 1; y (1) = 0; y (2) = −1; y (3) = 0; y (4) = 1;... Um gráfico destes resultados é apresentado na figura 5-9(b) acima, no qual se vê que a resposta é oscilatória. (1 − z −1 )(1 − z −1 ) 1 1 Se porém T = π , então temos Y ( z ) = = , e portanto a −1 −2 −1 1− 2z − z 1− z 1 − z −1 resposta no domínio do tempo é y (k ) = 1 para k = 1; 2;3;... , mostrado na figura (c). Esta resposta, ao contrário da anterior, pode induzir a idéia de que y (k ) se mantenha constante, ou seja, com T = π temos oscilações ocultas. 88