1 Instituto Nacional de Pesquisas Espaciais INPE Divisão de Mecânica Espacial e Controle Cinemática e dinâmica da atitude de satélites artificiais. Valdemir Carrara 3 Índice 1 – Introdução 2 – Cinemática 2.1 – Notação de vetores e matrizes 2.2 – Vetrizes 2.3 – Transformações de coordenadas 2.4 – Operações entre vetores e entre vetrizes 2.5 – Diádicas 2.6 – Representação da atitude Matriz de co-senos diretores Ângulo e eixo de Euler Ângulos de Euler Parâmetros simétricos de Euler Movimento com ângulos infinitesimais 2.7 – Cinemática Velocidade angular Cinemática em ângulo-eixo de Euler Cinemática em ângulos de Euler Cinemática em parâmetros simétricos de Euler Cinemática em deslocamentos infinitesimais 3 – Dinâmica da atitude 3.1 – Centro de massa e momento de inércia 3.2 – Dinâmica de um sistema de pequenas massas Equação vetorial para o momento angular Momento angular num sistema girante Energia cinética do sistema de massas Equações escalares do movimento 3.3 – Dinâmica de um corpo rígido Equações vetoriais do movimento Equações escalares do movimento Equações em relação ao centro de massa 3.4 – Corpo rígido acoplado a rotores Equações vetoriais do movimento Equações escalares do movimento Equações em relação ao centro de massa 3.5 – Corpo rígido com amortecedor de nutação Equações vetoriais do movimento Equações escalares do movimento para amortecedor translacional Equações em relação ao centro de massa com amortecedor translacional Equações escalares do movimento para amortecedor rotacional 3.6 – Corpo rígido acoplado a apêndices articulados Equações vetoriais do movimento Equações escalares do movimento Equações vetoriais do movimento em relação ao centro de massa Equações escalares do movimento em relação ao centro de massa Equações vetoriais com velocidades explícitas no tempo Referências bibliográficas 4 5 1 – Introdução Um satélite artificial em órbita da Terra ou vagando pelo espaço pode ser considerado fisicamente como um corpo livre de forças e torques, no sentido de que as ações remanescentes, isto é, as forças e torques que ainda restam neste ambiente são de pequena intensidade e, portanto, produzem pouco ou nenhum efeito em seu movimento. Mais especificamente, as forças alteram a velocidade do satélite, e, como conseqüência, modificam sua órbita. Por outro lado os torques são responsáveis pelo movimento do satélite ao redor de si, ou seja, alteram a velocidade de rotação dele. Este movimento muda a orientação com o tempo, e permite que o satélite aponte um dado instrumento para uma direção escolhida, desde que se consiga dosar o torque convenientemente. A direção que o satélite aponta é conhecida como atitude, e o movimento é dito movimento de atitude. A atitude é sempre relacionada a um sistema de referência, isto é, um sistema de coordenadas em relação ao qual a atitude é referida ou medida. Para que o movimento do próprio sistema de coordenadas de referência não afete ou influencie a atitude, é desejável que este sistema seja inercial, que, por definição, indica um sistema fixo (sem movimento) em relação ao espaço. Na prática não existe um sistema inercial perfeito, pois até mesmo as estrelas mais distantes movem-se com relação à Terra. Contudo, este movimento pode ser ignorado para finalidades analisadas aqui. O estudo do movimento de atitude pode ser feito de forma independente às suas causas, ao que se chama cinemática, ou então levando em conta o movimento ao longo do tempo, conhecido como dinâmica. Na verdade ambos são importantes no projeto de satélites, e serão abordados nos próximos capítulos. A modelagem apresentada neste documento visa atender a um objetivo estabelecido já há alguns anos, de dotar o INPE com um sistema de simulação computacional de atitude, que pudesse ajudar no desenvolvimento das diversas fases de uma missão espacial, desde a análise da missão, passando pelo projeto e definição do sistema de controle de atitude, e chegando até a fase de simulação em tempo real com equipamentos dentro da malha de controle, para finalidades de qualificação do subsistema. Enquanto que este documento relata o modelo físico-matemático a ser empregado neste simulador, um outro documento (Carrara, 2007) apresenta toda a estrutura e o uso do pacote computacional. 6 2 – Cinemática O movimento de um corpo rígido no espaço é usualmente representado por um conjunto de equações vetoriais. Livros e artigos empregam notações distintas, por vezes conflitantes, ao apresentar tais modelos. Um vetor pode, por exemplo, ser denotado em negrito, como em u, com seta acima ou abaixo do símbolo ( u , u ), ou ainda em itálico com ou sem negrito ( u , u ), e, finalmente, até mesmo em itálico e sem negrito como em u. Diante de tantas variações, é natural que surja um pouco de confusão, ainda mais se for considerado que um vetor necessita ser expresso em uma base ou sistema de coordenadas, e, novamente, novas alternativas se abrem: u = [u x , u y , u z ] , ou u = (u x u y u z )T , ou u = u x ˆi + u y ˆj + u z kˆ , e muitas outras. Além disso, vetores unitários como k̂ aparecem, às vezes, com seta ou, como foi grafado, com um circunflexo superior ou ainda sem qualquer ênfase. A indicação de transposição de uma matriz ou vetor sofre de ambigüidade: por vezes é o sobrescrito T (itálico ou não), e por vezes basta uma apóstrofe como em u’. A representação dos componentes do vetor na forma matricial tampouco é exclusiva: usam-se igualmente parêntesis ou colchetes para indicá-los. Outro problema típico é a possibilidade de se representar um mesmo vetor em bases distintas. Uma vez que não se pode escrever: u = (u x , u y , u z ) e u = (vx , v y , vz ) sem que inevitavelmente se conclua que ux = vx, uy = vy e uz = vz, então uma indicação clara do sistema de coordenadas no qual o vetor é representado torna-se obrigatória. Para isso emprega-se tanto sobrescritos quanto sub-escritos: u o , u o , ou u = (u x , u y , u z )o . Infelizmente esta técnica introduz um outro problema, já que notações diferentes passam a representar um mesmo vetor, ou seja, parece haver um paradoxo ao se efetuar uma simples soma vetorial como esta: u o = v a + w b , pois os vetores seriam representados em bases distintas. Embora seja perfeitamente possível trabalhar exclusivamente com uma representação vetorial-matricial dependente da base, esta forma exige cuidados especiais sempre que for necessário efetuar mudanças de base. As referências bibliográficas nesta área freqüentemente cometem imprecisões matemáticas para o bem da visualização. A própria representação matricial de um vetor é uma incoerência, pois vetores são entidades que possuem módulo, direção e sentido, o que certamente não se enquadra na definição de matrizes, muito embora seja possível atribuir ou deduzir estas qualidades a partir dos componentes expressos numa base qualquer. Além disso, certas operações como o produto escalar e vetorial são definidos para vetores, mas não para matrizes, ainda que seu resultado também possa ser obtido, em última instância, por operações ordinárias entre matrizes. Na busca por uma notação que, mais do que resolver o problema, pudesse oferecer um pouco mais de rigor matemático e físico, decidiu-se utilizar o conceito de vetrizes, que, como a mistura do nome indica, permite passar de uma representação para a outra, mantidos os devidos conceitos de cada uma, aliado a um maior rigor matemático. Este conceito não é de fácil assimilação, embora suas vantagens tornem-se evidentes com seu uso intensivo. A formalização de vetrizes pode ser encontrada em diversos livros, e, em particular, em Hughes (Hughes, 1986). Será apresentado aqui, nas próximas seções, a definição de vetrizes, suas principais propriedades, e um resumo acerca da representação da atitude. 7 2.1 – Notação de vetores e matrizes Vetores serão representados em negrito, em minúsculo, com seta abaixo do símbolo: u , w ou a . Matrizes de uma ou mais colunas são apresentadas com símbolos em negrito, como u, v ou J. Em geral símbolos em minúsculo representarão os vetores ou matrizes de uma coluna. Símbolos em itálicos serão usados para representar escalares. As principais operações utilizadas aqui e que envolvem vetores são o produto escalar entre dois vetores: a = u ⋅ v ≜ u v cos θ , 2.1 que resulta num escalar igual ao produto do módulo dos dois vetores e o co-seno do ângulo θ entre ambos, e o produto vetorial: w = u × v . 2.2 que resulta um vetor w perpendicular a ambos, e cujo módulo é dado pelo produto dos módulos dos vetores e o seno do ângulo θ entre eles: w = u × v ≜ u v sen θ 2.3 Quando os vetores u e v são expressos em termos de combinação linear de versores unitários â1 , â 2 , â 3 de uma base ortonormal, tal que u = u1 aˆ 1 + u2 aˆ 2 + u3 aˆ 3 e v = v1 aˆ 1 + v2 aˆ 2 + v3 aˆ 3 , então o produto escalar é facilmente obtido por meio de: a = u ⋅ v = u1 v1 + u2 v2 + u3 v3 , 2.4 enquanto que o produto vetorial resulta: w = u × v = (u2 v3 − u3v2 ) aˆ 1 + (u3v1 − u1v3 ) aˆ 2 + (u1v2 − u2 v1 ) aˆ 3 2.5 O módulo de um vetor pode ser obtido com base nas componentes referidas à base ortonormal: u = u = u ⋅ u = u1 u1 + u2 u2 + u3 u3 2.6 A representação matricial de um vetor é feita na forma de uma matriz coluna: v = (v1 v2 v1 v3 ) = v2 , v 3 T 2.7 onde o sobrescrito “T” indica a transposição da matriz. As operações equivalentes ao produto escalar e vetorial na representação matricial são efetuadas por: 8 a = vT w , 2.8 u = v× w , 2.9 e respectivamente, no qual o sobrescrito “×” indica a composição da matriz anti-simétrica equivalente ao produto vetorial: 0 v ≜ v3 −v 2 × −v3 0 v1 v2 −v1 , 0 dado que se conheça as componentes de v numa dada base: v = (v1 v2 2.10 v3 )T . Assim como no produto vetorial vale a regra v × w = −w × v , segue também que T T v× w = − w × v . Igualmente, como v ⋅ w =w ⋅ v , também v w = w v . Duas propriedades dos vetores são importantes do ponto de vista da análise dinâmica do movimento de um sólido: o duplo produto vetorial e o produto misto. Ambas são de fácil demonstração e, portanto, serão apresentadas sem maiores detalhes. O duplo produto vetorial resulta: u × ( v × w ) = (u ⋅ w ) v − (u ⋅ v )w , 2.11 enquanto que o produto misto permite escrever: u ⋅ v × w = u × v ⋅ w 2.12 As representações matriciais destas duas propriedades são, respectivamente: u× v× w = (uT w ) v − (uT v )w 2.13 uT v× w = (u× v )T w = vT w ×u 2.14 e A combinação das propriedades acima indicadas com aquelas da permutação dos operadores permite estender ainda mais o número de igualdades. Este desenvolvimento será deixado a cargo do leitor. 2.2 - Vetrizes Uma vez estabelecido que vetores são diferentes de matrizes, introduz-se agora uma transformação que permite passar de uma representação para outra. Já que a forma matricial 9 será usada exclusivamente para a notação dos componentes de um vetor numa dada base, seja então a base Fa de um sistema de coordenadas retangulares na qual o vetor v é expresso por: v = v1 aˆ 1 + v2 aˆ 2 + v3 aˆ 3 , 2.15 e tal que os versores aˆ i , (i = 1, 2, 3) que constituem a base de Fa são unitários. Uma vetriz Fa é então definida como a matriz coluna que armazena, em seus componentes, os versores relativos a esta base: aˆ 1 Fa ≜ aˆ 2 aˆ 3 2.16 Não há conflito em utilizar o mesmo símbolo Fa para denotar a base e a vetriz, pois esta última fornece justamente os versores da base. Nota-se que a vetriz é tanto uma matriz quanto um vetor, de onde provém o nome de vetriz. Se for definida agora a matriz coluna dos componentes do vetor v na mesma base, isto é, sendo v dado por: v1 v ≜ v2 , v 3 2.17 segue então imediatamente que se pode perfeitamente passar da representação matricial para a vetorial (e vice-versa) por meio de simples operações de produto escalar entre vetores ou produto de matrizes: v = vT Fa = Fa T v , 2.18 e similarmente v ⋅ aˆ 1 v = v ⋅ Fa = Fa ⋅ v = v ⋅ aˆ 2 v ⋅ aˆ 3 2.19 Estas equações, embora simples, sintetizam ao mesmo tempo o poder e a flexibilidade das vetrizes, pois permitem passar de uma representação para outra. É claro que desta última pode-se também inferir que vT = v ⋅ Fa T = Fa T ⋅ v , 2.20 de onde se percebe que, ao contrário de um vetor, uma vetriz pode ser transposta. É importante notar que as vetrizes comportam-se tanto como vetores quanto como matrizes. De fato, percebe-se que: 10 0 Fa × Fa T = −aˆ 3 aˆ 2 −aˆ 2 aˆ 1 ≜ − Fa × , 0 aˆ 3 0 −aˆ 1 2.21 enquanto que: Fa ⋅ Fa T = 1 2.22 no qual 1 é a matriz identidade de ordem 3. O produto escalar entre os vetores u e v expressos na base Fa pode agora ser posto na forma de vetrizes, resultando: u ⋅ v = uT Fa ⋅ Fa T v = uT v , 2.23 já definido anteriormente. O produto vetorial entre u e v é realizado de forma similar: u × v = uT Fa × Fa T v = −uT Fa × v = Fa T u× v , 2.24 cuja prova será deixada a cargo do leitor. A principal distinção entre as representações é evidenciar que um vetor, ao contrário de seu equivalente matricial, não necessita de uma base. De fato, dados dois sistemas de coordenadas Fa e Fb, se va e vb representarem respectivamente o vetor v nestas bases, então pode-se escrever: v = Fa T v a = Fb T v b , 2.25 e, analogamente, v a = Fa ⋅ v , v b = Fb ⋅ v 2.26 2.3 – Transformações de coordenadas ( ) T Se um sistema de referência Fb cuja base é dada pela vetriz Fb = bˆ 1 bˆ 2 bˆ 3 possuir uma dada orientação relativa a um outro sistema Fa, então conhecendo-se os co-senos diretores dos versores de Fb em relação a Fa (Figura 2.1) pode-se relacionar os sistemas por meio de: bˆ 1 = c11 aˆ 1 + c12 aˆ 2 + c13 aˆ 3 bˆ = c aˆ + c aˆ + c aˆ 2 21 1 22 2 23 3 bˆ 3 = c31 aˆ 1 + c32 aˆ 2 + c33 aˆ 3 , que leva à expressão: 2.27 11 Fb = Cba Fa , 2.28 no qual a matriz Cba fornece os co-senos diretores da transformação: c13 bˆ 1 ⋅ aˆ 1 bˆ 1 ⋅ aˆ 2 c23 = bˆ 2 ⋅ aˆ 1 bˆ 2 ⋅ aˆ 2 c33 bˆ 3 ⋅ aˆ 1 bˆ 3 ⋅ aˆ 2 c11 c12 Cba = c21 c22 c 31 c32 bˆ 1 ⋅ aˆ 3 bˆ 2 ⋅ aˆ 3 = Fb ⋅ Fa T bˆ 3 ⋅ aˆ 3 2.29 b̂ 3 â 3 Fb Fa â 2 b̂ 2 b̂1 â1 Fig. 2.1 – Os sistemas de coordenadas Fa e Fb. Uma vez que toda matriz de transformação entre sistemas de coordenadas retangulares é ortogonal própria, então vale a propriedade: −1 Cba = CTba = Cab , 2.30 de onde se conclui que: −1 Fa = Cab Fb = Cba Fb = CTba Fb . 2.31 Multiplicando à direita pela transposta da vetriz Fb, tem-se igualmente que: Cab = Fa ⋅ Fb T . 2.32 Em particular, quando a transformação envolvendo os sistemas é uma rotação pura efetuada ao redor de um dos eixos cartesianos (1, 2 ou 3), então as matrizes que relacionam os sistemas resultam em (Hughes, 1986; Wertz, 1978): 0 0 1 C1 (θ) ≜ 0 cos θ sen θ , 0 − sen θ cos θ cos θ 0 − sen θ C2 (θ) ≜ 0 1 0 sen θ 0 cos θ 2.33 Incluir uma figura de uma rotação no eixo z do sistema 1 até o sistema 2, e com isso Cx = C21 2.34 12 cos θ sen θ 0 C3 (θ) ≜ − sen θ cos θ 0 0 0 1 2.35 Estas matrizes são denominadas básicas, pois operam em direções específicas. Para inverter qualquer uma delas, basta trocar o sinal do ângulo de rotação, o que leva ao resultado: Ci−1 (θ) = CTi (θ) = Ci (−θ) . 2.36 Se va e vb representarem a matriz coluna dos componentes do vetor v nas bases Fa e Fb, respectivamente, então por definição tem-se que: v a = Fa ⋅ v , v b = Fb ⋅ v , 2.37 mas, da inversão desta última, v = Fb T v b , que resulta, após a substituição em va: v a = Fa ⋅ Fb T v b = Cab v b , 2.38 um resultado já bastante conhecido. Cab representa a matriz, portanto, dos co-senos diretores da base Fa na base Fb, ou a matriz de rotação que gira o sistema b em direção ao sistema a. 2.4 – Operações entre vetores e entre vetrizes Com base nas definições de vetrizes e matrizes de mudança de base, pode-se estabelecer as principais propriedades das operações entre vetores. Seja então três vetores u , v e w , cujas representações matriciais u = Fa ⋅ u , v = Fb ⋅ v e w = Fc ⋅ w são conhecidas em bases distintas Fa, Fb e Fc, respectivamente, e tal que Cab e Cac são as matrizes de mudança de base entre os sistemas Fa e Fb, e entre Fa e Fc, ou seja: Cab = Fa ⋅ Fb T , Cac = Fa ⋅ Fc T . 2.39 Neste caso, a soma, o produto escalar e o produto vetorial resultam: u + v + w = = Fa T (u + Cab v + Cac w ) = Fb T (CTab u + v + CTab Cac w ) , 2.40 = Fc T (CTac u + CTac Cab v + w ) u ⋅ v = uT Fa ⋅ Fb T v = uT Cab v = (CTab u)T v , 2.41 u × v = = uT Fa × Fb T v = uT Fa × Fa T Cab v = Fa T u× Cab v , 2.42 = uT Fa × Fb T v = uT Cab Fb × Fb T v = Fb T (CTab u)× v 13 Mas, substituindo Fa T = Fb T CTab nesta última expressão chega-se à identidade: (CTab u)× = CTab u× Cab . 2.43 Considerando que Fa = ( aˆ 1 aˆ 2 operações para as vetrizes: ( T aˆ 3 ) e Fb = bˆ 1 bˆ 2 bˆ 3 ) T , define-se as seguintes a) Produto escalar de um vetor por uma vetriz, resultando uma matriz coluna: v ⋅ Fa = Fa ⋅ v = v 2.44 b) Produto vetorial entre um vetor e uma vetriz, resultando uma vetriz Fc: v × aˆ 1 v × Fa ≜ v × aˆ 2 = − v× Fa = Fa× v = Fc v × aˆ 3 2.45 c) Produto escalar entre vetrizes, resultando numa matriz ou num escalar: aˆ 1 ⋅ bˆ 1 aˆ 1 ⋅ bˆ 2 Fa ⋅ Fb T ≜ aˆ 2 ⋅ bˆ 1 aˆ 2 ⋅ bˆ 2 aˆ 3 ⋅ bˆ 1 aˆ 3 ⋅ bˆ 2 aˆ 1 ⋅ bˆ 3 aˆ 2 ⋅ bˆ 3 = Cab aˆ 3 ⋅ bˆ 3 Fa T ⋅ Fb ≜ aˆ 1 ⋅ bˆ 1 + aˆ 2 ⋅ bˆ 2 + aˆ 3 ⋅ bˆ 3 2.46 2.47 d) Produto vetorial entre vetrizes, que resulta no produto de uma vetriz vetorial por uma matriz: aˆ 1 × bˆ 1 aˆ 1 × bˆ 2 Fa × Fb T ≜ aˆ 2 × bˆ 1 aˆ 2 × bˆ 2 aˆ 3 × bˆ 1 aˆ 3 × bˆ 2 aˆ 1 × bˆ 3 aˆ 2 × bˆ 3 = − Fa × Cab aˆ 3 × bˆ 3 2.48 e) Produto de uma vetriz por uma matriz coluna, resultando num vetor: vT Fa = Fa T v = v , 2.5 – Diádicas Uma diádica é definida como o produto entre dois vetores. Representa-se este produto por uma justaposição dos vetores u e v , resultando numa diádica D : D = u v , 2.49 14 sendo que este produto, em geral, não é comutativo, isto é, u v ≠ v u . A adição das diádicas I e J é também uma diádica D = I + J . O produto interno entre um vetor e uma diádica, diferentemente do produto escalar, resulta num vetor: u = v ⋅ D , 2.50 e que também não é comutativo, uma vez que v ⋅ D ≠D ⋅ v . Embora uma diádica seja representada por uma seta sob o símbolo, ela possui propriedades diferentes dos vetores e, rigorosamente, não pode ser considerada como um vetor. Por sua vez, se for considerado que um dos vetores da diádica origina-se do produto vetorial entre dois vetores, define-se então: J = (w , × u ) v = w × u v ≜ w ×D 2.51 que é também uma diádica. Contudo, percebe-se novamente que este produto não é comutativo e nem recíproco como o produto vetorial entre dois vetores: K = u ( v × w ×w ) = u v × w ≜D 2.52 O duplo produto vetorial na forma u × ( v × w ) resulta num vetor que se encontra no plano de v e w , e assim pode ser posto como uma combinação linear destes dois vetores, o que leva a: u × ( v × w ) = (u ⋅ w ) v − (u ⋅ v )w 2.53 Porém, uma vez que os parêntesis do segundo membro são desnecessários, pois há somente uma forma de se calculá-lo, então esta propriedade fica: u × ( v × w wv − u ⋅ D vw = u ⋅ (D wv − D vw ) ) = u ⋅ w v − u ⋅ v w = u ⋅ D 2.54 Decorre daí que as diádicas surgem sempre em decorrência de um produto interno, e considerando a igualdade u ⋅ v w =w u ⋅ v = w v ⋅ u , tem-se igualmente que u ⋅ D vw = D wv ⋅ u 2.55 Substituindo esta propriedade no duplo produto, chega-se a u × ( v × w wv − D wv ⋅ u = D vw ⋅ u − u ⋅ D vw , ) = u ⋅ D 2.56 que mostra que o produto interno entre uma diádica e um vetor não é comutativo. Considera-se novamente a diádica D = u v , tal que os vetores são conhecidos numa base Fa. Aplicando o conceito de vetrizes, tem-se que T T T D = Fa u v Fa = Fa D Fa , 2.57 15 de onde se conclui que a representação matricial de uma diádica é uma matriz quadrada de ordem 3, tal que D = u vT . À semelhança dos vetores, uma diádica é também expressa em relação a uma base de coordenadas. Inversamente, a representação matricial pode ser obtida a partir da sua diádica: T D = Fa ⋅ D ⋅ Fa 2.58 Nota-se ainda que o duplo produto interno de vetores por uma diádica resulta num escalar, ou seja: T u ⋅ D ⋅ v = u D v , 2.59 caso os dois vetores e a diádica sejam todos expressos na mesma base. Uma diádica nula ( D = 0 ) é uma diádica cuja representação matricial é uma matriz nula. Uma diádica unitária ( D = 1 ) é uma diádica cuja representação matricial é uma matriz identidade ( D = 1 ) de ordem 3. O produto interno de uma diádica unitária por um vetor qualquer não altera este vetor: u = u ⋅ 1 = 1 ⋅ u . 2.60 Uma diádica, à semelhança de um vetor, pode ser expressa em bases distintas. Considera-se então a diádica D e suas representações Da e Db nas bases Fa e Fb. Como, da T definição, Da = Fa ⋅ D ⋅ Fa , segue imediatamente que: Da = Fa ⋅ FbT Db Fb ⋅ FaT = Cab Db Cba = C ab Db CTab . 2.61 Este resultado indica que a transformação de uma diádica é realizada multiplicando-se a matriz da diádica pela matriz de rotação à esquerda e pela transposta desta à direita. Um caso particularmente interessante é o de uma diádica cujos vetores u e v que a formam são conhecidos em bases distintas, Fa e Fb, respectivamente. Pela definição da diádica tem-se T T T D = u v = Fa u v Fb = Fa Dab Fb , 2.62 que, inversamente, fornece: T T Dab = u vT = D = Fa ⋅ u v ⋅ Fb = Fa ⋅ D ⋅ Fb . 2.63 Porém, pode-se, igualmente, representar esta diádica integralmente em qualquer uma das bases, como D a na base Fa e Db na base Fb, que resultam: T T T T Da = Fa ⋅ D ⋅ Fa = Fa ⋅ Fa D ab Fb ⋅ Fa = D ab Cab . e 2.64 16 T T T Db = Fb ⋅ D ⋅ Fb = Fb ⋅ Fa Dab Fb ⋅ Fb = Cab Dab . 2.65 As diádicas representam um papel importante na dinâmica de corpos rígidos. Será mostrado que a inércia de um corpo é de fato uma diádica, ou seja, uma matriz. A diádica permite, portanto, que as equações da dinâmica possam ser obtidas consistentemente na forma vetorial. 2.6 – Representação da atitude A atitude ou orientação de um corpo no espaço é definida por um conjunto de parâmetros que permitem, de forma unívoca, correlacionar num instante de tempo qualquer um sistema de coordenadas fixo ao corpo a um outro sistema supostamente fixado a uma base. Em geral assume-se que este último seja inercial ou quase inercial, que significa que seu movimento, em relação a um sistema verdadeiramente inercial, seja desprezível quando comparado com o movimento próprio do corpo. Por outro lado, a compreensão do que se denomina sistema inercial requer que faça concessões ao rigor matemático. De fato, considera-se que um sistema inercial seja aquele que não apresente movimento de rotação. Porém, isto requer dois procedimentos: ser capaz de diferir entre movimentos angulares ínfimos e nenhum movimento angular, e medir estes resultados em relação a um outro sistema que, em essência, terá que ser ainda mais imóvel do que este que se está tentando medir. É óbvio que, se existe um sistema “mais inercial” do que outro, então este sistema deva ser adotado, pelo menos por enquanto. Como será visto adiante, pode-se mostrar que o momento angular de um corpo em movimento de rotação e não sujeito a torques tende a permanecer imóvel inercialmente. Este princípio permite que se estabeleçam direções inerciais baseadas em eixos de rotação. Infelizmente é muito difícil encontrar corpos efetivamente livres de torques. O eixo de rotação da Terra é comumente adotado como uma das direções inerciais, porém sabe-se que este eixo efetua um movimento cônico ao redor de um eixo perpendicular à órbita da Terra ao redor do Sol em um período de cerca de 20 mil anos. Mesmo este último sofre influências das estrelas próximas e da galáxia como um todo e, portanto, não pode ser considerado como verdadeiramente inercial. Outra solução consiste em definir um sistema inercial com base na direção de determinadas estrelas. Sabe-se, contudo, que estas apresentam movimento relativo ao sistema solar. Atualmente considera-se que a melhor estimativa de sistema inercial seja aquela dada pelas direções de quasares distantes. Ainda assim, embora a velocidade de afastamento deles possa ser medida, quase nada pode ser dito a respeito do movimento angular transversal, exceto de que deve ser suficientemente pequeno para que possa ser desprezado. Para as finalidades abordadas aqui, é suficiente considerar como inercial o sistema geocêntrico celeste, cujos eixos coincidem com o eixo de rotação da Terra e com a direção da interseção do plano do equador com o plano da eclíptica. Matriz de co-senos diretores Uma matriz de mudança de base, como a matriz de co-senos diretores, constitui uma representação da atitude, uma vez que permite estabelecer a orientação de um dado sistema de coordenadas Fb em relação à base Fa. Em geral assume-se que o sistema Fb é móvel com relação ao sistema Fa, mas a matriz não identifica qual dos sistemas é o móvel e qual é o fixo. Matrizes de co-senos diretores são ortogonais próprias e isto quer dizer que o produto escalar de uma linha (ou coluna) por outra resulta nulo, já que, por definição, as linhas (ou colunas) 17 constituem os componentes dos versores da base do sistema Fb em relação ao sistema Fa. Além disso, como tais versores são unitários, então o módulo de cada linha (ou coluna) é também unitário. Tem-se com isso 6 condições que relacionam entre si as 9 coordenadas dos versores da base. Restam, portanto apenas 3 parâmetros realmente independentes numa matriz. De fato, Euler enunciou que são necessários apenas 3 parâmetros para definir univocamente a orientação espacial de um sistema de coordenadas em relação a qualquer outro. Conclui-se, portanto, que uma matriz C de mudança de base não é a forma mais apropriada para descrever a atitude de um corpo, porque apresenta alta redundância interna. As matrizes de mudança de base foram vistas na seção anterior. Resta ainda analisar a composição de movimentos neste tipo de representação. Assim, se Cab e Cbc forem as matrizes que relacionam respectivamente as bases Fa com Fb e Fb com Fc, então pela definição v a = Cab v b , 2.66 v b = Cbc v c 2.67 e de onde decorre que: v a = Cab Cbc v c = Cac v c , 2.68 Cac = Cab Cbc , 2.69 ou seja: do qual se conclui que a matriz resultante de uma seqüência de duas ou mais transformações entre sistemas é dada pelo produto das matrizes de transformações. Enfatiza-se novamente que este resultado não é comutativo, pois a ordem das rotações influi na atitude atingida. Ângulo e eixo de Euler Euler também provou que qualquer orientação pode ser descrita como sendo produzida por uma rotação de um dado ângulo θ ao redor de um dado eixo a. Durante a rotação, a orientação do sistema móvel permanece fixa em relação ao eixo de rotação, o que permite escrever que Ca =a. 2.70 como visto na Figura 2.2. Pode-se mostrar, então, a partir das propriedades das matrizes de mudança de base e seus autovalores e autovetores, que a matriz Cba é dada por: Cba ≜ cos θ 1 + (1 − cos θ) a aT − sin θ a× , ou 2.71 18 c θ + a12 (1 − c θ) a1a2 (1 − c θ) + a3 s θ a1a3 (1 − c θ) − a2 s θ Cba = a1a2 (1 − c θ) − a3 s θ c θ + a22 (1 − c θ) a2 a3 (1 − c θ) + a1 s θ , a1a3 (1 − c θ) + a2 s θ a2 a3 (1 − c θ) − a1 s θ c θ + a32 (1 − c θ) 2.72 condicionado a aTa = 1, onde 1 representa a matriz identidade de ordem 3 e a1, a2 e a3 são os componentes do vetor a em qualquer um dos sistemas. Na equação acima cθ = cosθ e sθ = senθ. Apesar da aparente redução no número de parâmetros para descrever a atitude, ainda assim a condição de que o módulo de a seja unitário introduz uma condição a mais, e, novamente, tem-se apenas 3 parâmetros realmente independentes nesta representação. Os denominados ângulo e eixo de Euler, θ e a, podem ser obtidos a partir da constatação de que o traço da matriz de transformação vale 2cosθ + 1, e, portanto, cos θ = 1 (c11 + c22 + c33 − 1) . 2 2.73 a Fa Fb Fig. 2.2 – Rotação efetuada com eixo e ângulo de Euler. Embora θ possa assumir qualquer valor entre −π e π, costuma-se limitá-lo ao intervalo 0 ≤ θ ≤ π, uma vez que a rotação (a, θ) é totalmente equivalente a (−a, −θ). Admite-se, portanto, que o seno de θ seja calculado a partir do co-seno, e com isso tira-se que a1 = c23 − c32 , 2 sen θ a2 = c31 − c13 , 2sen θ a3 = c12 − c21 , 2sen θ 2.74 desde que, obviamente, o seno de θ seja não nulo. Para o caso senθ = 0 e cosθ = 1, ou equivalentemente quando o traço da matriz for igual a 3, nota-se que o eixo de rotação é indefinido, porque não houve, na realidade, rotação alguma. Finalmente, se senθ = 0 e cosθ = −1, ou se o traço da matriz for igual a −1, o ângulo deverá ser igual π, e as componentes do eixo serão calculadas por: 19 a1 = ± 1 + c11 , 2 a2 = ± 1 + c22 , 2 a3 = ± 1 + c33 , 2 2.75 sujeitos às seguintes condições: c12 = 2 a1 a2 , c13 = 2 a1 a3 , c23 = 2 a2 a3 2.76 Uma seqüência de transformações pode ser reduzida a um único ângulo-eixo de Euler. Se (a1, θ1) e (a2, θ2) forem as rotações efetuadas num corpo, então pode-se mostrar que o ângulo e o eixo resultante (a, θ) serão dados respectivamente por (Hughes, 1986): cos θ θ θ θ θ = cos 1 cos 2 − sen 1 sen 2 a1T a 2 2 2 2 2 2 2.77 e a sen θ θ θ θ θ θ θ = a1 sen 1 cos 2 + a 2 cos 1 sen 2 + a1× a 2 sen 1 sen 2 2 2 2 2 2 2 2 2.78 Ângulos de Euler Como foi visto, qualquer orientação no espaço pode ser descrita por meio de apenas três parâmetros. Euler concluiu que três ângulos seriam suficientes para estabelecer a correspondência entre os sistemas de coordenadas, caso as rotações fossem realizadas nos eixos cartesianos. Além disso, qualquer que seja a orientação final, ela pode ser obtida a partir de uma seqüência de rotações realizada ao redor de quaisquer eixos, 1, 2 ou 3, desde que a primeira e a segunda, ou a segunda e a terceira rotação não sejam realizadas sobre o mesmo eixo. São, portanto, válidas as seqüências de transformações: 1-2-3, 3-1-3, 2-1-3, 1-3-1, etc. A atitude de corpos em rotação ao redor do eixo 3 é facilmente visualizada numa transformação 3-1-3, como visto na Figura 2.3, com ângulos θ1, θ2 e θ3, respectivamente. Neste caso, θ1 e θ2 permanecem fixos, enquanto que θ3(t) descreve o movimento de rotação ao redor de b̂ 3 . Esta transformação é descrita por: c1c3 − s1c2 s3 Cba = C3 (θ3 ) C1 (θ2 ) C3 (θ1 ) = −c1s3 − s1c2c3 s1s2 s1c3 + c1c2 s3 − s1s3 + c1c2c3 −c1s2 s2 s3 s2c3 c2 2.79 onde ci = cos(θi) e si = sen(θi), com i = 1, 2, 3. Existem ao todo 12 combinações entre eixos e ângulos, o que se traduz por um mesmo número de matrizes de transformação. Muitas delas são pouco utilizadas, e as mais freqüentes em aplicações de determinação, navegação e controle são a 1-2-3, 3-1-3, 2-1-3 e 3-2-1. Todas as matrizes, contudo apresentam singularidades para certas situações, que surgem quando o ângulo intermediário assume valores iguais a kπ/2, para k inteiro. Surge então dois conjuntos de transformações, das quais 6 delas são realizadas sobre 3 eixos distintos, em que a singularidade se dá para θ2 = k π, e 6 restantes nas quais o primeiro eixo é repetido na terceira rotação, e onde a singularidade ocorre em θ2 = (2k +1) π/2 (Wertz. 1978). Nestas últimas os dois ângulos restantes ficam 20 indeterminados, e não há uma solução única para a atitude. Para a transformação 3-1-3, por exemplo, a matriz de transformação na singularidade θ2 = 0 resulta: cos(θ1 + θ3 ) sen(θ1 + θ3 ) 0 Cba = − sen(θ1 + θ3 ) cos(θ1 + θ3 ) 0 , 0 0 1 2.80 que é equivalente a uma rotação ao redor do eixo 3 de um ângulo θ1 + θ3, tornando-se impossível distinguir os valores individuais deles. â 3 b̂ 3 θ2 b̂ 2 b̂ 1 θ3 Fb â 2 â1 θ1 Fig. 2.3 – Rotação 3-1-3 com seqüência de ângulos θ1, θ2 e θ3. Fa Por sua vez, os ângulos da transformação 3-1-3 (ou outra qualquer) podem ser calculados em função dos elementos da matriz. De fato, percebe-se facilmente que: c θ1 = arctan 31 , −c32 θ2 = arccos(c33 ), c θ3 = arctan 13 , c23 2.81 desde que θ2 ≠ 0 e θ2 ≠ π. Para θ2 ≈ 0 ou θ2 ≈ π, os ângulos são calculados por: θ1 = 0 , c θ3 = arctan 12 , c11 2.82 limitados a 0 ≤ θ1 < 360o, 0o ≤ θ2 ≤ 180o e 0 ≤ θ3 < 360o. É importante salientar que a definição de matriz de atitude pode variar nas referências sobre o assunto. Alguns autores adotam a postura de que a matriz relaciona o sistema fixo com o móvel e outros adotam o contrário. Sabe-se que uma matriz é a inversa da outra, ou seja, sua transposta, o que permite rapidamente expressar uma em função da outra. Contudo, deve-se notar que a inversa de uma seqüência de transformações consiste na transformação em ordem inversa: Cab = CTba = C3 (−θ1 ) C1 (−θ2 ) C3 (−θ3 ) 2.83 21 Em função das singularidades, ângulos de Euler são pouco utilizados para representar a atitude em modelos numéricos, a menos que se garanta que a atitude estará distante dos pontos singulares, pois caso contrário podem ocorrer erros numéricos significativos. Contudo, deve-se reconhecer que os três ângulos de Euler são de fácil visualização quando comparados com outras representações da atitude. Da mesma forma que o produto de matrizes não é comutativo, uma seqüência de 3 rotações também não comuta. Isto significa que a simples troca da ordem das rotações individuais leva a resultados e transformações diferentes. Outro importante conjunto de ângulos, como mencionado anteriormente, é a seqüência 1-2-3, cuja matriz de transformação em função dos ângulos θ1, θ2 e θ3 é dada por: c3c2 Cba = C3 (θ3 ) C2 (θ2 ) C1 (θ1 ) = − s3c2 s 2 s3c1 + c3 s2 s1 c3c1 − s3 s2 s1 −c2 s1 s3 s1 − c3 s2c1 c3 s1 + s3 s2 c1 , c2 c1 2.84 com os limites 0 ≤ θ1 < 360o, –90o ≤ θ2 ≤ 90o e 0 ≤ θ3 < 360o. Segue imediatamente que as relações inversas são: −c θ1 = arctan 32 , c33 θ2 = arcsen(c31 ), −c θ3 = arctan 21 , c11 2.85 sujeitas às mesmas restrições da transformação 3-1-3 nas situações nas quais θ2 ≅ ±90o. Parâmetros simétricos de Euler Uma das várias formas de se evitar os problemas numéricos advindos do uso de ângulos de Euler consiste na representação por parâmetros de Euler. Os parâmetros baseiamse num eixo (vetor) e num ângulo de rotação, de forma análoga ao ângulo-eixo de Euler. O ângulo adotado, contudo, é a metade do ângulo de rotação θ, e a direção do eixo é fornecida pela matriz coluna a com módulo unitário. Os parâmetros simétricos são então definidos por: ε = a sen η = cos θ 2 θ 2 2.86 2.87 e satisfazem a condição: εT ε + η2 = ε12 + ε 22 + ε32 + η2 = 1 . 2.88 Sob tal circunstância, deve-se indagar qual a vantagem dos parâmetros de Euler em relação ao ângulo-eixo de Euler, já que há pouca diferença entre eles. De fato, mostra-se sem grandes dificuldades (Hughes, 1986) que se (ε1, η1) e (ε2, η2) forem duas transformações efetuadas nesta ordem, então a transformação que resulta desta composição será dada por: 22 ε = η1 ε 2 + η2 ε1 + ε1× ε 2 2.89 η = η1 η2 − ε1T ε 2 , 2.90 e que, contrariamente às expressões análogas em ângulo-eixo de Euler, independem de operações trigonométricas, o que facilita a computação numérica. Devido à simetria destas equações, os parâmetros de Euler são igualmente denominados parâmetros simétricos de Euler, e obedecem à álgebra de quatérnions (ou quaterniões) introduzida por Hamilton (Hamilton, 1844). Quatérnions são números hiper-complexos compostos por um vetor q e um escalar q, na forma: Q = q + q = q x i + q y j + qz k + q 2.91 no qual o vetor q = (qx qy qz)T é hiper-complexo, tal que i2 = j2 = k2 = i j k = −1. Porém, o produto das bases imaginárias é definido como: i j = k, j k = i, ki=j 2.92 de onde decorre imediatamente que o produto de quatérnions não é comutativo. A partir desta definição, fica fácil verificar que o produto entre dois quatérnions Q1 = η1 + ε1 e Q2 = η2 + ε2 resulta em: Q1 Q 2 = η1 η2 − ε1T ε 2 + η1 ε 2 + η2 ε1 + ε1× ε 2 . 2.93 Pela comparação desta última equação com a composição de movimentos em parâmetros de Euler, conclui-se que a transformação pode igualmente ser efetuada com o produto de quatérnions. De fato, uma transformação na forma v b = Cba v a , na qual Cba é a matriz que relaciona os sistemas Fa e Fb pode ser igualmente realizada por meio do produto de quatérnions, desde que um vetor possa ser considerado como um quatérnion com o valor escalar η nulo: vb = Q va Q 2.94 onde Q = η − ε é o conjugado do quatérnion Q = η + ε. Substituindo agora os parâmetros simétricos em função do ângulo-eixo de Euler mostrados acima na matriz de transformação em termos destas variáveis, tem-se então que Cba = (η2 − εT ε) 1 + 2 ε εT − 2η ε× ou ainda na forma completa: 2.95 23 η2 + ε12 − ε 22 − ε32 Cba = 2(ε1 ε 2 − ηε3 ) 2(ε1 ε3 + ηε 2 ) 2(ε1 ε 2 + ηε3 ) η −ε +ε −ε 2(ε 2ε3 − ηε1 ) 2 2 1 2 2 2 3 2(ε1 ε3 − ηε 2 ) 2(ε 2ε3 + ηε1 ) η2 − ε12 − ε 22 + ε32 2.96 Os parâmetros simétricos de Euler podem igualmente ser calculados em função dos elementos da matriz de transformação entre os sistemas, bastando verificar que: η=± 1 1+ σ 2 2.97 e c23 − c32 1 ε= c31 − c13 4η c12 − c21 2.98 onde σ = c11 + c22 + c33 é o traço da matriz Cba. A ambigüidade no sinal de η reflete o fato de que uma transformação (ε, η) é idêntica a outra na qual o sentido do ângulo e do eixo são trocados, ou seja, (−εε, −η). Infelizmente, como aponta Klumpp (Klumpp, 1976), estas relações falham quando η for próximo de zero, ou melhor, quando o ângulo θ estiver próximo ou for igual a π. Nesta situação ele recomenda adotar um procedimento que permita obter inicialmente o módulo de cada elemento do vetor ε por meio de: | εi |= cii 1 − σ + 2 4 2.99 e, em seguida, determina-se o índice k do elemento com maior valor absoluto entre os três. O sinal deste elemento é então corrigido por meio de: ε k = sgn(cij − c ji )| ε k | , 2.100 enquanto que os demais elementos são obtidos por: ε j = sgn[ε k (c jk + ckj )]| ε j | , 2.101 onde sgn(⋅) é a função que fornece o sinal do argumento: −1, se x < 0 sgn( x) = 1, se x > 0 0, se x = 0 2.102 24 Movimento com ângulos infinitesimais Dada uma representação de atitude qualquer, pode-se verificar qual seria sua forma se, ao invés de relacionar um movimento amplo, fosse este movimento de pequena amplitude, causado por pequenas variações dos parâmetros. Este estudo é particularmente importante em sistemas do tipo “strapdown”, nos quais uma plataforma solidária ao corpo mede, a cada instante, os deslocamentos angulares provocados pela mudança de atitude, em três eixos ortogonais. Se for admitido que o movimento não provoque velocidades elevadas ou, adicionalmente, que o intervalo de medidas seja suficientemente pequeno de forma a assegurar medições de pequenos ângulos, então esta estratégia é beneficiada pelas simplificações introduzidas na cinemática, tornando, assim, a atualização da atitude computacionalmente simples e rápida. Como apenas a representação por ângulos de Euler apresenta a característica de possuir o conjunto mínimo exigido de parâmetros (apenas 3 ângulos), ela é a mais promissora para esta análise. Qualquer uma das 12 diferentes configurações de seqüência entre os eixos é igualmente válida para isso. Contudo, devem ser descartadas aquelas que apresentam singularidades em θ2 ≈ 0, como a transformação 3-1-3, pois os demais ângulos são indistinguíveis nesta posição, como foi mostrado anteriormente. Por outro lado, na transformação 1-2-3 a singularidade ocorre em θ2 ≈ 90o, permitindo então que se obtenha a matriz de atitude considerando a seqüência de ângulos infinitesimais θ1, θ2 e θ3: 1 Cba ≅ −θ3 θ 2 θ3 1 −θ1 −θ2 θ1 = 1 − θ× , 1 2.103 caso sejam negligenciados os termos de segunda ordem, e tal que θ = ( θ1 θ2 θ3 ) . Pode-se igualmente mostrar que todas as transformações que utilizam 3 eixos distintos (como 3-2-1 ou 2-1-3, por exemplo), geram uma matriz idêntica a esta. Este resultado pode também ser obtido por meio da expressão para a matriz de atitude em termos do ângulo-eixo de Euler, bastando expandi-la em série de Taylor, até a primeira ordem: T a3 θ − a2 θ 1 Cba = − a3 θ 1 a1 θ = 1 − θ a× . a θ −a θ 1 1 2 2.104 Nota-se, porém, que embora o ângulo θ seja infinitesimal, o eixo mantém-se com magnitude unitária. Também não é difícil mostrar que um deslocamento angular infinitesimal nos parâmetros simétricos de Euler leva ao seguinte resultado: 1 Cba = −2ε3 2ε 2 2ε 3 1 −2ε1 −2ε 2 2ε1 = 1 − 2ε× 1 2.105 25 A combinação de dois movimentos pode agora ser realizado admitindo-se um vetor de deslocamentos infinitesimais θab, entre os sistemas Fa e Fb, e o vetor θbc entre Fb e Fc. O produto das matrizes resulta: Cca = Ccb Cba ≅ 1 − θ×ab − θ×bc , 2.106 desde que, novamente, sejam desprezados termos de ordem superior. Este resultado mostra que a combinação de movimentos infinitesimais é comutativa, já que o mesmo resultado seria obtido invertendo-se a ordem das transformações. 2.7 – Cinemática O movimento de orientação de um corpo no espaço provoca mudanças nos parâmetros que definem a atitude, de forma que a matriz de co-senos, ou os ângulos ou ainda os parâmetros de Euler são todos funções do tempo. É então necessário obter a forma com que tais parâmetros variam. Infelizmente, as equações oriundas deste movimento não são lineares, o que impede que se conheça uma integral analítica para a solução, exceto em casos particulares, como o do movimento rotacional puro, mostrado na Figura 2.3. Se o corpo não estiver sujeito a forças ou torques externos, e possuir um eixo de simetria ao redor do qual ele gira, então os ângulos θ1, θ2 permanecem fixos, enquanto que θ3 varia linearmente com o tempo. Outros movimentos particulares também possuem solução analítica, mas este não é o caso mais geral de corpos com assimetria de massa e sujeitos a torques. Diversas referências estudam estes casos e apresentam soluções (analíticas ou oriundas de integração numérica) do movimento de um sólido no espaço (Hughes, 1986; Wertz, 1978; Meirovitch, 1970; Crandall, 1968). Velocidade angular A velocidade angular de um corpo rígido é definida como sendo o vetor instantâneo ao redor do qual o sólido gira. Devido à dinâmica do movimento este eixo pode movimentar-se tanto num sistema de referência inercial quanto no próprio sistema de coordenadas fixado ao corpo. Torna-se, portanto, importante definir a direção instantânea do eixo de giro, além da taxa de rotação angular instantânea ao redor deste eixo. Fica então claro que a representação da atitude por meio de rotações infinitesimais permite estabelecer a definição de velocidade angular com base em: ɺ ω ≜θ onde θ = ( θ1 θ2 2.107 θ3 ) T são infinitesimais e medidos nos eixos cartesianos. Se for considerado que o ângulo θ, na representação por ângulo-eixo de Euler, seja também infinitesimal, então mostra-se que o vetor velocidade angular possui, em conseqüência, a mesma direção do eixo de Euler instantâneo, e magnitude dada pela variação temporal do ângulo. A velocidade angular é uma medida do movimento de um corpo, ou um sistema de referência, com relação a um outro sistema. Sejam então os sistemas ortonormais Fa e Fb, como mostrado na Figura 2.4. As origens podem coincidir, e geralmente coincidem; na figura a separação entre os sistemas é meramente pictórica, para facilitar a visualização. O vetor 26 velocidade angular ω ba representa a medida da rotação do sistema Fb em relação a Fa, e é o mesmo quer seja medido no sistema Fa, quer seja medido em Fb, embora, como já visto, suas componentes ou equivalente matricial sejam diferentes nestes sistemas. Contudo, a velocidade recíproca, isto é, a velocidade ω ab do sistema Fa em relação a Fb tem mesmo módulo e direção de ω ba , porém com sentido contrário, ou seja: ω ba + ω ab = 0 2.108 Analisa-se agora a composição de movimentos entre os sistemas. Considera-se inicialmente um ponto material cuja posição é descrita pelo vetor u fixado ao sistema Fb, como indicado na Figura 2.4, e deseja-se conhecer qual a velocidade deste ponto relativa ao sistema Fa. Como este ponto gira ao redor de ω ba , a velocidade é então perpendicular ao vetor velocidade angular e tangente à trajetória circular, e portanto é dada por: du v u = = uɺ = ω ba × u dt 2.109 b̂ 3 â 3 u Fb Fa â 2 v u ω ba b̂ 2 b̂ 1 â1 Fig. 2.4 – Movimento de rotação entre dois sistemas de coordenadas Contudo, se este ponto material mover-se no espaço, sua velocidade será interpretada de forma distinta por observadores situados em cada um dos sistemas, já que existe movimento relativo entre eles. Isto significa que a variação temporal do vetor u depende do sistema de referência na qual é realizada. Por meio da composição de movimentos, sabe-se que a velocidade de um ponto num sistema é igual à velocidade deste ponto com relação ao segundo sistema adicionada da velocidade de arrasto entre os sistemas, o que leva a: du du = +ω ba × u , dt a dt b 2.110 onde o índice subescrito indica o sistema de coordenadas na qual a velocidade do ponto é medida. Para facilitar a notação, as variações temporais realizadas no sistema Fb serão representadas por um índice sobrescrito no vetor, enquanto que o ponto indica sua derivada temporal: du uɺ a ≜ , dt a du uɺ b = , dt b 2.111 27 e assim a composição de velocidades fica: uɺ a = uɺ b + ω ba × u 2.112 Nota-se que o vetor u é o mesmo em ambos os sistemas. O índice sobrescrito representa somente o sistema de referência no qual a variação temporal do vetor é avaliada. Considera-se agora um terceiro sistema de coordenadas Fc cujas velocidades angulares ω ca e ω cb são conhecidas em relação aos sistemas Fa e Fb, respectivamente. Decorre daí que as b c velocidades do vetor u nestes sistemas valem uɺ a = uɺ c + ω ca × u e uɺ = uɺ + ω cb × u . Substituindo esta última na expressão que relaciona as velocidades nos sistemas Fa e Fb chega-se a: uɺ a = uɺ c + (ω cb + ω ba ) × u 2.113 de onde se conclui, por comparação, que velocidades angulares são aditivas, isto é: ω ca = ω cb + ω ba 2.114 Este resultado permite obter a velocidade angular resultante da composição entre sistemas de coordenadas distintos. A aceleração do ponto material pode agora ser obtida aplicando-se novamente a variação temporal à velocidade do vetor u , ou seja: ɺɺ a = u d b (uɺ + ω ba × u ) a dt 2.115 Uma vez que não houve necessidade de particularizar qualquer um dos sistemas de coordenadas, então os vetores podem ser tratados de forma semelhante, o que leva a b b ɺɺ a = u ɺɺ b + ω u ba × uɺ + (ω ɺ ba + ω ba × ω ba ) × u + ω ba × (uɺ + ω ba × u ) 2.116 onde se percebe que, da mesma forma que a velocidade angular, também a aceleração angular ω ɺ ba é idêntica quando avaliada em ambos os sistemas. Re-agrupando-se os termos, chega-se a: b b ɺɺ a = u ɺɺ b + 2 ω u ba × uɺ + ω ɺ ba × u + ω ba × (ω ba × u ) 2.117 ɺɺ a de um ponto material num sistema de que pode ser interpretada como: a aceleração u ɺɺb , referência fixo é igual à aceleração deste mesmo ponto relativa ao sistema móvel u b acrescida da aceleração de Coriolis 2 ω ba × uɺ , da aceleração angular do sistema móvel b ω ɺ ba × u , e da aceleração centrípeta ω ba × (ω ba × u ) . Nota-se, além disso, que a aceleração do sistema móvel deve ser avaliada no seu próprio sistema, ou seja, Fb. A variação de uma vetriz no tempo também pode ser obtida já que os versores da base podem ser considerados como vetores representados no próprio sistema de coordenadas. De 28 fato, considerando-se o versor bˆ i do sistema Fb e aplicando-se a composição de velocidades, ɺ então bˆ ia = ω ba × bˆ i , pois este versor é estacionário no seu próprio sistema. Pode-se portanto escrever: Fbɺ a = ω ba × Fb 2.118 O processo de variação de uma diádica D = u v representada na base Fb leva ao resultado: a b D ɺ = D ɺ + ω −D ×ω ba × D ba 2.119 Passa-se agora a considerar a relação da velocidade angular com as representações já discutidas da atitude. Em outras palavras, deseja-se conhecer como os parâmetros da atitude variam dado que o vetor velocidade angular seja conhecido. A matriz de atitude é definida pelo produto de vetrizes, na forma Cba = Fb ⋅ Fa T , e considerando que Faɺ a = 0 , resulta que ɺ = Fɺ a ⋅ F T = −ω× F ⋅ F T = −ω× C C ba b a ba b a ba ba 2.120 Porém, como os elementos da matriz de atitude são correlacionados entre si, erros oriundos da integração numérica desta equação fazem com que ela perca a condição de ortogonalidade e de determinante unitário. Métodos para restabelecer tais condições devem ser empregados sempre que necessário. A velocidade angular pode ser isolada desta última relação, o que fornece: ɺ CT ω×ba = −C ba ba 2.121 que permite relacionar a velocidade angular com as variações dos parâmetros que definem a atitude, quaisquer que sejam eles. Cumpre ainda salientar que a distinção entre derivadas realizadas em diferentes sistemas é aplicável exclusivamente a vetores (incluindo, é claro, diádicas e vetrizes). Escalares, matrizes e representações matriciais de vetores, como aqueles analisados nas seções seguintes, não necessitam de tais distinções. Cinemática em ângulo-eixo de Euler Para exprimir a cinemática em função dos parâmetros de ângulo-eixo de Euler, partese da relação acima e da equação que relaciona a matriz de atitude com estes parâmetros na equação 2.71. Derivando-se esta última, tem-se: ɺ ≜ −θɺ s θ 1 + θɺ s θ a aT + (1 − c θ) aɺ aT + (1 − c θ) a aɺ T − θɺ c θ a× − s θ aɺ × C ba 2.122 ɺ CT , e na qual sθ e cθ representam o seno e o que pode agora ser substituída em ω×ba = −C ba ba co-seno do ângulo θ, respectivamente. A simplificação desta relação é realizada considerando-se as igualdades: 29 aT a = 1 , aT a× = 0 , aɺ ×a = −a× aɺ , aɺ T a = aT aɺ = 0 , a× a = 0 , a aT = 1 + a× a× , aɺ ×a× = a aɺ T , a×aɺ aT + a aɺ T a× = −aɺ × , aɺ aT − a aɺ T = (a×aɺ )× , 2.123 e chega-se a ω×ba = θɺ a× − (1 − cos θ) (a×aɺ )× + sin θ aɺ × 2.124 Decorre imediatamente desta expressão que: ω ba = θɺ a − (1 − cos θ) a×aɺ + sin θ aɺ , 2.125 porém esta não fornece as equações na forma diferencial. Para isso multiplica-se à esquerda por aT e empregando-se as igualdades relatadas acima, tem-se que: θɺ = aT ωba 2.126 Para isolar aɺ recorre-se ao mesmo procedimento, ao multiplicar-se à esquerda por a× , e com isso a×ω ba = −(1 − cos θ) (a aT − 1)aɺ + sin θ a×aɺ 2.127 a×ω ba = −(1 − cos θ) (a aT aɺ − aɺ ) + sin θ a×aɺ 2.128 a×ω ba = (1 − cos θ) aɺ + sin θ a×aɺ 2.129 Pré-multiplicando-se novamente por a× , tem-se que a×a×ω ba = (1 − cos θ) a×aɺ − sin θ aɺ . 2.130 que pode ser compreendido como um sistema de duas equações nas incógnitas aɺ e a×aɺ . Isolando agora o valor desta última na primeira equação e substituindo-se na segunda, chegase a: aɺ = 1 × sin θ × × a a ω ba a − 2 1 − cos θ 2.131 que, junto com a expressão de θɺ permite integrar a atitude. Deve-se impor a condição de normalidade aT a = 1 durante esta integração. Nota-se, contudo, que esta relação apresenta singularidade em θ = 0, já que cot θ sin θ = , 2 1 − cos θ o que inviabiliza sua utilização em algumas situações. 2.132 30 Cinemática em ângulos de Euler ɺ CT , e Com relação a ângulos de Euler, parte-se novamente de ω×ba = −C ba ba considerando, por exemplo, uma seqüência 1-2-3, tem-se então que ɺ +C C ɺ C +C ɺ C C ) CT CT CT ω×ba = −(C3 C2 C 1 3 2 1 3 2 1 1 2 3 2.133 ɺ CT CT CT − C C ɺ CT CT − C ɺ CT ω×ba = −C3 C2 C 1 1 2 3 3 2 2 3 3 3 2.134 ou Mas 0 0 0 0 T T ɺ C = 0 0 θɺ , C ɺ C = 0 C 1 1 1 2 2 0 −θɺ θɺ 2 0 1 θɺ 3 0 0 −θɺ 2 T ɺ C = −θɺ 0 0 , e C 3 3 3 0 0 0 0 0 0 0 . 0 2.135 Fazendo 11 = (1 0 0 ) , 12 = ( 0 1 0 ) e 13 = ( 0 0 1) , tem-se então que ɺ CT = −(1 θɺ )× , C ɺ CT = −(1 θɺ )× e C ɺ CT = −(1 θɺ )× , de onde C 1 1 1 1 2 2 2 2 3 3 3 3 T T ω×ba = C3 C2 (11 θɺ 1 )× CT2 CT3 + C3 (12 θɺ 2 )× CT3 + (13 θɺ 3 )× T 2.136 que será igual a ω×ba = (C3 C2 11 θɺ 1 )× + (C3 12 θɺ 2 )× + (13 θɺ 3 )× 2.137 de onde se conclui que ω ba = C3 C2 11 θɺ 1 + C3 12 θɺ 2 + 13 θɺ 3 . 2.138 Fazendo as substituições, chega-se a ωba = S(θ2 , θ3 ) θɺ , 2.139 onde cos θ3 cos θ2 S(θ2 , θ3 ) = − sen θ3 cos θ2 sen θ2 sen θ3 cos θ3 0 θɺ 1 0 0 , e θɺ = θɺ 2 . θɺ 3 1 2.140 A matriz S necessita ser invertida para se chegar às equações diferenciais da cinemática em termos dos ângulos de Euler, o que leva a 31 cos θ3 sec θ2 θɺ = sen θ3 − cos θ tan θ 3 2 − sen θ3 sec θ2 cos θ3 sen θ3 tan θ2 0 0 ωba . 1 2.141 para a transformação 1-2-3. A matriz S depende da transformação realizada e, portanto, difere desta no caso de se empregar uma outra seqüência de transformação. Cinemática em parâmetros simétricos de Euler A equação cinemática em função dos parâmetros de Euler pode ser obtida de forma similar. Partindo da matriz de atitude em termos dos parâmetros de Euler: Cba = (η2 − εT ε) 1 + 2 ε εT − 2η ε× , 2.142 calcula-se sua variação temporal: ɺ = (2ηηɺ − εɺ T ε − εT εɺ ) 1 + 2 (εɺ εT + ε εɺ T ) − 2ηɺ ε× − 2η εɺ × , C ba 2.143 ɺ CT ω×ba = −C ba ba 2.144 tal que A equação cinemática em função dos parâmetros de Euler pode ser obtida a partir da relação entre estes parâmetros e o ângulo-eixo de Euler, ou seja: ε = a sen θ , 2 θ η = cos , 2 2.145 de onde tira-se que: εɺ = aɺ sen θ θɺ θ + a cos , 2 2 2 e θɺ θ ηɺ = − sen , 2 2 2.146 ou ainda εɺ = aɺ aT ε + a θɺ η, 2 θɺ ηɺ = − aT ε 2 2.147 Porém, substituindo as expressões de aɺ e θɺ já obtidas anteriormente, tem-se então que: εɺ = e ( ) 1 × ε + η 1 ω ba 2 2.148 32 1 ηɺ = − εT ωba 2 2.149 Definindo agora o quatérnion Q = (εε η)T, as equações da cinemática obtidas acima resultam em ɺ = 1Ω Q Q ba 2 2.150 no qual a matriz anti-simétrica Ωba é definida por: 0 ωba −ω3 = 0 ω2 −ω1 −ω× Ωba ≜ Tba −ωba ω3 0 −ω1 −ω2 −ω2 ω1 0 −ω3 ω1 ω2 , ω3 0 2.151 tal que ωba = (ω1 ω2 ω3)T. Cinemática em deslocamentos infinitesimais Partindo-se novamente da expressão que relaciona a matriz de atitude com os ângulos infinitesimais, ou seja: 1 Cba ≅ −θ3 θ 2 θ3 1 −θ1 e tal que θ = ( θ1 θ2 se a: −θ2 θ1 = 1 − θ× , 1 2.152 θ3 ) . Então, ao aplicar-se a variação temporal nesta expressão chegaT ɺ = −θɺ × C ba 2.153 ɺ CT , o que leva a Como visto anteriormente, ω×ba = −C ba ba ω×ba = θɺ × (1 + θ× ) = θɺ × 2.154 de onde θɺ = ω ba 2.155 Este resultado, embora simples, indica claramente que as velocidades angulares medidas nos eixos cartesianos fornecem o vetor da velocidade angular do veículo. De fato, pode-se igualmente definir o vetor velocidade angular por meio das suas componentes medidas nos eixos cartesianos. 33 35 3 – Dinâmica da atitude As equações da dinâmica permitem prever o comportamento de um corpo, isto é, seu estado futuro, a partir do conhecimento do seu estado, ou posição, atual. Estas equações são derivadas da segunda lei de Newton (F = m a), ou, mais precisamente, da variação do momento de um corpo ( F = pɺ ), aplicadas ao movimento rotacional ao redor de um eixo. De fato, considera-se que as equações da dinâmica rotacional, também denominadas de equações de Euler, são extensões da aplicação das leis do movimento translacional para o movimento rotacional. Na verdade a segunda lei é um caso particular do movimento translacional e rotacional de um corpo, no qual supõe-se que a massa esteja concentrada num único ponto. Da mesma forma que as equações da cinemática permitem prever a atitude a partir do conhecimento do histórico da velocidade angular ( θɺ = F (ω, t ) ), as equações da dinâmica permitem obter o comportamento desta velocidade conhecendo-se o histórico dos torques ɺ = G ( τ, t ) ). aplicados ao corpo ( ω As equações dinâmicas dependem de características do corpo em consideração. Podem, por exemplo, refletir o comportamento de um sistema de partículas (cada uma delas considerada pontual), atreladas ou não por forças mútuas, ou exemplificar um corpo rígido sob a ação de forças e torques externos. Embora na maior parte das vezes, e numa primeira aproximação, um corpo possa ser considerado rígido, como um foguete, um satélite ou uma aeronave, nem sempre este caminho pode ser adotado. A presença de líquidos combustíveis, ou a vibração de placas e superfícies de controle, ou ainda a rotação de motores fazem com que estes veículos não possam ser considerados exclusivamente rígidos, e, portanto, requerem um equacionamento dinâmico capaz de levar em conta tais efeitos. A dinâmica de corpos em rotação é derivada a partir das relações para o momento angular aplicada a um sistema de partículas. Se as partículas permanecerem imóveis entre si então se pode considerar este conjunto como um corpo rígido. Satélites artificiais, particularmente, podem ser classificados como rígidos somente se não possuírem painéis, líquidos, partes móveis ou qualquer tipo de movimento rotativo, como motores, a bordo. Neste capítulo serão apresentadas as formulações da dinâmica de corpos livres (sem apoio), considerando os casos particulares de motores (rodas de reação, volantes de inércia), amortecedores de nutação e movimento de apêndices articulados (painéis solares). Dois casos serão deixados sem estudo em virtude da aplicação requerida aqui: o movimento de líquidos (tanques de combustível, por exemplo) e flexibilidade de painéis. Estes dois efeitos introduzem, no satélite, perturbações de curto período, ou seja, sua dinâmica é mais rápida do que a do movimento do próprio corpo. Contudo, seus efeitos na atitude e estabilidade devem ser levados em conta, uma vez que podem ser importantes, principalmente em satélites com tanques volumosos ou grandes painéis. O movimento rotacional de um corpo é ditado pela generalização da lei de Newton aplicada a corpos em movimento rotativo. Tem-se, assim, um conjunto de equações diferenciais equivalentes àquelas do movimento translacional. A quantidade de movimento traduz-se, no movimento rotacional, na quantidade de movimento angular, ou simplesmente momento angular. Se, no movimento translacional, a derivada da quantidade de movimento é equivalente à resultante das forças externas aplicadas ao corpo (na verdade, no centro de massa do corpo), a derivada do momento angular é equivalente ao torque aplicado ao corpo, no movimento rotacional. Um importante fator a ser levado em conta é que, no movimento rotacional, deve-se definir um pólo ao redor do qual define-se o momento angular. Embora a 36 escolha deste pólo possa ser arbitrária, ela pode levar, e geralmente leva, a resultados distintos com relação à dinâmica. Considera-se, como exemplo, um corpo no formato de halteres assimétrico, com uma das massas menor do que a outra. Fica evidente que o comportamento dinâmico deste corpo difere caso o eixo de rotação seja transferido do centro de uma das massas para o centro da outra. No caso de sistemas mecânicos pode-se identificar facilmente o pólo ou o eixo de rotação de cada peça numa máquina, por exemplo. Este não é o caso de corpos livres no espaço, como os satélites, mísseis e aeronaves, uma vez que não há necessariamente um eixo de rotação facilmente identificável neles. Isto é particularmente importante quando se considera que, em geral, os torques externos quase sempre se originam a partir de forças e que estas necessitam de um ponto de aplicação para se tornarem torques. Pode ser mostrado que o centro de massa do corpo deve ser adotado como sendo pólo no estudo da dinâmica de corpos livres, pois uma força alinhada ao centro de massa não produz torque. O movimento de um corpo ao redor do seu centro de massa é caracterizado pela energia associada ao movimento rotacional, além do momento angular. É, portanto, conveniente obter as relações da energia cinética do movimento tanto quanto as expressões para a dinâmica, o que será feito nas próximas seções. Antes de derivar as equações da dinâmica de atitude, é conveniente estabelecer alguns conceitos que serão úteis neste desenvolvimento. A seção seguinte ilustra os conceitos envolvidos na distribuição de massa de um corpo em relação a um pólo ou um eixo. As demais introduzem, em grau crescente de generalidade, as relações dinâmicas na sua forma vetorial e analítica. 3.1 – Centro de massa e momento de inércia O movimento rotacional de um corpo no espaço é fortemente dependente da distribuição de massa deste corpo. Em outras palavras, a orientação ou atitude de um corpo depende de como sua massa é distribuída. Dois corpos de mesma massa podem ter comportamentos totalmente diferentes se suas massas forem distribuídas de forma distinta. Dois parâmetros são necessários para descrever a forma com que a massa se distribui por um corpo: o seu centro de massa e o seu momento de inércia. Considera-se inicialmente um sistema composto por N partículas de massa mn (n = 1, ..., N). cujas posições, rn, são conhecidas a cada instante em relação aos eixos coordenados Fa. Define-se então como o centro de massa do sistema o vetor dado por: rcm ≜ N 1 N ∑m ∑ r n mn . 3.1 n =1 n n =1 Se m for a massa do conjunto de partículas, isto é, se N m = ∑ mn n =1 então o centro de massa fica 3.2 37 rcm = 1 N ∑ rn mn m n =1 3.3 Este conceito pode ser facilmente estendido para um corpo com massa não concentrada, cuja posição seja conhecida a cada instante com relação a um sistema de eixos cartesianos Fa. como mostrado na Figura 3.1. Neste caso deve-se considerar o corpo como formado por elementos de massa infinitesimais, e efetuar a integração, ou seja: rcm ≜ 1 ra dm , m ∫M 3.4 onde a integral é realizada em toda a massa m do corpo. dm rb ra Fb rcm Fa Fig. 3.1 – Centro de massa de um corpo rígido. Se for fixado um sistema de coordenadas Fb preso ao corpo, e cuja origem coincida com o centro de massa, isto é, na posição dada pelo vetor rcm , como mostra a Figura 3.1, e tal que ra = rb + rcm , então, substituindo este resultado na definição do centro de massa chega-se à conclusão que ∫ r dm = 0 m b 3.5 Define-se o primeiro momento de inércia de um corpo, c , como sendo o vetor dado por c ≜ m rcm 3.6 Caso o sistema de coordenadas seja fixado ao centro de massa, então o primeiro momento de inércia é nulo. O momento de inércia de um sistema de partículas (também chamado de segundo momento de inércia) é uma diádica definida por: N J ≜ ∑ mn [(rn ⋅ rn ) 1 − rnrn ] , 3.7 n =1 onde 1 representa a diádica unitária. No caso de um corpo com massa distribuída continuamente no espaço o momento de inércia resulta: 38 J ≜ ∫ [(ra ⋅ ra ) 1 − ra ra ] dm . m 3.8 Quando o corpo possuir distribuição uniforme de massa é mais conveniente efetuar esta integral no seu volume, desde que a densidade ρ(ra ) do material seja conhecida: J = ∫ [(ra ⋅ ra ) 1 − ra ra ] ρ dV . V 3.9 O equivalente matricial desta expressão pode ser obtido pela substituição de ra = r Fa = Fa T ra , o que leva a T a J a = ∫ (raT ra 1 − ra raT ) dm . m 3.10 Novamente, se for considerado um sistema Fb preso ao centro de massa do corpo, define-se então o momento de inércia relativo a este centro como: I ≜ ∫ [(rb ⋅ rb ) 1 − rb rb ] dm . m 3.11 Porém, substituindo-se a relação ra = rb + c / m na expressão do momento de inércia, tem-se que J = I + (c ⋅ c 1 − cc ) / m = I + m (rcm ⋅ rcm 1 − rcm rcm ) , 3.12 que é conhecida como a relação de translação do momento de inércia. A representação matricial desta expressão é também bastante útil. Lembrando que o vetor rb é expresso no sistema de coordenadas Fb, então ra = Fa ⋅ (rb + rcm ) = Cab rb + rcm , na qual Cab é a matriz de transformação entre os sistemas Fa e Fb, e rcm é o vetor coluna das componentes do centro de massa expresso no sistema Fa, tem-se que T T J a = Cab I b CTab + m (rcm rcm 1 − rcm rcm ) 3.13 Conclui-se facilmente disto que a relação entre inércias referidas a dois sistemas com mesma origem, mas com orientações distintas é dada por: I a = Cab I b CTab 3.14 Uma vez que r rT = rT r1 + r× r× , então o momento de inércia pode também ser colocado na forma J a = − ∫ ra× ra× dm m 3.15 As matrizes de momentos de inércia são simétricas e definidas positivas. São igualmente chamadas de tensores de inércia. Além disso, apresentam ainda diversas 39 propriedades que podem ser encontradas em livros sobre o assunto (Crandall, 1968; Hughes, 1986). Será mostrado agora que a integral do duplo produto vetorial r a × (ω × r a ) no volume do corpo, onde r a é o vetor de integração e ω uma velocidade angular ou a composição de velocidades angulares, irá resultar no produto da diádica de inércia pelo vetor velocidade angular. Aplicando a propriedade do produto misto, tem-se que: ∫ R r a × (ω × r a ) dm = ∫ R [(r a ⋅ r a ) ω − (r a ⋅ ω ) r a ] dm 3.16 que pode ser re-escrita como ∫ r × (ω × ra ) dm = ∫ R [(ra ⋅ ra )1 ⋅ ω − ra (ra ⋅ ω )] dm , R a 3.17 na qual 1 representa a diádica unitária. Pode-se agora levar a velocidade angular para fora da integral, o que resulta: ∫ r × (ω × ra ) dm = ∫ R [(ra ⋅ ra )1 − ra ra ] dm ⋅ ω = J ⋅ ω , R a 3.18 onde J é a diádica de inércia do corpo no sistema de coordenadas Fb. 3.2 – Dinâmica de um sistema de pequenas massas O movimento de um corpo livre pode ser analisado a partir do seu momento. Assim como a aplicação de uma força altera o momento linear de uma massa, a aplicação de um torque irá afetar o momento angular de um corpo em rotação. Nesta seção será visto o equacionamento básico que rege o movimento de um sistema de massas pontuais. As demais seções cobrirão o movimento composto por um ou mais corpos rígidos sujeitos a um vínculo de movimento entre eles. Equação vetorial para o momento angular Considera-se agora um sistema composto por N pontos materiais de dimensões desprezíveis. Define-se o vetor momento angular deste sistema relativo ao ponto O como sendo igual à resultante do produto vetorial entre a posição rn do ponto de massa em relação a O e a quantidade de movimento p n de cada massa elementar (n = 1, ... N): N h o ≜ ∑ rn × p n . 3.19 n =1 Percebe-se, imediatamente, que o momento angular depende tanto do sistema de referência escolhido quanto do ponto O selecionado, já que tanto a posição quanto a velocidade dos pontos de massa variam entre sistemas distintos. De fato, se for considerado que ρ n = ro + rn , como ilustrado na Figura 3.2, a quantidade de movimento linear do ponto de massa fica então 40 p n = mn ρɺ n = mn (rɺo + rɺn ) 3.20 e a quantidade de movimento total fica: N p = ∑ p n = m v o + cɺ 3.21 n =1 no qual v o = rɺo , e o primeiro momento de inércia c é definido pela Equação 3.6. O momento angular resulta: N h o = c × v o + ∑ rn × mn rɺn . 3.22 n =1 N O vetor h o é denominado momento angular total, enquanto que h c = ∑ rn × mn rɺn é o n =1 momento angular absoluto, conforme Hughes (Hughes, 1986). Para não sobrecarregar a notação suprimiu-se a identificação da base na qual foram realizadas as variações dos vetores, já que todas se referem à base Fi, exceto se expressamente indicado. O rn ro ρn mn Fi Fig. 3.2 – Momento angular relativo a um ponto O conhecido. Se o ponto O for escolhido como o centro de massa do sistema ( c = 0 ) ou se O estiver fixo ( v o = 0 ), então o momento angular total resulta igual ao momento absoluto. Caso a origem do sistema de eixos seja escolhida como o ponto de referência para o momento angular, então ro = 0 e assim: N h = ∑ ρ n × mnρɺ n 3.23 n =1 Por outro lado, substituindo a igualdade rn = ρ n − ro no momento angular relativo ao ponto O, chega-se a: h = h o + ro × p , N onde p = ∑ p n . A Expressão 3.24 representa a mudança de pólo do momento angular. n =1 3.24 41 Da segunda lei de Newton, tem-se que a resultante das forças aplicadas a uma massa elementar deve ser igual à variação da quantidade de movimento medida na base Fi, ou seja: fn = pɺ n 3.25 A resultante das forças pode ser separada em duas parcelas: a resultante das forças externas aplicada ao ponto de massa, fne , e as forças internas ou entre as massas, fnm . Somando as forças em todas as massas tem-se o conhecido resultado: N f = ∑ fne = pɺ , 3.26 n =1 que indica que a variação do momento linear (quantidade de movimento) total do sistema de pontos materiais é igual à resultante das forças externas aplicadas a ele. Nota-se que o somatório das forças internas resulta nulo, pelo princípio da ação e reação de forças, ou seja: ∑∑ fnm = 0 , já que fnm = −fmn . n m A variação do momento angular pode agora ser obtida por meio de N N n =1 n =1 hɺ o = ∑ rɺn × p n + ∑ rn × pɺ n , 3.27 mas lembrando que rɺn = ρɺ n − rɺo , chega-se ao resultado: hɺ o = p × v o + g o 3.28 na qual g o é o somatório dos torques externos relativo ao ponto O, definido como: N g o ≜ ∑ rn × fne 3.29 n =1 Nota-se que a variação do momento angular será igual à resultante dos torques externos hɺ o = g o quando o ponto O for fixo ( v o = 0 ), e também quando O for coincidente com o centro de massa do sistema, pois v o = v c e p = m v c . De fato é mais conveniente, sempre que possível, considerar O coincidente com o centro de massa, visto a simplificação nas equações da dinâmica. Contudo, como salienta Hughes (Hughes, 1986), em certas situações, como aquelas nas quais o ponto de referência não é nem fixo e nem coincidente com o centro de massa, será mais produtivo conservar a forma mais geral. Esta situação ocorre, por exemplo, em satélites compostos por vários corpos rígidos e sujeitos a vínculos (articulações) entre eles. 42 Momento angular num sistema girante Passa-se a considerar agora que o sistema de massas pontuais apresente um movimento rotacional em torno de algum ponto conhecido. Adotando o ponto de referência O como sendo coincidente com o ponto por onde passa o eixo de rotação, seguramente consegue-se alguma simplificação, uma vez que o sistema de massas elementares permanece com posições conhecidas em relação a ele. Este conceito leva à dinâmica de um sistema rígido de massas, como descrito a seguir. Admite-se, originalmente, que o corpo gira ao redor de O com velocidade angular dada por ω =ω bi , ou seja, com velocidade angular da base Fb relativa à base Fi, como apresentado na Figura 3.3. A quantidade de movimento da massa pontual fica então: p n = mn (rɺoi + rɺni ) = mn ( v o + rɺnb + ω × rn ) 3.30 e, como a variação temporal depende do referencial, introduziu-se o sobrescrito para indicar o sistema de coordenadas. Pode-se agora obter as relações para a quantidade de movimento e o momento angular: p = m v o + cɺ b + ω × c 3.31 N N n =1 n =1 h o = c × v o + ∑ rn × mn rɺnb + ∑ mn rn × (ω × rn ) 3.32 Aplica-se agora a propriedade do duplo produto vetorial apresentado na Equação 2.11, a propriedade da diádica unitária (2.60) e a definição de diádica de inércia (3.7) ao momento angular, o que leva ao resultado: N h o = c × v o + ∑ rn × mn rɺnb + J ⋅ ω 3.33 n =1 ω rn Fb O rcm mn ro Fi Fig. 3.3 – Sistema girante de um conjunto de pequenas massas. Nota-se que a diádica de inércia pode variar, uma vez que não foi exigido que o sistema de massas permanecesse fixo com relação à base Fb. As variações da quantidade de movimento linear e do momento angular ficam, empregando a composição de movimentos da Relação 2.112: 43 pɺ b = fe − ω × p 3.34 hɺ bo = p × v o + g o − ω × h o , 3.35 onde fe é a resultante das forças externas aplicadas ao conjunto de massas: N fe ≜ ∑ fne . 3.36 n =1 A integração das Equações 3.34 e 3.35 permite que o movimento do sistema de massas seja conhecido, e tal que a quantidade de movimento linear e momento angular são dados respectivamente pelas Relações 3.31 e 3.33. Energia cinética do sistema de massas A energia cinética desse sistema pode ser encontrada partindo-se inicialmente da sua definição: T≜ 1 N ∑ mn v n ⋅ v n , 2 n =1 3.37 que leva ao seguinte resultado, após efetuar as devidas substituições: T= 1 1 N m v o ⋅ v o + v o ⋅ cɺ i + ∑ mn rɺni ⋅ rɺni 2 2 n =1 3.38 Efetua-se agora a composição de movimentos em sistemas girantes, resultando para a energia cinética: T= N 1 1 N 1 b b b m v o ⋅ v o + v o ⋅ cɺ b + ω ⋅ c × v o + ∑ mn rɺn ⋅ rɺn + ω ⋅ ∑ mn rn × rɺn + ω ⋅ J ⋅ ω 2 2 n=1 2 n =1 3.39 É interessante constatar que a variação da energia cinética resulta em: N Tɺ = ∑ mn vɺ in ⋅ v n , 3.40 n =1 mas, uma vez que a aceleração é causada pelas forças internas e externas aplicadas à massa, então N N Tɺ = ∑ fne + ∑ fnm ⋅ v n , n =1 m =1 3.41 mostrando com isso que a energia cinética pode crescer ou decrescer com o trabalho realizado tanto pelas forças externas quanto internas, desde que haja movimento relativo entre os pontos 44 de massa. Ao contrário, se os pontos moverem-se rigidamente então novamente não haverá contribuição das forças internas. Equações escalares do movimento Até agora todas as relações algébricas do movimento foram apresentadas na forma vetorial. É claro que a análise do movimento e a integração numérica ou analítica das equações diferenciais requerem que as equações sejam postas na forma matricial. Para isso empregam-se as diversas propriedades das vetrizes, vistas na Seção 2.3. Porém, uma vez que os vetores podem ser expressos em qualquer um dos dois sistemas de coordenadas, Fi e Fb, deve-se adotar um critério de escolha. Usualmente os vetores são representados numa base na qual eles estejam fixos ou cujo movimento possa ser medido. Assim, na base Fi representamse: ( vo ro ( ro fe pn fne f mn p ) = Fi ⋅ v o fe p ) 3.42 e no sistema Fb: ( rn ho ( = Fb ⋅ rn c ω rcm h o c ω rcm p n fne go ) = fmn g o ) 3.43 J = Fb ⋅ J ⋅ Fb T 3.44 C = Fb ⋅ Fi T 3.45 com N c = m rcm = ∑ mn rn 3.46 n =1 N J = ∑ mn (rnT rn 1 − rn rnT ) , 3.47 n =1 onde o momento linear e o momento angular são dados por: p n = mn (C v o + rɺnb − rn× ω) 3.48 p = m v o + CT cɺ b − CT c× ω 3.49 N h o = c× C v o + ∑ mn rn× rɺnb + J ω n =1 O movimento é regido pelas equações da dinâmica a serem integradas, dadas por: 3.50 45 N pɺ bn = f ne + ∑ f mn 3.51 m =1 N pɺ i = fe = ∑ f ne 3.52 hɺ bo = g o − C v×o p − ω× h o 3.53 n =1 ou seja, um sistema de N + 2 equações diferenciais. Hughes (Hughes, 1986) introduz, neste ponto, uma notação que permite escrever este sistema linear na forma matricial, usando, para isso, os conceitos da mecânica. Pode-se então descrever o sistema como dado por: P =MV , 3.54 no qual: P = ( p ho V = ( vo p1 ⋯ p N ) T 3.55 ω rɺ1b ⋯ rɺNb ) T 3.56 e m 1 −CT c× × J c C M = m1 C −m1 r1× ⋮ ⋮ m C −m r× N N N m1 CT m1 r1× m1 1 ⋮ 0 ⋯ mN CT ⋯ mN rN× 0 , ⋯ ⋱ ⋮ ⋯ mN 1 3.57 que denominada de matriz de inércia do sistema, para diferencia-la da matriz de inércia do corpo. Ela é simétrica, quadrada, de dimensão 3N + 6, porém não é constante, em virtude do movimento das massas pontuais. A energia cinética pode igualmente ser expressa na forma escalar, resultando em: T= 1 1 N 1 m vTo v o + ∑ mn (rɺnb )T rɺnb + ωT J ω + 2 2 n =1 2 +v C T o T N ∑m n T × rɺ + ω c C v o + ω b n n =1 N T ∑m n , 3.58 × b n n r rɺ n =1 ou, por meio da matriz de inércia, T= 1 T V MV , 2 3.59 46 3.3 – Dinâmica de um corpo rígido O movimento de um sistema de massas pontuais, analisado na seção anterior, aplicase, na verdade, a poucos exemplos da mecânica. Quando o corpo possui dimensões que ultrapassam as distâncias envolvidas no movimento, deve-se fazer uma abordagem de meios contínuos. A massa, neste caso, já não é mais concentrada num ponto (ou numa região muito pequena), mas distribui-se no espaço. Quando não houver movimento relativo entre quaisquer partes do corpo, diz-se que ele é rígido. Particularmente em satélites artificiais, a modelagem da dinâmica de corpo rígido é a mais utilizada e a que mais se aproxima do movimento real. Contudo, a crescente complexidade dos sistemas espaciais, junto com o aumento do poder computacional empregado em simulações, tem permitido a melhoria e a generalidade destes modelos, tornando-os mais precisos. Nesta seção será abordada inicialmente a modelagem dinâmica de um corpo rígido e, nas demais seções, esta modelagem será estendida para acomodar a dinâmica de componentes, utilizados em satélites, que introduzem efeitos de não rigidez. Exemplos de não rigidez são a presença de partes móveis (rotores, apêndices rotativos ou articulados, braços robóticos), fluidos (tanques de combustível, líquidos refrigerantes) ou ainda vibrações de painéis e apêndices. De forma semelhante à realizada na seção anterior, define-se inicialmente o momento angular para um corpo indeformável com distribuição contínua de massa, como aquele apresentado na Figura 3.4, em relação à origem do sistema Fi, como dado por: h i ≜ ∫ ρ × ρɺ i dm = ∫ ρ × v dm , m m 3.60 na qual a integral é efetuada em toda a massa m do corpo. Por sua vez, o momento angular em relação a um ponto O fixado ao corpo é definido por: h o ≜ ∫ r × v dm , m 3.61 onde r é o vetor do elemento de massa infinitesimal em relação a O. Nota-se, nesta expressão, que a velocidade do elemento continua sendo medida em relação a Fi, ainda que sua posição seja relativa a O. Substituindo a composição de vetores ρ = ro + r no momento em relação a Fi, chega-se facilmente ao resultado: h o = h i − ro × p , 3.62 pois o momento linear p do corpo é definido por: p ≜ ∫ v dm . m 3.63 47 O r dm ro ρ Fi Fig. 3.4 – Movimento de um corpo rígido ao redor do centro O. A variação do momento angular em relação à origem de Fi pode agora ser calculada, o que resulta: hɺ ii ≜ ∫ ρ × vɺ i dm , m 3.64 mas vɺ i dm é a força df aplicada ao elemento dm, e, pelo princípio da ação e reação, haverá uma força − df aplicada a um outro elemento de massa, com mesma linha de ação, o que significa que a integral irá se anular para todas as forças elementares internas. Porém, as forças externas não se equilibram, e com isso a variação do momento angular fica: hɺ ii ≜ g i , 3.65 onde g i é o torque resultante de todas as forças externas aplicadas ao corpo, incluindo forças originárias de pressão e binários puros, ou seja: g i ≜ ∫ ρ × df . m 3.66 Caso o conjunto de forças externas fi possam ser consideradas como pontuais, aplicadas a determinados pontos ρ i do corpo, então a expressão acima fica: N g i = ∑ ρ i × fi , 3.67 i=1 Nota-se, nesta expressão, que o torque é dependente do ponto de referência adotado, ou seja, depende da origem do sistema Fi. Contudo, este torque pode ser igualmente calculado em relação ao ponto O, bastando para isso que se substitua ρ = ro + r na definição de g i , que irá resultar: g i = ro × f + g o , 3.68 48 na qual f é a resultante das forças externas aplicadas ao corpo e g o é a resultante dos torques externos, definidos respectivamente por: N f ≜ ∑ fi , 3.69 i=1 N g o ≜ ∫ r × df = ∑ ri × fi . m 3.70 i =1 Pode-se igualmente mostrar, sem muito esforço, que a resultante dos torques externos independe do ponto de referência adotado, sempre que houver exclusivamente binários aplicados ao corpo, isto é, sempre que houver, para cada força fi , uma outra força igual e oposta com linhas de ação distintas. Nesta situação vale a igualdade g i = g o . A variação do momento linear é dada por: pɺ i = ∫ df = f . m 3.71 Por outro lado, a variação do momento angular relativa ao ponto O fica: hɺ io = g o − v o × p , 3.72 onde v o ≜ rɺoi é a velocidade do ponto O relativa a Fi. Para o corpo indeformável a energia cinética fica definida por: T≜ 1 v ⋅ v dm . 2 ∫m 3.73 Equações vetoriais do movimento De forma análoga ao realizado no movimento de um sistema de massas pontuais, admite-se que o corpo rígido gire ao redor do ponto O, com velocidade angular ω =ω bi , da base Fb relativa a Fi, como ilustrado na Figura 3.5. Se o corpo estiver livre no espaço, então o ponto O coincide com o centro de massa Cm. Isto é válido, é claro, para satélites. Contudo, Hughes (Hughes, 1986) mantém a distinção entre O e Cm para permitir a posterior aplicação do método a corpos articulados, nos quais esta separação torna o equacionamento mais simples. Não é difícil verificar que a coincidência de O com Cm acarreta simplificações na modelagem, e isto será mostrado adiante. Uma vez que não existe movimento relativo entre os elementos de massa de um corpo rígido, a quantidade de movimento linear passa a ser dada simplesmente por: p = m v o + ω × c 3.74 na qual v o é a velocidade de O relativa à base Fi, m é a massa do corpo e c é o primeiro momento de inércia. O momento angular em relação a O por sua vez é obtido a partir da definição: 49 h o = c × v o + ∫ r × rɺ i dm , m 3.75 e, como a posição r do elemento de massa dm é conhecida no sistema girante, então b rɺ i = rɺ b + ω × r , e, uma vez que não há movimento relativo na base Fb, rɺ = 0 e o momento angular resulta, aplicando a relação do duplo produto vetorial: h o = c × v o + ∫ (r ⋅ r 1 − rr ) dm ⋅ ω . m 3.76 A integral é agora facilmente reconhecível, e com isso tem-se que h o = c × v o + J ⋅ ω 3.77 ω Fb O rcm ro r Cm dm ρ Fi Fig. 3.5 – Movimento de um corpo rígido ao redor do centro O. Das relações 3.26 e 3.28 tem-se que a variação do momento linear e do momento angular resultam, respectivamente: pɺ i = f , 3.78 hɺ io = p × v o + g o 3.79 onde f é a resultante das forças externas fk aplicadas ao sólido, ou seja f = ∑ fk , 3.80 k e g o é a resultante de todos os torques aplicados ao corpo, inclusive aqueles provindos das forças: g o = ∑ rk × fk + ∑ g j k 3.81 j onde rk é o vetor do ponto de aplicação da força fk relativo ao ponto O e g j são binários puros. 50 Quando escritas no sistema fixado ao corpo, Fb, as variações do momento linear e angular resultam nas equações do movimento: pɺ b = f − ω × p , 3.82 hɺ bo = g o + p × v o − ω × h o 3.83 e A energia cinética pode também ser calculada para o corpo rígido, resultando: T= 1 1 m v o ⋅ v o + ω ⋅ c × v o + ω ⋅ J ⋅ ω . 2 2 3.84 A maior parte da literatura que trata da dinâmica de corpos rígidos apresenta as equações do momento angular e da energia cinética em relação ao centro de massa. De fato, pode-se mostrar que quando O coincide com o centro de massa consegue-se simplificações significativas nas relações da dinâmica. Além disso, um corpo livre, no espaço, gira ao redor do seu centro de massa, mesmo que este ponto não esteja fixo no corpo em virtude do movimento de apêndices articulados, fluidos, ou ainda partes móveis. É conveniente, pois, derivar aqui as equações vetoriais do movimento na situação em que O coincide com o centro de massa. O primeiro momento de inércia, neste caso, é nulo e ocorre um imediato desacoplamento entre o movimento translacional e o rotacional: p = m v cm , 3.85 h cm = I ⋅ ω 3.86 no qual v cm é a velocidade do centro de massa e I a diádica de inércia em relação a este centro. A energia cinética fica: T= 1 1 m v cm ⋅ v cm + ω ⋅ I ⋅ ω . 2 2 3.87 onde também se consegue identificar as parcelas devido ao movimento translacional e rotacional. Esta separação permite que a análise do movimento seja efetuada em apenas um deles, rotacional ou translacional, e, como seria de esperar, muitas referências sobre este assunto abordam exclusivamente o movimento rotacional ao redor do centro de massa, como, por exemplo, em Wertz (Wertz, 1978). Quando expressa no sistema fixado ao corpo a variação do momento linear não é afetada, mas a variação do momento angular fica: hɺ bcm = g cm − ω × h cm , pois, neste caso, p e v cm possuem a mesma direção. 3.88 51 Equações escalares do movimento De forma análoga àquela realizada na Seção 3.2, estabelece-se a base na qual cada vetor será representado, ou seja, as relações que permitem passar da representação vetorial para a matricial. Se todos os vetores forem expressos na base Fb, então ( ho c ω rcm ( = Fb ⋅ h o go c ω rcm vo g o ro v o p) = f ro f p ) , J = Fb ⋅ J ⋅ Fb T , 3.89 3.90 e tal que C = Fb ⋅ Fi T 3.91 c = m rcm = ∫ r dm m 3.92 J = ∫ (rT r 1 − r rT ) dm , 3.93 m O momento linear e o momento angular ficam então: p = m v o − c× ω , 3.94 h o = c× v o + J ω , 3.95 enquanto que suas variações resultam: pɺ b = f − ω×p , 3.96 hɺ bo = g o − v×o p − ω× h o . 3.97 Na forma escalar a energia cinética fica: T= 1 1 m vTo v o + ωT c× v o + ωT J ω . 2 2 3.98 Pode-se igualmente definir a matriz de inércia do sistema na forma: m 1 −c× M= × , J c 3.99 e, com isso, exprime-se a quantidade de movimento linear e angular por: P =MV , 3.100 52 no qual: P = ( p ho ) T V = ( vo 3.101 ω) T 3.102 A equação do movimento resume-se agora a: Pɺ b = T − Ω× P , 3.103 onde T é o vetor de forças e torques externos: T = (f go ) , T 3.104 e Ω× é a matriz definida por: ω× Ω× = × vo 0 . ω× 3.105 A energia cinética é dada simplesmente por: T= 1 T V MV . 2 3.106 Deve ser realçado que as equações dos movimentos são integradas nos momentos e não nas velocidades. Isto significa que, embora ω e v o variem com o tempo, não são obtidas diretamente a partir das equações do movimento. A vantagem de se trabalhar com a matriz de inércia do sistema é agora evidente, se for considerado que V = M −1 P , 3.107 que indica ser necessário inverter a matriz do sistema. Nota-se que este cálculo é necessário, pois as velocidades estão presentes tanto nas equações da dinâmica quanto da cinemática. A inversa pode ser calculada por meio de inversões por blocos, o que leva ao resultado: K K c× J −1 M −1 = −1 × , −1 −1 × × −1 −J c K J − J c K c J 3.108 K = ( m 1 + c× J −1 c× ) , 3.109 onde −1 mas, como todos os elementos de M são constantes, esta inversa poderá ser calculada uma única vez. 53 Equações em relação ao centro de massa Se a origem da base Fb fixada ao corpo coincidir com o centro de massa, as equações da dinâmica podem ser simplificadas para p = m v cm , h cm = I ω , pɺ b = f − ω×p , hɺ bcm = g cm − ω× h cm , 3.110 3.111 o que realça a característica de separação entre o movimento rotacional e o translacional. Nota-se que a inércia do corpo é representada por I quando referida ao centro de massa, e que ɺb, gcm indica o torque com relação a este mesmo ponto. Uma vez que pɺ b = m vɺ bcm e hɺ bcm = I ω substituindo-se estes resultados nas equações anteriores chega-se a: vɺ bcm = m −1 f − ω× v cm , 3.112 ɺ b = I −1 (g cm − ω× I ω) , ω 3.113 que permite integrar a equação do movimento rotacional diretamente em termos da velocidade angular do corpo. Embora os movimentos sejam independentes, Hughes (Hughes, 1986) esclarece que, em geral, os torques são causados por forças e estas provocam alterações no momento linear. Contudo, como, em geral, as variações no momento linear imposto pelas forças usadas no controle de atitude (como, por exemplo, em propulsores a jato) são desprezíveis quando comparadas ao momento total, costuma-se ignorar seus efeitos e apenas as equações do movimento rotacional são integradas. Se a base Fb coincidir com o sistema de eixos principais do corpo, então a matriz de inércia I resulta diagonal, e a equação do movimento angular pode ser separada nas suas componentes: ɺ 1b = g1 + ( I 2 − I 3 ) ω2 ω3 I1 ω ɺ b2 = g 2 + ( I 3 − I1 ) ω3 ω1 . I2 ω 3.114 ɺ 3b = g 3 + ( I1 − I 2 ) ω1 ω2 I3 ω Este sistema de equações, embora simples, é não linear, e apresenta solução analítica apenas em situações específicas, quando o torque é ausente ou possui comportamento particular. Se o corpo apresentar um eixo de simetria, isto é, se dois dos três momentos de inércia forem iguais, então um dos eixos torna-se independente dos demais, permitindo assim uma possível solução analítica. Nesta situação, se a direção do momento angular não coincidir com a direção da velocidade angular, tem-se o conhecido movimento de nutação, que provoca oscilações nas velocidades angulares transversais ao eixo de simetria. Na ausência de torques o momento angular permanece constante em módulo e direção quando observado a partir de um sistema inercial. O movimento do momento angular causado pela ação de torques no corpo é conhecido como precessão. 54 3.4 – Corpo rígido acoplado a rotores Passa-se agora a estudar o movimento de um corpo no qual está presente uma inércia rotativa, como, por exemplo, um motor, como ilustrado na Figura 3.6. Tais elementos são usualmente empregados nos sistemas de controle de atitude de satélites, e são conhecidos como rodas de reação ou volantes de inércia. Trata-se basicamente de motores elétricos brushless dotados de rotores com uma inércia elevada. Com a aplicação de torque ao motor, a reação deste torque é aplicada ao restante do satélite, e usa-se este torque para o controle de atitude. Uma vez que o torque é interno ao satélite, ele não altera o momento angular. ωn ω Fb O R rcm ro dmb rb bn an Wn Cm Fi Fig. 3.6 – Movimento de um corpo rígido composto com uma inércia rotativa. O sistema composto pelo corpo R e um conjunto de rotores Wn (n = 1, 2, ... N) fixados ao primeiro já não pode ser considerado como totalmente rígido, devido à presença das massas rotativas. Porém, pode-se assumir que cada um deles seja individualmente rígido, e aplicar as definições das equações do movimento a cada um destes corpos. Seja então o corpo R (rígido) de massa mb, com primeiro momento de inércia cb e diádica de inércia J b relativas a um sistema de coordenadas Fb fixado a este corpo. O rotor Wn (n = 1, 2, ... N) fixado ao corpo R tem posição do centro de massa dada por b n , massa mn, diádica de inércia relativa a O igual a J n e direção do eixo de rotação dada pelo vetor unitário a n que passa pelo centro de massa do rotor. A massa total m do conjunto é então calculada por: N m = mb + ∑ mn , 3.115 n =1 e, como a diádica dos rotores pode ser posta na forma J n = I n + mn (b n ⋅ b n 1 − b n b n ) , o primeiro e segundo momentos de inércia totais ficam: N c = cb + ∑ mn b n , 3.116 n =1 N N n =1 n =1 J = J b + ∑ J n = J b + ∑ ( I n + J b ,n ) , onde a diádica J b ,n é definida por: 3.117 55 J b ,n ≜ mn (b n ⋅ b n 1 − b n b n ) . 3.118 Nota-se que o primeiro e segundo momentos de inércia são todos invariantes, pois foi admitido que os centros de massa dos rotores coincidem com seus respectivos eixos de rotação. Assumindo agora que os rotores possuam simetria cilíndrica (e usualmente possuem), então se a direção do eixo de simetria for dada pelo vetor unitário a n , a diádica de inércia In referida ao centro de massa do rotor pode ser posta na forma (Hughes, 1986): In = I n,t 1 + ( I n , s − I n ,t ) a n a n , 3.119 na qual In,s é o momento de inércia do rotor no eixo de simetria a n , e In,t é o momento de inércia transversal, em qualquer direção perpendicular a este eixo. Equações vetoriais do movimento Passa-se agora a escrever as equações vetoriais do movimento, iniciando-se pelo momento linear do corpo rígido e de cada rotor: p b = mb v o + ω × cb , 3.120 p n = mn v o + ω × mn b n . 3.121 O momento linear do conjunto é formado pelas parcelas dos momentos individuais do corpo rígido e de cada um dos rotores, ou seja: N p = p b + ∑ p n = m v o + ω × c . 3.122 n =1 Por outro lado, o momento angular relativo ao ponto O do corpo R fica: h b = cb × v o + J b ⋅ ω 3.123 na qual v o é a velocidade de O relativa à base Fi, m é a massa do corpo e c é o primeiro momento de inércia. O momento angular do rotor n, em relação a O, por sua vez, será obtido a partir da definição: h n = mn b n × v o + ∫ ρ n × ρɺ in dmn , m 3.124 onde ρ n = b n + rn representa a posição de um elemento de massa do rotor relativo a O. Notase que a variação de ρ n é dada por: ρɺ in = bɺ in + rɺni = ω × (b n + rn ) + ω n × rn , 3.125 56 pela propriedade de adição de velocidades angulares (Equação 2.114), no qual ω n é a velocidade angular de rotação do rotor relativo ao corpo R. O momento angular do rotor n fica: h n = mn b n × v o + J b ,n ⋅ ω + I n ⋅ (ω +ω n), 3.126 Este mesmo resultado poderia ser obtido a partir da mudança de pólo do momento angular, dado pela Equação 3.62. De fato, observa-se que h n = b n × p n + h w, n , 3.127 onde h w,n é o momento angular do rotor n em relação ao seu próprio centro de massa, calculado por: h w,n = In ⋅ (ω +ω n) . 3.128 Pode-se agora calcular o momento angular total relativo a O pela soma de suas parcelas, o que resulta: N ( ) N h o = h b + ∑ b n × p n + h w,n = c × v o + J ⋅ ω + ∑ In ⋅ ω n n =1 3.129 n =1 Uma vez que a velocidade ω n tem direção do eixo de rotação do rotor, isto é, ω n = ωn a n , 3.130 substituindo na Relação 3.119, resulta para o momento angular N h o = c × v o + J ⋅ ω + ∑ I n , s ωn a n 3.131 n =1 O resultado acima indica claramente que o momento angular de um corpo individualmente rígido com rotores fixados a ele é igual ao momento angular do conjunto, acrescido pelo momento angular dos rotores. Considerando-se as Relações 3.119 e 3.130, a componente do momento angular relativo dos rotores na direção do eixo de rotação fica: hw,n = h w,n ⋅ a n = I n , s (a n ⋅ ω + ωn ) . 3.132 e cuja variação temporal é facilmente obtida, levando ao resultado: b ɺ n). hɺw,n = I n , s (a n ⋅ ω ɺ + ω 3.133 Escrevendo-se agora a variação do momento linear separadamente para o corpo R e o rotor Wn tem-se que: 57 N pɺ bi = f − ∑ fb ,n 3.134 pɺ in = fb ,n . 3.135 n =1 e, desde que todas as forças e torques internos são equilibrados, resulta que: N pɺ i = pɺ bi + ∑ pɺ in = f , 3.136 n =1 onde f é a resultante das forças aplicadas ao corpo R e fb, n é a força interna que atua no centro de massa do rotor Wn. Agindo da mesma forma e escrevendo-se a variação do momento angular relativo a O para ambos os corpos separadamente, tem-se para o corpo R: N hɺ bi = p b × v o + g o − ∑ (g b ,n + b n × fb, n ) 3.137 n =1 onde g b ,n é o torque interno no rotor Wn. Por sua vez, a variação do momento angular do rotor n será dada pela variação da Relação 3.127, que fornece: hɺ in = bɺ in × p n + b n × pɺ in + hɺ iw,n , 3.138 i e, como hɺ icm,n = g b,n , bɺ in = ω × b n e pɺ n = fb ,n , tem-se hɺ in = (ω × b n ) × p n + b n × fb ,n + g b,n . 3.139 Somando-se as variações dos momentos angulares do corpo R e dos rotores Wn, comprova-se o resultado já conhecido, após algumas manipulações algébricas: N hɺ io = hɺ bi + ∑ hɺ in = p × v o + g o 3.140 n =1 Este resultado mostra que o momento angular do conjunto é afetado apenas pelos torques externos, como era previsto. Embora o torque entre o corpo e os rotores seja interno, ele provoca alteração na velocidade de rotação do rotor, e, portanto, altera a relação de momentos entre eles. Este torque pode ser separado na componente na direção do eixo do rotor, e uma outra componente ortogonal a esta. A componente na direção do eixo pode ser usada para controlar a velocidade ω n de rotação do rotor. Como o torque no rotor é igual a i g n = g b,n ⋅ a n = hɺ w,n ⋅ a n , então o momento angular do rotor em relação ao seu centro de massa nesta direção fica: hw, n = a n ⋅ h w,n , e cuja variação resulta em 3.141 58 hɺw,n = aɺ in ⋅ h w, n + a n ⋅ hɺ iw,n = (ω × a n ) ⋅ h w,n + a n ⋅ g b ,n . 3.142 Mostra-se, contudo, que (ω × a ) ⋅ h w,n = 0 (Hughes, 1986), usando para isso a propriedade do produto misto (Relação 2.12) e as Equações 3.128, 3.119 e 3.130. A variação do momento angular do rotor resulta então hɺw,n = g n . 3.143 A energia cinética do corpo, incluindo os rotores, fica então dada por: T= 1 ( v o + ω × rb ) ⋅ ( v o + ω × rb )dmb + 2 ∫m 1 N + ∑ ∫ [ v o + ω × b n + (ω +ω n ) × rn ] ⋅ [ v o + ω × b n + (ω +ω n ) × rn ]dmn 2 n =1 m , 3.144 que resulta T= N 1 1 1 N m v o ⋅ v o + v o ⋅ ω × c + ω ⋅ J ⋅ ω + ω ⋅ I ω a + I n, s ωn2 . ∑ n,s n n ∑ 2 2 2 n=1 n =1 3.145 Equações escalares do movimento Pode-se agora exprimir as grandezas vetoriais obtidas anteriormente usando a notação matricial. Será utilizada a conversão: ( ho c ω ωn ( = Fb ⋅ h o an c ω ω n bn a n J = Fb ⋅ J ⋅ Fb T , go b n vo g o ro v o rb ro p) = f rb f p ) , 3.146 3.147 além dos escalares gn, In,s e In,t respectivamente o torque no rotor n, o momento de inércia deste rotor em relação ao eixo de rotação e transversalmente ao eixo. Nota-se que o momento de inércia J inclui as inércias do dos rotores, além da inércia do corpo R. A matriz de atitude e os momentos de inércia são calculados por: C = Fb ⋅ Fi T 3.148 I n = ∫ (rnT rn 1 − rn rnT ) dmn 3.149 m N J = J b + ∑ (I n + J b , n ) n =1 onde 3.150 59 J b = ∫ (rbT rb 1 − rb rbT ) dmb , 3.151 I n = ∫ (rnT rn 1 − rn rnT ) dmn = I n,t 1 + ( I n, s − I n,t ) a n aTn , 3.152 J b ,n = mn (bTn b n 1 − b n bTn ) 3.153 m m O momento linear e o momento angular ficam então: p = m v o − c× ω . 3.154 N h o = c× v o + J ω + ∑ I n , s ωn a n 3.155 n =1 enquanto que a componente do momento angular de cada rotor em relação ao seu centro de massa na direção do eixo de rotação pode ser calculada com base nas Relações 3.141, 3.128, 3.119 e 3.130, resultando: hw,n = I n , s aTn ω + I n , s ωn . 3.156 As equações do movimento ficam: pɺ b = f − ω×p 3.157 hɺ bo = g o − v×o p − ω× h o 3.158 hɺw,n = g n . 3.159 Pode-se novamente definir a matriz de inércia do sistema, o que leva a uma substancial simplificação das equações. Os vetores de momento e velocidade ficam: P = ( p ho V = ( vo hw,1 ⋯ hw,n ) T 3.160 ω ω1 ⋯ ωn ) , T 3.161 enquanto que a matriz de inércia do sistema é dada por: m1 −c× × J c T M= 0 I1, s a1T ⋮ ⋮ T 0 I N , s aTN 0 ⋯ I1, s a1 ⋯ I1, s ⋯ ⋮ ⋱ 0 ⋯ I N ,s a N 0 , ⋮ I N , s 0 3.162 60 e, igualmente, tem-se P =MV , 3.163 A equação da dinâmica é agora dada por: Pɺ = T − Ω× P , 3.164 onde T é o vetor de forças e torques: T = (f go g1 ⋯ g n ) , T 3.165 e a matriz Ω× é definida por: ω× × vo × Ω = 0T ⋮ 0T 0 ω× 0T ⋮ 0T ⋯ ⋯ ⋯ ⋱ ⋯ 0 0 0 ⋮ 0 0 0 0 . ⋮ 0 3.166 Finalmente, a energia cinética fica, na forma escalar, igual a: T= N 1 1 1 N m vTo v o − vTo c× ω + ωT J ω + ωT ∑ I n , s ωn a n + ∑ I n , s ωn2 . 2 2 2 n =1 n =1 3.167 ou, usando a matriz de inércia do sistema, T= 1 T V MV . 2 3.168 Nota-se ainda que é necessário inverter a matriz de inércia do sistema para que se obtenha o vetor de velocidades V. Esta inversão não é complicada, pois M é uma matriz esparsa, ou seja, contém diversas células nulas. Pode-se, por exemplo, utilizar a inversão por blocos, como apresentado na seção anterior, aplicando-a duas vezes à matriz, o que leva ao conjunto de matrizes: A M = T B −1 −1 B −G B C−1 G = , −1 T −1 −1 T −1 C −C B G C + C B G B C 3.169 onde G = (A − BC B −1 T ) −1 K K c× L = , × × × −L c K L − L c K c L 3.170 61 m 1 −c× A= × J c 3.171 ⋯ 0 0 B= , I1, s a1 ⋯ I N , s a N 3.172 I1, s ⋯ 0 C= ⋮ ⋱ ⋮ , 0 ⋯ I N ,s 3.173 K = ( m 1 + c× L c× ) , 3.174 −1 N L = J − ∑ I n , s a n aTn n =1 −1 , 3.175 sendo que as três últimas podem ser facilmente invertidas com métodos usuais (as duas últimas são matrizes quadradas de ordem 3). Equações em relação ao centro de massa Consegue-se significativa simplificação nas equações da dinâmica se o momento angular for expresso com relação ao centro de massa do conjunto corpo R e rotores Wn. Da mesma forma como ocorrido na seção anterior, o movimento do corpo pode então ser separado no movimento translacional e rotacional. De particular interesse aqui são as equações do movimento rotacional, já que as demais equações permanecem iguais às da Seção 3.2. O momento angular e sua variação ficam então iguais a: N N h cm = I − ∑ I n, s a n aTn ω + ∑ hw,n a n n =1 n =1 3.176 N N hɺ bcm = g cm − ω× h cm = g cm − ω× I − ∑ I n, s a n aTn ω − ω× ∑ hw,n a n , n =1 n =1 3.177 onde I é a matriz da diádica do conjunto em relação ao centro de massa. O momento angular dos rotores fica inalterado, portanto são válidas as Equações 3.156 e 3.159. Embora a matriz de inércia do sistema sofra também uma simplificação, ela ainda deverá ser invertida para que se possa determinar as velocidades angulares dos rotores e do corpo. Para evitar tais inversões pode-se exprimir as equações da dinâmica do corpo diretamente em termos das velocidades angulares, derivando-se hcm diretamente no sistema Fb, e igualando as duas relações para obter: N N ɺ b = g cm − ω× I b ω + ∑ hw, n a n − ∑ g n a n Ib ω n =1 n =1 3.178 62 com hɺw,n = g n . 3.179 e tal que a matriz de inércia reduzida Ib é definida por: N I b ≜ I − ∑ I n, s a n aTn n =1 3.180 As velocidades angulares dos rotores podem agora ser calculadas por meio da Relação 3.156: I n , s ωn = hw, n − I n, s aTn ω , 3.181 e, embora este sistema aparente ser mais complexo do que as equações envolvendo o momento angular, ainda assim deve-se notar que neste não há necessidade de se inverter a matriz de inércia do sistema, mas tão somente a matriz reduzida, que não varia e tem dimensão 3. Como último resultado, quando a origem do sistema Fb coincidir com o centro de massa do conjunto a energia cinética ficará na forma: T= N 1 1 1 N m vTo v o + ωT I ω + ωT ∑ I n , s ωn a n + ∑ I n, s ωn2 . 2 2 2 n=1 n =1 3.182 onde se nota novamente a separação entre os movimentos de rotação e de translação. 3.5 – Corpo rígido com amortecedor de nutação Um amortecedor de nutação é um dispositivo fixado ao satélite cuja finalidade é dissipar oscilações induzidas no movimento de atitude. Estes dispositivos podem ser ativos ou passivos. Os amortecedores passivos não requerem ação de controle nem energia adicional para operarem, e são mais simples do que os ativos. A nutação surge quando a direção do momento angular não coincide com um dos eixos principais de inércia do corpo. Para que isto ocorra é necessário, portanto, que o momento angular não seja nulo, isto é, que o corpo apresente uma certa velocidade angular de rotação, e também que ele tenha assimetria de massa, ou, em outras palavras, que pelo menos um dos momentos axiais de inércia seja distinto dos demais. Quando tais condições são satisfeitas, como, por exemplo, em satélites estabilizados por rotação, o vetor velocidade angular não se alinha com o momento angular, e o corpo descreve um movimento “bamboleante”, com um dos eixos principais descrevendo um cone ao redor do vetor momento angular. As componentes da velocidade angular em direções ortogonais ao eixo principal, referida ao corpo, apresentam um comportamento oscilatório devido ao movimento bamboleante. O amortecedor de nutação usa então este efeito oscilatório para dissipar o excesso de energia cinética do movimento giratório, o que provoca um decréscimo no ângulo de cone e faz com que tanto a velocidade angular quanto o eixo de maior momento de inércia tendam a ficar alinhados com o momento angular ao cabo de um curto período, descrevendo uma trajetória espiral até o alinhamento. Quando a nutação for totalmente removida, o corpo terá um movimento rotacional puro ao redor do eixo de maior momento de inércia conhecido 63 como “flat spin” (Fig. 3.7). No caso de um corpo com geometria semelhante a uma moeda, o eixo de maior momento de inércia é perpendicular ao plano da moeda, e, se a geometria for semelhante a uma caneta, o eixo de maior momento é perpendicular ao eixo longitudinal dela. Fig. 3.7 – Movimento de amortecimento de nutação num satélite assimétrico. Os pontos azuis mostram a trajetória espiral do eixo de maior momento de inércia (também em azul), e seu alinhamento ao eixo do momento angular (em vermelho). Os amortecedores de nutação podem operar por meios exclusivamente mecânicos, ou ainda eletro-magnéticos. Cada um deles tem seu próprio equacionamento matemático e sua taxa de dissipação de energia. Amortecedores mecânicos usam o atrito para prover a remoção de energia, enquanto que os eletromagnéticos usam a histerese ou correntes de Foucault induzidas em discos. A formulação apresentada aqui será aquela relacionada a amortecedores mecânicos. Estes são compostos por um sistema massa-amortecedor, no qual a massa sofre as acelerações do movimento oscilatório causado pelas velocidades angulares transversais, e o amortecedor provoca uma histerese que dissipa a energia deste movimento. Há diversos arranjos possíveis para estes amortecedores. Podem ser rotacionais ou translacionais. Podem incluir ou não uma mola restauradora, e o sistema de amortecimento pode ser sólido ou fluido. Os amortecedores rotacionais consistem basicamente de um rotor livre ou suportado por uma mola torcional. Se estiver livre ele deve ser lacrado com um líquido no interstício que irá provocar um atrito viscoso no rotor. No caso de ser suportado por uma mola, esta irá dissipar a energia por meio de histerese mecânica, como o usado no satélite SAS-A (Sen, 1970). Amortecedores mecânicos devem evitar o uso de atrito seco, pois neste caso o atrito estático em geral é maior do que o atrito dinâmico. Quando as acelerações tornam-se pequenas demais para sobrepujar o atrito estático, a dissipação de energia cessa, permanecendo ainda uma nutação residual que não é mais eliminada. Este efeito é menos intenso em atrito viscoso, como aqueles causados por líquidos. De fato, uma boa parte dos amortecedores de nutação usam líquidos como meio dissipativo e até mesmo como o elemento de massa. Amortecedores eletromagnéticos são igualmente eficientes em baixos ângulos de nutação. Os principais tipos de amortecedores são (ver Figura 3.8): • • • Anel tubular parcialmente preenchido com óleo, e com eixo descentralizado com relação ao eixo de maior momento de inércia (a). Setor tubular preenchido com óleo e uma esfera no interior. O setor é levemente curvado para fazer com que a esfera fique alojada no seu centro após a nutação ter sido amortecida, por ação da força centrífuga. O eixo do tubo é alinhado ao eixo de rotação (b). Disco com mola torcional. O eixo do disco é perpendicular ao eixo de maior momento de inércia, e a mola restaura a posição do disco além de dissipar a energia cinética (c). 64 • • Pêndulo com mola. O pêndulo oscila na direção do eixo de rotação, e a mola dissipa a energia vibratória (d). Massa com mola. Trata-se do mesmo princípio do pêndulo, porém usa uma mola translacional que confina o movimento da massa, ao mesmo tempo em que amortece a nutação (e). ω a d c b e Fig. 3.8 – Principais tipos de amortecedores de nutação empregados em satélites. Considera-se agora um corpo rígido R e um conjunto de amortecedores de nutação Dn (n = 1, 2, ... N) do tipo massa, mola e amortecedor translacional, mostrados na Figura 3.9. O corpo R possui massa mb, primeiro momento de inércia cb e diádica de inércia J b em relação ao sistema de coordenadas Fb fixado a ele no ponto O. O amortecedor Dn tem posição da massa mn dada por ρ n = b n + xn a n , coeficiente de amortecimento dn e constante de mola kn. A massa m do conjunto é calculada por: N m = mb + ∑ mn . 3.183 n =1 Admite-se agora que as dimensões dos amortecedores de nutação sejam reduzidas, ao ponto de se poder considerar a massa mn como pontual. Com isso a diádica do amortecedor passa a ser: J n = mn (ρ n ⋅ ρ n 1 − ρ n ρ n ) , 3.184 O primeiro e segundo momentos de inércia do conjunto valem então: N N N n =1 n =1 n =1 c = cb + ∑ mn ρ n = cb + ∑ mn b n + ∑ mn xn a n , 3.185 N J = J b + ∑ J n . n =1 3.186 65 ω an Fb O R dn bn Dn rcm ro Cm mn kn Fi Fig. 3.9 – Corpo rígido composto com amortecedores de nutação translacionais. Equações vetoriais do movimento O momento linear do conjunto pode agora ser considerado como sendo formado pelos momentos do corpo R e pelo momento dos amortecedores, dados respectivamente por: p b = mb v o + ω × cb , 3.187 p n = mn ( v o + ω × b n + vn a n ) , 3.188 onde v o é a velocidade de O relativa à base Fi, e vn = xɺn é a velocidade da massa mn. O momento linear do conjunto fica então igual a: N N n =1 n =1 p = p b + ∑ p n = m v o + ω × c + ∑ mn vn a n , 3.189 sendo que m é a massa total e c é o primeiro momento de inércia do conjunto. O momento angular relativo ao ponto O do corpo R, por sua vez fica: h b = cb × v o + J b ⋅ ω , 3.190 e o momento angular do amortecedor n, em relação a O, será calculado por meio de: h n = mn b n × v o + mn ρ n × ρɺ in , 3.191 onde ρ n = b n + xn a n é a posição da massa mn. A taxa de variação de ρ n pode ser calculada por: ρɺ in = bɺ in + xɺn a n + xn aɺ in = ω × (b n + xn a n ) + vn a n , 3.192 e com isso o momento angular do amortecedor de nutação n fica: h n = mn b n × v o + J n ⋅ ω + vn mn b n × a n . 3.193 66 Por outro lado, o momento angular total relativo a O é dado pela soma das parcelas individuais, resultando: N N n =1 n =1 h o = h b + ∑ h n = c × v o + J ⋅ ω + ∑ vn mn b n × a n . 3.194 As equações do movimento são obtidas ao se efetuar a variação temporal dos momentos (linear e angular). A variação do momento linear será igual ao somatório das forças externas e a variação do momento angular resultará no somatório dos torques externos aplicados ao corpo, incluindo os amortecedores. A análise será feita para cada corpo separadamente. Como a massa do amortecedor de nutação é concentrada num pequeno volume, então a força fn aplicada nela pelo corpo R é igual, e em sentido contrário, à sua reação. Neste caso, tem-se, para a variação do momento linear do corpo: N pɺ bi = f − ∑ fn , 3.195 n =1 enquanto que, para o amortecedor de nutação n, tem-se: pɺ in = fn . 3.196 Por sua vez, a força fn pode ser decomposta nas componentes axial e transversal à direção do movimento da massa. A componente axial deve ser equilibrada pela ação da mola e do amortecedor, de forma que: fn = −(kn xn + d n vn ) a n + fn,t , 3.197 onde fn,t é uma força transversal, tal que fn,t ⋅ a n = 0 . Somando-se as variações dos momentos lineares do corpo e dos amortecedores, resulta então: pɺ i = f . 3.198 A análise do momento angular é realizada de forma análoga, porém ressalta-se que, por hipótese, não há torques aplicados aos amortecedores pelo corpo. Partindo-se da Equação 3.72 a variação do momento angular fica, para o corpo, igual a: N hɺ bi = g o − v o × p b − ∑ b n × fn , 3.199 n =1 onde g o é resultante dos torques externos, enquanto que para os amortecedores de nutação vale: hɺ in = − v o × p n + b n × fn , 3.200 67 de onde se tira que a variação do momento angular total em relação a O fica: N hɺ io = hɺ bi + ∑ hɺ in = g o − v o × p . 3.201 n =1 A equação do movimento para cada um dos amortecedores pode ser obtida a partir da variação do momento linear. Uma vez que o movimento se dá ao longo da direção do vetor a n , calcula-se, então, a variação do momento nesta direção, ou seja: pɺ n = pɺ in ⋅ a n + p n ⋅ aɺ in = fn ⋅ a n + p n ⋅ ω × a n , 3.202 que irá resultar em: pɺ n = − kn xn − d n xɺn + mn ω ⋅ a n × ( v o − b n × ω ). 3.203 Como último resultado, antes de ingressar nas relações escalares do movimento, apresenta-se o cálculo da energia cinética, que neste caso fica: T= 1 ( v o + ω × rb ) ⋅ ( v o + ω × rb )dmb + 2 ∫m 1 N + ∑ mn ( v o + ω × b n + vn a n ) ⋅ ( v o + ω × b n + vn a n ) 2 n =1 , 3.204 que resulta T= 1 1 1 N 2 m v o ⋅ v o + v o ⋅ ω × c + ω ⋅ J ⋅ ω + ∑ mn vn + 2 2 2 n =1 N N n =1 n =1 . 3.205 + v o ⋅ ∑ mn vn a n + ω ⋅ ∑ mn vn (b n × a n ) Equações escalares do movimento para amortecedor translacional As relações apresentadas na forma vetorial serão agora convertidas para a notação matricial, comumente utilizada em implementações computacionais. Como apenas dois sistemas de referência estão em uso (Fi e Fb), admite-se então que todos os vetores são expressos na base girante, ou seja, Fb, e com isso vale a relação: J = Fb ⋅ J ⋅ Fb T , c = Fb ⋅ c 3.206 e tal que N J = Jb + ∑ J n , n =1 onde N c = cb + ∑ mn b n n =1 3.207 68 J b = ∫ (rbT rb 1 − rb rbT ) dmb , cb = ∫ rb dmb m 3.208 m J n = mn (bTn b n 1 − b n bTn ) . 3.209 O momento linear e o momento angular serão calculados por meio de: N p = m v o − c ω + ∑ mn vn a n , × 3.210 n =1 N h o = c× v o + J ω + ∑ vn mn b×n a n , 3.211 n =1 enquanto que o momento linear da massa presente no amortecedor de nutação é dado por: pn = aTn p n = mn (aTn v o − aTn b×n ω + vn ) , 3.212 com suas variações temporais dadas respectivamente por: pɺ b = f − ω×p , 3.213 hɺ bo = g o − v×o p − ω× h o , 3.214 pɺ n = mn ωT a×n ( v o − b×n ω) − kn xn − d n vn . 3.215 Devido à força de restituição da mola, uma nova equação diferencial deve ser inserida no sistema, dada simplesmente por: xɺn = vn . 3.216 A energia cinética, na forma matricial, é obtida a partir da Relação 3.205, resultando: T= +v 1 1 1 N m vTo v o + vTo ω× c + ωT J ω + ∑ mn vn2 + 2 2 2 n =1 N T o ∑m n vn a n + ω N T n =1 ∑m . 3.217 × n vn (b a n ) n n =1 Como sugerido por Hughes (Hughes, 1986) e Wertz (Wertz, 1978) é conveniente expressar as equações do momento e do movimento por meio da matriz de inércia do sistema. Tem-se assim que os vetores dos momentos e de velocidades do sistema ficam: P = ( p ho V = ( vo p1 ⋯ pn ) T ω v1 ⋯ vn ) , T 3.218 3.219 69 onde a matriz de inércia do sistema é dada por: m1 × c M = m1 a1T ⋮ m aT N N −c× J − m1 a1T b1× ⋮ − mN aTN b×N m1 a1 m1 b1× a1 m1 ⋮ 0 ⋯ mN a N ⋯ mN b×N a N , ⋯ 0 ⋱ ⋮ ⋯ mN 3.220 de onde tira-se que P =MV , 3.221 e T= 1 T V MV . 2 3.222 As Equações 3.213 a 3.216 devem ser integradas, e o vetor de velocidades do sistema pode ser obtido pela inversão da matriz de inércia do sistema, ou seja: V = M −1 P , 3.223 mas, diferentemente dos casos analisados anteriormente, esta matriz não é constante, pois depende do deslocamento xn das massas dos amortecedores de nutação. Isto significa que a matriz inversa deve ser calculada sempre que as velocidades forem requeridas. Pode-se empregar o mesmo método utilizado na Seção 3.4, mais precisamente as Equações 3.169 a 3.174, que são substituídas por A M = T B −1 −1 B G −G B C−1 = , −1 T −1 −1 T −1 C −C B G C + C B G B C 3.224 onde −1 K DL K G = ( A − B C−1BT ) = , T T −L D K L − L D K DL 3.225 m 1 −c× A= × J c 3.226 ⋯ mN a N ma B = 1 ×1 , × m1 b1 a1 ⋯ mN b N a N 3.227 70 m1 ⋯ 0 C= ⋮ ⋱ ⋮ , 0 ⋯ m N 3.228 K = ( N + D L DT ) , 3.229 −1 N L = m 1 − ∑ mn b×n a n aTn b×n n =1 N N = J − ∑ mn b×n a n aTn b×n n =1 −1 , 3.230 −1 , 3.231 N D = −c× + ∑ mn a n aTn b×n , 3.232 n =1 e, novamente, as matrizes N, L, e K podem ser facilmente invertidas pois são de ordem 3. Igualmente, a inversão de C é trivial. É evidente, contudo, que basta um único amortecedor de nutação para remover as velocidades angulares transversais do satélite, embora a formulação apresentada aqui permita que se disponha de um número qualquer de amortecedores. As equações diferenciais do movimento podem ser escritas na forma: Pɺ = T − Ω× P , 3.233 onde T é o vetor de forças e torques: f go T × × T= m1 ω a1 ( v o − b1 ω) − k1 x1 − d1 v1 , ⋯ m ω T a× ( v − b × ω ) − k x − d v N o N N N N N N 3.234 e a matriz Ω× é definida por: ω× × vo × Ω = 0T ⋮ 0T 0 ω× 0T ⋮ 0T 0 0 0 ⋮ 0 ⋯ ⋯ ⋯ ⋱ ⋯ 0 0 0 . ⋮ 0 3.235 71 Equações em relação ao centro de massa com amortecedor translacional Quando o momento angular é expresso em relação ao centro de massa do sistema consegue-se uma grande simplificação nas equações. Contudo, este procedimento não mais é válido aqui, uma vez que o centro de massa do conjunto varia conforme a posição da massa do amortecedor. Pode-se, inicialmente, considerar que este deslocamento seja desprezível, e com isso a matriz de inércia do conjunto torna-se constante. Admitindo-se então que esta hipótese seja válida, o momento angular passa a ser dado por: N h cm = I ω + ∑ vn mn b×n a n , 3.236 n =1 cuja variação temporal fica dada por: N hɺ bcm = g cm − ω× h cm = g cm − ω× I ω + ω× ∑ vn mn b×n a n , 3.237 n =1 O momento do amortecedor n e sua variação ficam iguais a: pn = mn (vn − aTn b×n ω) , 3.238 pɺ n = mn ωT J ba ,n ω − kn xn − d n vn , 3.239 e o deslocamento da massa fica: xɺn = vn . 3.240 sendo que Jab,n é definido por: J ba ,n = −a×n b×n = bTn a n 1 − b n aTn 3.241 As expressões obtidas requerem ainda que a matriz de inércia do sistema seja invertida, para que se possa avaliar o vetor V de velocidades. Uma forma de se evitar esta inversão é pela substituição direta das relações em termos das próprias velocidades. Para isso deve-se avaliar a variação do momento angular no próprio sistema Fb, que resulta, para a variação do momento linear e angular, respectivamente: ɺ b) pɺ n = mn (vɺn − aTn b×n ω 3.242 N ɺ b + ∑ mn vɺn b×n a n hɺ bcm = I ω 3.243 n =1 Igualando-se agora estas expressões àquelas já obtidas anteriormente, e resolvendo-se o sistema para as acelerações linear e angular, tem-se: 72 N N × T × b ɺ = g cm − ω× I ω + ω× ∑ vn mn b×n a n + I + ∑ mn b n a n a n b n ω n =1 n =1 N N 3.244 + ∑ (kn xn + d n vn ) b a n − ∑ mn ω J ba ,n ω b a n × n n =1 × n T n =1 N mn 1 + mn aTn b×n I −1 ∑ mn b×n a n vɺn = mn aTn b×n I −1g cm − mn aTn b×n I −1ω× I ω + n =1 × n −1 + mn a b I ω T n × N ∑v n × n 3.245 mn b a n + mn ω J ba ,n ω − kn xn − d n vn T n =1 A óbvia complexidade destas equações demonstra que nem sempre se consegue simplificar a dinâmica ao representá-la por meio das velocidades. Contudo, como foi dito, este procedimento evita a necessidade de se inverter a matriz M de inércia do sistema. Parte desta complexidade decorre do fato de se ter um amortecedor de nutação que se desloca linearmente num corpo em rotação. É claro que se ambos apresentassem movimento rotacional, ao contrário de translacional, certamente seria possível alguma simplificação. Como foi dito antes, um amortecedor de nutação rotacional é semelhante a uma roda de reação na qual o torque aplicado à roda deve ser substituído pelo torque de atrito e, eventualmente, também por um torque restaurador devido a uma mola. As equações de movimento deste amortecedor serão apresentadas na próxima seção. Como último registro, a energia cinética com movimento ao redor do centro de massa fica: N 1 1 N T = ωT J ω + ∑ mn vn2 + ωT ∑ mn vn (b×n a n ) . 2 2 n =1 n =1 3.246 Equações escalares do movimento para amortecedor rotacional Passa-se agora a considerar um corpo rígido R e um conjunto de amortecedores de nutação Dn (n = 1, 2, ... N) do tipo inércia, mola e amortecedor torcional, como mostrado na Figura 3.10. O corpo R possui massa mb, primeiro momento de inércia cb e diádica de inércia J b em relação ao sistema de coordenadas Fb fixado a ele no ponto O. O amortecedor Dn tem centro de massa na posição b n , massa mn, momento de inércia In com relação ao seu centro, e direção do eixo de rotação dada por a n . O coeficiente de amortecimento rotacional é dn e a constante de mola torcional é kn. Sob este ponto de vista, a formulação de um amortecedor de nutação rotacional em nada difere daquela deduzida para rotores (rodas de reação), exceto que o torque aplicado ao rotor deve ser substituído pelo torque do amortecedor, que vale: 73 ω Fb O R Cm rcm Dn bn an In ro kn dn Fi Fig. 3.10 – Movimento composto por um corpo e amortecedores de nutação rotacionais. g n = hɺ id ,n ⋅ a n = − kn θn − d n ωn , onde hɺ id ,n é a variação do momento angular do amortecedor n. O momento linear e o momento angular possuem expressões idênticas àquelas dos rotores, ou seja: p = m v o − c× ω . 3.247 N h o = c× v o + J ω + ∑ I n , s ωn a n , 3.248 n =1 onde In,s é o momento da inércia do amortecedor em relação ao seu eixo de rotação, a n . Por sua vez, a componente do momento angular do amortecedor n em relação ao seu centro de massa na direção do eixo de rotação fica: hd ,n = I n ,s aTn ω + I n ,s ωn . 3.249 As equações do movimento, com momento calculado em relação ao ponto O, são então dadas por: pɺ b = f − ω×p 3.250 hɺ bo = g o − v×o p − ω× h o 3.251 hɺd ,n = − kn θn − d n ωn 3.252 θɺ n = ωn 3.253 e A matriz de inércia do sistema, necessária para o cálculo das velocidades linear e angular, possui a mesma formulação da Seção 3.4 e por isso não será repetida aqui. A mesma idéia aplica-se também à energia cinética. Contudo, é interessante apresentar as equações do movimento quando o ponto de referência do momento angular passa a ser o centro de massa 74 do sistema. Ao contrário do amortecedor de nutação linear, neste caso o centro de massa do sistema não se move, e assim as equações são exatas. O momento angular do conjunto, em relação ao centro de massa, fica então: N N h cm = I − ∑ I n, s a n aTn ω + ∑ hd ,n a n , n =1 n =1 3.254 enquanto que sua variação passa a ser dada por: N N hɺ bcm = g cm − ω× I − ∑ I n, s a n aTn ω − ω× ∑ hd ,n a n , n =1 n =1 3.255 onde I é a matriz de inércia do conjunto em relação ao centro de massa. O momento angular dos amortecedores, hd , n , bem como sua variação hɺd , n , não sofreram alterações. Estas equações requerem, contudo, a inversão da matriz de inércia do sistema M, para que se possa calcular a velocidade angular. Para evitar esta inversão pode-se apresentar as equações em termos das variações do momento angular hcm referido ao sistema Fb, e posteriormente igualando as relações, que resulta: N N ɺ b = g cm − ω× I b ω + ∑ hd ,n a n + ∑ (kn θn + d n ωn ) a n Ib ω n =1 n=1 3.256 onde a matriz de inércia reduzida Ib é definida por: N I b ≜ I − ∑ I n, s a n aTn n =1 3.257 3.6 – Corpo rígido acoplado a apêndices articulados Introduz-se agora a modelagem da dinâmica de um corpo com apêndices articulados. Em virtude da disponibilidade de conversão da energia do Sol diretamente em energia elétrica por meio de células fotovoltaicas, é comum empregar-se grandes painéis em satélites, para coletar esta energia. Para melhorar o rendimento da conversão, procura-se manter, sempre que possível, os painéis, ou arranjos de células, voltados para a direção do Sol. Por outro lado é também comum que o satélite tenha necessidade própria de apontamento, em direções diferentes daquelas dos painéis (para a Terra, por exemplo). Neste caso a solução óbvia é dotar o satélite de juntas rotativas que permitam que os painéis apontem para o Sol de forma independente do movimento próprio do satélite, o que caracteriza um corpo principal (satélite) dotado de um ou mais apêndices (painéis) articulados. O desenvolvimento da dinâmica será semelhante aos realizados anteriormente, onde o momento angular é calculado com base nas velocidades. Também será desenvolvido o modelo da dinâmica em função exclusiva das velocidades angulares para o caso do movimento em relação ao centro de massa. Contudo, este modelo apresenta uma complexidade maior em virtude do centro de massa não ser fixo como nas dinâmicas estudadas anteriormente. 75 Considera-se então um corpo rígido R, de massa mb e com primeiro e segundo momentos de inércia dados por cb e J b , respectivamente. São fixados a este corpo N apêndices An, n = 1, 2, ... N, que podem ser considerados rígidos individualmente e articulados a ele por meio de juntas rotativas, como visto na figura 3.11. A massa do apêndice n é mn, e seu momento de inércia relativo a um sistema Fn fixado ao seu centro de massa é In . O vetor b n indica, no sistema Fb fixado ao corpo, a posição de um ponto qualquer Jn da articulação que une An com R, e a n é um vetor unitário que informa a direção do eixo de rotação desta articulação. Finalmente, o vetor d n fornece a posição do centro de massa do apêndice An em relação ao ponto escolhido na articulação. An ω an bn O R Fb ro Fn dn Jn Cm rcm db ωn Cb Fi Fig. 3.11 –Corpo rígido composto por apêndices articulados. A massa, o primeiro e o segundo momentos de inércia do conjunto formado pelo corpo R e pelos apêndices ficam, em relação ao ponto O, respectivamente: N m = mb + ∑ mn , 3.258 n =1 N N n =1 n =1 c = cb + ∑ mn ρ n = cb + ∑ mn (b n + d n ) , N N n =1 n =1 J = J b + ∑ J n = J b + ∑ (J b + d ,n + I n ) , 3.259 3.260 onde a diádica J b + d ,n é definida por: J b + d ,n = mn (ρ n ⋅ ρ n 1 − ρ n ρ n ) = mn [(b n + d n ) ⋅ (b n + d n ) 1 − (b n + d n ) (b n + d n )] , 3.261 que pode ser separada nas componentes: J b + d ,n = J bb,n + J bd ,n + J db ,n + J dd ,n , dadas por: 3.262 76 J bb,n = mn (b n ⋅ b n 1 − b n b n ) J bd , n = mn (b n ⋅ d n 1 − b n d n ) J db ,n = mn (d n ⋅ b n 1 − d n b n ) J dd , n = mn (d n ⋅ d n 1 − d n d n ) . 3.263 Os momentos J bd ,n e J db ,n são conhecidos como momentos mistos, pois parte deles é relativo ao corpo e parte é relativo ao apêndice. O centro de massa do sistema varia no sistema Fb, uma vez que: rcm = N 1 m d + mn (b n + d n ) , ∑ b b m n =1 3.264 onde se nota que a direção de d n varia com a rotação do apêndice ( d b é o centro de massa do corpo R relativo à base Fb). Equações vetoriais do movimento Os momentos do conjunto podem agora ser expressos em função das propriedades de massa e das velocidades angulares do corpo e dos apêndices. Esta formulação é semelhante à realizada no corpo composto por rotores, porém agora já não há simetria de massa ao redor do eixo de rotação. Será suposto também que não existam torques ou forças externas agindo nos apêndices, exceto aqueles provindos da articulação. Uma generalização do equacionamento para incluir estas forças e torques pode ser realizada, mas, em geral, satélites não contam com elementos geradores de força fixados aos painéis. Ademais, quaisquer força ou torque agindo neles poderia ter sua ação transferida para o corpo do próprio satélite, desde que a articulação pudesse apresentar os esforços de reação. Admite-se que a velocidade angular do corpo R seja ω , e que a velocidade do apêndice seja ω a =ω +ω n , onde ω n = ωn a n é a velocidade relativa entre o corpo e o painel. Escrevendo então o momento linear do corpo e do apêndice n, tem-se: p b = mb v o + ω × cb , 3.265 p n = mn v o + mn ω × (b n + d n ) + mn ω n × d n . 3.266 onde v o é a velocidade de O relativa à base Fi. Os momentos lineares podem agora ser reunidos no conjunto, o que resulta: N N n =1 n =1 p = p b + ∑ p n = m v o + ω × c + ∑ mn ω n × d n . 3.267 De forma análoga, produz-se o momento angular relativo ao ponto O para cada um dos corpos separadamente: h o ,b = cb × v o + J b ⋅ ω , 3.268 77 h o ,n = mn (b n + d n ) × v o + ∫ ρ n × ρɺ in dmn , m 3.269 e tal que ρ n = b n + d n + rn é a posição de um elemento de massa do apêndice n relativo a O e rn é a posição deste elemento referido ao centro de massa de An. Como b n é fixo em R, e d n e rn são fixos no apêndice, então a variação ρ n vale: ρɺ in = bɺ in + dɺ in + rɺni = ω × (b n + d n + rn ) + ω n × (d n + rn ) . 3.270 e com isso o momento angular do apêndice torna-se: h o ,n = mn (b n + d n ) × v o + (J b + d ,n + In ) ⋅ ω + (J db,n + J dd ,n + I n ) ⋅ ω n, 3.271 É também conveniente escrever o momento angular do apêndice em relação ao ponto Jn da articulação. Usando então a relação de mudança de pólo do momento angular (Equação 3.62) este momento resulta: h j , n = h o ,n − b n × p n = mn d n × v o + (J bd ,n + J dd ,n + In ) ⋅ ω + (J dd ,n + In ) ⋅ ω n 3.272 Calcula-se agora o momento angular do conjunto em relação ao ponto O, que irá resultar: N N n =1 n =1 h o = h o ,b + ∑ h o ,n = c × v o + J ⋅ ω + ∑ (J db,n + J dd ,n + In ) ⋅ ω n 3.273 A articulação introduz vínculos de força e torque que são transmitidos para o apêndice. Será mostrado, a seguir, de maneira similar à realizada nas seções anteriores, que a variação temporal do momento linear e angular do conjunto resultam respectivamente nas resultantes f das forças e g o dos torques externos referidos a O. Considerando fn como sendo a força aplicada pelo corpo ao apêndice n, então, por ação e reação, a força aplicada pelo apêndice no corpo será −fn . Tem-se com isso que a variação do momento linear do corpo R e do apêndice serão dados por: N pɺ bi = f − ∑ fn 3.274 pɺ in = fn , 3.275 n =1 onde foi suposto que não existam forças externas aplicadas a qualquer apêndice. Contudo, como afirma Hughes (Hughes, 1986), é fácil modificar estas expressões para que incluam forças e torques externos também nos painéis. Com isso, a variação do momento linear do conjunto fica: 78 N pɺ i = pɺ bi + ∑ pɺ in = f , 3.276 n =1 Por outro lado, sendo g j ,n o torque do corpo aplicado ao apêndice na articulação, a variação do momento angular do corpo R fica: N hɺ io ,b = p b × v o + g o − ∑ (g j , n + b n × fn ) , 3.277 n =1 enquanto que a variação do momento angular do apêndice pode ser calculado por meio da mudança de pólo, ou seja: hɺ io ,n = bɺ in × p n + b n × pɺ in + hɺ ij ,n . 3.278 Por outro lado, a variação do momento angular relativo ao ponto na junta pode ser calculado pela Relação 3.72, que leva a hɺ ij , n = g j ,n − v o × p n − (ω × b n ) × p n 3.279 i Lembrando que bɺ in = ω × b n e pɺ n = fn , resulta então hɺ io ,n = g j ,n − v o × p n + b n × fn , 3.280 e com isso a variação total, incluindo o corpo R e os apêndices An, irá resultar em: N hɺ io = hɺ oi ,b + ∑ hɺ io ,n = p × v o + g o , 3.281 n =1 como se desejava demonstrar. A derivada do momento angular do apêndice pode também ser escrita no referencial girante do próprio apêndice, resultando em: hɺ nj, n = h j , n × (ω +ω n ) − mn ( v o + ω × b n ) × [(ω +ω n ) × d n ] + g j , n 3.282 As equações acima podem sofrer certa simplificação se for considerado que tanto a velocidade angular quanto o torque estão direcionados no eixo de rotação do apêndice, isto é, g j , n = g j , n a n e ω n = ωn a n . Porém, este artifício não elimina o caráter vetorial do momento angular, pois o apêndice foi suposto assimétrico em relação ao eixo de rotação. Esta simplificação será mais perceptível quando forem mostradas as expressões do movimento em termos das velocidades angulares, mais adiante. A energia cinética do conjunto é calculada a partir da sua definição, de forma análoga às realizadas anteriormente: 79 T= 1 ( v o + ω × rb ) ⋅ ( v o + ω × rb )dmb + 2 ∫m 1 N + ∑ ∫ [ v o + ω × ρ n + ω n × (d n + rn )] ⋅ [ v o + ω × ρ n + ω n × (d n + rn )]dmn 2 n =1 m , 3.283 que resulta T= N 1 1 m v o ⋅ v o + v o ⋅ ω × c + ∑ mn ω n × d n + ω ⋅ J ⋅ ω + 2 n =1 2 3.284 N 1 N ( J I ) ω ω + ∑ω ⋅ + ⋅ + ⋅ n dd ,n n n ∑ (J db,n + J dd ,n + In ) ⋅ ω n 2 n =1 n =1 Equações escalares do movimento Antes de escrever as equações escalares do movimento deve-se recordar que foram estabelecidas 3 bases nas quais os vetores serão representados: o sistema inercial Fi, a base Fb fixada ao corpo R, e as diversas bases Fn fixadas aos apêndices. Os vetores definidos anteriormente são então assim representados: ( ho p go ( f ω vo = Fb ⋅ h o p g o (h ωn c cb f ω v o rb cb bn ) = c rb a n b n d n ω n g j , n 3.285 ) ) 3.286 J b + d ,n = Fb ⋅ J b + d , n ⋅ Fb T = J bb ,n + J bd ,n + J db, n + Cbn J dd ,n CTbn , J bb,n = Fb ⋅ J bb,n ⋅ Fb T = mn (bTn b n 1 − b n bTn ) , 3.287 j ,n dn ( an rn ) = Fn ⋅ h j ,n g j ,n rn e as diádicas ficam definidas por: N J = Fb ⋅ J ⋅ Fb T = J b + ∑ (J b+ d ,n + Cbn I n CTbn ) , n =1 J b = Fb ⋅ J b ⋅ Fb = ∫ (rbT rb 1 − rb rbT ) dmb , T m J bd ,n = Fb ⋅ J bd ,n ⋅ Fb T = mn (bTn Cbn d n 1 − b n dTn CTbn ) , J db ,n = Fb ⋅ J db ,n ⋅ Fb T = mn (dTn CTbn b n 1 − Cbn d n bTn ) , I n = Fn ⋅ In ⋅ Fn T = ∫ (rnT rn 1 − rn rnT ) dmn , m T J dd , n = Fn ⋅ J dd ,n ⋅ Fn = mn (dTn d n 1 − d n dTn ) , do qual se depreende que as inércias mistas relacionam-se por meio de J bd , n = JTdb ,n . Além disso, como Cbn é variante no tempo, então as inércias mistas também variam no tempo. O primeiro momento de inércia é dado por: 80 N c = cb + ∑ mn (b n + Cbn d n ) , 3.288 Cbn = Fb ⋅ Fn T , 3.289 n =1 onde Cnb = Fn ⋅ Fb T . Definindo agora a inércia do apêndice n em relação ao ponto fixado na articulação como sendo dada por: J n = J dd ,n + I n , 3.290 as expressões escalares dos momentos em relação ao ponto fixo O ficam então iguais a: N p = m v o − c× ω − ∑ mn Cbn d×n ω n . 3.291 n =1 N h o = c× v o + J ω + ∑ (J db ,n Cbn + Cbn J n ) ω n 3.292 n =1 enquanto que o momento angular do apêndice n em relação ao ponto da articulação Jn vale: h j , n = mn d×n CTbn v o + (CTbn J bd ,n + J n CTbn ) ω + J n ω n 3.293 cujas respectivas variações serão dadas por: pɺ b = f − ω×p 3.294 hɺ bo = g o − v×o p − ω× h o 3.295 hɺ nj , n = g j ,n + [h×j , n + mnCTbn ( v o + ω×b n )× Cbn d×n ](CTbn ω + ω n ) 3.296 Deve-se agora exprimir as equações do movimento em termos da matriz de inércia do sistema. Para isso nota-se que: P = (p ho V = ( vo h j ,1 ⋯ h j ,n ) T ω ω1 ⋯ ω n ) , T e a matriz de inércia do sistema fica então igual a: 3.297 3.298 81 m1 c× M = m1 d1× CTb1 ⋮ m d× CT N N bN −c× − m1 Cb1 d1× ⋯ (J db ,1 Cb1 + Cb1 J1 ) ⋯ J (C J bd ,1 + J1 C ) J1 ⋯ ⋮ ⋮ ⋱ 0 ⋯ T b1 T b1 (C J bd , N + J N C ) T bN T bN − mN CbN d×N (J db , N CbN + CbN J N ) 3.299 0 ⋮ JN e agora pode-se escrever que P =MV , 3.300 sendo T o vetor de forças e torques: T = (f g j ,1 ⋯ g j , N ) , T go 3.301 porém não se consegue exprimir a equação do movimento em termos da matriz de inércia do sistema, uma vez que as equações da dinâmica não são mais lineares. Como último resultado, a energia cinética será dada por: T= 1 1 1 N m vTo v o + ωT J ω + ∑ ωTn J n ω n + 2 2 2 n =1 N + v ω c + v Cbn ∑ mn ω d n + ω T o × T o n =1 × n N T ∑ (J db , n 3.302 Cbn + Cbn J n ) ω n n =1 que, em termos da matriz de inércia do sistema fica: T= 1 T V MV . 2 3.303 Para conhecer o histórico da atitude, deve-se integrar as equações acima em termos do momento linear, e os momentos angulares do corpo R e de cada apêndice An. As velocidades podem ser calculadas a partir da inversão da matriz de inércia do sistema que, neste caso, não é constante, pois depende da geometria entre os apêndices e o corpo. A inversa pode ser calculada a partir das inversas de sub-blocos, como realizado nas seções anteriores. Contudo, esta inversa é complexa em virtude da ordem do sistema, que, neste caso, é de 6 + 3N. Hughes (Hughes, 1986) salienta que a formulação do movimento em termos das velocidades angulares é de pouco valor, uma vez que tais equações são consideravelmente mais complexas do que aquelas que são expressas no momento angular. Porém, considerando que a inversa da matriz de inércia do sistema torna-se necessária, pode-se questionar se realmente o custo da complexidade não compensa o esforço computacional, principalmente se requisitos como processamentos em tempo-real forem levados em consideração. Deve ser salientado, também, que satélites com 2 painéis e 4 rodas de reação são bastante comuns, o que acarreta a necessidade de inversão de uma matriz quadrada de ordem 15. Hughes também adverte para o fato de que é melhor exprimir o momento angular relativo a um ponto fixo O, ao contrário do centro de massa, porque novamente as expressões são mais simples. Porém, a contrapartida é o aumento da ordem do sistema, o que também implica em maior esforço computacional. 82 Em vista disso, apresenta-se, a seguir, uma formulação para o momento angular expresso em relação ao centro de massa, no qual as variações temporais são efetuadas nas velocidades angulares. Equações vetoriais do movimento em relação ao centro de massa Ao exprimir o momento angular em relação ao centro de massa do conjunto, deve-se observar que a posição deste centro não é fixa em coordenadas relativas ao sistema do corpo R, devido ao movimento dos apêndices. Para evitar este problema, é comum projetar-se painéis de células solares em satélites de tal forma que o centro de massa do apêndice coincida com seu eixo de rotação. Com este procedimento o CM do conjunto irá permanecer fixo, e o equacionamento obtido anteriormente é válido. Situações especiais ocorrem quando o centro de massa do apêndice não mais coincide com seu eixo de rotação, o que é bastante comum em braços robóticos espaciais. Seja então um corpo R e N apêndices An, n = 1, 2, ... N, cujas massas e momentos de inércia são aquelas apresentadas no início desta seção. Por conveniência, o sistema Fb terá origem coincidente com o centro de massa do corpo R, para facilitar o equacionamento, uma vez que não há perda de generalidade, apenas simplificação do formalismo algébrico. Nesta situação o primeiro momento de inércia de R será nulo ( cb = 0 ), e o segundo momento será dado por Ib . Os parâmetros dos apêndices permanecem inalterados. Por conveniência o sistema inercial Fi será fixado no centro de massa do conjunto, como ilustrado na figura 3.12, o que permite uma simplificação adicional, já que neste ponto v cm é nulo. Contudo, deve-se ter em mente que este sistema pode não ser inercial se houver forças externas atuando no conjunto. O equacionamento apresentado a seguir é válido, portanto, apenas quando todos os torques são originários de binários puros. Definindo µ n = mn m como sendo a massa reduzida do apêndice An, µb = mb m como a massa reduzida do corpo R, a posição do centro de massa do conjunto pode ser calculada no sistema fixado no centro de massa de R, resultando na relação: rcm = N 1 N r dm + ( r + b + d ) dm b b ∑ ∫m n n n n + d n ) , n = ∑ µ n (b m ∫m n =1 n =1 3.304 e o primeiro e segundo momentos de inércia do conjunto serão dados respectivamente por: N c = m∑ µ n (b n + d n ) = m rcm , 3.305 n =1 N J = ∫ (ρ b ⋅ ρ b 1 − ρ bρ b ) dmb + ∑ ∫ (ρ n ⋅ ρ n 1 − ρ nρ n ) dmn = m m n =1 N = Ib + µb J r + ∑ ( In + J b + d −r ,n ) n =1 3.306 83 na qual as posições dos elementos de massa em R e An em relação ao centro de massa do conjunto são fornecidas respectivamente por ρ b = rb − rcm e ρ n = rn + b n + d n − rcm , e tal que as diádicas são definidas por J r = m (rcm ⋅ rcm 1 − rcm rcm ) , J b + d −r ,n = J b + d , n − J br ,n − J dr ,n − J rb, n − J rd ,n + µ n J r , J br , n = mn (b n ⋅ rcm 1 − b n rcm ) , J dr , n = mn (d n ⋅ rcm 1 − d n rcm ) , 3.307 J rb, n = mn (rcm ⋅ b n 1 − rcm b n ) , J rd ,n = mn (rcm ⋅ d n 1 − rcm d n ) , tal que Ib é o momento de inércia do corpo R em relação ao seu próprio centro de massa, e In e J b + d ,n já foram definidos anteriormente. Nota-se que se rcm for nulo a expressão acima reduz-se ao momento de inércia em relação ao ponto O. Pode-se agora proceder ao cálculo do momento angular em relação ao centro de massa. Lembrando inicialmente que a variação de rcm será dada por: N i rɺcm =ω × rcm + ∑ µ nω n × d n , 3.308 n =1 tem-se então que o momento angular do corpo R, relativo ao centro de massa, será: N i h cm,b = ∫ (rb − rcm ) × (rɺbi − rɺcm )dmb = ( Ib + µb J r ) ⋅ ω + µb ∑ J dr , n ⋅ ω n. m 3.309 n =1 An ω R an bn O Fb rcm ωn Fn dn Jn Fi Cm Fig. 3.12 – Corpo rígido composto por apêndices articulados. Por sua vez, o momento angular do apêndice An em relação ao centro de massa é definido por: i h cm,n = ∫ (rn + b n + d n − rcm ) × (rɺni + bɺ in + dɺ in − rɺcm )dmn A e com isso o momento formado pelo conjunto de todos os apêndices fica igual a 3.310 84 N ∑ h cm , n = n =1 N N n =1 n =1 3.311 = ∑ ( In + J b + d − r ,n ) ⋅ ω + ∑ [ I n + J db ,n + J dd ,n − (1 + µb ) J dr ,n ] ⋅ ω n que, adicionado ao momento angular do corpo, irá fornecer o momento angular total: N N n =1 n =1 h cm = h cm ,b + ∑ h cm,n = J ⋅ ω + ∑ ( I n + J db ,n + J dd ,n − J dr ,n ) ⋅ ω n, 3.312 e que, novamente, coincide com o momento angular relativo a O quando rcm for nulo. O momento angular do apêndice n em relação ao ponto de articulação da junta pode também ser obtido resultando: N h j , n = ( In + J dd ,n + J bd ,n − J rd ,n ) ⋅ ω + ( In + J dd ,n ) ⋅ ω n − ∑ µ k J dkdn ⋅ ω k 3.313 k =1 onde J dkdn é uma diádica cruzada definida por: J dkdn = mn (d k ⋅ d n 1 − d k d n ) , 3.314 Para calcular a variação do momento angular do apêndice, com base na relação de mudança de pólo, tem-se h cm,n = h j ,n + (b n − rcm ) × p n 3.315 onde o momento linear do apêndice, p n , neste caso, é definido por: i p n = ∫ (rɺni + bɺ in + dɺ in − rɺcm )dmn = A N = mnω × (b n + d n − rcm ) + mnω n × d n − mn ∑ µ k ω k × d k . 3.316 k =1 e hɺ icm,n Efetuando-se agora a variação temporal do momento angular, e lembrando que pɺ in = fn = g cm, n = g j ,n + (b n − rcm ) × fn , chega-se a n hɺ nj, n = g j ,n + h j ,n × (ω +ω n ) + ω × (b n − rcm ) − ∑ µ k ω k × d k × p n k =1 e, substituindo a relação de p n , resulta: 3.317 85 n hɺ ij , n = g j ,n + h j ,n × (ω ω ) m ω ( b r ) + + × − − n n cm ∑ µ k ω k × d k × [d n × (ω +ω n )] n k =1 3.318 A variação do momento angular do conjunto já é conhecida pela Relação 3.281 e é igual à resultante dos torques externos em relação ao centro de massa, ou seja: N hɺ icm = hɺ icm ,b + ∑ hɺ icm,n = g cm , 3.319 n =1 A energia cinética neste caso pode ser obtida da expressão relatada na seção anterior, adotando-se v o = 0 : N 1 1 N T= ω ⋅ J ⋅ ω + ω ⋅ ( J + I ) ⋅ ω + ω ⋅ (J db,n + J dd ,n + I n ) ⋅ ω n ∑ n dd ,n n n ∑ 2 2 n =1 n =1 3.320 que depende apenas das velocidades angulares. Equações escalares do movimento em relação ao centro de massa De forma análoga àquela realizada nas seções anteriores, inicialmente seleciona-se o sistema no qual os vetores serão representados. Os vetores relativos ao sistema Fb fixado no corpo R são: ( hcm p g cm ( = Fb ⋅ h cm f ω rcm p g cm c cb f ω rcm an bn ) = c rb a n rb cb b n 3.321 ) enquanto que aqueles associados ao apêndice An (bases Fn) são: (h j ,n dn ωn g j ,n ( rn ) = Fn ⋅ h j ,n d n ω n g j , n rn ) 3.322 A posição do centro de massa no sistema fixado ao corpo, a inércia do conjunto e as inércias mistas ficam: N rcm = Fb ⋅ rcm = ∑ µ n (b n + Cbn d n ) , 3.323 n =1 J = Fb ⋅ J ⋅ Fb T = N = I b + J r + ∑ [J bb,n + J bd , n + J db ,n + Cbn (I n + J dd ,n ) CTbn − J br ,n − J rd ,n − J dr ,n ] n =1 Ib = Fb ⋅ Ib ⋅ Fb T = ∫ (rbT rb 1 − rb rbT ) dmb , m T T J r = Fb ⋅ J r ⋅ Fb T = m (rcm rcm 1 − rcm rcm ), J bb,n = Fb ⋅ J bb,n ⋅ Fb T = mn (bTn b n 1 − b n bTn ) , 3.324 J bd ,n = Fb ⋅ J bd ,n ⋅ Fb = mn (b Cbn d n 1 − b n d C ) , T T n T n T bn 86 J db ,n = Fb ⋅ J db ,n ⋅ Fb T = mn (dTn CTbn b n 1 − Cbn d n bTn ) , J dd , n = Fn ⋅ J dd ,n ⋅ Fn T = mn (dTn d n 1 − d n dTn ) , I n = Fn ⋅ In ⋅ Fn T = ∫ (rnT rn 1 − rn rnT ) dmn , m onde I b é a matriz de inércia do corpo R em relação ao seu centro de massa e I n é matriz de inércia do apêndice. Adicionalmente, serão necessárias as seguintes inércias mistas: T J br , n = Fb ⋅ J br ,n ⋅ Fb T = mn (bTn rcm 1 − b n rcm ), T J rd ,n = Fb ⋅ J rd ,n ⋅ Fb T = mn (rcm Cbn d n 1 − rcm dTn CTbn ) , T J dr ,n = Fb ⋅ J dr ,n ⋅ Fb T = mn (dTn CTbn rcm 1 − Cbn d n rcm ), 3.325 J dkdn = Fn ⋅ J dkdn ⋅ Fn T = mn (dTk Ckn d n 1 − CTkn d k dTn ) , e tal que Ckn = Fk ⋅ Fn T = CTbk Cbn 3.326 O momento angular do conjunto será calculado no sistema de coordenadas fixado ao centro de massa do corpo, e será dado por: N h cm = Fb ⋅ h cm = J ω + ∑ J bn ω n , 3.327 n =1 onde J bn é definido por: J bn = (J db ,n − J dr ,n ) Cbn + Cbn (I n + J dd ,n ) , 3.328 e o momento angular do apêndice n relativo ao ponto de articulação na junta fica: N h j , n = Fn ⋅ h j ,n = J nb ω + (I n + J dd , n ) ω n − ∑ µ k J dkdn CTknω k , 3.329 k =1 tal que J nb vale J nb = CTbn (J bd ,n − J rd , n ) + (I n + J dd , n ) CTbn . 3.330 As variações dos momentos serão calculadas de: hɺ bcm = g cm − ω× h cm e 3.331 87 hɺ nj , n = Fn ⋅ hɺ ij ,n = × n × T × × = g j ,n + h j , n + mnCbn ω (b n − rcm ) − ∑ µ k Cbk ω k d k Cbn d×n k =1 T 3.332 (Cbn ω + ω n ) Embora seja possível escrever a equação acima em termos das matrizes de inércia e inércias mistas, ainda assim será necessário resolver um sistema linear de n + 1 equações para se isolar as velocidades angulares. Sendo assim, é preferível, neste caso, manter o equacionamento em termos do momento angular, e inverter a matriz de inércia do sistema quando necessário. Quando posto na forma da matriz de inércia do sistema, as equações do movimento ficam: P = ( h cm h j ,1 h j ,2 ⋯ h j ,n ) T 3.333 V = ( ω ω1 ω 2 ⋯ ω n ) , T 3.334 cuja matriz de inércia do sistema resulta: J J1b M = J 2b ⋮ J Nb J b1 Jb2 I1 + (1 − µ1 ) J dd ,1 −µ 2 J d 2 d 1 CT21 T −µ1J d 1d 2 C12 I 2 + (1 − µ 2 ) J dd ,2 ⋮ ⋮ T −µ1J d 1dN C1N −µ 2 J d 2 dN CT2 N ⋯ J bN T ⋯ −µ N J dNd 1 C N 1 ⋯ −µ N J dNd 2 CTN 2 ⋱ ⋮ ⋯ I N + (1 − µ N ) J dd , N 3.335 Após converter a equação vetorial da energia cinética para a representação matricial, obtém-se: 1 1 N T = ωT J ω + ∑ ωTn (J dd ,n + I n ) ω n + ωT 2 2 n =1 N ∑ [J db , n Cbn + Cbn (J dd ,n + I n )] ω n 3.336 n =1 Equações vetoriais com velocidades explícitas no tempo Um problema freqüentemente encontrado nas equações da dinâmica de sistemas articulados deve-se à necessidade de se conhecer o torque g cm que age na junta. Nas aplicações espaciais este torque é em geral exercido por motores CC sem escovas, motores de passo em painéis giratórios e braços robóticos ou mesmo por molas e amortecedores em sistemas de abertura de painéis e antenas. Neste último caso não é difícil conseguir-se uma expressão para este torque em função do ângulo da junta, porém, no caso de motores, o torque depende, entre outros fatores, da corrente agindo no estator. Ainda que seja possível modelar esta relação de dependência, a corrente elétrica, em geral, é controlada em malha fechada de forma a se garantir um dado movimento (por exemplo, uma determinada posição para o braço robótico ou uma determinada velocidade angular para um painel giratório). A clara implicação deste relacionamento é que uma simulação realista da dinâmica de atitude é somente possível se o sistema de controle completo (motor, eletrônica de controle, lei de controle) do sistema de acionamento for também modelado. Caso se deseje evitar tal modelagem pode-se recorrer a expressões explícitas do tempo para o torque, ou seja, 88 g cm = g m (t ) , ou ω n =ω m (t ) . Infelizmente, esta tática não evita a necessidade de um controle, ainda que rudimentar, para evitar que a velocidade angular de uma junta cresça de forma desmedida ou se comporte de forma não natural. De fato, a maioria das juntas articuladas nos painéis de satélites é acionada por motores de passo, cujo modelo é mais próximo de um gerador de posições angulares do que um gerador de torques. Um motor de passo, na verdade, gera torques bem superiores ao mínimo requerido para mover uma junta, mas este torque é tal que gera uma posição angular estável a cada passo (o torque pode ser positivo, negativo ou nulo). Se, por um lado, o modelo matemático destes motores é complexo, por outro pode-se supor que o motor seja tal que consiga gerar posições e velocidades angulares precisas nas juntas, e assim uma forma explícita no tempo da aceleração angular ( ω ɺ n = ω ɺ m (t ) ) torna-se mais adequada a esta representação. Esta estratégia, além de simplificar o modelo de atuação nas juntas permite uma redução na ordem do sistema, já que as juntas passam agora a se comportar de forma vinculada no tempo. Em outras palavras, a ordem do sistema fica assim igual à de um corpo rígido, permitindo que se exprimam as equações da dinâmica diretamente em termos das velocidades (e acelerações) angulares, ao invés do momento angular. O comportamento das acelerações das juntas em função do tempo, ou seja, de ω ɺ n (t ) deve ser ajustado para que se consiga o resultado adequado. Um painel que parta do repouso até uma velocidade angular ω n (t ) = ω n , e tal que ω n é constante no tempo, pode ter uma aceleração dada, por exemplo, por 0, para t < t0 ω ɺ n (t ) = ω n /(t1 − t0 ), para t0 ≤ t < t1 0, para t ≥ t 1 3.337 Pode-se argumentar que a dinâmica gerada por este método não é realista, mas sem dúvida é uma boa aproximação, desde que as hipóteses simplificadoras do movimento sejam respeitadas. Além disso, este método permite um equacionamento relativamente simples do movimento, apresentado a seguir. Considera-se novamente o corpo articulado como na seção anterior, na qual o momento angular relativo ao centro de massa do conjunto passa a ser calculado por: N N n =1 n =1 h cm = h cm ,b + ∑ h cm,n = J ⋅ ω + ∑ J n ⋅ ω n , 3.338 J n = I n + J db ,n + J dd ,n − J dr ,n 3.339 onde A variação temporal do momento angular pode agora ser obtida a partir da relação fundamental que a define, ou seja: N ɺɺ bi dmb + ∑ ∫ ρ n × ρ ɺɺ in dmn , hɺ icm = ∫ ρ b × ρ m m n =1 3.340 89 no qual ρ b = rb − rcm e ρ n = rn + b n + d n − rcm , e tal que hɺ icm = g cm , um resultado já bastante conhecido. A integração da variação do momento angular no movimento do corpo irá levar ao resultado: N b b hɺ icm = J ⋅ ω ɺ + ω × h cm + ∑ {ω n × [J n ⋅ (ω +ω n )] + J n ⋅ (ω ɺ n + ω ×ω n )} , 3.341 n=1 o que permite que se escreva: N b b J ⋅ ω ɺ = g cm − ω × h cm − ∑ {ω n × [J n ⋅ (ω +ω n )] + J n ⋅ (ω ɺ n + ω ×ω n )} , 3.342 n=1 b pois, por hipótese, ω ɺ n (t ) é conhecido. A energia cinética será dada, neste caso, por: T= 1 1 N i i ɺ ɺ ρ ⋅ ρ dm + ρɺ in ⋅ ρɺ in dmn , ∑ b b b ∫ ∫ m m 2 2 n =1 3.343 que irá resultar T= 1 1 N N ω ⋅ J ⋅ ω − m µ ω × d n ⋅ ∑ µ nω n × d n + ∑ nn 2 2 n=1 n =1 N 1 N + ∑ω ⋅ ( I + J ) ⋅ ω + n n dd ,n n ∑ ω n ⋅ ( In + J bd ,n + J dd ,n − J rd ,n ) ⋅ ω 2 n =1 n =1 . 3.344 A energia cinética, ao contrário do momento angular, apresenta uma parcela que acopla os movimentos entre os apêndices. Como este acoplamento depende das velocidades dos próprios apêndices, não há como expressá-lo por meio de diádicas de inércia sem aumentar sobremaneira a complexidade da expressão. J n = Fn ⋅ J n ⋅ Fn T = I n + J dd ,n + CTbn (J db, n − J dr ,n ) Cbn 91 Referências bibliográficas Carrara, V. Manual do pacote computacional para simulação de atitude de satelites. São José dos Campos, INPE, 2007. Crouch, P. E. Spacecraft Attitude Control and Stabilization: Applications of Geometric Control Theory to Rigid Body Models IEEE Transactions on Automatic Control, Vol. AC-29, No. 4, April 1984, available in media: http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=1103519&isnumber=24212. Crandall, S. H. (Ed.). Dynamics of Mechanical and Electromechanical Systems. New York: McGraw-Hill, 1968. Hamilton, W. R. On a new Species of Imaginary Quantities connected with a theory of Quaternions. Proceedings of the Royal Irish Academy, vol. 2, pp. 424-434, 1844. (Ed. Wilkins, D. R. 1999. Available in media: http://www.maths.soton.ac.uk/EMIS/classics/Hamilton/Quatern1.pdf). Hughes, P. C. Spacecraft Attitude Dynamics. Dover, Mineola, NY, 1986. Klumpp, A. R. Singularity-free extraction of a quaternion from a direction-cosine matrix. Journal of Spacecraft and Rockets, Vol 13, n. 12, pg 754-755, 1976. Meirovitch, L. Methods of Analytical Dynamics. New York: McGraw-Hill, 1970. Meyer, G. Design and Global Analysis of Spacecraft Attitude Control Systems. NASA. NASA TR R-361, March 1971. Available in media: http://ntrs.nasa.gov/archive/nasa/casi.ntrs.nasa.gov/19710009016_1971009016.pdf Sen, A. K. A. Nutation Damper for a Dual-Spin Spacecraft. IEEE Transactions on Aerospace and Electronic Systems. Vol AES-6, No. 6 pg. 764-769, Nov 1970. Available in media: http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=4103618&isnumber=4103613 Wertz, J. R. Spacecraft attitude determination and control, London: D. Reidel, 1978 (Astrophysics and Space Science Library).