SISTEMA DE GUIAGEM E LOCALIZAÇÃO DE CADEIRAS DE RODAS ROBÓTICAS UTILIZANDO SENSORES INDUTIVOS Celso De La Cruz∗, Edgard Battisti Guimaraes∗, Teodiano Freire Bastos∗ ∗ Departamento de Engenharia Elétrica, Universidade Federal do Espı́rito Santo, Av. Fernando Ferrari 514 Campus Universitário, 29075-910, Vitória-ES Emails: [email protected], [email protected], [email protected] Abstract— In the present work, a guidance system for robotic wheelchairs based on a segment of metallic path and inductive sensors is developed. The segments of metallic path are placed in locations such as doorways, passageways and target positions. A localization system based on a RFID (Radio-frequency identification) tag, placed at the end of a segment of metallic path is also proposed. A switching adaptive tracking control law for mobile robots is implemented in the guidance system for smooth movements of the vehicle. Experimental results show that the proposed solutions are efficient. Keywords— Robotic wheelchair, switching control, adaptive control, tracking control, inductive sensor. Resumo— No presente trabalho, desenvolve-se um sistema de guiagem para cadeiras de rodas robóticas baseado em segmento de trilha metálica e sensores indutivos. As trilhas metálicas são colocadas em lugares como portas, corredores e destinos. Além disso, desenvolve-se um sistema de localização baseado em cartões RFID (Identificação por rádio freqüência), colocados no final dos segmentos de trilha metálica. Uma lei de controle adaptativa comutada de seguimento de trajetórias para robôs moveis é implementada no sistema de guiagem para obter movimentos suaves na cadeira de rodas. Os resultados experimentais mostram que as soluções propostas são eficientes. Palavras-chave— Cadeira de rodas robótica, controle comutado, controle adaptativo, controle de seguimento de trajetória, sensor indutivo. 1 Introdução sensores indutivos e um leitor indutivo. A informação odométrica é utilizada para localização, a qual é corrigida cada vez que a cadeira de rodas robótica está sobre um landmark. Um sensor indutivo foi desenvolvido para detectar essas trilhas metálicas, considerando a robustez contra ruı́dos. As tecnologias utilizadas neste sistema de guiagem e localização são de baixo custo, o qual é um fator importante para as pessoas com deficiência. Uma lei de controle de seguimento de trajetória adaptativa comutada para cadeiras de rodas robóticas baseado no modelo dinâmico foi também implementada. A lei de controle adaptativa adaptase a parâmetros desconhecidos como massa, momento de inércia, etc. Este controle adaptativo é utilizado no sistema de guiagem para obter movimentos suaves da cadeira de rodas. Finalmente, apresentam-se resultados experimentais, no qual a cadeira de rodas navega, sem colidir, através de uma porta muito estreita. Os resultados experimentais mostram que as soluções propostas, apresentadas neste trabalho, são eficientes. Para pessoas com deficiência nas extremidades inferiores e superiores ou severas disfunções motoras é difı́cil ou impossı́vel dirigir uma cadeira de rodas convencional. Uma cadeira de rodas robótica pode ser utilizada para permitir a essas pessoas superar suas dificuldades em locomoção. O sistema da cadeira de rodas robótica integra um subsistema de sensoriamento, um módulo de navegação e controle e uma interface homem-máquina para guiar a cadeira de rodas em modo autônomo ou semiautônomo (Mazo, 2001), (Bourhis et al., 2001), (Zeng et al., 2008), (Parikh et al., 2007). Em ambos os modos, pode-se precisar de um sistema de guiagem e/ou de um sistema de localização. O sistema de guiagem pode ajudar ao usuário a deslocar-se por lugares estreitos ou perigosos. O sistema de localização informará ao sistema de navegação da cadeira de rodas a postura da cadeira de rodas dentro de um ambiente. No presente trabalho, desenvolve-se um sistema de guiagem e localização de uma cadeira de rodas. Este sistema é baseado em um segmento de trilha metálica e um cartão RFID (Identificação por Rádio Freqüência), os quais são detectados por um sensor indutivo e um leitor RFID. Um segmento de trilha metálica e um cartão RFID formam um ”landmark”. Os landmarks são situados em varias localizações, especialmente em portas, corredores, e em pontos de destino. Propõe-se um procedimento de localização baseado em encoders, 2 Sensor Indutivo Um sensor indutivo detecta, por meio de campos eletromagnéticos, a proximidade de um objeto metálico como alumı́nio, cobre e outros. O sensor indutivo desenvolvido é composto por dois circuitos LC, os quais são construı́dos com duas bobinas similares axialmente alinhadas 934 magnético próximo ao sensor está dentro das dimensões fı́sicas da cadeira de rodas. Por tanto, essas fontes de ruı́do podem ser deslocadas. Por exemplo, existe na cadeira de rodas grandes fontes de ruı́dos eletromagnéticos tais como cabos de força que alimentam com corrente chaveada aos motores. O seguinte foi verificado experimentalmente. Quando esses cabos de força estão a 5 cm do sensor, o sensor não funciona. Porém, quando os cabos de força estão a 20 cm do sensor (configuração atual da cadeira de rodas robótica), o ruı́do eletromagnético dessa fonte é praticamente eliminado. Figura 1: Vista esquemática do sensor indutivo. em um núcleo de ar (ver Fig. 1). As bobinas são separadas por uma distância igual a seus raios, garantindo um acoplamento magnético fraco entre elas. Em cada perı́odo de amostragem, ambos os circuitos LC são excitados simultaneamente e depois postos em oscilação livre. Quando um dos lados do sensor indutivo está próximo a uma placa metálica, a placa sofre uma indução (corrente de Foucault) do campo da bobina desse lado, e tem uma baixa indução do campo da bobina do outro lado. Essa indução afeta o indutor, diminuindo a amplitude do sinal e resultando em distorção de fase. Um decodificador detecta, por meio de comparadores, em um momento especı́fico do perı́odo de oscilação, a diferença resultante da tensão relativa, assim, identificando a presença de uma placa metálica. Um sensor indutivo que opera por princı́pios eletromagnéticos pode ser influenciado por campos magnéticos externos e ondas eletromagnéticas. Além disso, um sensor indutivo pode ser influenciado por outros fatores como parâmetros fı́sicos do sensor e seu proprio circuito. As seguintes soluções são utilizadas para tratar esses problemas. 2.1 2.2 Leitura com múltiplas amostragens Uma boa parte de ruı́dos elétricos e magnéticos são de natureza transitória. O ciclo de detecção do sensor é projetado para tratar esses ruı́dos transitórios por meio de um processo de múltiplas amostragens e descartes. O ciclo de detecção executa quatro excitações, no qual as três últimas amostras são consideradas para validar as leituras. A leitura é válida quando as três últimas amostras são iguais. Assim, uma alta imunidade ao ruı́do é obtida, sem grande prejuı́zo da sensibilidade. Mais de 1000 ciclos de detecção completos por segundo são executados, e não existe nenhum atraso considerável na detecção. 3 Localização da Cadeira de Rodas Robótica Utiliza-se a informação odométrica (calculada a partir do sinal dos encoders) para a localização da cadeira de rodas. A postura de referência do sistema odométrico (PRSO) é atualizado cada vez que a cadeira de rodas está sobre um landmark (segmento de trilha metálica e cartão RFID). Neste trabalho, a PRSO significa uma postura conhecida, a partir da qual a postura da cadeira de rodas é estimada. Cada landmark é detectado por sensores indutivo e identificado por um leitor RFID (ver Fig. 2). A PRSO tem que ser freqüentemente atualizada utilizando os landmarks para, assim, evitar grandes erros odométricos. Para atualizar a PRSO, primeiro, a cadeira de rodas robótica é posicionada sobre um segmento de trilha metálica. Segundo, a PRSO é atualizada utilizando as informações de posição e orientação do landmark, quando a cadeira de rodas alcança o final do segmento de trilha metálica. Estes procedimentos são descritos en detalhe a seguir. Detecção diferencial Nenhuma referência ou valor absoluto são considerados para a detecção. O sensor tem dois sistemas ressonantes LC casados, postos em oscilação ao mesmo tempo. A placa metálica é detectada por um decodificador que compara as tensões relativas nos circuitos LC, proporcionando uma alta imunidade a muitos tipos de flutuações no circuito, causadas por variações na fonte de tensão, ruı́dos elétricos, e outros. A figura 1 apresenta os campos magnéticos das duas bobinas com a mesma polaridade. Nessa configuração, sob a influência de ruı́do eletromagnético de uma fonte suficientemente distante, pode-se considerar que o campo do ruı́do eletromagnético passa por meio de ambas as bobinas com intensidade similar. Isso pode resultar em uma indução similar em ambas as bobinas com diferença praticamente nula na tensão induzida com a conseqüente eliminação do ruido pelo fator diferencial do processo de detecção. É importante considerar que o ruı́do eletro- 3.1 Estratégia para posicionar a cadeira de rodas robótica sobre um segmento de trilha metálica (EPCT) Para posicionar a cadeira de rodas robótica sobre o segmento de trilha metálica, é utilizada uma estratégia baseada em controle de seguimento de 935 Figura 2: Sensores da cadeira de rodas robótica. Figura 5: Ilustração do caso 1. seguintes 5 casos: Caso 1 : O sensor indutivo da esquerda não detecta nenhum metal e o da direita detecta um metal. Case 2 : O sensor indutivo da direita não detecta nenhum metal e o da esquerda detecta um metal. Case 3 : Ambos os sensores indutivos não detectam nenhum metal e, previamente, esteve-se no caso 1. Case 4 : Ambos os sensores indutivos não detectam nenhum metal e, previamente, esteve-se no caso 2. Case 5 : Ambos os sensores indutivos detectam um metal. A EPCT é apresentado a seguir. Se o caso 1 é verdadeiro, considera-se a orientação da trajetória desejada igual à orientação atual da cadeira de rodas (medida pela odometria) menos o ângulo Rot (ver Fig. 5), onde Rot é uma constante maior que zero. Se o caso 2 é verdadeiro, considera-se a orientação da trajetória desejada igual à orientação atual da cadeira de rodas mais o ângulo Rot . Se o caso 3 é verdadeiro, considera-se a orientação da trajetória desejada igual à orientação atual da cadeira de rodas menos o ângulo γGR Rot , onde γGR é uma constante maior que 1. Se o caso 4 é verdadeiro, considera-se a orientação da trajetória desejada igual à orientação atual da cadeira de rodas mais o ângulo γGR Rot . Se o caso 5 é verdadeiro, considera-se a orientação da trajetória desejada igual à orientação da cadeira de rodas medida no instante em que este caso se inicia (ver Fig. 6). A estratégia é ativada a partir do instante que ambos os sensores indutivos detectam um metal. Defina-se δψm como a diferença entre a orientação da cadeira de rodas e a orientação da trilha metálica (ver Fig. 6). Os sensores indutivos saem da trilha metálica quando δψm 6= 0. A velocidade com que os sensores saem da trilha metálica decresce à medida que decresce δψm . Quando os sensores indutivos estão saindo da trilha metálica, esta estratégia move a cadeira de rodas robótica, tal que os sensores indutivos voltam a ficar sobre a trilha metálica outra vez. Por exemplo, se o caso Figura 3: Segmento de trilha metálica. trajetória. A realimentação ao controlador de seguimento de trajetória é a informação odométrica. A trajetória desejada é dirigida a um determinado segmento de trilha metálica. O segmento de trilha metálica básico é mostrado na Fig. 3. Cada segmento de trilha metálica tem uma entrada, a qual é utilizada para assegurar que o sensor indutivo detecte o landmark mesmo que existam erros no seguimento de trajetória com respeito à trajetória desejada real, causada por erros de odometria e de controle (ver Fig. 4). Defina-se a trajetória desejada virtual como a trajetória desejada real deformada por erros odométricos (ver Fig. 4). Pode-se considerar que o sistema de controle guia o veı́culo, fazendo com que siga a trajetória desejada virtual. Posicionar a cadeira de rodas robótica sobre um segmento de trilha metálica significa que o ponto h está sobre a linha média a essa trilha, e que a orientação da cadeira de rodas é igual à orientação da trilha. Antes de apresentar a estratégia para alcançar este objetivo, definem-se os Figura 4: Trajetórias consideradas. A trajetória real é a trajetória descrita pelo ponto h. A trajetória desejada real é a trajetória que o robô deveria seguir. A trajetória desejada virtual é a trajetória desejada real deformado por erros odométricos. 936 Figura 6: Ilustração do caso 5. 1 é verdadeiro, a cadeira de rodas segue a trajetória desejada modificada, ilustrada na Fig. 5, causando uma rotação da cadeira de rodas. Enquanto o caso 1 é verdadeiro, a trajetória desejada é continuamente modificada porque a orientação da cadeira de rodas é continuamente modificada. Assim, a cadeira de rodas gira até que os sensores indutivos fiquem sobre a trilha metálica. Portanto, pode-se garantir que os sensores indutivos seguirão a trilha metálica quando se utiliza esta estratégia. Se o ponto h segue uma trilha reta, então a orientação da cadeira de rodas tende à orientação da trilha. Isto pode-se verificar experimentalmente. Comentário 1. É importante ressaltar que a estratégia proposta utiliza um controle de seguimento de trajetória baseado no modelo dinâmico. Portanto, a cadeira de rodas robótica tem movimentos suaves durante a aplicação desta estratégia. Figura 7: Esquemático da cadeira de rodas robótica. 3.2 onde presente trabalho. São considerados os parâmetros do modelo dinâmico constantes, porém desconhecidos. 4.1 O esquemático da cadeira de rodas robótica é ilustrado na Fig. 7, onde G é o centro de massa, h = [x y]T é o ponto requerido para seguir a trajetória, u e ω são as velocidades linear e angular, e ψ é a orientação do veı́culo. Pode-se notar que a cadeira de rodas robótica tem a mesma estrutura que um robô tipo uniciclo. Considere-se o seguinte modelo dinâmico de um robô móvel tipo uniciclo (De La Cruz et al., 2008) como o modelo da cadeira de rodas: Dν̇ + Ta θ0 = νref Atualizando a PRSO · O cartão RFID é fixado no solo (ver Fig. 3), tal que o leitor RFID, localizado na parte traseira da cadeira de rodas, o detecte quando os sensores indutivos estão próximos do final do segmento de trilha metálica. A partir do instante em que o leitor RFID detecta um cartão RFID, a EPCT é desativada e a cadeira de rodas move-se mantendo sua orientação. Quando ambos os sensores indutivos não detectam nenhum metal, assume-se que o sensor indutivo alcançou o final do segmento de trilha metálica. Neste instante, a postura da cadeira de rodas é estimada a partir da informação da postura do segmento de trilha metálica identificado pelo cartão RFID; e a postura de referência do sistema odométrico (PRSO) é atualizada com essa postura estimada da cadeira de rodas. 4 Modelo Dinâmico D= θ10 0 Ta = 0 θ·20 ¸ · , ν= 0 0 0 0 u ω −ω 2 0 (1) ¸ · , νref = u 0 0 uω 0 ω uref ω ¸ ref ¸ , , (2) θ0 = [θ10 θ20 ... θ60 ]T , θi0 é o i-ésimo parâmetro do modelo e, uref e ωref são as velocidades de referência linear e angular. Geralmente, estas velocidades de referência são sinais de entrada comuns em veı́culos autônomos comerciais. Portanto, para manter a compatibilidade com outros veı́culos autônomos, é interessante expressar o modelo da cadeira de rodas robótica numa forma adequada, considerando como entradas de controle as velocidades de referência linear e angular. Os parâmetros do modelo θi0 são funções de parâmetros fı́sicos da cadeira de rodas com usuário, parâmetros do motor, e parâmetros do controlador PID de velocidade de baixo nı́vel. Controle Adaptativo Comutado Nesta seção, é descrito o controlador adaptativo comutado de seguimento de trajetória para robôs moveis desenvolvido em (De La Cruz et al., 2008). Este controlador adaptativo é implementado no 4.2 Controlador Adaptativo O controlador adaptativo de seguimento de trajetória implementado é o seguinte (De La Cruz 937 parâmetros quando o erro de controle é menor que um limite. Para tal fim, utiliza-se a seguinte estratégia de comutação (De La Cruz et al., 2008): ( ˙ ˙+ θ̂(t) se VeT (t) > Cv θ̂ (t) = (13) 0 se VeT (t) ≤ Cv et al., 2008): νref = D̂M (υ − N ) + Ta θ̂ ˙ υ = ḧd + K1 h̃ + K2 h̃, (3) h̃ = hd − h (4) ˙ θ̂ = KA Y T P eT . (5) onde VeT = eT T P eT , onde ¸ · e Cv é uma constante maior que zero. cos ψ sin ψ , 1 1 sin ψ − a a cos ψ · ¸ −uω sin ψ − aω 2 cos ψ N= , uω cos ψ − aω 2 sin ψ M= (6) 5 θ̂ é uma estimativa do vetor de parâmetros θ , D̂ é a matriz D definida com parâmetros estimados em lugar de parâmetros verdadeiros, hd e ḣd definem a trajetória desejada, K1 ∈ R2×2 e K2 ∈ R2×2 são matrizes diagonais definidas positivas, " # · ¸ h̃ 0 eT = ˙ , Y = ∈ R4×6 (7) M̂ −1 T h̃ T = · T11 0 ¸ T11 T22 ¸ u 0 0 , 0 uω ω ³ ´ = M ḧ − N , M̂ = D̂M. 0 T22 −ω 2 0 (8) (9) onde diag(.) representa uma matriz diagonal. Os parâmetros estimados do modelo, utilizados no controle adaptativo comutado, são inicializados como O parâmetro a (ver Fig. 7) tem que ser diferente de zero para evitar singularidades. A matriz constante KA ∈ R6×6 é uma matriz diagonal definida, tal que KA > 0, e a matriz P ∈ R4×4 é definida como P = P T > 0, tal que AK T P + P AK = −Q; onde · AK = 0 −K2 Q = QT > 0 I −K1 θ̂10 = 0.3308, θ̂40 = 1.0144, (10) (11) e I é uma matriz identidade de dimensão 2 × 2. A matriz AK é Hurwitz porque K1 e K2 são matrizes diagonais com elementos positivos diferentes de zero. Portanto, se a matriz P é calculada a partir de (10), utilizando algum Q = QT > 0, obtém-se uma matriz P , tal que P = P T > 0. Para calcular Y , tem-se que evitar θ̂1 = 0 e θ̂2 = 0 -ver equação (7)-. Para fazer isto, o seguinte algoritmo de projeção é aplicado: θ̂i = li se θ̂i ≤ li − ζi Rot = π/20, θ̂30 = −0.0152, θ̂60 = 0.8944. γGR = 2.5. (15) Instantes diferentes do experimento são mostrados na Fig. 8. A cadeira de rodas robótica é guiada para um landmark da porta sobre uma trajetória desejada reta. Utilizando o segmento de trilha metálica, a cadeira de rodas robótica atravessa uma porta estreita com uma velocidade de 0.075 m/s. Uma vez atravessada a porta, a cadeira de rodas robótica é localizada e pode informar ao usuário onde é que ele está e/ou informar ao sistema automático a postura da cadeira de rodas para navegar automaticamente para o seguinte objetivo. A figura 9 mostra a evolução das trajetórias no experimento. A Fig. 10a mostra a evolução da velocidade e a Fig. 10b mostra as acelerações. As acelerações correspondem a movimentos suaves. (12) onde i = 1, 2; li é o valor mı́nimo possı́vel de θi0 ; ζi > 0; e li − ζi > 0. 4.3 θ̂20 = 0.1317, θ̂50 = 0.0712, Estes parâmetros identificados correspondem ao modelo de uma cadeira de rodas robótica sem usuário. A identificação deste modelo foi feita utilizando a estimativa por mı́nimos quadrados (Aström and Wittenmark, 1995) aplicado a um modelo de regressão filtrado (Reyes and Kelly, 1997) obtida a partir do modelo dinâmico. Os parâmetros da EPCT são: ¸ , Experimentos O experimento foi realizado com a cadeira de rodas robótica desenvolvida no Departamento de Engenharia Elétrica da Universidade Federal do Espı́rito Santo - Brasil. O parâmetro a da Fig. 7 é escolhido como 0.3 m. Os parâmetros do controle adaptativo comutado são: · ¸ · ¸ 6 0 0.5 0 K1 = , K2 = , 0 6 0 0.5 KA = diag(1/32, 1/32, 1/80, 1/10, 1/0.8, 1/0.32), ll1 = 0.14, lu1 = ∞, ll2 = 0.7, lu2 = ∞, ll3 = −∞, lu3 = ∞, ll4 = 0.8, lu4 = 1.2, ll5 = −0.03, lu5 = 0.03, ll6 = 0.8, lu6 = 1.2, Cυ = 0.005. 0 · (14) Estratégia de Comutação No controle adaptativo podem-se apresentar problemas de robustez, conhecidos como deriva paramétrica, causados por erros de medida, ruı́dos ou perturbações. Uma forma possı́vel de prevenir a deriva paramétrica é desativando a adaptação dos 938 6 Conclusões Um sistema de guiagem e localização eficiente foi desenvolvido neste trabalho. As caracterı́sticas principais deste sistema são a simplicidade, robustez e baixo custo. O sistema é robusto com respeito às medidas dos sensores. A informação odométrica é corrigida utilizando somente segmentos de trilha metálica e cartões RFID, os quais são detectados e identificados por meio de sensores indutivos e um leitor RFID, respectivamente. Outra importante caracterı́stica é o movimento suave da cadeira de rodas robótica proporcionado pelo controle de seguimento de trajetória baseado no modelo dinâmico. As experimentações mostram um exemplo de aplicação do sistema de guiagem, o qual é assistir ao usuário portador de deficiências no passo por portas estreitas. Em trabalhos futuros o presente sistema será melhorado utilizando algoritmos SLAM e integrado a um sistema de navegação. Figura 8: Guiagem da cadeira de rodas robótica. Agradecimentos 6.5 Este trabalho contou com o apoio da FAPES (Projeto: ”Controlador Dinâmico Adaptativo Aplicado a uma Cadeira de Rodas Robotizada Comandada por Sinais Cerebrais”), Processo (39385183/2007). y−axis (m) 6 5.5 5 Referências 4.5 Aström, K. and Wittenmark, B. (1995). Adaptive Control, Addison-Wesley. 4 4.5 5 5.5 6 6.5 x−axis (m) 7 7.5 8 Bourhis, G., Horn, O., Habert, O. and Pruski, A. (2001). An autonomous vehicle for people with motor disabilities, IEEE Robotics and Automation Magazine 8(1): 20–28. Figura 9: Evolução das trajetórias no experimento. A trajetória e trajetória desejada são representadas por uma linha sólida e pontilhada, respectivamente. De La Cruz, C., Carelli, R. and Bastos, T. (2008). Switching adaptive control of mobile robots, IEEE International Symposium on Industrial Electronics - ISIE08 pp. 835–840. Mazo, M. (2001). An integral system for assisted mobility, IEEE Robotics and Automation Magazine 8(1): 46–56. 0.2 velocities 0.1 Parikh, S., Grassi, V., Kumar, V. and Okamoto, J. (2007). Integrating human inputs with autonomous behaviors on an intelligent wheelchair platform, IEEE Intelligent Systems 22(2): 33–41. 0 u ω −0.1 −0.2 0 10 20 30 time (s) (a) 40 50 accelerations 0.4 0.2 Reyes, F. and Kelly, R. (1997). On parameter identification of robot manipulator, IEEE International Conference on Robotics and Automation pp. 1910–1915. 0 −0.2 −0.4 d(u)/dt d(ω)/dt 0 10 20 30 time (s) (b) 40 50 Zeng, Q., Teo, C., Rebsamen, B. and Burdet, E. (2008). A collaborative wheelchair system, IEEE Transactions on Neural Systems and Rehabilitation Engineering 16(2): 161–170. Figura 10: Evolução da velocidade e aceleração da cadeira de rodas. 939