Boletim Ano 8 Número 15 Março de 2010 Informativo do Grupo de Pesquisa Matemática Computacional PONTIFÍCIA UNIVERSIDADE CATÓLICA DE GOIÁS (PUC GOIÁS) DEPARTAMENTO DE COMPUTAÇÃO EDITORIAL Temos a satisfação de publicar mais um número do Boletim para os interessados em Computação. Em particular, em Matemática Computacional. No Boletim anterior, informamos sobre a aprovação pela CAPES do Mestrado em Engenharia de Produção e Sistemas na PUC GOIÁS, com a participação de pesquisadores do Grupo, Clarimar, Marco e Sibelius. Todavia, gostaríamos aqui de manifestar a nossa indignação quanto a falta de comprometimento com os Mestrados e Doutorados da nossa Instituição. Como a PUC GOIÁS deseja obter a excelência? Em particular, no Mestrado em Engenharia de Produção e Sistemas, comprometendose com uma disciplina com duas aulas por semana (1h30min em sala de aula cada) valendo 3 créditos na carga horária do Professor, enquanto uma disciplina da Graduação (1h30min em sala de aula cada) vale 4 créditos? Ainda, comprometendose com uma orientação de Dissertação de Mestrado valendo 1,5 créditos, enquanto uma orientação de Trabalho de Conclusão de Curso vale 1 crédito? Lembrome de uma estória que diz assim: É hora de levantar? – Não, é hora de acordar. A principal novidade do Grupo é a nossa participação no Instituto Nacional de Ciências e Tecnologias Analíticas Avançadas (INCTAA), através do pesquisador Clarimar. Como uma das conseqüências, temos agora a Diretoria TécnicoCientífica do Departamento de Polícia Federal (DTCDPF) como uma parceira, atualmente com dois projetos. Maiores detalhes sobre o INCTAA estão na seção Perguntas e Respostas. Os integrantes do grupo no momento são: como pesquisadores, Clarimar José Coelho, Marco Antonio Figueiredo Menezes, Sibelius Lellis Vieira (PUC GOIÁS), Humberto José Longo, Leizer de Lima Pinto, Telma Woerle de Lima Soares (UFG), Claudio Thomas Bornstein, Nelson Maculan Filho (COPPESistemas/UFRJ) e Maria do Socorro Nogueira Rangel (UNESPSão José do Rio Preto); como estudantes, Douglas Machado de Freitas, Gustavo Siqueira Vinhal, Kelligton Fabrício de Souza Neves, Paulo Henrique de Oliveira Souza, Tiago da Silva Curtinhas (PUC GOIÁS), Kelton de Sousa Santiago (UFG) e Elivelton Ferreira Bueno (Universidade de Montreal/Canadá); e como técnicos, Anderson da Silva Soares, Arlindo Rodrigues Galvão Filho, Synara Rosa Gomes 1 dos Santos (ITA), Gustavo Teodoro Laureano (USP/São Carlos), Ivon Rodrigues Canedo, Jeuel Bernardes Alves (PUC GOIÁS) e Marcello Marinho Ribeiro (UnB). Marco Antonio Figueiredo Menezes Líder do Grupo PERGUNTAS E RESPOSTAS: Sobre o INCTAA. Aqui, a nossa idéia é a de levantar algumas perguntas para os alunos da Computação que venham a esclarecer, viabilizar e integrar a sua formação. Em seguida, forneceremos as devidas respostas através de entrevistas com responsáveis pela área. O que é o INCTAA? O Instituto Nacional de Ciências e Tecnologias Analíticas Avançadas (INCTAA) tem uma abordagem contemporânea inter e multidisciplinar e pretende desencadear ações sinérgicas que levem ao avanço científico e à inovação da tecnologia, da instrumentação e dos métodos analíticos para enfrentar os desafios atuais que se impõem nas mais diversas áreas do conhecimento e de interesse ao desenvolvimento econômico e social do Brasil. Dentre elas, podem ser citadas: a ambiental, de novos materiais e da nanotecnologia (no seu uso e consequências ambientais, ainda desconhecidas), a biológica, do controle de qualidade de produtos e processos das indústrias (por exemplo, farmacêutica, petroquímica e de combustíveis fósseis e combustíveis renováveis), de comercialização de alimentos e produtos agrícolas, e na área forense. Estas áreas permitem um amplo leque de atuação do Instituto, que possibilitará a solução de problemas analíticos prioritários ao país e relevantes à perenização do momento favorável de crescimento econômico e social, tanto por meio de avanços científicos e tecnológicos significativos, como por meio da formação de recursos humanos qualificados. O INCTAA tem sede na Universidade Estadual de Campinas e é coordenado pelo Prof. Dr. Célio Pasquini. Para saber mais visite a página do INCTAA: http://www.inctaa.iqm.unicamp.br/index.php. O grupo de pesquisadores principais do INCTAA distribuise por diversas regiões do país, incluindo pesquisadores seniores bem como jovens pesquisadores contratados em centros emergentes. A Figura 1 exibe a distribuição geográfica das instituições que participam do INCTAA. Em suas atuações individuais, esses pesquisadores definem um perfil inter e multidisciplinar que o INCTAA deseja integrar (informações extraídas da página do INCTAA). 2 Figura 1. Distribuição geográfica das instituições participantes do INCTAA. Fonte: página do INCTAA http://www.inctaa.iqm.unicamp.br/index.php. ACONTECEU Aconteceu informa Congressos, Simpósios, Jornadas e Encontros Científicos com a nossa participação, de outubro/2009 a fevereiro/2010. V Semana de Ciência e Tecnologia da PUC GOIÁS: 19 a 23 de outubro de 2009, Goiânia/Goiás. ACONTECENDO Acontecendo relata as atividades do Grupo Matemática Computacional. Sugerimos uma visita ao nosso MURAL, em frente ao Departamento de Computação e no final do corredor em frente a sala 409, bloco F, área 3. 3 Seminário de Otimização: Toda sextafeira, das 17h30min às 18h30minh, na Área 3, Bloco F, Sala 409. Coordenador: Dr. Marco Antonio Figueiredo Menezes. Seminário de Análise Multivariada : Toda quintafeira, das 17h30min às 18h30min, na Área 3, Bloco F, Sala 409. Coordenador: Dr. Clarimar José Coelho. Projetos em andamento: 1. Manutenção e desenvolvimento do LabPL (quinto ano – http://agata.ucg.br/formularios/vpg/projeto/admin/ficha_cadastro.asp?inscricao=2513 ) – Coordenador: Marco Antonio; PROPE/PUC GOIÁS. 2. Desenvolvimento de aplicativo para dar apoio ao gerenciamento da grade horária na Universidade Católica de Goiás (terceiro ano http://agata.ucg.br/formularios/vpg/projeto/admin/ficha_cadastro.asp?inscricao=3289) Coordenador: Marco Antonio; PROPE/PUC GOIÁS. 3. Quimiometria baseada em técnicas de processamento de sinal (terceiro ano http://agata.ucg.br/formularios/vpg/projeto/admin/ficha_cadastro.asp? inscricao=3387) Coordenador Clarimar; PROPE/PUC GOIÁS. Orientações em andamento: 1. Filtro SavitskyGolay – Aluno: Paulo Henrique Oliveira; Orientador: Clarimar José Coelho; Iniciação Científica. 2. Filtro de Kalman – Aluno: Gustavo Siqueira Vinhal; Orientador: Clarimar José Coelho; Iniciação Científica. 3. Funções spline – Aluno: Thiago Curtinhas; Orientador: Clarimar José Coelho; Iniciação Científica. 4. Análise qualitativa de mamona utilizando processamento de imagens Aluno: Wagner Oliveira de Araújo; Orientador: Clarimar José Coelho; Mestrado. 5. Desenvolvimento de métodos e instrumentação analíticos para uso forense Aluna: Daniela Ribeiro; Orientador: Clarimar José Coelho; Mestrado. 6. Desenvolvimento de métodos e instrumentação analíticos para uso forense – Aluno: Edson Freitas; Orientador: Clarimar José Coelho; Mestrado. 7. Sobre o problema de designação de salas de aulas – Aluno Kelligton Fabrício de Souza Neves; Orientador: Marco Antonio Figueiredo Menezes; Trabalho de Conclusão de Curso I. 4 ACONTECERÁ Acontecerá informa eventos nos próximos meses no que concerne às atividades de pesquisa. 33ª Reunião Anual da Sociedade Brasileira de Química: 28 a 31 de maio de 2010, Águas de Lindóia/SP. XXX Congresso da Sociedade Brasileira de Computação: 20 a 23 de julho de 2010, Belo Horizonte/MG. XLI Simpósio Brasileiro de Pesquisa Operacional: 30 de agosto a 03 de setembro de 2010, Bento Gonçalves/RS. XXXIII Congresso Nacional de Matemática Aplicada e Computacional: 20 a 23 de setembro de 2010, Águas de Lindóia/SP. PRODUÇÃO CIENTÍFICA Divulgação da produção científica. Este Boletim divulga o período outubro/2008 fevereiro/2009. Trabalhos publicados em revistas: 1. dos Santos, S. R., Coelho, C. J. Estudo da Relação Linear Entre Conjuntos de Dados Químicos Empregando Análise de Correlação Canônica, Revista Eletrônica de Iniciação Científica (REIC) da SBC, a. ix, v. iv, Dezembro de 2009, ISSN – 15198219. Orientações concluídas: Calibração multivariada com regressão linear múltipla e bootstrap; Aluno: Leandro Pedrosa; Orientador: Clarimar José Coelho; Iniciação Científica. 2. Calibração multivariada com regressão linear múltipla; Aluno Samuel Costa Vicente; Orientador: Clarimar José Coelho; Iniciação Científica. 1. 5 ARTIGO PréProcessamento de Sinal Empregando Filtro de SavitzkyGolay em Quimiometria Paulo Henrique de Oliveira Souza Departamento de Computação Pontifícia Universidade Católica de Goiás (PUC GOIÁS) Introdução O uso de computadores na coleta e análise de dados químicos cresceu muito nas últimas quatro décadas gerando um grande volume de dados. Os dados são obtidos através da medição de determinadas propriedades de amostras. Um exemplo de propriedade medida é a absorbância de radiação luminosa para vários comprimentos de ondas. A área da química analítica que trata estes dados é denominada de quimiometria. O termo quimiometria foi introduzido em 1972 por Wold e Kowalski e tem o objetivo de extrair informação útil a partir destes dados utilizando ferramentas da lógica, matemática, estatística e computação [1]. A calibração é uma das ferramentas da quimiometria que pode ser usada para determinar a concentração dos componentes de interesse presentes em amostras analisadas [1, 5, 6]. Nesse caso os dados são obtidos sob a forma de um sinal analítico discreto, ou seja, um vetor digital x = [ x 0 , x1 ,..., x n −1 ] [1, 4, 5]. Durante a coleta os dados podem ser contaminados por ruídos dificultando a interpretação das propriedades e a formulação do modelo de calibração. Dai a importância do préprocessamento dos dados. Essa etapa ocorre após a coleta e antes da calibração. O filtro SavitzkyGolay tem a finalidade de diminuir a relação sinal ruído ou razão da potência de um sinal e a potência do ruído sobreposto ao sinal [2]. 6 Este trabalho emprega o filtro de SavitzkyGolay no préprocessamento de sinais analíticos no contexto da quimiometria. Como exemplo de aplicação é desenvolvido um algoritmo para a suavização de sinais de açoliga contendo Manganês (Mn), Cromo (Cr), Molibdênio (Mo), Níquel (Ni) e Ferro (Fe). Filtro de SavitzkyGolay Para diminuir a presença de ruídos gaussianos em dados na forma de sinais digitais são utilizados filtros de suavização. O ruído gaussiano é o ruído cuja densidade de probabilidade responde a uma distribucão normal (ou distribucião de Gauss). Um dos filtros mais utilizados em qumiometria é o filtro de SavitzkyGolay, que foi descrito pela primeira vez em 1964 por Abraham Savitzky e Marcel J. E. Golay. O filtro de SavitzkyGolay define um intervalo de tamanho predefinido no início do sinal e ajusta através da técnica de mínimos quadrados um polinômio aos pontos do intervalo. O ponto central do intervalo é substituído pelo ponto central do polinômio. O processo é repetido, através de uma operação de convolução, até que todos os pontos do sinal tenham sido substituídos [4, 7, 8, 10]. O algoritmo que aplica o filtro SavitzkyGolay se divide em duas partes, na primeira os coeficientes de uma janela são calculados, na segunda é feita a convolução entre o sinal e a janela. A Janela é uma função discreta, uma sequência de números, que no caso do filtro SavitzkyGolay deve ter tamanho impar [4,7,8,10]. Os pontos do sinal filtrado são gerados através do polinômio: para variando de a . (1) O polinômio pode ser escrito como: 7 (2) onde é o grau do polinômio e o tamanho da janela é onde , . Ou na forma matricial , . Quando é usada a fórmula da pseudoinversa é possível saber o valor de da seguinte forma . Onde é a matriz transposta de e é a inversa do produto das matrizes e [9]. O polinômio é calculado da seguinte maneira (3) onde , e é o ponto central do polinômio. Assim, os valores da janela são os valores da linha central da matriz resultante de . A convolução é uma operação matemática binária cujo resultado e os operandos são funções, ou sinais [11,12,13]. O sinal utilizado no experimento é uma sequência de números, ou seja, é uma função discreta. O filtro de SavitzkyGolay utiliza a convolução 8 entre o sinal com ruído e a janela para gerar um sinal filtrado, assim como, o sinal mostrado na Figura 3. Para calcular o sinal resultante da convolução, no caso do filtro de SavitzkyGolay, é usada a fórmula: (4) para variando de a , onde é o sinal filtrado na posição , é a janela na posição e é o sinal com ruído na posição [4]. Existem dois parâmetros que podem variar no filtro SavitzkyGolay, o grau do polinômio e o tamanho da janela. O grau do polinômio deve ser menor que o tamanho da janela e a janela deve ter tamanho ímpar. Dados usados no trabalho Os dados foram obtidos por meio de um espectrômetro de emissão atômica em plasma com acoplamento indutivo sequencial convertido para um sistema de múltiplos canais de detecção baseado em um arranjo linear de 1024 fotodiodos. A Figura 1 mostra o sinal certificado para o Mn. Figura 1. Sinal original do Mn. 9 O aparelho instrumental faz uso das propriedades de absorção e emissão de plasma, conforme descrito em Pimentel [3]. Estes dados são organizados na forma de uma matriz de 17 linhas e 723 colunas onde cada linha é um sinal discreto com a absorbância de um elemento químico contido na amostra de açoligas e cada coluna contém a absorbância desses elementos para um diferente comprimento de onda de luz. O filtro de Savitzky Golay é aplicado na primeira linha da matriz que contém dados do Mn com ruído adicionado ao sinal do Mn mostrado na Figura 2. Figura 2. Sinal da figura 1 com ruído. Medida para comparação O índice utilizado para comparar o sinal com ruído e o sinal sem ruído é o erro quadrático médio de predição (RMSEP) que é dado por RMSEP= (5) onde mt é o tamanho do sinal, é o sinal original na posição e é o sinal filtrado na posição . 1 Experimental Para aplicar o filtro de SavitzkyGolay um algoritmo é implementado utilizando o Octave. Como os dados originais estão sem ruídos, foi inserido ruído no sinal original gerando valores aleatórios, usando a função rand do Octave, que foram somados ao sinal original. O filtro foi testado para todos os graus de polinômios possíveis e para todos os tamanhos de janela menores do que vinte. A cada execução do algoritmo de filtragem foi calculado o RMSEP entre o sinal filtrado e o sinal original. Resultado Dentre todos os tamanhos de janelas testados (janela menores que 20) e dentre todos os graus possíveis (o grau do polinômio sempre deve ser menor que o tamanho da janela), o melhor resultado é dado para janela de tamanho 7 e polinômio de grau 2, onde o sinal filtrado apresentou RMSEP igual a 102,0019 contra 141,9988 do sinal com ruído com uma melhora de 28,15%. Figura 3. Sinal filtrado. 1 A Figura 3 mostra o sinal resultante da suavização do sinal com ruído utilizando filtro SavitzkyGolay com janela de tamanho 7 e com polinômio de grau 2. As figuras 4, 5, 6 e 7 mostram uma comparação feita entre parte (os cinqüenta primeiros pontos) do sinal original, com ruído e filtrado. A Figura 4 mostra o sinal original, que é representado pela curva contínua, e o sinal com ruído, representado pela curva tracejada cujos pontos estão sinalizados com x. Nesta é possível observar que o ruído deforma o sinal, isso pode influenciar na fase de calibração provocando erros no modelo de predição. Figura 4. Comparação entre o sinal original e o sinal com ruído. A Figura 5 mostra uma comparação entre o sinal original, representado pela curva contínua, e o sinal filtrado, representado pela curva cujos pontos estão sinalizados com círculos. Nesta é possível observar que o filtro não recupera totalmente a forma original do sinal. 1 Figura 5. Comparação entre o sinal original e o sinal filtrado. Na Figura 6 é possível observar o resultado do processo de filtragem, onde o filtro produz um novo sinal, representado pela curva cujos pontos estão sinalizados com círculos. Esses pontos aproximamse, porem não necessariamente, tocam o sinal de entrada representado pela curva tracejada cujos pontos estão sinalizados com x. Figura 6. Comparação entre o sinal com ruído e o sinal filtrado. 1 A Figura 7 mostra o sinal original, representado pela curva contínua; o sinal com ruído, representado pela curva tracejada cujos pontos estão sinalizados com x; e o sinal filtrado, representado pela curva cujos pontos estão sinalizados com círculos. Nesta é possível observar que o sinal filtrado, apesar de não ser idêntico ao sinal original, se aproxima do sinal original mais do que o sinal com ruído. Figura 7. Comparação entre o sinal original, filtrado e com ruído. Bibliografia Ferreira, M. M., Antunes, A. M. M., S., M. et al. Quimiometria I: Calibração multivariada, um tutorial. Quimica Nova, v. 22, n. 5, p. 724–731, Novembro 1999. Skoog, D. A. Leary, J. J., Principles of Instrumental Analysis, Saunders College Publishing, 1991. Pimentel, M. F., Neto, B. B., Araújo, M. C. U, Pasquini, C. Simultaneous multielemental determination using Lawresolution inductively coupled plasma spectrometer/diode array detection system. Spectrochimica Acta, Part B, 52:21512161, 1997. 1 Chau, F. T. et al. Chemometrics From Basics to Wavelet Transform, Wiley Interscience. v. 164, p. 2332, 2004. Ibidem, p. 112. Brereton, R. G. Introduction to multivariate calibration in analytical chemistry. The Analyst Tutorial Review. p. 21252154. Madisetti, V. K., Williams. D. B. The Digital Signal Processing Handbook. In: Karam, L. J., McClellan J. H., Selesnick. I. W., Burrus C.S. Digital Filtering. CRC Press, p. 6371, 1999. Madisetti, V. K., Williams. D. B. The Digital Signal Processing Handbook. In: Jenkins W. K. Fourier Series, Fourier Transforms, and the DFT CRC Press. p. 1617, 1999. Sic [4]. Corrêa J. S., Rodrigues S. L. Programas Aplicativos ao Processamento de Sinais em Tempo Discreto. EDPUCRS. p. 4953. 1996. Matos A. M. Telemetria e Conceitos Relacionados. p. 336, 2004. Hsu P.H. Sinais e Sistemas. Bookman. p. 63, 1995. Madureira L. Problemas de Equações Diferenciais Ordinárias e Transformadas de Laplace. FEUP edições. 2ª ed. p. 166. 2004. INFORMAÇÕES E CONTATO Página Principal: http://agata.ucg.br/formularios/NPI/matematicacomp_index.htm Página do boletim: http://agata.ucg.br/formularios/NPI/matematicacomp_boletim.htm [email protected] 1