Visão por Computador http://gec.di.uminho.pt/lesi/vpc, http://gec.di.uminho.pt/mcc/vpc LESI / LMCC – 5º Ano Introdução João Luís Ferreira Sobral Departamento do Informática Universidade do Minho Setembro 2003 Programa Introdução e objectivos Pretende-se com esta disciplina complementar a formação dos alunos com conhecimentos da área de Visão por Computador. Designadamente, pretende-se introduzir conhecimentos relativos aos métodos de processamento de imagens, utilizados para melhorar as características de imagens, e os processos que visam a extracção automática de informação de imagens. Para atingir estes objectivos, e sendo o processamento de imagem uma área de índole bastante experimental, existirá uma forte ligação entre a componente teórica e a componente prática: os conceitos introduzidos na componente teórica serão experimentados na aula prática seguinte, utilizando uma ferramenta de processamento de imagem, o sistema Khoros. Desta forma são experimentadas as diversas técnicas, permitindo ao aluno obter as suas próprias conclusões relativamente a cada método. Componente Teórica I. Processamento de Imagem o Introdução aos sistemas de processamento de imagem. o Natureza de uma imagem digital. Calibração de imagem. o Propriedades estatísticas das imagens: brilho e contraste. Histograma. o Filtros no domínio do espaço. Convolução digital. Filtros passa-alto e passa-baixo. Suavização de imagens. Detecção e realce de contornos. Filtros não lineares. o Filtros no domínio das frequências. Transformada de Fourier e Teorema da convolução. o Restauração de imagem. o Compressão de imagem: compressão sem perda e compressão com perda. o Processamento de imagens a cor. II. Análise de Imagem o Binarização simples múltipla e adaptativa. o Operadores morfológicos: erosão, dilatação e esqueletização. o Análise de texturas: modelos estrutural, estatístico e espectral. o Segmentação de imagens em regiões. Detecção de formas: verificação de padrões, pirâmides de resolução e transformada de Hough. o Descrição de formas: chain codes, assinaturas, polígonos e convex hull. o Reconhecimento de objectos III. Visão por Computador em Tempo Real o Requisitos de processamento em termos de hardware e software. Componente Prática o Sessões práticas com o sistema Khoros, Desenvolvimento de algoritmos. Visão por Computador 2 © João Luís Sobral 2003 Programa Equipa Docente João Luís Ferreira Sobral email: jls@... telefone: 4439 (253 604439 do exterior) Planeamento Aula Dia Matéria 1 26/09 2 3/10 3 10/10 4 17/10 Restauração de imagem GZ 5 5 24/10 Processamento de imagens a cores GZ 6 6 31/10 Compressão de imagem GZ 8 7 7/11 Segmentação de imagens, operadores morfológicos GZ 9, 10 8 14/11 Representação e descrição de regiões. GZ 11 9 21/11 Reconhecimento de objectos / regiões GZ 12 10 28/11 Visão por Computador em tempo real 11 5/12 Projecto: processamento de imagem 12 12/12 Projecto: segmentação de imagens em regiões 13 19/12 Projecto: classificação de regiões Apresentação da disciplina, caracterização da área, natureza e características de uma imagem Propriedades estatísticas das imagens, alteração do brilho e contraste, convolução digital Transformada de Fourier, filtros no domínio das frequências, teorema da convolução Bibliografia GZ 1, 2 GZ 3 GZ 4 Bibliografia GZ2e R. Gonzalez, R. Woods. Digital Image Processing, 2ª Ed, Prentice Hall, 2002. (http://www.imageprocessingbook.com/) SK2e M. Sonka, V. Hlavac, R. Boyle. Image Processing Analysis and Machine Vision, 2ª edição, Prentice Hall, 1999. Avaliação Um trabalho prático (ou um exame escrito). Visão por Computador 3 © João Luís Sobral 2003 Caracterização da área Principais aplicações • Realçar informação contida na imagem para facilitar a sua percepção • Obter informação da imagem para apoio a modelos de decisão Três níveis de processamento • Baixo nível (processamento de imagem) • Nível intermédio (análise de imagem) • Alto nível (compreensão de imagem) Alguns exemplos de aplicações de processamento de imagem/visão • Medidas antropométricas • Contagem de pessoas • Reconhecimento de matrículas • Vigilância remota Visão por Computador 4 © João Luís Sobral 2003 Natureza de uma imagem digitalizada Sistema de aquisição e processamento de imagens O processo de digitalização • Amostragem de uma imagem 3D numa superfície 2D • Obtenção de pixels quadrados ou rectangulares • Tipicamente obtém imagens de 256x256 a 1024x1024 pixels • Existem vários tipos de sensores (luz visível, infravermelho, etc.) • Podem existir vários tipos de sensores operando em simultâneo Alguns problemas do processo de digitalização • Limites dos sensores (amplitude e tempo de resposta) • Período de amostragem • Desfasamento temporal entre os vários sensores • Ruído de quantificação (aliasing) Operações típicas a aplicar às imagens • Remover ruído • Melhorar o contraste da imagem • Alterar o tamanho ou forma da imagem • Corrigir a distorção espacial • Retirar rastos do movimento • Corrigir focagens deficientes • Codificar imagens • Segmentar imagens para localizar objectos ou realçar atributos Visão por Computador 5 © João Luís Sobral 2003 O nosso sistema de visão Formação da imagem no nosso olho • A luz proveniente do exterior é projectada na retina, depois de ter atravessado a córnea e a lente • O olho adapta a forma da lente para focar objectos mais distantes (lente mais plana) ou mais próximos (lente mais curva). • A distância entre a lente e a retina varia entre 14 mm e 17mm • A parte da retina responsável por detectar os detalhes da imagem tem cerca de 150 000 elementos por mm2 e uma área de 1.5mm x 1.5mm Adaptação de brilho e discriminação • O nosso olho não utiliza um sistema de brilho proporcional à intensidade da luz (os contornos são realçados e o brilho não depende apenas de sua intensidade) Visão por Computador 6 © João Luís Sobral 2003 O nosso sistema de visão Adaptação de brilho e discriminação (cont.) • O nosso olho sofre de ilusões ópticas, fenómenos que ainda não estão completamente explicados Visão por Computador 7 © João Luís Sobral 2003 O nosso sistema de visão A luz e o espectro electomagnético • O nosso olho apenas é sensível a uma parte reduzida do especto. • O nosso olho capta as ondas (na gamas do espectro visível) reflectidas pelos objectos. Os objectos brancos reflectem de forma balanceada todas as cores visíveis. Visão por Computador 8 © João Luís Sobral 2003 Aquisição de Imagem Sensores • Elementos sensíveis à energia, transformando-a numa voltagem. • Cada sensor é sensível a um determinado tipo de energia (i.é., gama do especto). • A aquisição pode ser efectuada por um único sensor, por uma linha de sensores ou por uma matriz de sensores. Visão por Computador 9 © João Luís Sobral 2003 Aquisição de Imagem Sensores • Captação de imagem com uma linha de sensores • Captação de imagem com uma matriz de sensores Visão por Computador 10 © João Luís Sobral 2003 Aquisição de Imagem Amostragem e discretização • A voltagem produzida pelos sensores tem que ser amostrada (i.é., detectado o seu valor em intervalos fixos) e discretizada para valores inteiros, uma vez que a voltagem é um sinal contínuo. • Quando são utilizados vários sensores, o número de sensores estabelece o número de amostragens. Visão por Computador 11 © João Luís Sobral 2003 Aquisição de Imagem Representação de uma imagem digital • Representação de uma imagem de M linhas por N colunas: • Tipicamente o número de tons associado a cada pixel é geralmente uma potência de 2. • Resolução espacial (i.é., amostragem) • Resolução em número de tons (i.é., discretização) Visão por Computador 12 © João Luís Sobral 2003