PROCESSAMENTO DIGITAL DE IMAGENS Princípios & Aplicações Paulo Roberto Girardello Franco, Ph.D. CONTEÚDO 1) 2) 3) 4) 5) 6) 7) 8) 9) Breve histórico Terminologia Áreas de aplicação Representação de imagens Visualização de imagens Transformadas- DFT- aliasing - filtros Operações lineares Compactação de imagens Aplicações 1) BREVE HISTÓRICO 1920 - Transmissão de fotos de jornais entre Londres e New York Redução do período de transporte da foto através do Atlântico de mais de 1 semana para 3 apenas horas. Sistema Bartlane de transmissão de imagens via cabo. 1964 - Transmissão das fotos da Lua feitas pela Ranger 7 (Programa espacial e computadores digitais) Melhoria das fotos pelo Jet Propulsion Lab em Pasadena na Califórnia. 2) TERMINOLOGIA EM PROCESSAMENTO DIGITAL DE IMAGENS - DIP IMAGENS VISÍVEIS OBJETOS FUNÇÕES MATEMÁTICAS IMAGENS CONTÍNUAS GRAVURAS DESENHOS DISCRETAS FOTOGRAFIAS PINTURAS IMAGENS FÍSICAS NÃO VISÍVEIS IMAGENS ÓPTICAS Gravura: É a representação de um objeto feita por intermédio de uma pintura, desenho ou fotografia. Descrição, vívida, acurada de um objeto ou coisa de tal maneira que sugira a imagem mental ou dê uma idéia do objeto. Processamento Digital de Imagem: Começa com uma imagem e produz uma versão modificada da imagem. É utilizado para descrever tanto o processamento quanto a análise de imagens. Computer Graphics: Se refere ao processamento e ao display de imagens de coisas que existem conceitualmente ou como uma descrição matemática. A ênfase aqui é na geração de imagens função da iluminação, geometria e de uma câmera imaginaria Computer vision: Preocupa-se com o desenvolvimento de sistema que podem interpretar o conteúdo de cenas naturais. Em robótica são os olhos do computador. Digitalização: É o processo de converter uma imagem da sua forma original numa forma digital - conversão no sentido de não destruição dos originais. O processo reverso é a operação de mostrar a imagem digital (playback, cópia em papel, reconstrução da imagem, e gravação da imagem). Escarpamento: É o processo de selecionar o endereço de uma posição específica dentro do domínio da imagem (elemento da gravura - pixel) Amostragem: Significa a medição do nível de cinza de uma imagem em cada pixel. A amostragem é feita por dispositivos sensíveis a luz e que produzem uma voltagem proporcional a intensidade de luz que é refletida pela imagem F(x,y) I(x,y) R(x,y) Quantização: É a representação do valor lido do nível de cinza por um número inteiro. O sensor de imagens é normalmente seguido por um conversor analógico-digital. Resolução dos níveis de cinza: É o número de níveis de cinza por unidade de medida da amplitude de uma imagem Operações globais e pontuais: Operações globais são aquelas que se aplicam sobre toda a imagem digitalizada. Operações pontuais são aquelas operações nos quais o valor dos pixels de saída dependem apenas do valor do pixel de entrada. 3) ÁREAS DE APLICAÇÃO Melhoria do aspecto da imagem para interpretação humana Processamento de dados de uma cena para percepção autônoma de máquinas Compactação de imagens 4) REPRESENTAÇÃO DE IMAGENS Uma imagem digital é uma matriz de 2 dimensões onde seus elementos são chamados de pixels (picture x elements) Y filas intensidade colunas X Imagens com diferentes tipos dados Pixels do tipo: bit byte sem sinal float complexo dupla precisão Armazenamento de Imagens Digitais em Computadores: Um arquivo de uma imagem não possui apenas os valores dos pixels associados com as suas coordenadas mas também um header que provê informações adicionais como, por exemplo: tamanho tipo de dado do pixel modelo de cor Dimensions: width=256, Height=256 Pixel type: unsigned byte Color Model: Greyscale Imagem monocromática ou simplesmente imagem: Se refere a uma função da intensidade da luz em duas dimensões f(x,y), onde x e y representam coordenadas espaciais e o valor de f em qualquer ponto de (x,y) é proporcional ao brilho (níveis de cinza da imagem naquele ponto) - digitalização Uma matriz 512 x 512 com 128 níveis de cinza é equivalente a uma imagem de TV branco e preto. Imagem com tons de cinza 5) VISUALIZAÇÃO DE IMAGENS 256 x 256 pixels Região de InteresseROI: Aqui apenas estamos interessados numa pequena região ao redor do olho da gaivota ROI 10 x 10 pixels Zoom na ROI: Valores na ROI 142 107 90 80 78 85 88 102 107 105 174 107 34 26 76 85 102 110 115 110 164 218 250 255 250 252 102 80 127 174 237 218 24 34 34 24 51 88 19 53 34 19 24 85 34 44 26 26 34 24 90 26 26 26 26 34 90 53 26 26 34 73 105 90 98 105 105 110 110 110 110 117 115 110 110 117 110 132 115 110 255 252 127 117 71 76 85 107 107 107 255 255 164 137 90 83 78 93 102 105 Elementos da percepção visual - Olho humano: Cones e bastonetes Perfil de uma linha vertical central 237 200 150 100 50 0 100 200 255 Estatística de imagens Parâmetros estatísticos de uma imagem: número de pixels: 65536 pixel positivos: 65536 pixel negativos: 0 valor mínimo: 0 valor máximo: 255 valor médio: 87,19 desvio padrão: 65,77 pixels zero:0 5000 3000 0 50 100 150 200 250 300 Estatística de imagens Imagem de uma espinha dorsal- pixels em ponto flutuante número de pixel:58368 pixels positivos: 58368 valor mínimo: 1024 valor máximo: 1892 valor médio: 1068,9 pixels negativos:0 desvio padrão: 79,0 Histograma 30000 20000 10000 0 10 20 30 40 50 60 70 80 90 100 6) TRANSFORMADAS Domínio da Imagem Domínio das transformadas Processamento Filtragem, melhoramento, codificação, restauração Tipos de transformadas Transformada Discreta de Fourier Transformada Rápida de Fourier Transformada Walsh Transformada Haddamard Transformada Haar Transformada Hotelling Transformada Coseno Discreta Transformada Wavelet Transformada Discreta de Fourier em 2D: f(x,y) F(u,y) F(u,v) Transformada Discreta de Fourier 61 62 63 64 65 66 real ( 2.385244779e-17, ( 0.0078125, ( 1.880985883e-17, ( 0.5078125, ( 1.301042607e-17, ( 0.0078125, Imagem simples f(x,y imaginaria 0.1059114784) -0) 0.3182459772) 0) -0.3182459772) -0) Magnitude do Espectro de f(x,y)) Transformada Discreta de Fourier Perfil da Magnitude do Espectro Perfil da fase do Espectro Propriedades da DFT Rotação Espectro Soma Propriedades da DFT Translação Fase Mag.do Espectro DFT de Imagens simples Senoidal Retangula r DFT: Amostragem e aliasing Sinal senoidal 1 /128 ciclos por amostra 16/128 ciclos por amostra DFT: Amostragem e aliasing Sinal senoidal 64 /128 ciclos por amostra 68/128 ciclos por amostra DFT: Amostragem e aliasing DFT: Filtragem passa-baixo Imagem a ser filtrada Filtragem passa-baixo Imagem filtrada diâmetro 31 pixels DFT: Filtragem passa-alto Imagem a ser filtrada Filtragem passa-alto Imagem filtrada diâmetro 31 pixels DFT: Filtragem do tipo passa-banda Imagem a ser filtrada Filtragem passa-banda Imagem filtrada DFT: Filtragem de ruído coerente Imagem original Magnitude do Espectro da Imagem DFT: Filtragem de ruído coerente Máscara de filtragem Produto máscara e espectro DFT: Filtragem de ruído coerente Imagem filtrada Ruído coerente 7) OPERAÇÕES LINEARES Melhoria de imagens Imagem original Imagem com ruído branco -shot noise 10% de shot-noise Imagem filtrada com filtro de valor mediano 3X3 3 vezes Imagem filtrada com filtro de valor mediano 3X3 1 vez Imagem filtrada com filtro de valor mediano 5X5 1 vez Imagem filtrada com filtro de valor médio 5X5 1 vez Ressaltar cantos de imagens Imagem original da retina Operador Sobel na direção x imagem após filtro PA Operador Sobel na direções x e y Operador Isotrópico Operador Roberts Operador Prewitt Operador Sobel 8) COMPACTAÇÃO DE IMAGENS Definição de padrões Sem perdas - lossless Com perdas Compactação de fotos - JPEG Compactação de filmes - MPEG número de quadros por segundo predição de movimento 9) APLICAÇÕES Telecomunicações Telefones celulares com imagens Educação - videoconferências Agricultura Gerenciamento de colheitas em tempo real Medicina Tratamento de imagens em MRI’s Segurança Bancos de com impressões digitais, íris dos olhos, rosto Reconhecimento de assinaturas