IMPA – Instituto de Matemática Pura e Aplicada
IMCA – Instituto de Matemática y Ciencias Afines
Processamento de Imagens
Marcelo Bernardes Vieira
http://www.impa.br/~mbvieira/IMCA
Referências gerais
Computação Gráfica: Imagem
Digital Image Processing
Jonas Gomes e Luiz Velho
2a edição – IMPA
Rafael C. Gonzalez e Richard E. Woods
Cursos
Fourier transform to Wavelets (Siggraph)
Calendário
29/11: definição
Fundamentos de cor
Sistemas de cor
Imagem digital
30/11: representação
Representação de sinais
Teoria da amostragem
Calendário
1/12: filtragem
Introdução aos filtros digitais
Filtragem de imagens
2/12: análise
Análise tempo-frequência
Transformada de wavelets
Calendário
3/12: teoria da informação
Introdução à compressão de imagens
Elementos de teoria da informação
6/12: compressão
Compressão livre de erro
Compressão JPEG, JPEG2000
Prof. Luiz Velho
Calendário
7/12: quantização
8/12: dithering
9/12: composição de imagens
10/12: avaliação
IMPA – Instituto de Matemática Pura e Aplicada
IMCA – Instituto de Matemática y Ciencias Afines
Fundamentos de cor
Marcelo Bernardes Vieira
Estudo da cor
Cor é uma manifestação perceptual da luz
Processo psicofísico: sensoriamento de sinais
eletromagnéticos intermediado pelo sofisticado
sistema visual humano.
Estudo da cor
Física da cor
Modelos matemáticos da cor
Representação da cor
Codificação da cor
Física da cor
Fótons se deslocam a uma velocidade constante
c e a onda associada tem uma freqüência f.
Freqüência e velocidade definem o comprimento
de onda: f = c
Quando os fótons encontram a retina, impulsos
elétricos são gerados que, durante seu caminho
até o cérebro, são traduzidos em percepção de
cor.
Física da cor
Do ponto de vista perceptual, os
diferentes comprimentos de onda
estão associados a diferentes cores.
Espectro visível: 380 a 780 nm (10e9m)
Violeta:
Azul:
Verde:
Amarelo:
Laranja:
Vermelho:
380 – 440 nm
440 – 490 nm
490 – 565 nm
565 -590 nm
590 – 630 nm
630 – 780 nm
Formação da cor
Percepção de processos químicos e físicos
diversos. Os processos mais importantes
são aditivo, subtrativo e de pigmentação.
Processo aditivo:
Formação da cor
Processo subtrativo: a luz que recebemos é
processada por um filtro, material sólido
transparente, ou através de um corante, que
absorve determinados comprimentos de onda
e transmite outros.
Formação da cor
Formação por pigmentação: quando
um raio luminoso atinge partículas
chamadas pigmentos, há um efeito de
espalhamento com fenômenos sucessivos
e simultâneos de reflexão, transmissão e
absorção entre os diversos pigmentos.
Modelo de representação da cor
O modelo espacial do sinal de cor associa
cada comprimento de onda a uma medida
de energia radiante: distribuição espectral.
Fontes de luz
E
100
Luz branca
50
0
400
Luz colorida
100
500
E
600
700
comprimento de
onda dominante
define a
matiz (hue)
50
0
400
(mm)
500
600
700
(mm)
Fontes de luz
E
400
comprimento de
onda dominante
define a
matiz (hue)
500
600
E
(mm)
700
400
matiz (hue)
intensidade
define o
brilho
(brightness)
500
600
brilho (brightness)
a concentração no
comprimento de
onda dominante
define a
saturação ou pureza
E
400
500
600
saturação
(mm)
700
700 (mm)
Objetivo
Definir matematicamente um sistema de
amostragem e reconstrução de cor.
Sistema físico de
amostragem de cor
Consiste de um número finito de
sensores s1, s2, ..., sn = filtros do sinal
luminoso.
Cada sensor possui uma resposta
espectral si()
Cor resultante: Ci= ∫ C() Si() d
Ideal: Ci= ∫ C() δ( - i) d
Define uma transf. linear: R: є → Rn
Metamerismo: R(C1) = R(C2)
Sistema de reconstrução de cor
Consiste de um número finito de
emissores e1, e2, ..., en.
Cada sensor gera uma cor com
distribuição espectral Pi() (primária)
forma uma base de um espaço de cor.
Processo aditivo: Cr() = Σ Ck Pk()
Define uma transf. linear: R: є → Rn
Metamerismo: R(C1) = R(C2)
O olho humano
Função de reconstrução de cor
As curvas de resposta espectral de um
sistema físico de amostragem são difíceis
de se calcular.
Função de reconstrução de cor:
Tk(C) = ∫ C() Ck() d = componente da
cor associada à primária Pk()
Representação CIE-RGB
Luz branca:
Luz de teste:
Anteparos
Luzes primárias:
1=436nm
2=546nm
3=700nm
Representação CIE-RGB
C( ) = r() R + g() G + b() B
0.4
b( )
r( )
0.2
- 0.2
400
500
r( )
600
546 nm
0
438 nm
Valores dos tri-esimulos
g( )
700
(mm)
Diagrama de cor CIE-RGB
Curva de resposta espectral média
Dado um sistema físico de amostragem de
cor com sensores s1, s2, ..., sn essa curva é:
V() = Σ si Si() , si são constantes.
Para o olho humano essa curva é chamada de
função de eficiência luminosa relativa
Luminância
É a grandeza colorimétrica que corresponde aos
termos perceptuais de brilho (emissores) ou
luminosidade (refletores)
L() = k ∫ C() V() d , k é constante
A percepção de cor pelo olho humano é dividida
na fase de captação e combinação.
São combinados na forma L-M, H – (L+M), L+M.
O canal B para luminância é desprezível=> Y = R+G
Os outros termos (crominância) são (R-G) e (B-Y)
IMPA – Instituto de Matemática Pura e Aplicada
IMCA – Instituto de Matemática y Ciencias Afines
Sistemas de cor
Marcelo Bernardes Vieira
Triângulo de Maxwell
Chamamos de plano de crominância ou
plano de Maxwell o plano x+y+z =1.
(x,y,z) são os componentes de cor de um
sistema com três primárias
L(s) = s L()
Sólido de cor
O conjunto de todas as cores possíveis
formam um cone convexo = sólido de cor
Combinação convexa de duas distribuições
espectrais é uma distribuição espectral
Cada distribuição corresponde a um único
ponto no espaço de cor
O espaço de cor é o conjunto de retas que
passam pela origem
Padrão CIE-RGB
L(C) = 0,176R + 0.81G + 0.011B
L(C()) = Σ ai L(P())
Padrão CIE-XYZ
Funções de reconstrução XYZ
1) As componentes devem ser positivas
2) Deve-se obter o maior numero possível de cores com coord. nulas
3) Duas primárias devem ter luminância nula
Diagrama de cor CIE-XYZ
Diagrama de cor CIE-XYZ
Cor complementar
Mudança entre sistemas
CIE-RGB e CIE-XYZ
Sistemas uniformes
Não uniformidade
Sistema de cor Lab
•
•
•
•
L = Iluminação
a = Conteúdo Vermelho/Verde
b = Conteúdo Amarelo/Azul
Distâncias euclidianas são úteis!
Dispositivos:
Sistema de cor do monitor
Sistema de cor mRGB
Sistema de cor CMY/CMYK
Sistemas de vídeo componente
O olho tem menor sensibilidade para detectar
cores do que variações de intensidade
Utiliza-se uma banda maior para a luminância: Y =
0,299R + 0,587G + 0,116B
Os componentes de crominância são representados
como: R-Y e B-Y
Sistemas baseados em Y, R-Y, B-Y são
chamados de vídeo componente.
Sistemas de vídeo digital
O padrão internacional para vídeo digital
Y, Cr, Cb é dado pela seguinte
transformação de Y, R-Y, B-Y:
Y = 16 + 234Y
Cr = 128 + 112 (0,5/(1-0,114) * (B-Y))
Cb = 128 + 112 (0,5/(1-0,299) * (R-Y))
Usado nos padrões JPEG e MPEG.
Sistemas de vídeo composto
São sistemas de cor para transmissão de vídeo
(NTSC, PAL, etc.).
Os componentes são combinados em um único
sinal:
O sinal de luminância pode ser utilizado em aparelhos
preto e branco
As crominâncias podem ser codificada em apenas 5%
da banda de passagem sem degradar o sinal de
luminância.
Sistema YUV
U = 0,493 (B-Y)
V = 0,877 (R-Y)
Sistemas de vídeo composto
• Sistema YIQ: IQ é obtido a partir de uma
rotação das coordenadas UV
• I ocupa uma banda menor
Componentes de uma cor
Modelo HSI
Modelo HSI
Sistemas computacionais
Exemplo: codificação YUV
YUV 4:4:4 => 8 bits para cada elemento
YUV 4:2:2 => Y1 U1 Y2 V2 Y3 U3 Y4 V4
Reconstrução da sequência: Y1 U1 V1 Y2 U1 V2 ...
IMPA – Instituto de Matemática Pura e Aplicada
IMCA – Instituto de Matemática y Ciencias Afines
Imagem digital
Marcelo Bernardes Vieira
Níveis de abstração na representação de uma imagem
Definições
Discretização x reconstrução
Discretização é o processo de conversão de um sinal
contínuo em uma representação discreta
Reconstrução consiste em se obter o sinal contínuo a
partir de sua representação
Codificação x decodificação
Codificação consiste em se obter uma sequência finita de
símbolos
Decodificação permite obter a representação a partir da
sequência de símbolos
Modelos matemáticos de sinais
Um sinal se manifesta pela variação de alguma
grandeza física
Pode ser em função do tempo (som) ou do espaço
(imagem). Ou dos dois (vídeo)
Estamos interessados em um modelo
funcional no qual um sinal é representado por
uma função f: U С Rm → Rn
Espaço de sinais: {f: U С Rm → Rnbb}
Modelos funcionais
O sinal f: U С Rm → Rn é chamado
contínuo. Isso significa somente que o
domínio e o contra-domínio são um
continuum de números. Mas não que f
seja contínua topologicamente.
Representação: discretização do
domínio ou contra-domínio de f
Modelos funcionais
Sinal contínuo-contínuo
Sinal contínuo-discreto: contra-domínio
discretizado (quantização)
Sinal discreto-contínuo: domínio
discretizado (amostragem)
Sinal discreto-discreto: amostrado e
quantizado = IMAGEM DIGITAL
Modelos funcionais
Discretização para amostragem consiste
em calcular f em um conjunto finito de
pontos p1, p2, ...,pK do conjunto U.
Reconstrução consiste em interpolar os
valores f(p1), f(p2), ..., f(pK) de modo a
obter uma aproximação f’ de f
Vamos utilizar dois modelos funcionais:
Modelo espacial
Modelo espectral
Modelo espacial de sinais
O subconjunto U representa a região no
espaço na qual varia a grandeza física
(Domínio do espaço ou tempo).
Som estéreo: f: U С R → R2 (unidimensional)
U = tempo
Imagem: f: U С R2 → Rn
U = espaço
Rn é um espaço de cor (n=1 => monocromática)
Vídeo: f: U С R x R2 → Rn (inclui tempo)
Imagem em escala de cinza
Modelo espectral de sinais
O sinal periódico f(t) = a cos(2πω0t + φ) no
domínio do espaço pode ser representado por
F(ω) = { a se ω = ω0; 0 senão
Qualquer sinal periódico pode ser definido pelo
modelo funcional acima utilizando a série de
Fourier: f(t) = ∑ ck ei 2π k ω t onde ω é a
frequência fundamental do sinal.
Domínio da frequência: transformada de Fourier
Representação matricial
para imagem
Geralmente, o suporte de uma imagem é
uma região retangular
U = [a,b] x [c,d] = {(x,y) Є R2; a ≤ x ≤ b; c
≤ y ≤ d}
Representação matricial consiste em
discretizar esse retângulo com um
reticulado Δ = (Δx, Δy) Є R2
Δ={(xj,yk) Є U; xj= j Δx, yk= Δy, j,k Є Z}
Reticulado: representação matricial
Resolução espacial
Imagem digital
É um sinal amostrado e quantizado:
Coordenadas de pixels
Resolução
Informação de cor de cada pixel
Gamute é o conjunto de todas a cores de uma
imagem
Monocromática com 2 cores = imagem binária
Monocromática com n cores = tons de cinza
Se o espaço de cor tem dimensão k, podemos
considerar cada componente de cor em separado.
Topologia de uma imagem
Norma:
4-conexa: |x| + |y|
8-conexa: Max |x|, |y|
Geometria do pixel