IMPA – Instituto de Matemática Pura e Aplicada
IMCA – Instituto de Matemática y Ciencias Afines
Processamento de Imagens
Marcelo Bernardes Vieira
http://www.impa.br/~mbvieira/IMCA
Referências gerais

Computação Gráfica: Imagem



Digital Image Processing


Jonas Gomes e Luiz Velho
2a edição – IMPA
Rafael C. Gonzalez e Richard E. Woods
Cursos

Fourier transform to Wavelets (Siggraph)
Calendário

29/11: definição




Fundamentos de cor
Sistemas de cor
Imagem digital
30/11: representação


Representação de sinais
Teoria da amostragem
Calendário

1/12: filtragem



Introdução aos filtros digitais
Filtragem de imagens
2/12: análise


Análise tempo-frequência
Transformada de wavelets
Calendário

3/12: teoria da informação



Introdução à compressão de imagens
Elementos de teoria da informação
6/12: compressão


Compressão livre de erro
Compressão JPEG, JPEG2000
Prof. Luiz Velho




Calendário
7/12: quantização
8/12: dithering
9/12: composição de imagens
10/12: avaliação
IMPA – Instituto de Matemática Pura e Aplicada
IMCA – Instituto de Matemática y Ciencias Afines
Fundamentos de cor
Marcelo Bernardes Vieira
Estudo da cor

Cor é uma manifestação perceptual da luz


Processo psicofísico: sensoriamento de sinais
eletromagnéticos intermediado pelo sofisticado
sistema visual humano.
Estudo da cor




Física da cor
Modelos matemáticos da cor
Representação da cor
Codificação da cor
Física da cor



Fótons se deslocam a uma velocidade constante
c e a onda associada tem uma freqüência f.
Freqüência e velocidade definem o comprimento
de onda: f = c
Quando os fótons encontram a retina, impulsos
elétricos são gerados que, durante seu caminho
até o cérebro, são traduzidos em percepção de
cor.
Física da cor








Do ponto de vista perceptual, os
diferentes comprimentos de onda
estão associados a diferentes cores.
Espectro visível: 380 a 780 nm (10e9m)
Violeta:
Azul:
Verde:
Amarelo:
Laranja:
Vermelho:
380 – 440 nm
440 – 490 nm
490 – 565 nm
565 -590 nm
590 – 630 nm
630 – 780 nm
Formação da cor


Percepção de processos químicos e físicos
diversos. Os processos mais importantes
são aditivo, subtrativo e de pigmentação.
Processo aditivo:
Formação da cor

Processo subtrativo: a luz que recebemos é
processada por um filtro, material sólido
transparente, ou através de um corante, que
absorve determinados comprimentos de onda
e transmite outros.
Formação da cor

Formação por pigmentação: quando
um raio luminoso atinge partículas
chamadas pigmentos, há um efeito de
espalhamento com fenômenos sucessivos
e simultâneos de reflexão, transmissão e
absorção entre os diversos pigmentos.
Modelo de representação da cor

O modelo espacial do sinal de cor associa
cada comprimento de onda a uma medida
de energia radiante: distribuição espectral.
Fontes de luz
E
100

Luz branca
50
0
400

Luz colorida
100
500
E
600
700
comprimento de
onda dominante
define a
matiz (hue)
50
0
400

(mm)
500
600
700

(mm)
Fontes de luz
E
400
comprimento de
onda dominante
define a
matiz (hue)
500
600
E

(mm)
700
400
matiz (hue)
intensidade
define o
brilho
(brightness)
500
600
brilho (brightness)
a concentração no
comprimento de
onda dominante
define a
saturação ou pureza
E
400
500
600
saturação

(mm)
700

700 (mm)
Objetivo

Definir matematicamente um sistema de
amostragem e reconstrução de cor.
Sistema físico de
amostragem de cor



Consiste de um número finito de
sensores s1, s2, ..., sn = filtros do sinal
luminoso.
Cada sensor possui uma resposta
espectral si()
 Cor resultante: Ci= ∫ C() Si() d
 Ideal: Ci= ∫ C() δ( - i) d
Define uma transf. linear: R: є → Rn

Metamerismo: R(C1) = R(C2)
Sistema de reconstrução de cor


Consiste de um número finito de
emissores e1, e2, ..., en.
Cada sensor gera uma cor com
distribuição espectral Pi() (primária)



forma uma base de um espaço de cor.
Processo aditivo: Cr() = Σ Ck Pk()
Define uma transf. linear: R: є → Rn

Metamerismo: R(C1) = R(C2)
O olho humano
Função de reconstrução de cor


As curvas de resposta espectral de um
sistema físico de amostragem são difíceis
de se calcular.
Função de reconstrução de cor:
 Tk(C) = ∫ C() Ck() d = componente da
cor associada à primária Pk()
Representação CIE-RGB
Luz branca:
Luz de teste:
Anteparos
Luzes primárias:
1=436nm
2=546nm
3=700nm
Representação CIE-RGB
C( ) = r() R + g() G + b() B
0.4
b( )
r( )
0.2
- 0.2
400
500
r( )
600
546 nm
0
438 nm
Valores dos tri-esimulos
g( )
700

(mm)
Diagrama de cor CIE-RGB
Curva de resposta espectral média

Dado um sistema físico de amostragem de
cor com sensores s1, s2, ..., sn essa curva é:


V() = Σ si Si() , si são constantes.
Para o olho humano essa curva é chamada de
função de eficiência luminosa relativa
Luminância


É a grandeza colorimétrica que corresponde aos
termos perceptuais de brilho (emissores) ou
luminosidade (refletores)
 L() = k ∫ C() V() d , k é constante
A percepção de cor pelo olho humano é dividida
na fase de captação e combinação.



São combinados na forma L-M, H – (L+M), L+M.
O canal B para luminância é desprezível=> Y = R+G
Os outros termos (crominância) são (R-G) e (B-Y)
IMPA – Instituto de Matemática Pura e Aplicada
IMCA – Instituto de Matemática y Ciencias Afines
Sistemas de cor
Marcelo Bernardes Vieira
Triângulo de Maxwell


Chamamos de plano de crominância ou
plano de Maxwell o plano x+y+z =1.
(x,y,z) são os componentes de cor de um
sistema com três primárias
L(s) = s L()
Sólido de cor

O conjunto de todas as cores possíveis
formam um cone convexo = sólido de cor



Combinação convexa de duas distribuições
espectrais é uma distribuição espectral
Cada distribuição corresponde a um único
ponto no espaço de cor
O espaço de cor é o conjunto de retas que
passam pela origem
Padrão CIE-RGB

L(C) = 0,176R + 0.81G + 0.011B

L(C()) = Σ ai L(P())
Padrão CIE-XYZ
Funções de reconstrução XYZ
1) As componentes devem ser positivas
2) Deve-se obter o maior numero possível de cores com coord. nulas
3) Duas primárias devem ter luminância nula
Diagrama de cor CIE-XYZ
Diagrama de cor CIE-XYZ
Cor complementar
Mudança entre sistemas
CIE-RGB e CIE-XYZ
Sistemas uniformes
Não uniformidade
Sistema de cor Lab
•
•
•
•
L = Iluminação
a = Conteúdo Vermelho/Verde
b = Conteúdo Amarelo/Azul
Distâncias euclidianas são úteis!
Dispositivos:
Sistema de cor do monitor
Sistema de cor mRGB
Sistema de cor CMY/CMYK
Sistemas de vídeo componente

O olho tem menor sensibilidade para detectar
cores do que variações de intensidade



Utiliza-se uma banda maior para a luminância: Y =
0,299R + 0,587G + 0,116B
Os componentes de crominância são representados
como: R-Y e B-Y
Sistemas baseados em Y, R-Y, B-Y são
chamados de vídeo componente.
Sistemas de vídeo digital

O padrão internacional para vídeo digital
Y, Cr, Cb é dado pela seguinte
transformação de Y, R-Y, B-Y:




Y = 16 + 234Y
Cr = 128 + 112 (0,5/(1-0,114) * (B-Y))
Cb = 128 + 112 (0,5/(1-0,299) * (R-Y))
Usado nos padrões JPEG e MPEG.
Sistemas de vídeo composto


São sistemas de cor para transmissão de vídeo
(NTSC, PAL, etc.).
Os componentes são combinados em um único
sinal:



O sinal de luminância pode ser utilizado em aparelhos
preto e branco
As crominâncias podem ser codificada em apenas 5%
da banda de passagem sem degradar o sinal de
luminância.
Sistema YUV


U = 0,493 (B-Y)
V = 0,877 (R-Y)
Sistemas de vídeo composto
• Sistema YIQ: IQ é obtido a partir de uma
rotação das coordenadas UV
• I ocupa uma banda menor
Componentes de uma cor
Modelo HSI
Modelo HSI
Sistemas computacionais

Exemplo: codificação YUV


YUV 4:4:4 => 8 bits para cada elemento
YUV 4:2:2 => Y1 U1 Y2 V2 Y3 U3 Y4 V4

Reconstrução da sequência: Y1 U1 V1 Y2 U1 V2 ...
IMPA – Instituto de Matemática Pura e Aplicada
IMCA – Instituto de Matemática y Ciencias Afines
Imagem digital
Marcelo Bernardes Vieira
Níveis de abstração na representação de uma imagem
Definições

Discretização x reconstrução



Discretização é o processo de conversão de um sinal
contínuo em uma representação discreta
Reconstrução consiste em se obter o sinal contínuo a
partir de sua representação
Codificação x decodificação


Codificação consiste em se obter uma sequência finita de
símbolos
Decodificação permite obter a representação a partir da
sequência de símbolos
Modelos matemáticos de sinais

Um sinal se manifesta pela variação de alguma
grandeza física



Pode ser em função do tempo (som) ou do espaço
(imagem). Ou dos dois (vídeo)
Estamos interessados em um modelo
funcional no qual um sinal é representado por
uma função f: U С Rm → Rn
Espaço de sinais: {f: U С Rm → Rnbb}
Modelos funcionais


O sinal f: U С Rm → Rn é chamado
contínuo. Isso significa somente que o
domínio e o contra-domínio são um
continuum de números. Mas não que f
seja contínua topologicamente.
Representação: discretização do
domínio ou contra-domínio de f
Modelos funcionais




Sinal contínuo-contínuo
Sinal contínuo-discreto: contra-domínio
discretizado (quantização)
Sinal discreto-contínuo: domínio
discretizado (amostragem)
Sinal discreto-discreto: amostrado e
quantizado = IMAGEM DIGITAL
Modelos funcionais



Discretização para amostragem consiste
em calcular f em um conjunto finito de
pontos p1, p2, ...,pK do conjunto U.
Reconstrução consiste em interpolar os
valores f(p1), f(p2), ..., f(pK) de modo a
obter uma aproximação f’ de f
Vamos utilizar dois modelos funcionais:


Modelo espacial
Modelo espectral
Modelo espacial de sinais

O subconjunto U representa a região no
espaço na qual varia a grandeza física
(Domínio do espaço ou tempo).

Som estéreo: f: U С R → R2 (unidimensional)


U = tempo
Imagem: f: U С R2 → Rn
U = espaço
 Rn é um espaço de cor (n=1 => monocromática)


Vídeo: f: U С R x R2 → Rn (inclui tempo)
Imagem em escala de cinza
Modelo espectral de sinais

O sinal periódico f(t) = a cos(2πω0t + φ) no
domínio do espaço pode ser representado por



F(ω) = { a se ω = ω0; 0 senão
Qualquer sinal periódico pode ser definido pelo
modelo funcional acima utilizando a série de
Fourier: f(t) = ∑ ck ei 2π k ω t onde ω é a
frequência fundamental do sinal.
Domínio da frequência: transformada de Fourier
Representação matricial
para imagem

Geralmente, o suporte de uma imagem é
uma região retangular


U = [a,b] x [c,d] = {(x,y) Є R2; a ≤ x ≤ b; c
≤ y ≤ d}
Representação matricial consiste em
discretizar esse retângulo com um
reticulado Δ = (Δx, Δy) Є R2

Δ={(xj,yk) Є U; xj= j Δx, yk= Δy, j,k Є Z}
Reticulado: representação matricial
Resolução espacial
Imagem digital

É um sinal amostrado e quantizado:




Coordenadas de pixels
Resolução
Informação de cor de cada pixel
Gamute é o conjunto de todas a cores de uma
imagem



Monocromática com 2 cores = imagem binária
Monocromática com n cores = tons de cinza
Se o espaço de cor tem dimensão k, podemos
considerar cada componente de cor em separado.
Topologia de uma imagem
Norma:
4-conexa: |x| + |y|
8-conexa: Max |x|, |y|
Geometria do pixel
Download

Transparências