Visão Computacional
Formação da Imagem
www.dca.ufrn.br/~lmarcos/courses/visao
Sumário
• Princípios óticos, geométricos e
radiométricos na formação de imagens de
intensidade
• Natureza de imagens de intensidade,
aquisição e modelos matemáticos
• Modelos matemáticos de câmeras
• Range images (imagens de profundidade).
Mais sobre visão
Variantes
Mais variantes
Iluminação
• Fontes de luz emitem luz:
– Espectro eletro-magnético
– Posição e direção
• Superfícies refletem luz
– Reflectância
– Geometria (posição, orientação, micro-estrutura)
– Absorção
– Transmissão
• Iluminação é determinada pela interação entre
fontes de luzes e superfícies
O que é cor?
• Refere-se à radiancia ou irradiância medida
em 3 comprimentos de onda diferentes.
• Cor da cena: radiância vinda das superfícies
(para iluminação).
• Cor da imagem: irradiância, usado para
renderização.
• Quantidades com diferentes unidades, não
devem ser confundidas.
O que é uma imagem?
• Irradiância: cada pixel mede a luz incidente
em um ponto do filme
• Proporcional à integral da radiância da cena
que chega àquele ponto
O que é uma imagem?
• Para nós, a grosso modo, efetivamente,
imagem é formada por três matrizes
bidimensionais de picture elements (pixels)
que codificam a radiação eletromagnética
emitida ou refletida por cada ponto
correspondente da cena medida em três
comprimentos de onda diferente,
quantizados em valores, geralmente, de fácil
manipulação (inteiros, char).
Percepção de iluminação
• A luz recebida de um objeto pode ser
expressa por
I() = ()L()
• onde () representa a reflectividade ou
transmissividade do objeto (albedo) e L() é
a distribuição de energia incidente.
• Intervalo de iluminação do sistema visual
humano: 1 a 1010
Luminância de um objeto
• A luminância ou intensidade de luz de um
objeto espacialmente distribuído, com
distribuição de luz I(x, y, ), é definida
como:
f  x , y 

0 I
 x , y ,V   d
• V() é a função de eficiência luminosa
relativa do sistema visual.
Luminância e brilho
• Luminância de um objeto é independente da
luminância dos objetos ao seu redor.
• Brilho de um objeto também chamado de
brilho aparente, é a luminância percebida e
depende da luminância ao redor do objeto.
• Duas regiões com mesma luminância, cujas
regiões ao redor de ambas possuem
diferentes luminâncias terão diferentes
brilhos aparentes.
Tipos de imagens
• Imagens de intensidade
– Similar a fotografias
– Codifica intensidade, cor
– Adquiridas por câmeras
• Imagens de profundidade (range images)
– Codifica forma e distância
– Adquiridas por sensores especiais (sonar,
câmeras laser)
Características comuns
• Matriz 2D de valores (números)
• Conseqüências:
– Relação exata da imagem com a cena (física) é
determinada pelo processo de aquisição que
depende em última análise do sensor usado
– Qualquer informação contida nas imagens pode
ser ultimamente extraída (calculada) a partir de
uma matriz 2D na qual está codificada
Parâmetros físicos
• No sistema visual humano, o processo de
formação de imagem começa com os raios
de luz vindos da cena projetando nos fotoreceptores da retina
• Uma variedade de parâmetros físicos afetam
a formação das imagens num sistema
artificial
Parâmetros óticos
• Caracterizam a ótica do sistema
–
–
–
–
tipo de lentes;
distância focal;
campo de vista;
abertura angular.
Parâmetros fotométricos
• Caracterizam o modelo da luz que chega ao
sensor após reflexão nos objetos da cena
– tipo, intensidade e direção de iluminação
– propriedades de reflectância das superfícies
visualizadas
– efeitos da estrutura do sensor na quantidade de
luz chegando aos fotoreceptores
Parâmetros geométricos
• Posição na imagem na qual um ponto 3D é
projetado
– tipos de projeção
– posição e orientação da câmera no espaço
– distorções de perspectiva e outras introduzidas
no processo de imageamento
Outros parâmetros
• Propriedades físicas da matriz foto-sensitiva
da câmera
• Natureza discreta dos fotoreceptores
• Quantização da escala de intensidade
• Outro erros que não podem ser modelados
(erro não sistemáticos)
Ótica básica
• Formação da imagem em VC começa com o
raio de luz que entra na câmera através da
abertura angular (pupila num humano)
• Raio bate numa tela (ou plano imagem) e o
sensor foto-receptivo registra a intensidade
da luz
• Muitos raios vem de luz refletida e alguns
de luz direta, outros de luz refratada
Focando uma imagem
• Qualquer ponto numa cena pode refletir
raios vindos de várias direções
• Muitos raios vindos do mesmo ponto
podem entrar na câmera.
• Para termos imagens nítidas, todos os raios
vindos de um mesmo ponto P da cena
devem convergir para um ponto único p no
plano de imagem.
Reduzindo abertura
• Apenas um raio de cada ponto entra na
câmera
• Imagens nítidas, sem distorções, mesmo à
distâncias diferentes
Problemas com pin-hole
• Tempo de exposição longo
• Quantidade mínima de luz
• Difração
Introduzindo um sistema ótico
• Lentes e abertura resolvem o problema
– Introduz outros elementos para que um raio
vindo do mesmo ponto 3D convirja para um
único ponto na imagem
– Mesma imagem que uma pin-hole mas com
tempo de exposição bem menor e abertura
maior
Duas restrições básicas
• 1) Qualquer raio que entra no sistema de
lentes paralelo ao eixo ótico, sai na direção
do foco no outro lado
• 2) Qualquer raio que entra na lente vindo da
direção do foco, sai paralelo ao eixo ótico
do outro lado
Lentes finas
Lente fina
Eixo ótico
Fl
Fr
f
f
Lentes finas
Lente fina
Eixo ótico
Fr
Fl
f
f
Lentes finas
Lente fina
P
Q
Eixo ótico
s
O
S
Fl
Fr
p
R
Z
f
f
z
Modelo básico
• Propriedade 1) a PQ e propriedade 2) a PR
• Defletem para se encontrar em algum ponto
do outro lado
• Uma vez que o modelo de lente fina foca
todos os raios vindos de P para convergirem
para o mesmo ponto, PQ e PR se
Lente fina
P
intersectam em p
Q
S
O
Fl
Z
f
R
f
Eixo ótico
s
p
Fr
z
Equação fundamental
P
• Usando similaridade entre os pares de
triângulo (<PFlS>, <ROFl>) e (<psFr>,
<QOFr>), obtém-se:
Zz = f2
• Fazendo Z´=Z+f e z´= z+f, encontramos:
Lente fina
1 /Z´ + 1/z´ = 1/f
Q
S
O
Fl
Z
f
R
f
Eixo ótico
s
p
Fr
z
Campo de vista
• Seja d o diâmetro efetivo das lentes
(periferia pode não ser visível)
• Juntamente com f, determinam o campo de
vista:
tan w = d/(2f)
• Metade do ângulo subentendido pelo
diâmetro, visto a partir do foco
Projeção ortográfica
• Ponto focal no infinito (raios são paralelos e
ortogonais ao plano imagem)
• Bom modelo para lentes de telescópios
• (x, y, z) é mapeado em (x, y, 0) (se xy é
plano imagem)
Projeção Perspectiva
(homografia)
• Projeta radialmente cada ponto na imagem
• Linhas são projetadas apenas por seus
pontos finais
• Não queremos imagem invertida
Download

Visão Computacional - DCA