Integrando Textura e Forma para a
Recuperação de Imagens por Conteúdo
André Guilherme Ribeiro Balan
Grupo de Banco de Dados e Imagens
Instituto de Ciências Matemáticas e Computação
Universidade de São Paulo
Conteúdo

Introdução

Técnica proposta



Método de Segmentação
Vetor de Características
Medida de Similaridade

Experimentos e Resultados

Conclusões
Introdução

Motivação para o desenvolvimento de técnicas CBIR:


Objetivo:


O aumento contínuo da quantidade de imagens digitais nos
hospitais e centros médicos.
Desenvolver uma ferramenta que auxilie os especialistas encontrar
imagens específicas em grandes repositórios.
Principal abordagem:


Extrair características que representem o conteúdo da imagem;
Comparar as características usando uma medida de similaridade.
Introdução

Exemplo de consulta:
 “encontre as cinco imagens mais semelhantes à
imagem identificada por radialcabeca_343.jpg”
Introdução

Grupos de características:



Brilho/Cor;
Forma;
Textura.

Brilho/Cor são características simples de serem extraídas,
mas podem causar ambigüidade.

Forma e Textura caracterizam melhor o conteúdo da
imagem, mas são mais complexas e custosas de serem
extraídas.
A técnica proposta

Principais elementos em imagens médicas:

órgãos, tecidos, anomalias, plano de fundo, …
Forma e Textura características

Neste contexto, nosso trabalho propõe a utilização
de textura e forma.
A técnica proposta

Esta abordagem compreende:

A segmentação da imagem baseada em textura.

A extração de características simples de forma do objetos obtidos
na segmentação.

O uso de uma função simples de medida de similaridade.
O método de segmentação

Método de segmentação empregado:


Método EM/MPM;
Principais características do EM/MPM:



Baseado em Textura;
Automático (não-supervisionado);
Utiliza campos aleatórios de Markov (MRF);
O método de segmentação

Sobre o EM/MPM:



Basicamente: um algoritmo de otimização.
Objetivo: “minimizar o número esperado de pixels classificados
erroneamente”
Sobre o uso de MRFs


Permite a representação de texturas de comportamento aleatório
(presente na maioria dos tipos de imagens)
Demanda uma quantidade relativamente pequena de parametros.
EM/MPM – visão geral
Campo Aleatório
de Markov
Imagem Segmentada
.
..
1
2
3
(1, 21)
L
(L, 2L)
(3, 23)
Imagem a ser O usuário define o Um mapa de classificação
segmentada número de classes é criado aleatoriamente
Realiza-se uma
nova
classificação
Algoritmo MPM
.
..
1
2
3
L
Características das
classes são definidas
Atualiza-se as
características
das classes
Algoritmo EM
Exemplos de segmentação
Classes (5)
1
2
3
4
5
fundo
Classes (2)
1
2
fundo
O vetor de características

O conjunto de características proposto inclui:



Medidas de forma da imagem segmentada;
Medidas da imagem original considerando a segmentação.
As medidas são obtidas das regiões:
Classes (5)
1
2
3
4
5
5 regiões distintas
O vetor de características

Para cada região, 5 características são extraídas:






Centro de massa (centróide);
Massa (tamanho);
Medida de dispersão;
Média e
Variância.
Deixe I e S denotar a imagem original e a imagem
segmentada, respectivamente.
O vetor de características

A massa da região c é:
mc 

x,y

hc ( x , y )
where

1 if
hc  

 0 if
S x,y  c
S x,y  c
Em outra palavras, massa é o numero de pixels da região c.
O vetor de características


O centro de massa da região c
é o par (xoc , yoc)
A medida de dispersão mede a
compactação da região:
 oc – centro de massa de c
 oi,c – centro de massa de
uma região isolada i na
região c

xo c 
x,y
dc 

x  hc ( x , y )
mc

,
yo c 
y  hc ( x , y )
x,y
mc
dist ( o c , o i , c )
i
Exemplo
de regiões
isoladas na
região azul
O vetor de características

Média e Variância são calculadas sobre a imagem original I
considerando a segmentação S

c 
I x , y  hc ( x , y )
x,y
mc
 (I
média
c 
2
x, y
  c )  hc ( x , y )
x, y
variância
N
O vetor de características

Se a imagem é segmentada em L classes o vetor de características é:
xo1
yo1
m1
d1
1
21
...
xoL
yoL
mL
dL
L
2L
...
Características da classe com menor média
Características da classe com maior média

Há 6 valores por região/classe (o centróide tem dois valores)

O vetor possui 6 x L valores reais.
Medida de similaridade

A medida de similaridade entre duas imagens é dada pela
Distância Euclidiana entre os vetores de características.

Os valores do vetor são normalizados para se obter maior
poder de caracterização.
Experimentos e Resultados

Bando de imagens reduzido para experimentos:
Categoria de Imagem

Número de Imagens
Angiograma
21
RM Bacia Axial
33
RM Cabeça Axial
50
RM Abdômen Coronal
34
RM Cabeça Sagital
38
RM Espinha Sagital
44
Imagens segmentadas em 5 classes → 30 características
por imagem.
Experimentos e Resultados

Exemplo de consulta utilizando o vetor proposto (30 valores)
Imagem de busca: 2865.jpg
Miniaturas das 24
imagens recuperadas
Experimentos e Resultados

Usando histogramas (256 valores)
Imagem de busca: 2865.jpg
Miniaturas das 24
imagens recuperadas
Experimentos e Resultados

Gráficos Precision x Recall
- 5 consultas por curva
- as mesmas consultas para ambas as técnicas
Técnica proposta
Histograma
1
Precision
Precision
1
0
0
0
0,1
0,2
0,3
0,4
0,5
Recall
0,6
0,7
0,8
0,9
1
0
0,1
0,2
0,3
0,4
0,5
Recall
0,6
0,7
0,8
0,9
1
Conclusões

Vantagens da técnica proposta




Alto poder de discriminação;
Número relativamente pequeno de características;
Método automático de segmentação.
Desvantagem

Alto custo para segmentação

Imagens de 300 x 400 pixels levam de 3 a 5 segundos em uma
máquina com processador Athlon 2600.
Download

Integrando Textura e Forma para a Recuperação de Imagens por