Visão Computacional – 2010
Aula 0: Introdução
Paulo Sérgio Rodrigues
PEL205
Administrivia
•
Aulas:
Quartas: 18:30 às 22:10 hs
•
Professor: Paulo Sérgio Rodrigues
www.fei.edu.br/~psergio
psergio@fei.edu.br
•
Pré-requisitos: Programação, Álgebra, Cálculo e
Experiência na preparação de Documentos
Acadêmicos
•
Textbooks:
“Digital Image Processing”
by Rafael Gonzalez & Richard Woods
“Vários artigos científicos”
Objetivos
• Introdução dos Principais problemas de Visão
Computacional.
• Introduzir os principais problemas e técnicas
volta às aplicações
• Dar aos alunos ferramentas e oportunidades
para discutir, formalizar, implementar e
escrever artigos com soluções razoáveis para
problemas complexos.
• Dar aos alunos uma visão geral da literatura e
da área de visão computacional, bem como de
sua complexidade e importância.
Por que estudar Visão
Computacional?
• Imagens e vídeos existem em todo lugar
• A cada dia, novas aplicações práticas têm
surgido:
– Construção de modelos virtuais de estruturas
reais 3D.
– segurança (quem está fazendo o que?)
– Pós-processamento de vídeo
– Reconhecimento de faces, gestos, etc..
• Vários problemas científicos desafiadores
– Como funciona um sistema de reconhecimento de
objetos?
• Um entendimento melhor a respeito da visão
humana.
Principais Tópicos tratados em
Visão Computacional
• Detecção de Formas ou Movimento
“Qual a forma 3D desse objeto?”
• Segmentação
“O que pertence a que?”
• Tracking (Rastreamento)
“A onde cada objeto vai?”
• Reconhecimento
“O que é isso?”
Visão
Visão Top Down
x
Visão Bottom Up
Visão Bottom Up
Desafio: Visão Baseada em Contexto
Visão Bottom Up: Análise de Imagens com Base
em informações de Cor, Forma ou Textura
Visão Top Down
Visão Top Down ou Bottom Up ?
Visão Computacional
Grandes Desafios Futuros
Telemedicina
Gerenciamento de Grandes Bases de Dados
Análise de Imagens em Vídeo
Ambientes Virtuais Colaborativos
Ambientes Virtuais Colaborativos
TV-Digital
Sub-divisão da Disciplina
Visão de
Baixo
Médio
Alto-Nível
Visão de Baixo Nível:
Geralmente é abordado, mas não necessariamente restrito a:
Transformações de Imagens: Transformada de Fourier, DFT, Propriedades,
FFT, Walsh, Hadamard, Hotteling, DCT, SVD e Slant
Melhoramento de Imagens: Espacial e Freqüência, Equalização Histogrâmica
Filtragem: Espacial e Freqüência
Processamento baseado em Cor: Sistemas de Cores
Processamento Baseado em Gradiente: Detectores de Direção
Processamento Baseado em Textura: Matriz de Co-ocorrência
Compressão de Imagens: Compressão JPEG
Compressão de Vídeos: Detecção de Transição
Registro de Imagens: Entropia: Tradicional e Não-Extensiva
Morfologia Matemática
Visão de Médio Nível:
Geralmente é abordado, mas não necessariamente restrito a:
Segmentação de Imagens: Baseada em Cor, Gray-Scale,
Pontos Principais, Movimento
Clusterização: K-Means, SOM, outros métodos, Crescimento
De Região
Entropia: Tradicional e Não-Extensiva
Detecção de Bordas, Limiarização Iterativa, Limiar Ótimo
Visão de Alto Nível:
Geralmente é abordado, mas não necessariamente restrito a:
Representação de Cenas: Código de Cadeia,
Assinaturas de Imagens, Aproximação Poligonal, Squeletização
Descritores de Cenas: Descritores de Fourier, Momentos
Invariantes, Descritores de Regiões
Morfologia Matemática, Análise de Imagens, Métodos
Estruturais, Casamento de Padrões, Métodos Baseados em
Strings e Linguagens de Autômatos
Classificadores Estatísticos: SVM, Redes Neurais, Redes
Bayesianos
Visão de Baixo Nível:
Geralmente é abordado, mas não necessariamente restrito a
Restauração de Imagens:
Melhoramento de Imagens: Espacial e Freqüência
Filtragem: Espacial e Freqüência
Processamento baseado em Cor
Processamento Baseado em Gradiente
Processamento Baseado em Textura
Curso de Visão 2010: PEL205
Regras:
Trabalho Teórico-Prático I (TTP-I): Visão de Baixo Nível
Trabalho Teórico-Prático II (TTP-II): Visão de Médio Nível
Trabalho Teórico-Prático II (TTP-II): Visão de Médio Nível
Prova Final (PF): Todo o Conteúdo
Nota Final: 2*TTP-I + 2*TTP-II + 2*TTP-III + 4*PF
Média < 5.0 = D (Reprovado)
5.0 <= Média < 7.5 = C
7.5 <= Média < 8.5 = B
8.5 <= Média
= A
Trabalhos Teóricos-Práticos
Assunto: TTPI -Visão de Baixo Nível;
TTPII - Visão de Médio Nível;
TTPIII - Visão de Alto Nível;
Trabalho em Equipe de até 3 alunos:
Equipe I: Guilherme e Werner;
Equipe II: Celso, André e Puff
De que consta: deverá ser preparada uma teoria envolvendo vários tópicos de visão
computacional não necessariamente vistos em sala, discutida e preparado
experimentos para validação, preparação de um artigo em inglês de 4 a 8 páginas e
submissão para uma revista de renome (B3, B4, B5, A1 ou A2) de circulação
internacional.
Avaliação: Será avaliado o emprenho de cada aluno, o nível do artigo de acordo
com os 5 níveis acima, discussão e debate com os colegas e com o professor. As
notas são individuais. Para composição dessa nota, deverão ser entregues avanços
semanais. Relatórios adiados diminuem 1% da nota por dia de atraso.
OBS: Cada artigo terá como primeiro autor, um dos alunos e último autor, o
professor da disciplina.
TTP-I
Assunto: Visão de Baixo Nível
Equipe GW: Guilherme e Werner
O artigo consta do tema de Análise de Vídeo explorando o tema Entropia
Não-Extensiva para Detecção de Transições.
Uma sugestão do título e estrutura do artigo está disponível na página da disciplina.
Base de dados: fica a cargo dos alunos, mas uma boa sugestão são usar Treilers de filmes no
YouTube.
Artigos sugeridos para Trabalhos Relacionados também estão disponíveis.
Todo o Material deverá ser atualizado no DropBox.
Fica Livre para os alunos poderem sugerir, se preferirem novo: título, objetivo, Artigos-bases,
modos de experimentos e linguagem de implementação, e até uma nova estrutura para artigo
diferente da sugerida pelo professor.
Data da entrega: 13 de Outubro de 2010
TTP-I
Assunto: Visão de Baixo Nível
Equipe CAP: Celso, André e Puff
O artigo consta do tema de Registros de Imagens Médicas explorando o tema Entropia NãoExtensiva em imagens de ultra-som, Dicom, Raio-x, RM, ou outras
sugeridas.
Uma sugestão do título e estrutura do artigo está disponível na página da disciplina.
Base de dados: disponível com o Professor
Artigos sugeridos para Trabalhos Relacionados também estão disponíveis.
Todo o Material deverá ser atualizado no DropBox.
Fica Livre para os alunos poderem sugerir, se preferirem novo: título, objetivo, Artigos-bases,
modos de experimentos e linguagem de implementação, e até uma nova estrutura para artigo
diferente da sugerida pelo professor.
Data da entrega: 13 de Outubro de 2010
Download

Visão Computacional