Visão Computacional – 2010 Aula 0: Introdução Paulo Sérgio Rodrigues PEL205 Administrivia • Aulas: Quartas: 18:30 às 22:10 hs • Professor: Paulo Sérgio Rodrigues www.fei.edu.br/~psergio [email protected] • Pré-requisitos: Programação, Álgebra, Cálculo e Experiência na preparação de Documentos Acadêmicos • Textbooks: “Digital Image Processing” by Rafael Gonzalez & Richard Woods “Vários artigos científicos” Objetivos • Introdução dos Principais problemas de Visão Computacional. • Introduzir os principais problemas e técnicas volta às aplicações • Dar aos alunos ferramentas e oportunidades para discutir, formalizar, implementar e escrever artigos com soluções razoáveis para problemas complexos. • Dar aos alunos uma visão geral da literatura e da área de visão computacional, bem como de sua complexidade e importância. Por que estudar Visão Computacional? • Imagens e vídeos existem em todo lugar • A cada dia, novas aplicações práticas têm surgido: – Construção de modelos virtuais de estruturas reais 3D. – segurança (quem está fazendo o que?) – Pós-processamento de vídeo – Reconhecimento de faces, gestos, etc.. • Vários problemas científicos desafiadores – Como funciona um sistema de reconhecimento de objetos? • Um entendimento melhor a respeito da visão humana. Principais Tópicos tratados em Visão Computacional • Detecção de Formas ou Movimento “Qual a forma 3D desse objeto?” • Segmentação “O que pertence a que?” • Tracking (Rastreamento) “A onde cada objeto vai?” • Reconhecimento “O que é isso?” Visão Visão Top Down x Visão Bottom Up Visão Bottom Up Desafio: Visão Baseada em Contexto Visão Bottom Up: Análise de Imagens com Base em informações de Cor, Forma ou Textura Visão Top Down Visão Top Down ou Bottom Up ? Visão Computacional Grandes Desafios Futuros Telemedicina Gerenciamento de Grandes Bases de Dados Análise de Imagens em Vídeo Ambientes Virtuais Colaborativos Ambientes Virtuais Colaborativos TV-Digital Sub-divisão da Disciplina Visão de Baixo Médio Alto-Nível Visão de Baixo Nível: Geralmente é abordado, mas não necessariamente restrito a: Transformações de Imagens: Transformada de Fourier, DFT, Propriedades, FFT, Walsh, Hadamard, Hotteling, DCT, SVD e Slant Melhoramento de Imagens: Espacial e Freqüência, Equalização Histogrâmica Filtragem: Espacial e Freqüência Processamento baseado em Cor: Sistemas de Cores Processamento Baseado em Gradiente: Detectores de Direção Processamento Baseado em Textura: Matriz de Co-ocorrência Compressão de Imagens: Compressão JPEG Compressão de Vídeos: Detecção de Transição Registro de Imagens: Entropia: Tradicional e Não-Extensiva Morfologia Matemática Visão de Médio Nível: Geralmente é abordado, mas não necessariamente restrito a: Segmentação de Imagens: Baseada em Cor, Gray-Scale, Pontos Principais, Movimento Clusterização: K-Means, SOM, outros métodos, Crescimento De Região Entropia: Tradicional e Não-Extensiva Detecção de Bordas, Limiarização Iterativa, Limiar Ótimo Visão de Alto Nível: Geralmente é abordado, mas não necessariamente restrito a: Representação de Cenas: Código de Cadeia, Assinaturas de Imagens, Aproximação Poligonal, Squeletização Descritores de Cenas: Descritores de Fourier, Momentos Invariantes, Descritores de Regiões Morfologia Matemática, Análise de Imagens, Métodos Estruturais, Casamento de Padrões, Métodos Baseados em Strings e Linguagens de Autômatos Classificadores Estatísticos: SVM, Redes Neurais, Redes Bayesianos Visão de Baixo Nível: Geralmente é abordado, mas não necessariamente restrito a Restauração de Imagens: Melhoramento de Imagens: Espacial e Freqüência Filtragem: Espacial e Freqüência Processamento baseado em Cor Processamento Baseado em Gradiente Processamento Baseado em Textura Curso de Visão 2010: PEL205 Regras: Trabalho Teórico-Prático I (TTP-I): Visão de Baixo Nível Trabalho Teórico-Prático II (TTP-II): Visão de Médio Nível Trabalho Teórico-Prático II (TTP-II): Visão de Médio Nível Prova Final (PF): Todo o Conteúdo Nota Final: 2*TTP-I + 2*TTP-II + 2*TTP-III + 4*PF Média < 5.0 = D (Reprovado) 5.0 <= Média < 7.5 = C 7.5 <= Média < 8.5 = B 8.5 <= Média = A Trabalhos Teóricos-Práticos Assunto: TTPI -Visão de Baixo Nível; TTPII - Visão de Médio Nível; TTPIII - Visão de Alto Nível; Trabalho em Equipe de até 3 alunos: Equipe I: Guilherme e Werner; Equipe II: Celso, André e Puff De que consta: deverá ser preparada uma teoria envolvendo vários tópicos de visão computacional não necessariamente vistos em sala, discutida e preparado experimentos para validação, preparação de um artigo em inglês de 4 a 8 páginas e submissão para uma revista de renome (B3, B4, B5, A1 ou A2) de circulação internacional. Avaliação: Será avaliado o emprenho de cada aluno, o nível do artigo de acordo com os 5 níveis acima, discussão e debate com os colegas e com o professor. As notas são individuais. Para composição dessa nota, deverão ser entregues avanços semanais. Relatórios adiados diminuem 1% da nota por dia de atraso. OBS: Cada artigo terá como primeiro autor, um dos alunos e último autor, o professor da disciplina. TTP-I Assunto: Visão de Baixo Nível Equipe GW: Guilherme e Werner O artigo consta do tema de Análise de Vídeo explorando o tema Entropia Não-Extensiva para Detecção de Transições. Uma sugestão do título e estrutura do artigo está disponível na página da disciplina. Base de dados: fica a cargo dos alunos, mas uma boa sugestão são usar Treilers de filmes no YouTube. Artigos sugeridos para Trabalhos Relacionados também estão disponíveis. Todo o Material deverá ser atualizado no DropBox. Fica Livre para os alunos poderem sugerir, se preferirem novo: título, objetivo, Artigos-bases, modos de experimentos e linguagem de implementação, e até uma nova estrutura para artigo diferente da sugerida pelo professor. Data da entrega: 13 de Outubro de 2010 TTP-I Assunto: Visão de Baixo Nível Equipe CAP: Celso, André e Puff O artigo consta do tema de Registros de Imagens Médicas explorando o tema Entropia NãoExtensiva em imagens de ultra-som, Dicom, Raio-x, RM, ou outras sugeridas. Uma sugestão do título e estrutura do artigo está disponível na página da disciplina. Base de dados: disponível com o Professor Artigos sugeridos para Trabalhos Relacionados também estão disponíveis. Todo o Material deverá ser atualizado no DropBox. Fica Livre para os alunos poderem sugerir, se preferirem novo: título, objetivo, Artigos-bases, modos de experimentos e linguagem de implementação, e até uma nova estrutura para artigo diferente da sugerida pelo professor. Data da entrega: 13 de Outubro de 2010