Classificação de Padrões
Vetores de características e espaços de
estados
Classificação de Padrões
Funções discriminantes
Classificação de Padrões
Técnicas de classificação: vizinho mais
próximo
Classificação de Padrões
Medidas de distância entre vetores
• Distância de Hamming =
• Distância Euclidiana =
 (| x  y |)
i
i
2
 n
  ( xi  y ) 
i 
 i 1
Classificação de Padrões
Classificadores lineares
•
Técnicas estatísticas: classificação Bayesiana
• Importante técnica analítica que facilita o entendimento da
natureza estatística dos dados
• Baseia-se na teoria estatística de probabilidades e
probabilidades condicionais
• Em reconhecimento de padrões, medições são feitas sobre os
padrões (componentes do vetor de características) a fim de
se obter uma estimativa da probabilidade de um padrão
pertencer a uma classe particular.
• Mais formalmente, seja Gi (i=1,2,...,n) a lista de possíveis
grupos ou classes, define-se a probabilidade de um padrão
pertencer a uma classe como sendo P(Gi), onde 0  P(Gi)  1
• O uso de probabilidades condicionais permite a inclusão de
conhecimento prévio sobre o problema de forma a melhorar
a estimativa de um padrão pertencer a uma dada classe
• Dados dois eventos X e Y, a probabilidade condicional é
definida como sendo a probabilidade do evento Y dada a
ocorrência do evento X: P(Y |X)
• Em reconhecimento de padrões, o conhecimento prévio que é
combinado com a função de probabilidade da classe são as
medições de dados obtidas para o padrão, ou seja, o vetor de
características X = (x1, x2 , ..., xn )
• Assim, o problema de classificação de padrões pode ser
enunciado como: Considerando um conjunto de medições, X,
qual é a probabilidade dele pertencer à classe Gi , ou seja
P(Gi |X) ?
Regra de Bayes
• Decida por x pertencer à classe i se:
P(Gi |X) > P(Gj |X)
para i=1,2,...,n
ij
• Como estimar as probabilidades condicionais?
 Fazendo suposições sobre os dados de padrões
 Descrevendo distribuições desconhecidas através de modelos
 Dado que se sabe que o padrão deva pertencer a um dos n
grupos, então define-se a probabilidade de se se obter aquele
padrão em cada um dos grupos P(X | Gi)
 P(Gi |X) = P(X | Gi ) . P(Gi) / (
j
P(X | Gj) . P(Gj) )
Outras técnicas estatísticas
• EM algorithm: Expectation-Maximisation
• Support Vector Machines
Download

Classificação