Classificação de Padrões Vetores de características e espaços de estados Classificação de Padrões Funções discriminantes Classificação de Padrões Técnicas de classificação: vizinho mais próximo Classificação de Padrões Medidas de distância entre vetores • Distância de Hamming = • Distância Euclidiana = (| x y |) i i 2 n ( xi y ) i i 1 Classificação de Padrões Classificadores lineares • Técnicas estatísticas: classificação Bayesiana • Importante técnica analítica que facilita o entendimento da natureza estatística dos dados • Baseia-se na teoria estatística de probabilidades e probabilidades condicionais • Em reconhecimento de padrões, medições são feitas sobre os padrões (componentes do vetor de características) a fim de se obter uma estimativa da probabilidade de um padrão pertencer a uma classe particular. • Mais formalmente, seja Gi (i=1,2,...,n) a lista de possíveis grupos ou classes, define-se a probabilidade de um padrão pertencer a uma classe como sendo P(Gi), onde 0 P(Gi) 1 • O uso de probabilidades condicionais permite a inclusão de conhecimento prévio sobre o problema de forma a melhorar a estimativa de um padrão pertencer a uma dada classe • Dados dois eventos X e Y, a probabilidade condicional é definida como sendo a probabilidade do evento Y dada a ocorrência do evento X: P(Y |X) • Em reconhecimento de padrões, o conhecimento prévio que é combinado com a função de probabilidade da classe são as medições de dados obtidas para o padrão, ou seja, o vetor de características X = (x1, x2 , ..., xn ) • Assim, o problema de classificação de padrões pode ser enunciado como: Considerando um conjunto de medições, X, qual é a probabilidade dele pertencer à classe Gi , ou seja P(Gi |X) ? Regra de Bayes • Decida por x pertencer à classe i se: P(Gi |X) > P(Gj |X) para i=1,2,...,n ij • Como estimar as probabilidades condicionais? Fazendo suposições sobre os dados de padrões Descrevendo distribuições desconhecidas através de modelos Dado que se sabe que o padrão deva pertencer a um dos n grupos, então define-se a probabilidade de se se obter aquele padrão em cada um dos grupos P(X | Gi) P(Gi |X) = P(X | Gi ) . P(Gi) / ( j P(X | Gj) . P(Gj) ) Outras técnicas estatísticas • EM algorithm: Expectation-Maximisation • Support Vector Machines