TRACTS
TRAJECTORY CLASSIFICATION
USING TIME SERIES
Aluno: Irineu Junior Pinheiro dos Santos
Orientador: Luis Otávio de Campos Álvares
ESTRUTURA DE APRESENTAÇÃO
 Introdução;
Conceitos Utilizados;
 O Método TRACTS;
 Experimentos Realizados;
 Conclusão.

2/54
INTRODUÇÃO – MOTIVAÇÃO

Grande disponibilidade de dados de trajetórias:
GPS;
 Celulares (triangulação e GPS);
 RFID;


Análise dos padrões comportamentais dos objetos
móveis a partir de suas trajetórias.
3/54
INTRODUÇÃO – MOTIVAÇÃO


Diversos trabalhos tem sido propostos para
realizar análise de dados espaço-temporais;
Poucos tem utilizado o conceito de classificação.
4/54
INTRODUÇÃO – OBJETIVO DO TRABALHO
5/54
ESTRUTURA DE APRESENTAÇÃO
Introdução;
 Conceitos
Utilizados;
Trabalhos Relacionados;
 O Método TRACTS;
 Experimentos Realizados;
 Conclusão.

6/54
CONCEITOS – TRAJETÓRIA
7/54
CONCEITOS - CLASSIFICAÇÃO


Produzir um modelo
de classificação;
Classificar novos
registros.
8/54
CONCEITOS - CLASSIFICAÇÃO

Avaliação do modelo
usando a Matriz de
Confusão, gerando
métricas:
Acurácia;
 Erro;
 Taxa de VP;
 Taxa de VN

9/54
CONCEITOS – SÉRIES TEMPORAIS


Séries temporais consistem de sequência de
valores ou eventos obtidos sobre repetidas
medidas de tempo;
Muitas aplicações envolvendo séries temporais
tem sido utilizadas.
10/54
CONCEITOS – SÉRIES TEMPORAIS –
TRANSFORMAÇÕES
Discrete Fourier transform (DFT) (Faloutsos et.
al., 1994 );
 Piecewise linear e Piecewise constant models
(PAA) (Chakrabarti et. al, 2002);
 Haar Wavelet (Haar, 1910).
 Adaptative piecewise constant approximation
(APCA) (Geurts, 2001);

11/54
CONCEITOS – SAX

Realiza o tratamento
de séries temporais:
Facilita a mineração
de dados através do
uso de árvores de
sufixo, hashing,
modelos de markov,
etc;
 Permite o uso de
algoritmos de
processamento de
texto e de
bioinformática.

12/54
CONCEITOS – SAX
Primeiro é realizada a
conversão da série
temporal para uma
representação PAA;
 Após, é realizada a
conversão da
representação PAA
para símbolos;
 Manter a
equiprobabilidade.

13/54
CONCEITOS – SAX –
MÚLTIPLAS SÉRIES TEMPORAIS
14/54
CONCEITOS –
BITMAPS DE SÉRIES TEMPORAL



Ou Time Series Bitmap (TSB), proposto por
(Kumar et. al., 2005) e permite o tratamento de
strings;
Transformar sequências de caracteres em mapas
de bits.
O tamanho da matriz de bits gerada é definido a
partir de dois parâmetros:
Dimensão ();
 Resolução ou Profundidade ();

15/54
CONCEITOS –
BITMAPS DE SÉRIES TEMPORAL

Três mapas de bits com dimensão  = 4 e três
profundidades distintas.
16/54
CONCEITOS –
BITMAPS DE SÉRIES TEMPORAL

Mapa de bits gerado para as strings c1: baccbdca
e c2: dcddaabb.
17/54
ESTRUTURA DE APRESENTAÇÃO
Introdução;
Conceitos Utilizados;
 Trabalhos
Relacionados;
O Método TRACTS;
 Experimentos Realizados;
 Conclusão.

18/54
TRABALHOS RELACIONADOS

Trabalhos focados para um domínio específico:

(Panagiotakis et. al., 2009): baseado na similaridade;


(Lee & Hoff, 2007): descobrir a atividade esportiva;


Além de uma grande necessidade de parametrização, necessita
de diversas trajetórias semelhantes para caracterizar uma
atividade esportiva;
(Zheng et. al., 2008): descobrir o meio de transporte;


Depende fortemente da relação espacial entre as trajetórias;
Apesar do bom processo de classificação, parte da acurácia é
dependente da semântica de transição específica entre meios de
transporte, prejudicando a sua generalização;
(García et. al., 2006): identificação do modo de voo;

O trabalho realiza com muita competência a classificação do
modo de voo a partir das trajetórias de aviões, mas os filtros de
Kalmam utilizados acabam sendo muito especializados nessa
tarefa, prejudicando também a generalização do método.
19/54
TRABALHOS RELACIONADOS
Um método geral foi proposto por (Lee, Han,
Gonzalez & Li, 2008), que introduziu o método
TraClass;
 O processo é dividido em duas etapas:

Clusterização;
 Classificação:

Trajectory Based (TB): Fornece rótulos de classe para
trajetória com base na etapa anterior;
 Region Based (RB): Descobre as regiões com maior número
de trajetórias de uma única classe, permitindo estabelecer
uma região para aquela classe.

20/54
TRABALHOS RELACIONADOS
Clusterização
Classificação
21/54
ESTRUTURA DE APRESENTAÇÃO
Introdução;
Conceitos Utilizados;
Trabalhos Relacionados;
O
Método TRACTS;
Experimentos Realizados;
 Conclusão.

22/54
O MÉTODO TRACTS


Objetivo: construir um método capaz de realizar
classificação de trajetórias utilizando algoritmos
tradicionais de classificação;
Problema: como utilizar algoritmos tradicionais
de classificação com dados espaço-temporais?
Formato (, , , , );
 Quais atributos?
 Quais classes?

23/54
O MÉTODO TRACTS
24/54
O MÉTODO TRACTS – PREPARAÇÃO



Formata os dados geográficos dos dispositivos de
rastreamento para um formato padrão
(, , , , );
Reconstrói as trajetórias de acordo com a
necessidade (ex.: segmenta as trajetórias);
Elimina os ruídos das trajetórias.
25/54
O MÉTODO TRACTS – CARACTERIZAÇÃO



Realiza a extração dos valores das características
da trajetória;
Fornece a semântica necessária para análise no
processo de classificação;
Quais devem ser as características extraídas de
cada uma das trajetórias do conjunto de dados?
26/54
O MÉTODO TRACTS – CARACTERIZAÇÃO

Trajetórias de objetos móveis sempre terão
algumas características espaço-temporais, tais
como velocidade, aceleração e direção.
27/54
O MÉTODO TRACTS – CARACTERIZAÇÃO

Características globais:
Comprimento;
 Duração;
 Deslocamento;


Características locais:
Velocidade entre dois pontos consecutivos;
 Aceleração entre duas velocidades consecutivas;
 Direção entre dois pontos consecutivos;
 Variação da direção entre duas direções consecutivas;

28/54
O MÉTODO TRACTS – CARACTERIZAÇÃO

Para cada uma das características locais, para
cada trajetória, é realizada a transformação dos
valores das características para séries temporais.
29/54
O MÉTODO TRACTS – TRANSFORMAÇÃO

Primeiramente, as séries temporais são
transformadas pelo método SAX:

Todas as séries temporais são normalizadas para
cada característica;

Cada série temporal é transformada em uma
sequência de caracteres.
30/54
O MÉTODO TRACTS – TRANSFORMAÇÃO

As sequências de caracteres são transformadas
em mapas de bits através do método TSB;
31/54
O MÉTODO TRACTS – TRANSFORMAÇÃO
Velocidade_aa: 15,38
 Velocidade_ab: 34,62
 Velocidade_ba: 30,77
 Velocidade_bb: 19,23

32/54
O MÉTODO TRACTS - TRANSFORMAÇÃO















Velocidade_a
Velocidade_b
Velocidade_c
Aceleração_a
Aceleração_b
Aceleração_c
Direção_a
Direção_b
Direção_c
...
Comprimento
Deslocamento
Duração
...
Classe
33/54
O MÉTODO TRACTS – CLASSIFICAÇÃO


Utiliza os atributos como entrada nos algoritmos
de classificação tradicionais;
O modelo de classificação é gerado e avaliado;

Podem ser gerados tantos modelos quanto forem
necessários, através da execução de diversos
algoritmos, até que seja gerado um modelo de
classificação com a acurácia esperada.
34/54
ESTRUTURA DE APRESENTAÇÃO
Introdução;
Conceitos Utilizados;
Trabalhos Relacionados;
O Método TRACTS;
 Experimentos

Realizados;
Conclusão.
35/54
EXPERIMENTOS REALIZADOS


A validação do método TRACTS foi realizada com
os mesmos dados do método proposto pelo grupo
de Jiawei Han (Lee et. al., 2008);
Foram utilizadas três bases de dados de
trajetórias:
Conjunto de trajetórias de três tipos de animais
distintos, rastreados por RFID;
 Trajetórias de navegação de dois barcos;
 Trajetórias de furacões.

36/54
EXPERIMENTOS REALIZADOS

A classe do conjunto de dados de animais era cada um
dos tipos de animais:




Nos dados dos barcos a classe foi o nome dos mesmos:



Alce;
Gado;
Veado;
Point Sur;
Point Lobos;
Para os furacões, a classe foi a força máxima atingida
por cada um dos furacões:





F1;
F2;
F3;
F4;
F5.
37/54
EXPERIMENTOS REALIZADOS
Para cada um dos conjunto de dados, as
trajetórias, no formato (, , , , ) foram
tratadas para eliminação de ruído e sofreram
processo de segmentação, conforme necessário;
 Foram extraídas as características de cada uma
das trajetórias (locais e globais);
 As características locais foram transformadas em
séries temporais, as quais sofreram um processo
de transformação pelo processo SAX e TSB;
 Foram montados os arquivos de entrada para a
ferramenta Weka e houve o processo de
classificação.

38/54
EXPERIMENTOS REALIZADOS – ARQUIVO
WEKA
39/54
EXPERIMENTOS REALIZADOS –
RESULTADO WEKA
40/54
EXPERIMENTOS REALIZADOS –
RESULTADOS
Domínio
# Trajetórias
# Pontos
# Séries
Temporais
Tempo
Geração
Animais
253
287134
1012
634,06s
Barcos
404
56622
1616
61,92s
Furacões
1367
39777
5468
161,89s
41/54
EXPERIMENTOS REALIZADOS –
RESULTADOS (ANIMAIS)
Configuraç
ão do
método
TRACTS.3.1
Total de
atributos
utilizados
16
Acurácia de
classificaçã
o
94,07%
Algoritmo utilizado
Kstar
Tempo geração do
modelo de
classificação
0,01
TRACTS.3.2
40
94,47%
Adaboost+BayesNet
0,6
TRACTS.3.3
112
95,26%
Bagging+SMO
3,6
TRACTS.3.4
328
95,65%
SMO
0,31
TRACTS.3.5
976
95,26%
SMO
0,42
TRACTS.3.6
2920
95,26%
SMO
0,69
TRACTS.4.1
20
97,23%
SMO
0,17
TRACTS.4.2
68
95,26%
Bagging+RandomForest
2,8
TRACTS.4.3
260
96,05%
Bagging+SMO
5,5
TRACTS.4.4
1028
95,65%
Bagging+SMO
16,5
TRACTS.4.5
4100
92,89%
SMO
0,89
TRACTS.5.1
24
94,47%
Adaboost+J48
1,6
TRACTS.5.2
104
95,65%
Adaboost+NaiveBayes
1,6
TRACTS.5.3
504
96,05%
SMO
0,34
TRACTS.5.4
2504
95,26%
SMO
0,66
TRACTS.7.1
32
94,86%
Bagging+SMO
2,8
TRACTS.7.2
200
96,44%
Bagging+SMO
5,5
TRACTS.7.3
1376
95,65%
SMO
0,47
TRACTS.7.4
Média
9608
-
94,07%
95,24%
SMO
2,01
-
2,45
Tam. alfabeto
profundidade
42/54
EXPERIMENTOS REALIZADOS – MELHORES
RESULTADOS DO MÉTODO TRACTS
Domínio
Config.
TRACTS
#
Atributos
Acurácia
Classif.
Algoritmo
Tempo
Animais
TRACTS.4.1
20
97,23%
SMO
0,17s
Barcos
TRACTS.3.2
39
100%
NaiveBayes
0,01s
Furacões TRACTS.4.3
260
71,24%
AODEsr
0,44s
43/54
EXPERIMENTOS REALIZADOS –RESULTADO
COMPARATIVO
Método
Animais
TRACTS
97,23%
TraClass RB-TB
83,30%
TraClass TB-Only 50,00%
Acurácia
Barcos
Furacões
100,00%
71,24%
98,20%
73,10%
84,40%
65,40%
Média
89,49%
84,87%
66,60%
44/54
EXPERIMENTOS REALIZADOS

Os motivos principais para a dificuldade de
classificação das trajetórias de furacões foram:
A classe de toda a trajetória era definida pelo
comportamento de parte dela;
 O domínio de dados era formado por objetos móveis
da natureza, ou seja, com comportamento caótico.


Nos domínios onde existia um comportamento
racional do objeto móvel, a acurácia de
classificação das trajetórias foi claramente
superior;
45/54
ESTRUTURA DE APRESENTAÇÃO
Introdução;
Conceitos Utilizados;
Trabalhos Relacionados;
O Método TRACTS;
Experimentos Realizados;
 Conclusão.
46/54
CONCLUSÃO
O método TRACTS demonstrou-se eficaz na
tarefa de criar um modelo de classificação com
boa acurácia;
 De forma geral o método foi superior a um outro
método proposto para o mesmo fim, sem
comprometimento da propriedade de
independência de domínio considerado.

47/54
CONCLUSÃO – CONTRIBUIÇÕES



Primeiro método de classificação de trajetórias
que transforma trajetórias em séries temporais;
Utilização de algoritmos tradicionais de
classificação para realizar a construção de
modelos de classificação de trajetórias;
Manter uma boa independência quanto ao
domínio considerado no conjunto de dados,
possibilitando uma análise pura das
características da trajetória.
48/54
CONCLUSÃO – PUBLICAÇÕES

Esse trabalho resultou no seguinte artigo
publicado:

Santos, I.P., & Alvares, L.O. (2011). TRACTS: Um
método para a classificação de trajetórias de objetos
móveis usando séries temporais. 8º Encontro
Nacional de Inteligencia Artificial (ENIA) – CSBC,
Proceedings (pp. 800-808). Natal, Brasil: Springer.
49/54
CONCLUSÃO – TRABALHOS FUTUROS
Estudo em outros domínios de aplicação,
utilizando outras características geométricas da
trajetória (locais e globais);
 Busca de novos métodos de tratamento de
strings, além do TSB, que também possibilitem a
detecção de padrões interessantes a partir da
string gerada pelo método SAX;
 Submissão de artigo para uma revista
internacional.

50/54
CONCLUSÃO – REFERÊNCIAS







Chakrabarti, K., Keogh, E., Mehrotra, S., & Pazzani, M. (2002, Junho). Locally
adaptive dimensionality reduction for indexing large time series databases.
ACM Transactions on Database Systems , pp. 151–162.
Faloutsos, C., Ranganathan, M., & Manolopoulos, Y. (1994 ). Fast subsequence
matching in time-series databases. SIGMOD international conference on
Management of data, Proceedings (pp. 419–429). New York, NY, EUA: ACM.
Geurts, P. (2001). Pattern Extraction for Time Series Classification. European
Conference on Principles of Data Mining and Knowledge Discovery PKDD,
Proceedings (pp. 115–127). London, UK: Springer.
Kamber, M., & Han, J. (2006). Data Mining: Concepts and Techniques. San
Francisco, CA, EUA: Morgan Kaufmann.
Kumar, N., Lolla, V. N., Keogh, E., Lonardi, S., Ratanamahatana, C. A., & Wei,
L. (2005). Time-series Bitmaps: A Practical Visualization Tool for working with
Large Time Series Databases. 5th SIAM International Conference on Data
Mining - SDM'05, Proceedings (pp. 531-535). Newport Beach, CA, EUA: SIAM.
Lee, J.-G., Han, J., Gonzalez, H., & Li, X. (2008). TraClass: trajectory
classification using hierarchical region-based and trajectory-based clustering.
VLDB Endowment (pp. 1081-1094). Auckland, Nova Zelândia: VLDB
Endowment.
Lonardi, S. (2001). Global detectors of unusual words: design implementation
and applications to pattern discovery in biosequences. Department of
Computer Sciences, Purdue University.
51/54
ESTRUTURA DE APRESENTAÇÃO
Introdução;
Conceitos Utilizados;
Trabalhos Relacionados;
O Método TRACTS;
Experimentos Realizados;
Conclusão.
52/54
TRACTS
TRAJECTORY CLASSIFICATION
USING TIME SERIES
PERGUNTAS?
Aluno: Irineu Junior Pinheiro dos Santos
Orientador: Luis Otávio de Campos Álvares
EXPERIMENTOS REALIZADOS –
RESULTADOS
Domínio
Tamanho Alfabeto SAX
Tempo Geração
Animais
3
5260,02s
Animais
7
5327,01s
Barcos
3
218,21s
Barcos
7
208,62s
Furacões
3
395,12s
Furacões
7
433,95s
54/54
EXPERIMENTOS REALIZADOS –
RESULTADOS
Domínio
Alfabeto SAX
Profundidade
Tempo Geração
Animais
3
1
88,06s
Animais
7
4
1180,94s
Barcos
3
1
19,58s
Barcos
7
4
1097s
Furacões
3
1
4,12s
Furacões
7
4
1132,96s
55/54
Download

slides2