identificaÇÃodepadrÕesde itinerÁriosedepontos ...€¦ · brenonaodikusunoki...

44
BRENO NAODI KUSUNOKI IDENTIFICAÇÃO DE PADRÕES DE ITINERÁRIOS E DE PONTOS INTERMEDIÁRIOS EM DADOS ESPAÇO-TEMPORAIS UTILIZANDO BUSCA POR SIMILARIDADE LONDRINA–PR 2013

Upload: others

Post on 11-Oct-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

BRENO NAODI KUSUNOKI

IDENTIFICAÇÃO DE PADRÕES DEITINERÁRIOS E DE PONTOS

INTERMEDIÁRIOS EM DADOSESPAÇO-TEMPORAIS UTILIZANDO BUSCA

POR SIMILARIDADE

LONDRINA–PR

2013

Page 2: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca
Page 3: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

BRENO NAODI KUSUNOKI

IDENTIFICAÇÃO DE PADRÕES DEITINERÁRIOS E DE PONTOS

INTERMEDIÁRIOS EM DADOSESPAÇO-TEMPORAIS UTILIZANDO BUSCA

POR SIMILARIDADE

Trabalho de Conclusão de Curso apresentadoao curso de Bacharelado em Ciência da Com-putação da Universidade Estadual de Lon-drina para obtenção do título de Bacharel emCiência da Computação

Orientador: Prof. Dr. Daniel dos Santos Kas-ter

LONDRINA–PR

2013

Page 4: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

Breno Naodi KusunokiIDENTIFICAÇÃO DE PADRÕES DE ITINERÁRIOS E DE PONTOS IN-

TERMEDIÁRIOS EM DADOS ESPAÇO-TEMPORAIS UTILIZANDO BUSCAPOR SIMILARIDADE/ Breno Naodi Kusunoki. – Londrina–PR, 2013-

Orientador: Prof. Dr. Daniel dos Santos Kaster

– Universidade Estadual de Londrina, 2013.

1. Busca por similaridade. 2. Trajetória padrão. 3. Itinerário padrão. I.Prof. Dr. Daniel dos Santos Kaster II. Universidade Estadual de Londrina. III.Faculdade de Ciência da Computação. IV. IDENTIFICAÇÃO DE PADRÕES DEITINERÁRIOS E DE PONTOS INTERMEDIÁRIOS EM DADOS ESPAÇO-TEMPORAIS UTILIZANDO BUSCA POR SIMILARIDADE.

CDU 02:141:005.7

Page 5: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

BRENO NAODI KUSUNOKI

IDENTIFICAÇÃO DE PADRÕES DEITINERÁRIOS E DE PONTOS

INTERMEDIÁRIOS EM DADOSESPAÇO-TEMPORAIS UTILIZANDO BUSCA

POR SIMILARIDADE

Trabalho de Conclusão de Curso apresentadoao curso de Bacharelado em Ciência da Com-putação da Universidade Estadual de Lon-drina para obtenção do título de Bacharel emCiência da Computação

BANCA EXAMINADORA

Prof. Dr. Daniel dos Santos KasterUniversidade Estadual de Londrina

Orientador

Prof. Dr. Segundo Membro da BancaUniversidade/Instituição do Segundo

Membro da Banca

Prof. Msc. Terceiro Membro da BancaUniversidade/Instituição do Terceiro

Membro da Banca

Londrina–PR, 24 de novembro de 2013

LONDRINA–PR2013

Page 6: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca
Page 7: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

Dedico este trabalho aos meus pais, Catarina e Paulo, que me deram todo o suporte queprecisei até o presente momento.

Page 8: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca
Page 9: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

AGRADECIMENTOS

Agradeço primeiramente aos meus pais, Catarina e Paulo, por todo apoio e dedi-cação que contribuiram para a conclusão deste trabalho.

Ao meu orientador, professor Dr. Daniel dos Santos Kaster, pelo grande apoio,orientação e principalmente pela grande oportunidade que ele me deu em conjunto como Giovani Benedetti Penha e a Veltec Soluções Tecnológicas S/A.

Agradeço a Izabel da secretaria acadêmica do CCE, por esclarecer as dúvidasreferentes à todo tipo de documentação durante a graduação e também agradeço a ValdeteMatos por todo apoio e momentos de descontração.

A todos que me ajudaram durante a graduação e principalmente ao Arthur Henri-que Coutinho, Marcos Okamura, Luiz Guilherme Castilho Martins, Rafael Seidi Shigue-oka, Ernesto Yuiti Saito e Hélio Albano de Oliveira que ajudaram e me acompanharamdurante os últimos anos da graduação.

Por fim, agradeço a todos os professores e funcionários do departamento que de-sempenham suas funções em sua totalidade.

Page 10: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca
Page 11: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

Todas as vitórias ocultam uma abdicação. (Simone de Beauvoir)

Page 12: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca
Page 13: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

KUSUNOKI, B. N.. IDENTIFICAÇÃO DE PADRÕES DE ITINERÁ-RIOS E DE PONTOS INTERMEDIÁRIOS EM DADOS ESPAÇO-TEMPORAIS UTILIZANDO BUSCA POR SIMILARIDADE. 42 p.Trabalho de Conclusão de Curso (Graduação). Bacharelado em Ciência daComputação – Universidade Estadual de Londrina, 2013.

RESUMO

O problema de reconhecimento de padrões é extremamente difundido e exis-tem inúmeros trabalhos que abordam esse problema e suas variantes. Esta pesquisaconsistirá na busca de padrões de itinerários e de pontos intermediários em dadosespaço-temporais utilizando busca por similaridade e técnicas de mineração de da-dos. A principal motivação para esta pesquisa é a possibilidade de solucionar umproblema real, referente ao problema de reconhecimento de padrões, de uma em-presa de rastreamento de veículos onde o processo de se encontrar esses padrõesé manual e oneroso. O objetivo final é o reconhecimento dos padrões que foramcitados anteriormente de forma automática.

Palavras-chave: Busca por similaridade. Trajetória padrão. Itinerário pa-drão.

Page 14: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca
Page 15: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

KUSUNOKI, B. N.. PATTERN RECOGNITION OF ITINERARIESAND INTERMEDIATE POINTS IN SPATIO-TEMPORAL DATAUSING SIMILARITY SEARCH.. 42 p. Final Project (Undergraduation).Bachelor of Science in Computer Science – State University of Londrina, 2013.

ABSTRACT

The problem of pattern recognition is extremely widespread and exist inmany works dealing with this problem and their variants. The research will consistin finding itinerary and intermediate point patterns in space-temporal data usingsimilarity search and data mining techniques. The main motivation for this researchis the possibility to solve real problems, about the pattern recognition problem ofa vehicle tracking company where the process to find these patterns is manual andexpensive. The final objective is the pattern recognition that were mentioned earlierautomatically.

Keywords: Similarity search. Trajectory pattern. Itinerary pattern.

Page 16: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca
Page 17: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

LISTA DE ILUSTRAÇÕES

Figura 1 – Visualização de um ponto no mapa. . . . . . . . . . . . . . . . . . . . . 29Figura 2 – Direcional habilitado (a) e Direcional desligado (b) . . . . . . . . . . . 30Figura 3 – Ilustração das regiões . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31Figura 4 – Saída do programa de visualização utilizando R. . . . . . . . . . . . . . 32Figura 5 – A visualização do programa desenvolvido com Google Maps. . . . . . . 33Figura 6 – Visualização dos pontos iniciais e finais dos itinerários cadastrados. . . 34Figura 7 – Trajetória com ruídos (a) e Itinerário cadastrado (b) . . . . . . . . . . 34Figura 8 – Ilustração dos pontos classificados . . . . . . . . . . . . . . . . . . . . . 37

Page 18: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca
Page 19: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

LISTA DE TABELAS

Tabela 1 – Experimento com 2 bases de dados da mesma empresa em número depontos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

Tabela 2 – Experimento com 2 bases de dados da mesma empresa em porcentagens 38Tabela 3 – Experimento utilizando conjuntos de empresas distintas em número de

pontos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38Tabela 4 – Experimento utilizando conjuntos de empresas distintas em porcentagens 39

Page 20: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca
Page 21: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

LISTA DE ABREVIATURAS E SIGLAS

API Application Programming Interface.

GPS Global Positioning System.

GIS Geographic Information System.

Page 22: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca
Page 23: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

SUMÁRIO

1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231.1 Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231.2 Objetivos e contribuições . . . . . . . . . . . . . . . . . . . . . . . . . . . 241.3 Organização do trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

2 FUNDAMENTAÇÃO TEÓRICA . . . . . . . . . . . . . . . . . . . . . 252.1 Trabalhos correlatos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252.2 Conceitos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

2.2.1 Geoprocessamento . . . . . . . . . . . . . . . . . . . . . . . . . . 262.2.2 Mineração de dados . . . . . . . . . . . . . . . . . . . . . . . . . . 262.2.3 Busca por similaridade . . . . . . . . . . . . . . . . . . . . . . . . 262.2.4 Dados espaço-temporais . . . . . . . . . . . . . . . . . . . . . . . 27

3 DESENVOLVIMENTO . . . . . . . . . . . . . . . . . . . . . . . . . . . 293.1 Definições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.1.1 Coordenada geográfica . . . . . . . . . . . . . . . . . . . . . . . . 293.1.2 Ponto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293.1.3 Posição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293.1.4 Trajetória . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303.1.5 Itinerário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303.1.6 Direcional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303.1.7 Constante de mapa . . . . . . . . . . . . . . . . . . . . . . . . . . 313.1.8 Região . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.2 Pré-processamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323.3 Experimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3.3.1 Avaliação de métodos de classificação existentes no Weka . . . . . 363.3.1.1 Análise dos resultados utilizando bases de dados distintas 36

Referências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

Page 24: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca
Page 25: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

23

1 INTRODUÇÃO

Na última década a utilização de técnicas de geoprocessamento cresceu substanci-almente. Este crescimento pode ser observado pelo grande número de ferramentas criadascomo Google Earth [1], Google Maps [2], ArcGIS [3] que podem ser utilizadas na car-tografia, fotogrametria, geoestatística, banco de dados geográficos, WebMapping1, SIGe auxiliando também em tomadas de decisão fundamentadas nas informações extraídasatravés das ferramentas citadas.

Atualmente, existem diversas soluções que fornecem o rastreamento e gerencia-mento de veículos de forma inteligente visando a diminuição de gastos com manutenções,combustível, pneus, entre outros fatores que poderiam ser evitados com o uso corretodo veículo. A pesquisa está ambientada na área de buscas por similaridade em dadosespaço-temporais e será baseada em um problema real que ocorre em uma dessas soluçõesexistentes no mercado.

1.1 MOTIVAÇÃO

A motivação da pesquisa é que no sistema que existe hoje no qual será aplicadoo resultado desta pesquisa, grande parte das funcionalidades como o gerenciamento erastreamento dos veículos dependem do cadastramento manual e exaustivo dos itineráriosa serem percorridos pelos veículos, pois sem esses itinerários delineados previamente,não é possível inferir se o veículo está percorrendo o trajeto correto, se o mesmo estána velocidade correta para o trecho, se o motorista está gastando combustível além donecessário, entre outras conclusões.

O problema consiste em encontrar itinerários padrões a partir de uma base dedados espaço-temporais e efetuar a extração de pontos intermediários, que podem serpontos de ônibus de tranporte coletivo ou paradas obrigatórias em viagens interestaduais,dos itinerários identificados de forma automática. Esses dados são gerados a partir deveículos que possuem um módulo de GPS que envia posições a cada um minuto e quarentae cinco segundos ou em intervalos menores quando o direcional do módulo está ativado. Odirecional é uma configuração do módulo que quando habilitada, o veículo passa a reportaruma maior quantidade de posições quando o mesmo efetua curvas com mais de vinte ecinco graus. Essas posições que descrevem em que localidade o automóvel se encontra noglobo terrestre contêm informações como latitude, longitude, data em que foi enviada,velocidade do veículo, direção em graus, eventos como ignição ligada ou desligada, portaaberta ou fechada, entre outras. Essas posições são enviadas para um gateway onde são1 WebMapping é o processo de criação, implementação e geração de mapas para World Wide Web.

Page 26: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

24 Capítulo 1. INTRODUÇÃO

processadas e persistidas em sistemas de gerenciamento de banco de dados relacionais eque são utilizadas pelo software existente para efetuar o gerenciamento e rastreamento deveículos.

1.2 OBJETIVOS E CONTRIBUIÇÕES

O principal objetivo a ser desenvolvido neste trabalho de conclusão de curso éobter uma solução que encontre os itinerários e pontos intermediários padrões de talforma que essa solução seja extraída dos dados espaço-temporais e processada gerandoas trajetórias de cada itinerário juntamente com os respectivos pontos intermediários deforma automática.

Primeiramente, existe a necessidade de efetuar um pré-processamento para separaros dados que só foram inseridos para teste dos que realmente foram enviados pelos veículos,filtrar todas as posições quando o direcional estava ligado nos veículos e retirar possíveisruídos que possam ser derivados da má configuração do módulo que envia as posições ouaté mesmo ocasionados por alguma falha no hardware.

Um dos objetivos específicos é o reconhecimento dos pontos onde cada itineráriocomeça e termina, para que se possa delimitar todas as trajetórias que passam por essespontos e também identificar e remover outliers.

Outro objetivo seria a identificação de regiões semelhantes entre as trajetórias parainferir se determinadas regiões são pontos intermediários ou são somente pontos de tráfegointenso em determinados horários. Por fim a identificação dos pontos intermediários decada itinerário padrão reconhecido, que podem ser pontos de transporte coletivo de deter-minada linha de ônibus, locais de entrega de mercadorias, pontos de parada em viagensinterestaduais, entre otros.

1.3 ORGANIZAÇÃO DO TRABALHO

No capítulo 2 será apresentado toda a fundamentação teórica para este trabalhode conclusão de curso e alguns trabalhos correlacionados a proposta de pesquisa; nocapítulo 3 será apresentado todo o desenvolvimento do trabalho, contendo a descriçãodetalhada do problema, juntamente com as definições de cada componente da proposta depesquisa, descrição do pré-processamento dos dados, a proposta de solução do problema,as dificuldades encontradas e experimentos realizados.

Page 27: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

25

2 FUNDAMENTAÇÃO TEÓRICA

2.1 TRABALHOS CORRELATOS

Através de uma simples análise dos dados espaço-temporais pode-se retirar diver-sas informações de objetos em movimento como velocidade, aceleração, trajetória entredeterminado espaço de tempo. Assim, existe a possibilidade de se agrupar essas informa-ções de tal forma que se possa distinguir quais trajetórias foram desenvolvidas por carros,caminhões, ônibus, motocicletas ou pedestres. Esta classificação das trajetórias é feitaanalisando a variação da velocidade, aceleração e o intervalo em que a velocidade variadurante o decorrer da trajetória [4].

Shaw e Gopalan[5] têm como objetivo, encontrar os padrões de trajetórias maisfrequentes em um banco de dados relacional que é alimentado por um arquivo de textocontendo as coordenadas. Esse trabalho utiliza uma modificação do algoritmo de associ-ação chamado Apriori para extraír as coordenadas mais frequentes da base de dados.

Zheng, Wei e Peng[6] propõem uma forma de se inferir as rotas mais popularesatravés de um conjunto de trajetórias incertas geradas por aplicações de geolocalizaçãocomo Foursquare1, Flickr2 e trajetórias feitas por taxis. Neste trabalho foi utilizado umgrafo roteável, onde os vértices são as posições geográficas, as arestas indicam o tempo decada trajeto entre 2 vértices e um algoritmo denomidado de top-k que obtem as k rotasmais utilizadas.

Existem outros trabalhos como de Wen [7] que cria um método que obtem as rotasregulares de uma base de dados que contem históricos das trajetórias já feitas por usuárioscom objetivo de obter mais informações sobre o comportamento das pessoas, recomendarroteiros de viagens de acordo com as rotas obtidas pelo método podendo assim melhorar aexperiência do turista durante a viagem e como consequência disso uma maior satisfaçãodo cliente.

O trabalho de Fontes e Bogorny [8] propõe um método de detecção de anomaliasem trajetórias entre determinadas regiões delimitadas por polígonos no espaço geográfico,que leva em consideração a duração da trajetória, alinhamento do tempo dos pontos emrelação as demais trajetórias e verificando se a distância de cada ponto não está a umadistância maior que um determinado limiar.

Outro trabalho relacionado ao reconhemento de padrões entre trajetórias utili-

1 Foursquare é um aplicativo que permite ao utilizador indicar onde se encontra e procurar por lugarespróximos de seu interesse.

2 O Flickr é um site da web de hospedagem e partilha de imagens, que possibilita indicar em que lugaras fotos foram tiradas.

Page 28: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

26 Capítulo 2. FUNDAMENTAÇÃO TEÓRICA

zando uma método que utiliza comparações entre objetos que estiveram no mesmo lugare em instantes muito próximos [9].

Aplicação de métodos que fazem o alinhamento de posições de GPS enviados pelousuário à malha rodoviária, obtendo as trajetórias com uma baixa taxa de amostragemde posições [10]. O artigo [11] utiliza um método de clusterização para agrupar rotasrealizadas por táxis com objetivo de identificar outliers que podem ser rotas fraudulentasque têm maiores distâncias em relação as rotas comumente utilizadas para se ir à umdeterminado lugar.

2.2 CONCEITOS

Antigamente, as informações como a disposição das malhas ferroviárias e dos re-cursos minerais em determinada região eram armazenadas somente em documentos emapas em papel. Com o advento da tecnologia, foi possível transcrever e armazenar essasinformações em ambiente computacional de tal forma que as mesmas pudessem ser repre-sentadas e analisadas com maior facilidade. Desta maneira, surgiu o geoprocessamento.Com o aumento das informações coletadas e o avanço no armazenamento de grandesquantidades de dados, surgiu a necessidade de se ter formas de se processar e extrairinformações relevantes de forma automática que antes eram desconhecidas, a partir disso,surgiu a mineração de dados.

2.2.1 Geoprocessamento

Geoprocessamento é um processo que utiliza técnicas com fundamentação matemá-tica e computacional para o processamento dos dados geográficos e que vem influenciandode forma crescente várias áreas como cartografia, telecomunicações, transportes, planeja-mento urbano, análise de recursos naturais possibilitando assim o processamento, análisee tomadas de decisão baseadas nas informações retiradas desses dados [12].

2.2.2 Mineração de dados

Mineração de dados é o processo automático de descoberta de informações úteisem grandes quantidades de dados que não eram conhecidas antes da aplicação das técnicasde extração de informações relevantes da base de dados [13].

2.2.3 Busca por similaridade

A busca por similaridade surgiu da necessidade de se ter consultas mais inteligen-tes, que possam comparar dados complexos e estabelecer relações de similaridade entre

Page 29: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

2.2. Conceitos 27

eles. Esse tipo de busca pode ser utilizado para verificar semelhanças entre imagens, ví-deos, séries temporais, dados genéticos, entre outros dados complexos [14].

Uma das aplicações da busca por similaridade é a detecção de semelhanças entreimagens médicas como ressonância magnética, mamografia e tomografia. Essa busca podeauxiliar o diagnóstico do paciente, pois o médico pode recuperar imagens semelhantes dabase de dados, comparar com a do paciente e verificar os diagnósticos de cada imagemrecuperada ajudando o médico na tomada de decisão e no prognóstico [15, 16].

2.2.4 Dados espaço-temporais

Antes, pesquisas em modelos de dados espaciais e temporais eram desenvolvidasseparadamente, atualmente essas pesquisas estão correlacionadas. Quando existe a inte-gração de espaço e tempo, temos dados geométricos evoluindo ao longo do tempo. Embanco de dados existem três abstrações fundamentais de dados espaço-temporais, pontosque descrevem a localização de um objeto, linhas que descrevem conexões no espaço oua evolução de determinados objetos no espaço-tempo que podem ser representadas comopolilinhas e regiões onde a medida é relevante representadas por polígonos [17].

Page 30: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca
Page 31: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

29

3 DESENVOLVIMENTO

3.1 DEFINIÇÕES

Nesta seção serão apresentadas as definições e os termos utilizados neste trabalhode conclusão de curso.

3.1.1 Coordenada geográfica

As coordenadas (a latitude e a longitude) de um ponto sobre a superfície da Terra,se referem ao equador e a um meridiano-origem. No âmbito deste trabalho a latitude serárepresentada por 𝑥 é a latitude por 𝑦.

3.1.2 Ponto

Um ponto 𝑝𝑡 é composto por 2 coordenadas geográficas(𝑥 e 𝑦). A figura 1 mostracomo é representado o ponto no mapa.

Figura 1 – Visualização de um ponto no mapa.

3.1.3 Posição

Uma posição 𝑝 é composta pelo identificador, o identificador do veículo, data e horaem que foi enviada, latitude, longitude, direção do veículo em relação ao globo terrestreno instante em que a posição foi enviada, velocidade do veículo, valor que indica se oveículo está com a ignição ligada ou desligada no momento do envio da posição e o tipode posição.

Page 32: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

30 Capítulo 3. DESENVOLVIMENTO

3.1.4 Trajetória

Uma trajetória, no contexto deste trabalho, é a evolução de um objeto no espaçoem um determinado intervalo de tempo e pode ser definida por uma sequência finitade posições ordenadas cronologicamente, 𝑡𝑟𝑎𝑗𝑖 : 𝑝𝑖

1 → 𝑝𝑖2 → · · · → 𝑝𝑖

𝑛, cada posição𝑝𝑖

𝑘 ∈ 𝑡𝑟𝑎𝑗𝑖.

3.1.5 Itinerário

No âmbito deste trabalho um itinerário 𝑖𝑡 é definido como uma lista ordenadafinita de pontos, 𝑖𝑡𝑗 : 𝑝𝑡𝑗

1 → 𝑝𝑡𝑗2 → · · · → 𝑝𝑡𝑗

𝑛, onde 𝑝𝑡𝑗1 é o ponto inicial e o 𝑝𝑡𝑗

𝑛 é o final.

3.1.6 Direcional

O direcional é uma configuração do módulo que quando habilitada, o veículo passaa reportar uma maior quantidade de posições quando o mesmo efetua curvas com mais devinte e cinco graus. Essa configuração existe para que se possa possa se delinear curvas commaior precisão, pois sem ela o veículo envia uma posição a cada 1 minuto e 45 segundos.A figura 2 ilustra as posições enviadas com o direcional habilitado e com a configuraçãodesligada.

( a ) ( b )

Figura 2 – Direcional habilitado (a) e Direcional desligado (b)

Page 33: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

3.1. Definições 31

3.1.7 Constante de mapa

A constante de mapa C, também chamada de grau geodésico, é um valor aproxi-mado resultante da divisão da circunferência da terra, que é de aproximadamente quarentamil quilômetros, por trezentos e sessenta graus que resulta em um valor aproximado de111,111 quilômetros. O cálculo feito está apresentado em 3.1.

C = 40.000360

∼= 111, 111 . . . (3.1)

3.1.8 Região

É um quadrado definido por dois pontos, onde cada lado tem tamanho △𝑥. Nafigura 3 é mostrado algumas regiões plotadas no mapa, as regiões em verde demonstramque a região tem entre 3 à 10 pontos, as laranjas contêm de 11 à 20 pontos, as vermelhasde 21 à 30 pontos e as pretas têm no mínimo 31 pontos ou mais.

Figura 3 – Ilustração das regiões

Page 34: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

32 Capítulo 3. DESENVOLVIMENTO

3.2 PRÉ-PROCESSAMENTO

Para facilitar a compreensão do problema foi desenvolvido um programa de visu-alização dos dados geográficos, inicialmente o software de visualização dos dados espaço-temporais começou a ser desenvolvido utilizando o programa R [18], programa utilizadopara computação estatística e construção de gráficos, mas com a grande quantidade dedados, em torno de milhões de posições geográficas, o desempenho do mesmo não foisatisfatório e também o R não tem mapas nativos com informações detalhadas comomalhas rodoviárias e cidades. A figura 4 ilustra o resultado do processamento dos dadosgeográficos pelo programa desenvolvido utilizando o R.

−22.79 −22.78 −22.77 −22.76 −22.75 −22.74 −22.73

−4

7.2

1−

47

.20

−4

7.1

9−

47

.18

−4

7.1

7−

47

.16

−4

7.1

5−

47

.14

Raw data

x

y

Figura 4 – Saída do programa de visualização utilizando R.

Uma alternativa escolhida foi desenvolver o programa utilizando as APIs do Google[2], visto que as APIs proporcionam mais opções personalizadas para visualização dos

Page 35: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

3.2. Pré-processamento 33

dados, permitindo plotar pontos, polígonos e polilinhas no mapa. A figura 5 mostra asaída do programa escrito utilizando o Google Maps.

Figura 5 – A visualização do programa desenvolvido com Google Maps.

Mas como o Google Maps tem restrições de utilização do mesmo na criação detrabalhos derivados do conteúdo ou de qualquer parte da API, optou-se por desenvolverutilizando tecnologias open source1 como Open Street Maps [19], Play Framework [20] ea biblioteca de javascript Leaflet [21]. A figura 6 mostra a visualização dos pontos iniciaisdos itinerários cadastrados no sistema em verde e os finais em vermelho.

Existe a necessidade de se pré-processar os dados, pois na base de dados existemdiversos ruídos que podem ser posições inseridas para teste da aplicação, posições du-plicadas, posições com características especiais que só existem depois do cadastramentomanual dos itinerários, posições incorretas devida a falha na configuração do módulo queenvia as posições ou até mesmo por falha de hardware.

A extração das trajetórias feitas pelos veículos dos pontos enviados pelos mesmosfoi efetuada através do algoritmo 1.

1 O termo open source, ou código aberto em português, foi criado pela OSI (Open Source Initiative) erefere-se a software também conhecido por software livre.

Page 36: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

34 Capítulo 3. DESENVOLVIMENTO

Figura 6 – Visualização dos pontos iniciais e finais dos itinerários cadastrados.

(a) (b)

Figura 7 – Trajetória com ruídos (a) e Itinerário cadastrado (b)

Page 37: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

3.2. Pré-processamento 35

Algoritmo 1: Construção das trajetóriasEntrada: 𝑐[ ]← vetor com as posições dos veículosSaída : 𝑣[ ]← vetor de trajetórias𝑝← próxima posição de 𝑐[ ]enquanto existir posições em 𝑐[ ] faça

se 𝑝 é uma posição cuja ignição está desligada então𝑡← nova trajetória;𝑡.𝑣𝑒𝑡𝑜𝑟𝐷𝑒𝑃𝑜𝑠𝑖𝑐𝑜𝑒𝑠[ ]← 𝑝;𝑝← próxima posição de 𝑐[ ]enquanto 𝑝 for do mesmo veículo de 𝑡 e a ignição estiver ligadafaça

𝑡.𝑣𝑒𝑡𝑜𝑟𝐷𝑒𝑃𝑜𝑠𝑖𝑐𝑜𝑒𝑠[ ]← 𝑝;𝑝← próxima posição de 𝑐[ ]

fim enqto𝑣[ ]← 𝑡

fim sesenão

𝑝← próxima posição do conjuntofim se

fim enqto

Page 38: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

36 Capítulo 3. DESENVOLVIMENTO

3.3 EXPERIMENTOS

Nesta seção será mostrado alguns experimentos realizados na busca por uma so-lução para o problema.

3.3.1 Avaliação de métodos de classificação existentes no Weka

Objetivo deste experimento é classificar os pontos enviados pelos veículos comopontos de interesse, neste caso pontos iniciais ou finais. Este primeiro experimento foirealizado da seguinte forma, primeiramente houve a necessidade de se classificar o conjuntode dados A, com base nos pontos iniciais e finais já cadastrados no sistema. A classificaçãoconsistiu em comparar cada posição do conjunto A com cada ponto de interesse cadastradono sistema e verificar se estavam a 50 metros de distância se determinado ponto estiver amenos de 50 metros ele é classificado como um ponto de interesse, caso contrário o mesmonão é um ponto de interesse.

O segundo passo foi utilizar o conjunto de dados A como entrada para os algoritmosde classificação contidos no Weka gerando assim um modelo de classificação baseado nosdados classificados do conjunto de dados A e o terceiro passo foi utilizar um outro conjuntode dados B para testar o modelo de classificação analisando a acurácia do mesmo.

Os conjuntos de dados são da mesma empresa mas de meses distintos e cadaconjunto de dados possui 100.000 posições. Os atributos utilizados para gerar o modelode classificação foram data, direção, velocidade, ignição, tipo e o atributo objetivo é sedeterminada posição é ou não um ponto inicial ou final.

Na figura 8 está demonstrado os resultados depois que o conjunto de dados B foiclassificado pelo modelo. O círculo preto representa um determinado ponto de interessecadastrado no sistema com raio de 50 metros. Os pontos verdes representam os pontosclassificados de maneira correta pelo modelo. Os círculos azuis são os pontos que não sãode interesse e o vermelho é uma posição que foi classificada erroneamente como sendo deinteresse pelo modelo de classificação.

A tabela 1 mostra os resultados obtidos utilizando diversos algoritmos de classifi-cação já implementados no programa Weka e a tabela 2 traz o resultado em porcentagem.

3.3.1.1 Análise dos resultados utilizando bases de dados distintas

O segundo experimento utiliza duas bases de dados de empresas distintas, cadauma com 100.000 posições e de meses distintos.

A tabela 3 mostra os resultados obtidos em número de pontos e a tabela 4 traz oresultado em porcentagem.

Page 39: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

3.3. Experimentos 37

Figura 8 – Ilustração dos pontos classificados

Nome do método Corretos Incorretos Positivos Negativos Falsos negativos Falsos positivos

Logistic 73335 26667 2328 71007 23630 3037

Attribute Selected Classifier 73376 26626 3012 70364 22946 3680

Bagging 73816 26186 6546 67270 19412 6774

Classification Via Regression 73465 26537 4386 69079 21572 4965

Filtered Classifier 73823 26179 1796 72027 24162 2017

Logit Boost 73323 26679 2938 70385 23020 3659

Multi Class Classifier 73335 26667 2328 71007 23630 3037

Random Committee 69760 30242 9401 60359 16557 13685

Random Sub Space 73613 26389 2331 71282 23627 2762

Decision Table 73295 26707 2455 70840 23503 3204

JRip 73860 26142 1342 72518 24616 1526

OneR 68733 31269 3602 65131 22356 8913

PART 73869 26133 2234 71635 23724 2409

J48 74064 25938 3642 70422 22316 3622

LMT 74012 25990 4122 69890 21836 4154

Random Forest 70862 29140 9135 61727 16823 12317

Random Tree 67910 32092 9467 58443 16491 15601

REP Tree 72167 27835 6989 65178 18969 8866

Tabela 1: Experimento com 2 bases de dados da mesma empresa em número de pontos

Page 40: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

38 Capítulo 3. DESENVOLVIMENTO

Nome do método Corretos Incorretos Positivos Negativos Falsos negativos Falsos positivos

Logistic 73.335% 26.667% 3.1744733% 96.82553% 88.6114% 11.388607%

AttributeSelectedClassifier 73.376% 26.626% 4.104884% 95.89512% 86.178925% 13.821077%

Bagging 73.816% 26.186% 8.867996% 91.132% 74.13122% 25.868786%

ClassificationViaRegression 73.465004% 26.537% 5.9701896% 94.02981% 81.290276% 18.709726%

FilteredClassifier 73.823% 26.179% 2.432846% 97.567154% 92.29535% 7.704649%

LogitBoost 73.323% 26.679% 4.0069284% 95.99307% 86.28509% 13.714907%

MultiClassClassifier 73.335% 26.667% 3.1744733% 96.82553% 88.6114% 11.388607%

RandomCommittee 69.76% 30.241999% 13.476205% 86.523796% 54.748363% 45.251637%

RandomSubSpace 73.613% 26.389% 3.1665602% 96.833435% 89.53352% 10.466482%

DecisionTable 73.295% 26.706999% 3.3494782% 96.65052% 88.00314% 11.996855%

JRip 73.86% 26.142002% 1.8169509% 98.183044% 94.16265% 5.83735%

OneR 68.733% 31.269% 5.2405686% 94.75943% 71.49573% 28.50427%

PART 73.869% 26.133001% 3.0242727% 96.97572% 90.78177% 9.21823%

J48 74.063995% 25.938002% 4.917369% 95.08263% 86.035934% 13.964069%

LMT 74.012% 25.99% 5.569367% 94.43063% 84.01693% 15.98307%

RandomForest 70.862% 29.14% 12.891253% 87.10875% 57.73164% 42.26836%

RandomTree 67.909996% 32.092% 13.94051% 86.059494% 51.386635% 48.61336%

REPTree 72.167% 27.835% 9.684482% 90.31552% 68.14802% 31.851986%

Tabela 2: Experimento com 2 bases de dados da mesma empresa em porcentagens

Nome do método Corretos Incorretos Positivos Negativos Falsos negativos Falsos positivos

Logistic 92667 7335 574 92093 5118 2217

Attribute Selected Classifier 93059 6943 569 92490 5123 1820

Bagging 92667 7335 574 92093 5118 2217

Classification Via Regression 91127 8875 755 90372 4937 3938

Filtered Classifier 92840 7162 549 92291 5143 2019

Logit Boost 92724 7278 584 92140 5108 2170

Multi Class Classifier 92667 7335 574 92093 5118 2217

Random Committee 84370 15632 1566 82804 4126 11506

Random Sub Space 93708 6294 328 93380 5364 930

Decision Table 88644 11358 606 88038 5086 6272

JRip 93585 6417 347 93238 5345 1072

OneR 80277 19725 885 79392 4807 14918

PART 92970 7032 260 92710 5432 1600

J48 91381 8621 709 90672 4983 3638

LMT 90828 9174 722 90106 4970 4204

Random Forest 85908 14094 1543 84365 4149 9945

Random Tree 82568 17434 1653 80915 4039 13395

REP Tree 88057 11945 1237 86820 4455 7490

Tabela 3: Experimento utilizando conjuntos de empresas distintas em número de pontos

Page 41: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

3.3. Experimentos 39

Nome do método Corretos Incorretos Positivos Negativos Falsos negativos Falsos positivos

Logistic 92.667% 7.3349996% 0.6194222% 99.38058% 69.77505% 30.224949%

Attribute Selected Classifier 93.059% 6.9430003% 0.61144006% 99.38856% 73.786545% 26.213451%

Bagging 92.667% 7.3349996% 0.6194222% 99.38058% 69.77505% 30.224949%

Classification Via Regression 91.127% 8.875% 0.82851404% 99.171486% 55.62817% 44.37183%

Filtered Classifier 92.84% 7.162% 0.59133995% 99.40866% 71.80955% 28.190449%

Logit Boost 92.724% 7.278% 0.6298262% 99.37018% 70.18412% 29.815882%

Multi Class Classifier 92.667% 7.3349996% 0.6194222% 99.38058% 69.77505% 30.224949%

Random Committee 84.37% 15.632001% 1.8561101% 98.14389% 26.394575% 73.60542%

Random Sub Space 93.708% 6.294% 0.35002348% 99.64998% 85.22402% 14.775976%

Decision Table 88.644% 11.358001% 0.68363345% 99.31637% 44.77901% 55.220993%

JRip 93.585% 6.4170003% 0.37078592% 99.62921% 83.29437% 16.705626%

OneR 80.277% 19.724998% 1.1024328% 98.89757% 24.370089% 75.62991%

PART 92.97% 7.032% 0.2796601% 99.720345% 77.24687% 22.753128%

J48 91.381004% 8.620999% 0.77587247% 99.22413% 57.80072% 42.19928%

LMT 90.828% 9.174% 0.79490906% 99.205086% 54.17484% 45.825157%

Random Forest 85.908005% 14.094% 1.7961075% 98.20389% 29.438057% 70.56194%

Random Tree 82.568% 17.434% 2.0019863% 97.99801% 23.167376% 76.83263%

REP Tree 88.057% 11.945001% 1.4047719% 98.59522% 37.29594% 62.704063%

Tabela 4: Experimento utilizando conjuntos de empresas distintas em porcentagens

Page 42: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca
Page 43: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

41

REFERÊNCIAS

1 GOOGLE Earth lets you fly anywhere on Earth to view satellite imagery, maps,terrain, 3D buildings, from galaxies in outer space to the canyons of the ocean.http://www.google.com/earth/index.html, 2013.

2 GOOGLE Maps has a wide array of APIs that let you embed the robustfunctionality and everyday usefulness of Google Maps into your own website.https://developers.google.com/maps, 2013.

3 ARCGIS - A platform for designing and managing solutions through the applicationof geographic knowledge. http://www.esri.com/software/arcgis, 2013.

4 DODGE, S.; WEIBEL, R.; FOROOTAN, E. Revealing the physics of movement:Comparing the similarity of movement characteristics of different types of movingobjects. Computers, Environment and Urban Systems, v. 33, n. 6, p. 419–434, 2009.

5 ARTHUR.A.SHAW; GOPALAN, N. Article: Frequent pattern mining of trajectorycoordinates using apriori algorithm. International Journal of Computer Applications,v. 22, n. 9, p. 1–7, May 2011. Published by Foundation of Computer Science.

6 WEI, L.-Y.; ZHENG, Y.; PENG, W.-C. Constructing popular routes from uncertaintrajectories. In: Proceedings of the 18th ACM SIGKDD international conference onKnowledge discovery and data mining. New York, NY, USA: ACM, 2012. (KDD ’12),p. 195–203. ISBN 978-1-4503-1462-6. Disponível em: <http://doi.acm.org/10.1145-/2339530.2339562>.

7 WEN et al. Mining regular routes from gps data for ridesharing recommendations.In: Proceedings of the ACM SIGKDD International Workshop on Urban Computing.New York, NY, USA: ACM, 2012. (UrbComp ’12), p. 79–86. ISBN 978-1-4503-1542-5.Disponível em: <http://doi.acm.org/10.1145/2346496.2346510>.

8 FONTES, V. C.; BOGORNY, V. Discovering semantic spatial and spatio-temporaloutliers from moving object trajectories. CoRR, abs/1303.5132, 2013.

9 PANAGIOTAKIS, C.; PELEKIS, N.; KOPANAKIS, I. Trajectory voting andclassification based on spatiotemporal similarity in moving object databases. In:Proceedings of the 8th International Symposium on Intelligent Data Analysis: Advancesin Intelligent Data Analysis VIII. Berlin, Heidelberg: Springer-Verlag, 2009. (IDA ’09),p. 131–142. ISBN 978-3-642-03914-0. Disponível em: <http://dx.doi.org/10.1007/978-3-642-03915-7 12>.

10 LOU, Y. et al. Map-matching for low-sampling-rate gps trajectories. In: Proceedingsof the 17th ACM SIGSPATIAL International Conference on Advances in GeographicInformation Systems. New York, NY, USA: ACM, 2009. (GIS ’09), p. 352–361. ISBN978-1-60558-649-6. Disponível em: <http://doi.acm.org/10.1145/1653771.1653820>.

11 GE, Y. et al. A taxi business intelligence system. In: Proceedings of the 17th ACMSIGKDD international conference on Knowledge discovery and data mining. New York,NY, USA: ACM, 2011. (KDD ’11), p. 735–738. ISBN 978-1-4503-0813-7. Disponível em:<http://doi.acm.org/10.1145/2020408.2020523>.

Page 44: IDENTIFICAÇÃODEPADRÕESDE ITINERÁRIOSEDEPONTOS ...€¦ · brenonaodikusunoki identificaÇÃodepadrÕesde itinerÁriosedepontos intermediÁriosemdados espaÇo-temporaisutilizandobusca

42 Referências

12 DAVIS MIGUEL VIEIRA MONTEIRO, G. C. e. C. Introdução à Ciência daGeoinformação. [S.l.: s.n.], 2001.

13 TAN, P.-N.; STEINBACH, M.; KUMAR, V. Introduction to Data Mining, (FirstEdition). Boston, MA, USA: Addison-Wesley Longman Publishing Co., Inc., 2005. ISBN0321321367.

14 FILHO, R. F. S. et al. Desmistificando o conceito de consultas por similaridade:A busca de novas aplicações na medicina. In: 2o Workshop de Informática Médica -WIM’2002. Gramado, RS: [s.n.], 2002. p. in CD–ROM.

15 PETRAKIS, E.; FALOUTSOS, C. Similarity searching in medical image databases.Knowledge and Data Engineering, IEEE Transactions on, v. 9, n. 3, p. 435–447, 1997.ISSN 1041-4347.

16 KASTER, D. dos S. Tratamento de condições especiais para busca por similaridadeem bancos de dados complexos. Tese (Doutorado) — Universidade de São Paulo, Institutode Ciências Matemáticas e de Computação, São Carlos, 2012.

17 ERWIG, M. et al. Spatio-temporal data types: An approach to modeling andquerying moving objects in databases. Geoinformatica, Kluwer Academic Publishers,Hingham, MA, USA, v. 3, n. 3, p. 269–296, set. 1999. ISSN 1384-6175. Disponível em:<http://dx.doi.org/10.1023/A:1009805532638>.

18 R is a free software environment for statistical computing and graphics.http://www.r-project.org, 2013.

19 OPENSTREETMAP (OSM) is a collaborative project to create a free editable mapof the world. http://www.openstreetmap.org, 2013.

20 PLAY is based on a lightweight, stateless, web-friendly architecture. Built on Akka,Play provides predictable and minimal resource consumption (CPU, memory, threads)for highly-scalable applications. http://www.playframework.com, 2013.

21 LEAFLET is a modern open-source JavaScript library for mobile-friendly interactivemaps. http://leafletjs.com, 2013.