Sistemas para Informação
Geo-Referenciada
DEI-IST 2009/2010
Informação geo-referenciada...
Corpo Docente

Bruno Martins (responsável)



Gabriel Pestana



Algoritmos e estruturas de dados para informação geo-referenciada
Processamento de texto considerando critérios geográficos
Aplicações de sistemas de informação geo-referenciada
Alinhamento com aspectos de “negócio”
José Borbinha


Interoperabilidade em sistemas para informação geo-referenciada
Modelação de sistemas para informação geo-referenciada
Organização das aulas

Aulas teóricas

Introdução de conceitos fundamentais
 Resumos das aulas são elementos de avaliação
 Apenas se número de alunos inscritos >= 5

Aulas de laboratório

Introdução a ferramentas de software
 Apoio a realização de projectos
 Reuniões semanais individuais se < 5 alunos
Avaliação

Realização de projecto durante o semestre

Projecto individual se < 5 alunos
 Propostas de projectos no site da cadeira

50% relatório

25% revisão do estado da arte
 25% descrição da implementação
40% qualidade da concretização
 10% apresentação (final do semestre)

Programa

Aspectos cognitivos no processamento de informação geográfica

Conceitos fundamentais sobre sistemas de informação geográfica

Interoperabilidade entre sistemas de informação geográfica

Geo-referenciação com recurso a sistemas de coordenadas

Geo-referenciação através de nomes de ruas e nomes de locais

Gestão de informação geográfica e geo-referenciada

Prospecção e recuperação de texto, de acordo com a geografia

Visualização de informação geográfica e geo-referenciada

Desafios à gestão de informação geográfica e geo-referenciada
Aspectos cognitivos no processamento
de informação geográfica

Modelos formais são um requisito para aplicações computacionais.
Noções intuitivas sobre “geografia” documentadas formalmente.

Conceitos de “naive geography” de Egenhofer e Mark (1995)


“...naive geography is the body of knowledge that people have about the
surrounding geographic world.”




Existência de factores que influenciam a percepção/distorção das distâncias
A topologia é fundamental, a métrica serve para refinar
...
Leis fundamentais das “ciências da informação geográfica”

Lei de Tobler ou “1ª Lei da Geografia”

"Everything is related to everything else, but near things are more related than
distant things."
Conceitos fundamentais sobre
sistemas de informação geográfica

Desafios na representação da informação
geográfica e geo-referenciada, para efeitos do
seu processamento computacional.

Modelos de representação : “raster” versus “vectorial”.
Conceitos fundamentais de geometria computacional.
Operações sobre layers de informação.


Interoperabilidade entre sistemas de
informação geográfica

Esforços em curso no sentido de normalizar o acesso e a
partilha de dados nos sistemas para informação geográfica.

Normas do Open Geospatial Consortium



OGC Simple Features e Geographic Objects specifications
Geography Markup Language e Keyhole Markup Language
Normas do OGC para Geographic Web Services


Web Mapping Services, Web Feature Services, ...
Infra-estruturas de Dados Geo-espaciais
Geo-referenciação com recurso
a sistemas de coordenadas

Sistemas de “mapeamento” da Terra que permitem
representar a superfície do planeta através de um
sistema (esférico) de coordenadas.


Sistemas de coordenadas geográficas e suas propriedades.
Projecção cartográfica.

Factores que influencíam a qualidade da geo-referenciação:

Resolução, ...
Geo-referenciação através de nomes
de ruas e nomes de locais

Forma mais comum de geo-referenciar informação é
através do uso de moradas e nomes de locais.

Como converter esta informação de geo-referenciação
(i.e., vaga) em informação formalmente geo-referenciada
(i.e., coordenadas) para aplicações computacionais.

Bases de dados de locais (i.e., gazetteers)
Geo-codificação de endereços
Relação com as normas actuais do OGC


Gestão de informação geográfica e
geo-referenciada

Desafios computacionais inerentes ao armazenamento e
manipulação eficiente de informação geo-referenciada.

Algoritmos de geometria/topologia computacional


Operações elementares de geo-estatística


Operações estáticas, problemas de queries geométricas, ...
Superfícies de interpolação, ...
Estruturas de dados para acesso a informação geográfica

Árvores R, Quad-Trees, ...
Prospecção e recuperação de texto, de
acordo com propriedades geográficas

Como processar e pesquisar informação textual de
acordo com critérios geográficos.

Prospecção de texto para aplicações geográficas

Reconhecimento e desambiguação de ocorrências de nomes de locais
em documentos textuais.
 Detecção e monitorização “geográfica” de tópicos em documentos.

Motores de busca “geográficos”

Indexação de informação e processamento de interrogações.
 Estimativas da “relevância geográfica” de documentos.
Visualização de informação
geográfica e geo-referenciada

Introdução a técnicas de visualização específicas para
informação geo-referenciada.

Cartografia temática para visualização de informação


Mapas de cloropletas, cartogramas, ...
Utilização de “globos virtuais” em visualização de
informação geo-referenciada

Google Earth, Microsoft Virtual Earth, Nasa Worldwind, ...
Desafios à gestão de informação
geográfica e geo-referenciada

Sistemas de informação geográfica deixaram de pertencer
ao domínio exclusivo de especialistas.

Novos tipos de utilizadores e novas aplicações na Web:




Informação geográfica de origem “voluntária”


National Spatial Data Infrastructures
OpenSteetMaps
Aplicações estilo ”Augmented Reality Maps”
Questões de qualidade e de confiança na informação
Processamento de um volume crescente de informação
Parte 2
PROPOSTAS DE PROJECTOS
Propostas de projectos no Fénix

Extracting gazetteer footprints from satellite imagery

Handling placenames in map images

Finding Interesting sites with basis on Flickr Data

Finding the boundaries of vague regions with basis on Flickr Data

Finding city pathways with basis on Flickr Data

Geographic Disambiguation of Search Engine Queries

Spatio-Temporal Theme Pattern Mining over Twitter Data

Extracting Gazetteer Information from the Web

Spatio-Temporal Clustering of Blog Data

...
Tópico de Projecto: Extracting gazetteer
footprints from satellite imagery

Refinar as descrições das áreas geográficas associadas
aos conceitos armazenados em gazetteers, através da
análise de imagens de satélite.


Reconhecer features geográficas em imagens.
Componente forte de processamento de imagens.

Integrating gazetteers and remote sensed imagery

http://doi.acm.org/10.1145/1463434.1463467
Tópico de Projecto : Spatio-Temporal
Theme Pattern Mining over Twitter Data

Encontrar sub-tópicos nos textos e analisar os seus padrões geotemporais, por exemplo através de modelos probabilísticos de tópicos.


Reconhecer tópicos e locais mencionados nos documentos.
Componente forte em modelos probabilísticos para text mining e
spatial data mining (e.g., Probabilistic Latent Semantic Indexing)

A probabilistic approach to geotemporal mining on webblogs


Mining geographic knowledge using location aware topic model


http://doi.acm.org/10.1145/1135777.1135857
http://doi.acm.org/10.1145/1316948.1316967
GeoFolk: Latent Spatial Semantics in Web 2.0 Social Media

http://www.wsdm-conference.org/2010/proceedings/docs/p281.pdf
Tópico de Projecto : Geographic
Disambiguation of Search Engine Queries

Detectar quando é que uma querie tem um intuito geográfico, e
reconhecer qual a área geográfica de interesse.


Queries podem não mencionar locais explicitamente.
Reconhecer locais nas queries e/ou no texto dos resultados
retornados por um motor de busca para as queries a classificar.
Classificar queries e desambiguar locais.

Categorizing web queries according to geographical locality



http://doi.acm.org/10.1145/956863.956925
Query Parsing Task for GeoCLEF2007

http://clef-campaign.org/2007/working_notes/LI_OverviewCLEF2007.pdf
Tópicos de Projecto : Geographic
Analysis of Flickr data

Várias aplicações podem tomar como base a análise de grandes
conjuntos de fotos com anotações geo-temporais:

Encontrar as extensões geográficas para áreas/conceitos vagos.
 Encontrar percursos frequentemente utilizados.
 Encontrar áreas de interesse (e respectivos tópicos) dentro de cidades.

Data mining sobre grandes volumes de dados.

Mapping the world's photos


Modelling vague places with knowledge from the Web


http://doi.acm.org/10.1145/1526709.1526812
http://dx.doi.org/10.1080/13658810701850547
Trajectory clustering: a partition-and-group framework

http://doi.acm.org/10.1145/1247480.1247546
Tópico de Projecto : Extracting Gazetteer
Information from the Web

Aquisição de gazetteers, de forma (semi-)automática, através de
prospecção de informação na Web.

Reconhecimento de locais numa grande de documentos Web.
Abordagens estilo bootstrapping.
Inferência dos footprints geográficos (e temporais) associados.



Semi-supervised learning of geo. gazetteers from the
internet

http://dx.doi.org/10.3115/1119394.1119397
Tópico de Projecto : Handling placenames in
map images

Permitir a indexação e a pesquisa de mapas digitalizados (i.e., imagens)
através de nomes de locais ou de regiões geográficas.


Uso de técnicas de OCR para reconhecimento de nomes nos mapas.
Desambiguação dos nomes reconhecidos nos mapas.
Componente forte de processamento de imagens.

Toponym Recognition in Scanned Color Topographic Maps



http://doi.ieeecomputersociety.org/10.1109/ICDAR.2007.25
Mining maps and their automatic region-time-theme classification

http://portal.acm.org/citation.cfm?id=1517468
Tópico de Projecto : Mining textual travelogues
and associating them to images

Prospecção de informação geo-temporal em documentos com
relatos de viagens, por forma a associar segmentos do texto a
coordenadas e a fotos no site de partilha de fotos Flickr.


Reconhecer e desambiguar nomes e locais em textos.
Medir a similaridade entre fotos e segmentos de texto.

Visualizing textual travelogue with location-relevant images


http://portal.acm.org/citation.cfm?id=1629890.1629904
Generating location overviews with images and tags by mining
user-generated travelogues

http://portal.acm.org/citation.cfm?id=1631418
Software a ser usado

Java Topology Suite


PostgreSQL + PostGIS


http://flickrj.sourceforge.net/
LingPipe Text Mining API


http://www.xmlmind.com/qizx/
Flickr Java API


http://dev.mysql.com/doc/refman/5.0/en/spatial-extensions.html
QizX XQuery Engine


http://postgis.refractions.net/
MySQL with Spatial Extensions


http://sourceforge.net/projects/jts-topo-suite/
http://alias-i.com/lingpipe/
Java Advanced Imaging API

http://java.sun.com/javase/technologies/desktop/media/jai/
Outros serviços a utilizar

Geoplanet World Gazetteer


Yahoo! Geo Technologies (e.g., GeoPlanet, PlaceMaker)


http://www.flickr.com/services/
Serviços Geográficos do SAPO


http://developer.yahoo.com/geo/
Flickr Services API


http://www.geonames.org/
http://services.sapo.pt/Metadata/Service/GIS?culture=PT
Google Maps API

http://code.google.com/apis/maps/
Questões?
Download

Apresentação da disciplina