Sistemas para Informação Geo-Referenciada DEI-IST 2009/2010 Informação geo-referenciada... Corpo Docente Bruno Martins (responsável) Gabriel Pestana Algoritmos e estruturas de dados para informação geo-referenciada Processamento de texto considerando critérios geográficos Aplicações de sistemas de informação geo-referenciada Alinhamento com aspectos de “negócio” José Borbinha Interoperabilidade em sistemas para informação geo-referenciada Modelação de sistemas para informação geo-referenciada Organização das aulas Aulas teóricas Introdução de conceitos fundamentais Resumos das aulas são elementos de avaliação Apenas se número de alunos inscritos >= 5 Aulas de laboratório Introdução a ferramentas de software Apoio a realização de projectos Reuniões semanais individuais se < 5 alunos Avaliação Realização de projecto durante o semestre Projecto individual se < 5 alunos Propostas de projectos no site da cadeira 50% relatório 25% revisão do estado da arte 25% descrição da implementação 40% qualidade da concretização 10% apresentação (final do semestre) Programa Aspectos cognitivos no processamento de informação geográfica Conceitos fundamentais sobre sistemas de informação geográfica Interoperabilidade entre sistemas de informação geográfica Geo-referenciação com recurso a sistemas de coordenadas Geo-referenciação através de nomes de ruas e nomes de locais Gestão de informação geográfica e geo-referenciada Prospecção e recuperação de texto, de acordo com a geografia Visualização de informação geográfica e geo-referenciada Desafios à gestão de informação geográfica e geo-referenciada Aspectos cognitivos no processamento de informação geográfica Modelos formais são um requisito para aplicações computacionais. Noções intuitivas sobre “geografia” documentadas formalmente. Conceitos de “naive geography” de Egenhofer e Mark (1995) “...naive geography is the body of knowledge that people have about the surrounding geographic world.” Existência de factores que influenciam a percepção/distorção das distâncias A topologia é fundamental, a métrica serve para refinar ... Leis fundamentais das “ciências da informação geográfica” Lei de Tobler ou “1ª Lei da Geografia” "Everything is related to everything else, but near things are more related than distant things." Conceitos fundamentais sobre sistemas de informação geográfica Desafios na representação da informação geográfica e geo-referenciada, para efeitos do seu processamento computacional. Modelos de representação : “raster” versus “vectorial”. Conceitos fundamentais de geometria computacional. Operações sobre layers de informação. Interoperabilidade entre sistemas de informação geográfica Esforços em curso no sentido de normalizar o acesso e a partilha de dados nos sistemas para informação geográfica. Normas do Open Geospatial Consortium OGC Simple Features e Geographic Objects specifications Geography Markup Language e Keyhole Markup Language Normas do OGC para Geographic Web Services Web Mapping Services, Web Feature Services, ... Infra-estruturas de Dados Geo-espaciais Geo-referenciação com recurso a sistemas de coordenadas Sistemas de “mapeamento” da Terra que permitem representar a superfície do planeta através de um sistema (esférico) de coordenadas. Sistemas de coordenadas geográficas e suas propriedades. Projecção cartográfica. Factores que influencíam a qualidade da geo-referenciação: Resolução, ... Geo-referenciação através de nomes de ruas e nomes de locais Forma mais comum de geo-referenciar informação é através do uso de moradas e nomes de locais. Como converter esta informação de geo-referenciação (i.e., vaga) em informação formalmente geo-referenciada (i.e., coordenadas) para aplicações computacionais. Bases de dados de locais (i.e., gazetteers) Geo-codificação de endereços Relação com as normas actuais do OGC Gestão de informação geográfica e geo-referenciada Desafios computacionais inerentes ao armazenamento e manipulação eficiente de informação geo-referenciada. Algoritmos de geometria/topologia computacional Operações elementares de geo-estatística Operações estáticas, problemas de queries geométricas, ... Superfícies de interpolação, ... Estruturas de dados para acesso a informação geográfica Árvores R, Quad-Trees, ... Prospecção e recuperação de texto, de acordo com propriedades geográficas Como processar e pesquisar informação textual de acordo com critérios geográficos. Prospecção de texto para aplicações geográficas Reconhecimento e desambiguação de ocorrências de nomes de locais em documentos textuais. Detecção e monitorização “geográfica” de tópicos em documentos. Motores de busca “geográficos” Indexação de informação e processamento de interrogações. Estimativas da “relevância geográfica” de documentos. Visualização de informação geográfica e geo-referenciada Introdução a técnicas de visualização específicas para informação geo-referenciada. Cartografia temática para visualização de informação Mapas de cloropletas, cartogramas, ... Utilização de “globos virtuais” em visualização de informação geo-referenciada Google Earth, Microsoft Virtual Earth, Nasa Worldwind, ... Desafios à gestão de informação geográfica e geo-referenciada Sistemas de informação geográfica deixaram de pertencer ao domínio exclusivo de especialistas. Novos tipos de utilizadores e novas aplicações na Web: Informação geográfica de origem “voluntária” National Spatial Data Infrastructures OpenSteetMaps Aplicações estilo ”Augmented Reality Maps” Questões de qualidade e de confiança na informação Processamento de um volume crescente de informação Parte 2 PROPOSTAS DE PROJECTOS Propostas de projectos no Fénix Extracting gazetteer footprints from satellite imagery Handling placenames in map images Finding Interesting sites with basis on Flickr Data Finding the boundaries of vague regions with basis on Flickr Data Finding city pathways with basis on Flickr Data Geographic Disambiguation of Search Engine Queries Spatio-Temporal Theme Pattern Mining over Twitter Data Extracting Gazetteer Information from the Web Spatio-Temporal Clustering of Blog Data ... Tópico de Projecto: Extracting gazetteer footprints from satellite imagery Refinar as descrições das áreas geográficas associadas aos conceitos armazenados em gazetteers, através da análise de imagens de satélite. Reconhecer features geográficas em imagens. Componente forte de processamento de imagens. Integrating gazetteers and remote sensed imagery http://doi.acm.org/10.1145/1463434.1463467 Tópico de Projecto : Spatio-Temporal Theme Pattern Mining over Twitter Data Encontrar sub-tópicos nos textos e analisar os seus padrões geotemporais, por exemplo através de modelos probabilísticos de tópicos. Reconhecer tópicos e locais mencionados nos documentos. Componente forte em modelos probabilísticos para text mining e spatial data mining (e.g., Probabilistic Latent Semantic Indexing) A probabilistic approach to geotemporal mining on webblogs Mining geographic knowledge using location aware topic model http://doi.acm.org/10.1145/1135777.1135857 http://doi.acm.org/10.1145/1316948.1316967 GeoFolk: Latent Spatial Semantics in Web 2.0 Social Media http://www.wsdm-conference.org/2010/proceedings/docs/p281.pdf Tópico de Projecto : Geographic Disambiguation of Search Engine Queries Detectar quando é que uma querie tem um intuito geográfico, e reconhecer qual a área geográfica de interesse. Queries podem não mencionar locais explicitamente. Reconhecer locais nas queries e/ou no texto dos resultados retornados por um motor de busca para as queries a classificar. Classificar queries e desambiguar locais. Categorizing web queries according to geographical locality http://doi.acm.org/10.1145/956863.956925 Query Parsing Task for GeoCLEF2007 http://clef-campaign.org/2007/working_notes/LI_OverviewCLEF2007.pdf Tópicos de Projecto : Geographic Analysis of Flickr data Várias aplicações podem tomar como base a análise de grandes conjuntos de fotos com anotações geo-temporais: Encontrar as extensões geográficas para áreas/conceitos vagos. Encontrar percursos frequentemente utilizados. Encontrar áreas de interesse (e respectivos tópicos) dentro de cidades. Data mining sobre grandes volumes de dados. Mapping the world's photos Modelling vague places with knowledge from the Web http://doi.acm.org/10.1145/1526709.1526812 http://dx.doi.org/10.1080/13658810701850547 Trajectory clustering: a partition-and-group framework http://doi.acm.org/10.1145/1247480.1247546 Tópico de Projecto : Extracting Gazetteer Information from the Web Aquisição de gazetteers, de forma (semi-)automática, através de prospecção de informação na Web. Reconhecimento de locais numa grande de documentos Web. Abordagens estilo bootstrapping. Inferência dos footprints geográficos (e temporais) associados. Semi-supervised learning of geo. gazetteers from the internet http://dx.doi.org/10.3115/1119394.1119397 Tópico de Projecto : Handling placenames in map images Permitir a indexação e a pesquisa de mapas digitalizados (i.e., imagens) através de nomes de locais ou de regiões geográficas. Uso de técnicas de OCR para reconhecimento de nomes nos mapas. Desambiguação dos nomes reconhecidos nos mapas. Componente forte de processamento de imagens. Toponym Recognition in Scanned Color Topographic Maps http://doi.ieeecomputersociety.org/10.1109/ICDAR.2007.25 Mining maps and their automatic region-time-theme classification http://portal.acm.org/citation.cfm?id=1517468 Tópico de Projecto : Mining textual travelogues and associating them to images Prospecção de informação geo-temporal em documentos com relatos de viagens, por forma a associar segmentos do texto a coordenadas e a fotos no site de partilha de fotos Flickr. Reconhecer e desambiguar nomes e locais em textos. Medir a similaridade entre fotos e segmentos de texto. Visualizing textual travelogue with location-relevant images http://portal.acm.org/citation.cfm?id=1629890.1629904 Generating location overviews with images and tags by mining user-generated travelogues http://portal.acm.org/citation.cfm?id=1631418 Software a ser usado Java Topology Suite PostgreSQL + PostGIS http://flickrj.sourceforge.net/ LingPipe Text Mining API http://www.xmlmind.com/qizx/ Flickr Java API http://dev.mysql.com/doc/refman/5.0/en/spatial-extensions.html QizX XQuery Engine http://postgis.refractions.net/ MySQL with Spatial Extensions http://sourceforge.net/projects/jts-topo-suite/ http://alias-i.com/lingpipe/ Java Advanced Imaging API http://java.sun.com/javase/technologies/desktop/media/jai/ Outros serviços a utilizar Geoplanet World Gazetteer Yahoo! Geo Technologies (e.g., GeoPlanet, PlaceMaker) http://www.flickr.com/services/ Serviços Geográficos do SAPO http://developer.yahoo.com/geo/ Flickr Services API http://www.geonames.org/ http://services.sapo.pt/Metadata/Service/GIS?culture=PT Google Maps API http://code.google.com/apis/maps/ Questões?