SemanticGIS

Abgeschlossen
Am Projekt beteiligt: Frank Boochs (i3mainz), Steffen Staab (Universität Koblenz-Landau), Timo Homburg (i3mainz), Ana Roxin (Université de Bourgogne), Karl-Heinz Freckmann (geocom), Stefan Jäger (geomer), Falk Würriehausen (i3mainz), Christophe Cruz (Université de Bourgogne), Ashish Karmacharya (i3mainz) i3mainz, CC BY SA 4.0

Das SemGIS-Projekt zielt darauf ab, heterogene Daten zu interpretieren, indem es über eine semantische Schicht Interoperabilität zwischen ehemals unverbundenen räumlichen und nicht-räumlichen Datensätzen schafft. Anwendungen für diese semantische Schicht finden sich im Katastrophenmanagement, im Notfallmanagement und in der dezentralen grünen Energie.

Motivation

Die Aktivitäten im Jahr 2018 waren durch die Bereitstellung der ersten Version des SemGIS-Prototyps motiviert, um unseren Partner Geomer bei der Integration von Daten aus verschiedenen Quellen und der Anreicherung dieser Daten durch Linked Open Data zu unterstützen.

Während die Integration solcher Daten an sich von enormer Bedeutung ist, ist ein Aspekt der Integration, der oft vernachlässigt wird, die Qualität der integrierten heterogenen Daten. Mit Hilfe von Datenqualitätsmetriken lässt sich feststellen, ob die integrierten semantischen Daten für eine Vielzahl von Aufgaben geeignet sind, die der Endnutzer ausführen möchte. In der wissenschaftlichen Literatur werden qualitätsgesicherte Daten als Daten definiert, die die vom Endnutzer gestellten Anforderungen erfüllen. Die Zwecke von Daten können jedoch als multidimensional betrachtet werden, da Daten auf viele verschiedene Arten und in vielen verschiedenen Zusammenhängen verwendet werden können. Daher ist es wichtig, einen vom Anwendungsfall abhängigen Rahmen für die Bewertung der Datenqualität zu schaffen, um die integrierten semantischen Daten zu bewerten und Hinweise auf die situationsabhängige Nützlichkeit der Kartendaten für den Endnutzer mit Hilfe semantischer Technologien zu geben. Daneben ist es sinnvoll, eine zeitliche Perspektive einzunehmen. Könnten die Veränderungen von Kartendaten mit einem angepassten Algorithmus auf Basis des bisherigen Kartenverhaltens vorhergesagt werden, könnte ein Indikator für die zukünftige Kartenqualität gegeben werden, was die Zuverlässigkeit der Qualitätsbewertung deutlich erhöht. Insgesamt sollen die Möglichkeiten nicht nur integrierter, sondern auch qualitätsgesicherter integrierter Daten im Rahmen der Dissertation von Timo Homburg als Teil des SemGIS-Projekts erforscht werden.

Im Zusammenhang mit dem Anwendungsfall im Katastrophenmanagement hat die Untersuchung der bestehenden Systeme und Bedürfnisse des Katastrophenmanagements es ermöglicht, eine Grenze auf der Ebene der Aktionspläne und Richtlinien zu identifizieren, die für die Reaktion auf eine Katastrophe vorbereitet wurden. Sie werden nach ihrer Anwendung bei einer Katastrophe oder nach der Schulung der Akteure für den Katastrophenfall bewertet. Einige Tests der Pläne können jedoch ungeeignet oder mit hohen Kosten verbunden sein. Deshalb wollen wir ein Instrument bereitstellen, das die Prüfung von Aktionsplänen mit geringeren Kosten ermöglicht. Die Untersuchung bestehender Arbeiten hat es ermöglicht, ein solches Werkzeug durch ein Multi-Agenten-System zu bestimmen, um die Entscheidungsfindung von Einsatzkräften auf der Grundlage von vorbereiteten Plänen und Richtlinien entsprechend einer Katastrophensituation zu simulieren. Die Multi-Agenten-Simulation bietet einen Überblick über die Folgen dieser Entscheidungsfindung, was eine Bewertung der vorbereiteten Pläne und Leitlinien ermöglicht. Bestehende Multi-Agenten-Modelle sind jedoch auf einen bestimmten Anwendungsfall und die aus Simulationsexperimenten erwarteten Beobachtungen ausgerichtet. Sie sind daher kaum an unterschiedliche Planungssimulationen und unterschiedliche Experimente anpassbar. Aus diesem Grund wurde in der Doktorarbeit von Claire Prudhomme ein Verfahren zur automatischen Modellierung von Multi-Agenten-Systemen aus den im semantischen Informationssystem enthaltenen Informationen des Katastrophenmanagements vorgeschlagen, um die Katastrophenmanagement-Gemeinschaft bei der Erstellung von Aktionsplänen zu unterstützen.

Aktivitäten

SemGIS-Prototyp

Die Aktivitäten im Jahr 2018 lassen sich mit der Entwicklung von Anwendungsfällen für mehrere Kooperationspartner und der Entwicklung wesentlicher Werkzeuge zur Datenintegration und Qualitätssicherung zusammenfassen. Weitere Prototypen zur Datenintegration von Daten mit vordefinierten (und extrahierten) Ontologien wurden im Projekt von Frühjahr bis Sommer entwickelt. GMLImporter ermöglicht die automatisierte Konvertierung von relationalen Geodaten mit einer vordefinierten Ontologie. Im Rahmen eines Praktikums beim Projektpartner Geomer wurde ein weiterer Prototyp entwickelt, der es ermöglicht, Mapping-Schemata zu erstellen, um Datensatzspalten und ihre jeweiligen Werte nicht nur auf vordefinierte Klassen, sondern auch auf Werte abzubilden, die über SPARQL-Abfragen aus dem Semantic Web abgerufen werden können. Diese und andere Funktionen des Prototyps bieten allgemeinere Mittel zur Umwandlung von Geodaten in RDF als andere frühere Ansätze. Darüber hinaus wurden datenformatspezifische Ontologien weiterentwickelt und führten zur Zusammenarbeit mit dem Bundesamt für Kartographie und Geodäsie, das SemGIS beim Aufbau einer nationalen Linked-Data-Infrastruktur unterstützt. Darüber hinaus führte ein Austausch zwischen GeoNet MRN und der Firma EFTAS zur Integration und Unterstützung des XErleben-Formats für Points of Interest und zu einem möglichen neuen Projektvorschlag im Kontext des Tourismus.

Bewertung der Datenqualität

Von Januar bis März 2018 konzentrierte sich die Arbeit an dieser These auf die Veröffentlichung eines Posters auf der LBS-Konferenz in Zürich. Das Poster beleuchtet die Idee, einen Klassifikator für die Vorhersage von Kartenveränderungen zu entwickeln, mit dem Bereiche einer Karte identifiziert werden können, die möglicherweise Veränderungen unterworfen sind. Der Klassifikator kann als Mittel zur Messung der Unsicherheit in Kartendaten verwendet werden, was wiederum für viele Anwendungsfälle, die auf Kartendaten angewiesen sind, nützlich sein könnte. Im März 2018 wurde das Konzept der Datenqualitätsbewertung um Anforderungsprofile von Anwendungsfällen erweitert, die mithilfe einer Ontologie ausgedrückt und durch Schlussfolgerungen abgeleitet werden können. So ist es möglich, einen Anwendungsfall wie z.B. einen Feuerwehreinsatz semantisch zu definieren, diesen Fall mit Kartenanforderungen zu verknüpfen und diese Anforderungen anhand von vorberechneten Datenqualitätsmetriken zu überprüfen. Die Auswirkung dieser Datenqualitätsmetriken auf die Durchführbarkeit der gegebenen Aufgabe kann sowohl auf der Ebene der Kartenobjekte als auch durch Aggregation auf einer höheren Ebene mit Hilfe von Semantic Reasoning bewertet werden, was den Endnutzern die Möglichkeit gibt, zu prüfen, welche Teile einer Karte zur Durchführung einer bestimmten Operation verwendet werden können. Dieses Konzept wurde im Juli in Berlin auf dem BIS Quality Of Data Workshop vorgestellt und führte anschließend zu einer Veröffentlichung im Konferenzband. In der Zwischenzeit wurde an einer Zeitschriftenpublikation gearbeitet, um die WebIST-Publikation von 2017 zu erweitern. Hier wurde das WebIST-Papier von 2017 um die Idee erweitert, Datenqualitätsparameter in die automatisierte Extraktionsmethode einzubringen und um die Idee der thematischen Cluster, die zu einer Priorisierung von speziellen Inhalten im zu importierenden Datensatz führen. Diese Priorisierung ist wiederum anwendungsfallspezifisch und kann daher als Hinweis für einen Standardvorschlag zur Datenqualitätsbewertung für spezielle Arten von Geodaten verwendet werden. Eine weitere Publikation für die Fachzeitschrift SIGSPATIAL ist ebenfalls in Vorbereitung. Aufbauend auf der Veröffentlichung auf der LBS-Tagung in Zürich sollen zwei Städte in Thüringen auf ihre Eignung zur Veränderungsprognose getestet werden. Basierend auf den Gebäudegrundrissdaten der jeweiligen Städte und neueren OpenStreetMap-Daten desselben Gebiets wurden Datenqualitätsmetriken berechnet und als Merkmale für die Vorhersage einer Veränderung, Hinzufügung, Löschung oder Nichtveränderung der besagten Kartendaten verwendet. Vorläufige Ergebnisse deuten darauf hin, dass der Klassifikator insgesamt eine gute Genauigkeit bei der Identifizierung der vier Fälle aufweist, aber es wird noch daran gearbeitet, die Wiedererkennung der Klassifizierungen zu verbessern. In Vorbereitung eines neuen Projektantrags wurden mehrere Prototypen zur Demonstration der Datenintegration entwickelt und im SemGIS-Github-Repository veröffentlicht. Diese Prototypen implementieren Uplift- und Downlift-Funktionalität und können optional eine Datenqualitätsschicht enthalten, wie sie im Berliner Antrag vorgestellt wird.

Multiagentensimulation für das Katastrophenmanagement

Die vorangegangenen Forschungsjahre in diesem Teil des SemGIS-Projekts haben zur Entwicklung eines semantischen Modells für den Bereich des Katastrophenmanagements (2016) und eines Meta-Modells für die Multi-Agenten-Simulation geführt, das an die Simulation des Katastrophenmanagements angepasst ist (2017). Die Präsentation dieser Forschungen erfolgte 2018 durch eine Veröffentlichung im International Journal of Information Systems for Crisis Response and Management und eine Präsentation auf der Konferenz Spatial Analysis and GEOmatics (SAGEO) 2018. Auf der Grundlage des Multi-Agenten-Metamodells, das für die Anpassung an verschiedene Pläne des Katastrophenmanagements entwickelt wurde, wurden Forschungen durchgeführt, um einen Prozess zur automatischen Generierung einer Multi-Agenten-Simulation zu entwickeln, die spezifischen Experimenten gemäß dem informationsbezogenen Katastrophenmanagement (DM) entspricht. Dieser Prozess basiert auf einer Wissensbasis und einem Reasoner, der Wissen über Katastrophenmanagement und Wissen über Multi-Agenten-Simulation durch ihre semantischen Modelle verwendet. Der Prozess besteht aus drei Schritten: (i) Integration von spezifischem Wissen über das Katastrophenmanagement eines Verwaltungsgebiets, (ii) Durchführung von Schlussfolgerungen aus dem Wissen über das Katastrophenmanagement zur Erstellung von Multi-Agenten-Modellen, (iii) automatische Implementierung von Modellen zur Durchführung von Experimenten. Im ersten Schritt werden die entwickelten Funktionalitäten zur Integration, Manipulation und semantischen Anreicherung von Geodaten in das semantische geografische Informationssystem verwendet und die Wissensbasis mit Informationen aus der realen Welt gefüllt. Diese Geoinformationen über ein Verwaltungsgebiet vervollständigen das Wissen über Katastrophenmanagement, das in der Wissensbasis durch eine Ontologie namens semDM dargestellt wird. Der zweite Schritt führt zur Modellierung der Multi-Agenten-Simulation in der Wissensbasis durch Anreicherung der Ontologie semMAS, die das Wissen über die Multi-Agenten-Simulation einschließlich des zuvor entworfenen Multi-Agenten-Metamodells darstellt. Der Reasoner verwendet eine Reihe von Regeln, die auf Konzepten der Ontologie semDM basieren, um neue Konzepte und Instanzen in der semMAS Ontologie zu erzeugen. Der dritte Schritt verwendet dann die semMAS Ontologie und eine Reihe von implementierten Modellen, um die Implementierung des Modells zu generieren und die Simulation auszuführen.

Resultate

Das Ergebnis der Entwicklungen ist die erste Version des SemGIS-Prototyps, dessen Übersicht in Abbildung 1 dargestellt ist. Dieser Prototyp bietet Funktionalitäten für den Uplift von Daten aus verschiedenen Datenquellen, die Anreicherung durch die entworfene Wissensbasis und die Linked Open Data (siehe ein Beispiel in Abbildung 2) und den Downlift von Daten in verschiedenen Standardformaten. Dieser Prototyp basiert auf der Entwicklung von Werkzeugen für die Datenintegration, die Extraktion von XML-Schemata in Eulen, die Integration von Kartenstilen und weiteren Provenienzen, Datenqualität und Metadaten sowie Uplift- und Downlift-Funktionalitäten. Diese Funktionen werden über eine Webschnittstelle bereitgestellt, die in Abbildung 3 dargestellt ist.

Speziell für die Datenqualität wurde eine vergleichende Webkarten-App unter Verwendung von Leaflet entwickelt, um die Unterschiede aufzuzeigen (Abbildung 4). Darüber hinaus wurden Untersuchungen zur Vorhersage der Datenqualität durchgeführt, und es wird eine Zeitschriftenveröffentlichung über die Klassifizierung von Kartenänderungen im Raum Jena und Erfurt in Thüringen als Proof of Concept erwartet.

Die Entwicklungen zur automatisierten Generierung von Multiagentensimulationen für das Katastrophenmanagement (Abbildung 5) ermöglichen es uns, eine Reihe von Simulationsexperimenten für einen ersten Anwendungsfall zu generieren. Dieser Anwendungsfall entspricht der Simulation eines Plans, der erstellt wurde, um eine große Anzahl von Opfern während einer Katastrophe zu verwalten. Dabei kommen mehrere Akteure auf verschiedenen Handlungs- oder Entscheidungsebenen zum Einsatz: die Gemeinde auf der strategischen Ebene, der Feuerwehrkommandant und der medizinische Leiter auf der taktischen Ebene sowie medizinisches Personal wie Ärzte, Krankenschwestern oder Sanitäter, aber auch Feuerwehrleute auf der operativen Ebene. Im nächsten Jahr werden weitere Entwicklungen und Experimente durchgeführt, um diesen Prozess auf einen anderen Anwendungsfall anzuwenden und die Grenzen der Lösung zu ermitteln.