Please activate JavaScript!
Please install Adobe Flash Player, click here for download

arcAKTUELL 3.2012 - Reale und virtuelle Infrastrukturen

S C H W E R P U N K T28 Können Sie sich das vorstellen? Das World Wide Web als globalen Da- tenraum, in dem Sie einen Großteil aller Daten dieser Welt sehr einfach finden und nutzen können? In dem Sie durch Daten wie durch Doku- mente surfen und dabei Informationen aus vielen Quellen in Beziehung setzen? In dem Sie keine technische Unterscheidung mehr zwischen Daten und Metadaten treffen? In dem Sie alle Informationsressourcen über globale Suchmaschinen mit hoher Trennschärfe finden können, also auch raumbezogene Daten, Karten und Geodienste? Tatsächlich entwickelt sich das Web mit hoher Geschwindigkeit weiter. Die bekannten Web-Paradigmen wie das „Web of Documents“ und das „Web of Services“ werden um ein weiteres starkes Paradigma er- gänzt: das „Web of (Linked Open) Data“. Hierbei werden Webtechno- logien dazu verwendet, konkrete Objekte und Sachverhalte der realen Welt in Form von Daten zu beschreiben und über Links miteinander zu vernetzen. Tim Berners-Lee, der Begründer des Web und Vorsitzende des W3C-Konsortiums, definiert die Grundprinzipien von Linked Open Data wie folgt: · Nutze URIs (Universal Resource Indentifiers; Anm. der Red.) als Namen für jegliche Dinge · Nutze HTTP URIs, sodass man diese Namen als Webadressen verwenden kann · Biete nützliche Informationen an, wenn jemand eine solche Web- adresse aufsucht; verwende hierbei die Standards RDF und SPARQL · Definiere Links zu anderen URIs, sodass man darüber weitere Dinge aufsuchen kann (http://www.w3.org/DesignIssues/LinkedData.html) Wenn man beispielsweise das Biotopkataster Nordrhein-Westfalens als Linked Open Data anbieten wollte, könnte dies wie folgt geschehen: Das beim Landesamt für Natur, Umwelt und Verbraucherschutz (LANUV) registrierte Biotop mit der Bezeichnung BK-4733 bekäme im Web of Data den Bezeichner http://www.lanuv.nrw.de/Biotope/BK-4733. Dies wäre gleichzeitig die Webadresse, unter der weitere Informationen zu diesem Biotop abgerufen werden könnten. In unserem Fall wären dies elementare Aussagen der Art „hat die Bezeichnung BK-4733“, „weist ein Vorkommen von Baldellia ranunculoides auf“ oder „hat die räum- liche Ausdehnung [Polygon]“. RDF dient hierbei zur Codierung solcher elementaren Aussagen. Mithilfe der SQL-ähnlichen Abfragesprache SPARQL könnten die Polygone der Biotope mit Vorkommen von Baldel- lia ranunculoides ermittelt werden, um sie in einer Karte darzustellen. Ein wesentlicher Vorteil gegenüber herkömmlichen Datenbanken kommt aber erst zustande, wenn dieser Datenbestand über Links mit anderen Datenbeständen verknüpft wird. Eingehende Links könnten beispiels- weise von dem Begriff „Amtliche Biotopkataster in Deutschland“ auf die entsprechenden Kataster der Bundesländer verweisen, sodass von die- sem Knoten aus alle Datenbestände auf Länderebene aufgesucht wer- den könnten. Ausgehende Links könnten auf verwendete Taxonomien, auf Zeigerwerte und Fundorte der Arten oder auf Gefährdungskatego- rien der Roten Listen verweisen, unabhängig von deren Speicherort. Durch die Vernetzung der Daten über URIs entsteht ein global verteil- ter Graph, der – ähnlich wie die Hypertext-Struktur des Web of Docu- ments – genutzt werden kann, um auf Daten zuzugreifen, die inhaltlich in Beziehung stehen. Sofern diese Daten aus verschiedenen oder gar unbekannten Quellen stammen, werden in der Regel ähnliche Vorver- arbeitungen erforderlich sein, wie sie auch bei der Integration her- kömmlicher Datenquellen anfallen. Begrifflichkeiten müssen aufeinan- der abgebildet, unterschiedliche Skalen und Vokabulare müssen homogenisiert und unterschiedliche Qualitäten müssen berücksichtigt werden. Der Vorteil von Linked Open Data besteht darin, dass die ver- wendeten Webtechnologien einen sehr einfachen Zugang zu den Daten selbst ermöglichen und dass die verwendeten Links Daten aus den unterschiedlichsten Quellen zu einem globalen Datenraum ver- knüpfen. Daten und Metadaten können dabei gleichermaßen als Linked Data codiert und angeboten werden. Der Begriff „Open“ in „Linked Open Data“ steht für den Appell an alle Datenanbieter, ihre Daten so bereitzustellen, dass der Datennutzung so wenig wie möglich im Wege steht. Dies betrifft den Aspekt des Nutzen- könnens ebenso wie den Aspekt des Nutzendürfens. Ersteres wird bei Linked Data durch die Verwendung einfacher Webtechnologien und durch die Vernetzung der Daten erheblich verbessert. Letzteres liegt im Ermessen der Datenanbieter und kann wie bei herkömmlichen Daten- und Diensteangeboten geregelt werden. Linked Open Data ist ein Thema der angewandten Forschung. Offene Fragen betreffen beispielsweise die Gestaltung effizienter Daten- modelle, das Management von Datenqualität in offenen heterogenen Datenbeständen oder die Realisierung effizienter Werkzeuge für die Arbeit mit Linked Open Data. Gleichzeitig zeigt das exponentielle Wachstum von Datenangeboten, Werkzeugen und Anwendungen die zunehmende Relevanz für die Praxis. Alles deutet darauf hin, dass Linked Open Data bei der Weiterentwicklung von Geodateninfrastruk- turen eine ganz wesentliche Rolle spielen wird. Dr. Albert Remke Esri Deutschland Group GmbH Kranzberg 52°North – Initiative for Geospatial Open Source Software GmbH http://52north.org Literatur Tom Heath and Christian Bizer (2011): Linked Data – Evolving the Web into a Global Data Space (1st edition). Synthesis Lectures on the Semantic Web: Theory and Technology, 1:1, 1-136. Morgan & Claypool ++ Das Web als globale DATENBANK

Seitenübersicht