CAA Webcast “Unicorns”

Freitag den 3.12., von 16:00-18:30

Vortragende: Timo Homburg und Florian Thiery

Timo Homburg studierte Informatik (Bachelor) an der Hochschule RheinMain in Wiesbaden und Informatik mit Schwerpunkt Computerlinguistik an der Uni Frankfurt und schloss mit dem Master of Science ab. Am i3mainz der Hochschule Mainz forscht er schwerpunktmäßig an der Erschließung von räumlichen Daten als Linked Data, mit besonderem Fokus auf Rasterdaten. Desweiteren gilt sein Interesse der Verknüpfung von räumlichen Daten mit linguistischen Fachdaten. Als Mitglied der OGC GeoSPARQL Standards Working Group und als Co-Editor der Spatial Data On the Web Best Practices W3C Note treibt er die Standardisierung von Geodateninhalten im Semantic Web voran. Im Rahmen dieser Arbeit liegt sein Fokus auch auf der Erstellung von Tools, welche die Erschließbarkeit von Linked Data Inhalten für möglichst viele Forschungscommunities ermöglichen soll. Dabei stellt das in diesem Vortrag vorgestellte SPARQLing Unicorn QGIS Plugin ein Beispiel dieses Engagements dar.

Florian Thiery studierte Geoinformatik und Vermessung an der FH Mainz und schloss das Studium 2013 als Master of Science ab. Seine Masterarbeit bei Prof. Kai-Christian Bruhn in Kooperation mit dem RGZM befasste sich mit Semantic Web und Linked Data, speziell mit der Generierung von Interoperabilität in archäologischen Fachdaten am Beispiel römischer Töpferstempel. Nach dem Studium arbeitete er am i3mainz in mehreren Projekten zur semantischen Modellierung, u.A. ChronOntology und dem Labeling System. Seit 2016 ist er Research Software Engineer am RGZM im Arbeitsbereich Wissenschaftliche IT und setzt dort LOD in der Samian Research Datenbank, der Ceramic Typologies Ontology, Dating Mechanisms (fuzzy wobbling relative time intervals) und der archaeology.link Plattform ein. Er engagiert sich zudem in der NFDI-Initiative NFDI4Objects, ist Sprecher der CAA SIG on Semantic and LOUD in Archaeology, Mitbegründer der Initiative Linked Pipes der Linked Pasts, Mitglied des CAA Scientific Committees und des Beirats der CAA-DE. In den Jahren 2020/2021 war er Fellow des Wikimedia Deutschland Fellow-Programms Freies Wissen mit einem Projekt zu Irischen Ogham Steinen.

1. Impuls-Vortrag: Was ist dieses LOD und SPARQL und wozu brauche ich das?

Relationale Datenmodellierung und RDBMS sind in der digitalen Archäologie nicht mehr wegzudenken und die de facto Standard-Datenstruktur für archäologische Daten. Darüber hinaus gibt es aber auch immer mehr Anwendungen und Datenmodellierungen, die als Grundlage eine Graphstruktur besitzen. In der Archäologie sind dies z.B. Netzwerkanalysen, Least Cost Routing oder semantische Netzwerke, z.B. auf Basis des CIDOC-CRM Referenzmodells. 
Mit Tim Berners-Lee und anderen Wissenschaftler:inn am CERN kam nicht nur die Idee des Internets auf, sondern auch ab den 2000ern die Idee von Linked Open Data (LOD) und damit der Erstellung eines Knowledge Graphen als Linked Open Data Cloud, welche auch für die Archäologie nutzbar sind. LOD sind Teil der sogenannten 5-Sterne-Daten, die auch in der Archäologie anzustreben sind (mindestens Level 3).
Dieser Vortrag vermittelt die Grundlagen von Datenmodellierungen in Graphen, Linked Open Data und die SQL-ähnliche Abfragesprache SPARQL. Insbesondere wird auf den LOD Standard für Geodaten eingegangen: GeoSPARQL, als Pendant zu den bekannten OGC Webdiensten wie WFS und WMS. Wir geben praktische Beispiele für archäologisch relevante Datenrepositorien (Thesauri, Gazetteers, Space-Time-Gazetteers und Fachdaten), und zeigen die Möglichkeiten von SPARQL auf, welche im zweiten Teil – Workshop – parktisch in QGIS vertieft werden. Schlussendlich wird das SPARQLing Unicorn QGIS Plugin vorgestellt, welches im darauffolgenden Workshop anwendungsnah vorgeführt wird.

2. QGIS Linked Geo-Data Workshop

Im Workshop wird das SPARQLing Unicorn QGIS Plugin exemplarisch vorgeführt. Dazu werden vorhandene Daten von SPARQL Endpoints zur Abfrage und semantischen Anreicherung genutzt, aber auch Daten von Teilnehmenden verwendet, siehe Call for Datasets. Insbesondere drei Funktionalitäten werden dabei behandelt: Query von (Geo-)Datensätzen aus SPARQL Endpoints, Anreicherung von Geodaten mit Wikidata und Export von GeoJSON in vereinfachtes RDF mittels des GeoSPARQL Vokabulars.
Die Abfrage verschiedener archäologisch relevanten LOD im Raum Großbritannien –  hier: Nomisma (Münzen), Roman Open Data (Amphoren), Linked Open Samian Ware (Terra Sigillata), Linked Ogham Data (Ogham), Hadrians Wall und Limes Data  –  ermöglicht eine gemeinsame Kartierung und Auswertung in QGIS durch spezialisierte SPARQL Queries zu den Triplestores. Exemplarisch wird zudem gezeigt, wie die Anreicherung von Limes Kastellen mit Höhenangaben aus Wikidata ermöglicht wird und somit eine Kartierung erfolgt. Zuletzt können einfach strukturierte Daten aus dem Beispiel-Geodatensatz für Archäologie AtlantGIS in GeoSPARQL transformiert werden.
Der Workshop richtet sich an Teilnehmer:innen, die mit QGIS vertraut sind, die Struktur von Vektordaten kennen und sich mit relationaler Datenmodellierung im FDM beschäftigen. Kenntnisse in semantischer Modellierung, Ontologien, Linked Data oder Wikidata sind hilfreich aber keine Voraussetzung.

Im Anschluss an den Vortrag und Workshop wird es ausreichend Möglichkeiten zur Diskussion geben.

Die Folien für Vortrag und Workshop sind auf Zenodo hinterlegt:
Timo Homburg, & Florian Thiery. (2021, December 3). CAA Webcast “Unicorns”. CAA-DE Webcast, virtual. Zenodo. https://doi.org/10.5281/zenodo.5752802