Upgrade Open Data: From 3★ to 5★ with AI

Mit KI aus 3★ Open‑Data‑Tabellen verlinkte 5★ Linked Open Data machen – für KI Systeme nutzbarer!

DCC Data Competence Center, Statistisches Amt Basel-Stadt

Bedarf/Problem und Zielgruppe

Viele Open Government Data Datensätze sind bereits öffentlich verfügbar – meist als CSV oder Excel.

Damit erreichen sie das 3-Star-Level im Open-Data-Modell: maschinenlesbar, aber noch nicht wirklich vernetzbar.

Was fehlt: • semantische Beschreibung der Daten • standardisierte Metadaten • Links zu anderen Datensätzen

Ohne diese Verknüpfungen bleiben OGD-Daten oft isolierte Tabellen, statt Teil eines vernetzten Wissenssystems zu werden.

Das Problem: Die Transformation zu 5-Star Linked Open Data ist heute meist viel Handarbeit.

(Nicht) verfügbare Daten

Es ist alles verfügbar - wir müssen uns nun darum kümmern, alle Teile zusammenzubringen, und 5-Stern Daten zu generieren 👍

Erwarteter Nutzen

Wenn das Problem gelöst wäre, könnten Open‑Government‑Data automatisch vernetzt und von KI-Systemen direkt verstanden und genutzt werden – statt nur als einzelne CSV‑Downloads zu existieren.

Ziel für den Hackathon

Ziel: Während des Hackathons möglichst viele 3★ Open‑Government‑Data‑Datensätze automatisiert zu 5★ Linked Open Data anreichern und für KI‑Systeme nutzbar machen. Dabei die Pipeline testen und vielleicht sogar verbessern 😇

Lösungsansätze

Lösungsansätze • Automatische Generierung von semantischen Metadaten für OGD‑Datensätze • Umwandlung von Tabellen (CSV/Excel) in Linked Open Data (RDF / Knowledge Graph) • Automatisches Linking zu bestehenden OGD‑Datensätzen oder Referenzdaten • Nutzung von KI/LLMs, um Datenschemata zu verstehen und Ontologien vorzuschlagen • Aufbau einer Pipeline, die Datensätze direkt für KI‑Systeme nutzbar macht

Was wir bereits ausprobiert haben • Entwicklung eines KI‑gestützten Tools, das Datensätze analysiert und Metadaten generiert • erste automatische Vorschläge für semantische Strukturen und Links zwischen Datensätzen • Tests mit bestehenden OGD‑Datensätzen (z. B. aus data.bs.ch) • Integration der aufbereiteten Daten in den Melody Bot als Proof‑of‑Concept

Einschränkungen

Nur offene Daten, offene Lizenzen, offene und dokumentierte Lösungen einsetzen, damit die Ergebnisse nach dem Hackathon weiter ausgebaut werden können.

Nachhaltigkeit

Die Ergebnisse werden an Fachtagungen wie den Schweizerischen Statistiktagen publiziert, damit weitere Institutionen von der Lösung profitieren können, und das LOD System Schweiz sich schneller entwickelt.

All attendees, sponsors, partners, volunteers and staff at our hackathon are required to agree with the Hack Code of Conduct. Organisers will enforce this code throughout the event. We expect cooperation from all participants to ensure a safe environment for everybody.

The contents of this website, unless otherwise stated, are licensed under a Creative Commons Attribution 4.0 International License. The application that powers this site is available under the MIT license.