Frag deine Verwaltung — LINDAS per Chat abfragen
Vertrauenswürdiger Hermes-Agent für natürliche Sprache zu SPARQL: Antworten aus LINDAS mit Quellen, Tabellen und Datenprovenienz.
Bedarf/Problem und Zielgruppe
LINDAS stellt Verwaltungsdaten als Knowledge Graphs bereit: Strompreise, Biodiversität, Kantonsstatistiken und Bundesregister. Diese Infrastruktur ist mächtig, aber für Menschen ohne SPARQL- oder Linked-Data-Kenntnisse kaum nutzbar. Eine Journalistin, die Strompreise über Kantone vergleichen will, kann LINDAS nicht direkt einsetzen. Ein Bürger, der Umweltdaten seiner Gemeinde sucht, braucht technische Hilfe. Die Daten sind offen, aber nicht wirklich zugänglich.
Es fehlt eine vertrauenswürdige Schnittstelle, die natürliche Sprache in überprüfbare SPARQL-Abfragen übersetzt und Ergebnisse verständlich zurückgibt: mit Quelle, Zeitpunkt der Abfrage, generierter SPARQL-Abfrage und klarer Kennzeichnung von Unsicherheit.
Zielgruppe:
- Journalist:innen, die datengestützt recherchieren
- Bürger:innen, die Verwaltungsdaten ihrer Gemeinde oder ihres Kantons verstehen wollen
- Parlamentarier:innen und politische Entscheidungsträger:innen, die Daten für politische Arbeit brauchen
- NGOs und Forschende, die auf offene Verwaltungsdaten angewiesen sind
- Verwaltungsmitarbeitende ohne technischen Hintergrund, die LINDAS-Daten für ihre Arbeit nutzen möchten
(Nicht) verfügbare Daten
Alle benötigten Verwaltungsdaten sind bereits öffentlich zugänglich:
- LINDAS SPARQL-Endpoint: https://lindas.admin.ch/sparql/ - der zentrale Zugang zu den Knowledge Graphs der Bundesverwaltung
- Datenbereiche auf LINDAS: Energie (Strompreise pro Kanton/Gemeinde/Netzbetreiber via ElCom), Umwelt (Rote Listen, Biodiversität via BAFU), Kantonsstatistiken, Bundesregister
- Schema-Dokumentation: https://schema.ld.admin.ch/ - Ontologien und Core Entities wie Kantone und Gemeinden sind dokumentiert
- opendata.swiss als ergänzende Quelle und Einstiegspunkt für weitere offene Datensätze
- LLM-API für die Übersetzung von natürlicher Sprache in SPARQL (wird vom Challenge-Owner bereitgestellt)
- Hermes agent als agentisches Backend für Tool-Orchestrierung, Dialogführung und kanalunabhängige Chat-Integration
Es werden keine zusätzlichen oder unveröffentlichten Verwaltungsdaten benötigt.
Erwarteter Nutzen
Der Prototyp macht offene Verwaltungsdaten auch für Personen ohne SPARQL- oder Linked-Data-Kenntnisse nutzbar. Nutzer:innen können Fragen in natürlicher Sprache stellen und erhalten eine nachvollziehbare Antwort aus offiziellen Datenquellen.
Der Nutzen besteht insbesondere in:
- niederschwelligem Zugang zu LINDAS für nicht-technische Zielgruppen
- schnellerer Recherche über Gemeinde-, Kantons-, Energie- und Umweltdaten
- besserer Wiederverwendbarkeit von offenen Verwaltungsdaten in Journalismus, Politik, Forschung und Verwaltung
- höherem Vertrauen durch Quellenangaben, Abfragezeitpunkt, generierte SPARQL-Abfrage und Unsicherheitskennzeichnung
- Stärkung von Open Government Data, weil Daten nicht nur veröffentlicht, sondern praktisch verständlich und nutzbar werden
Langfristig kann der Ansatz als wiederverwendbarer Chat-Zugang zu LINDAS dienen und auf verschiedene digitale Kanäle erweitert werden, z.B. Webchat, Signal oder WhatsApp.
Ziel für den Hackathon
Ein funktionsfähiger Prototyp: Eine Chat-Schnittstelle, über die man Fragen in natürlicher Sprache stellen kann. Der konkrete Kanal soll austauschbar bleiben; für die Demo eignet sich Webchat als stabiler Primärkanal, Signal oder WhatsApp können als Messaging-Adapter gezeigt werden.
Das System übersetzt die Frage in eine SPARQL-Abfrage, fragt LINDAS ab und antwortet verständlich. Jede Antwort soll mindestens enthalten:
- kurze Antwort in Deutsch oder Französisch
- Quelle und Zeitpunkt der Abfrage
- generierte SPARQL-Abfrage oder Link zur Abfrage
- Tabelle oder Diagramm bei Vergleichen/Zeitreihen
- Hinweis, wenn eine Frage mehrdeutig ist oder eine Rückfrage nötig wird
Mindestens drei LINDAS-Bereiche sollen funktionieren: Energie, Umwelt und Kantons-/Gemeindedaten. Für die finale Demo soll ein Bereich, z.B. Energie/Strompreise, besonders robust und visuell überzeugend sein.
Lösungsansätze
Bestehende Ansätze:
- GovTech Hackathon 2024: "Empowering OGD-users with an AI-powered Chatbot" - ähnlicher Gedanke für CSV-basierte Daten auf opendata.swiss, aber nicht fokussiert auf Knowledge Graphs und SPARQL
- Text-to-SQL-Systeme wie Vanna.ai oder LangChain SQL Agent existieren, aber Text-to-SPARQL über föderierte Knowledge Graphs ist komplexer wegen Ontologien, URIs und semantischen Beziehungen
Mein Ansatz:
- Hermes agent als Dialog- und Tool-Orchestrierung: Der Agent führt Rückfragen, ruft SPARQL-Tools auf, formatiert Antworten und bleibt kanalunabhängig.
- Kanalunabhängige Chat-Adapter: Webchat als robuste Demo-Oberfläche; Signal oder WhatsApp als optionale Messenger-Kanäle. So wird der Lösungsraum nicht auf WhatsApp beschränkt.
- Schema-gestütztes Prompting: Die LINDAS-Ontologie, Core Entities und Beispielabfragen werden als Kontext genutzt, damit der Agent nicht frei halluziniert.
- Template-Bibliothek: Für häufige Fragetypen wie Kantonsvergleich, Zeitreihe, Ranking oder Gemeindesuche werden geprüfte SPARQL-Templates vorbereitet.
- Trust Layer: Jede Antwort zeigt Quelle, Abfragezeitpunkt, SPARQL und Unsicherheiten. Bei niedriger Sicherheit fragt der Agent nach statt eine scheinbar sichere Antwort zu erfinden.
- Exportfähigkeit: Ergebnisse sollen als Tabelle, CSV oder einfache Visualisierung weiterverwendbar sein.
Noch nicht ausprobiert: Die optimale Balance zwischen Template-Matching und freier SPARQL-Generierung. Das ist eine Kernfrage für den Hackathon.
Einschränkungen
Einschränkungen und Hinweise für Teilnehmer:innen:
- Alle Ergebnisse müssen unter einer Open-Source-Lizenz veröffentlicht werden, z.B. MIT oder Apache 2.0.
- Der LINDAS SPARQL-Endpoint ist öffentlich zugänglich, aber Abfragen sollten gecacht werden, um Rate Limits und unnötige Last zu vermeiden.
- LINDAS-Daten sind offizielle Verwaltungsdaten. Antworten müssen klar kennzeichnen, woher die Daten stammen und wann sie abgefragt wurden.
- Der Prototyp soll auf Deutsch und Französisch funktionieren.
- Bei personenbezogenen oder sensiblen Fragen soll der Agent klar ablehnen oder auf öffentlich verfügbare Daten beschränken.
- Der Messaging-Kanal ist nicht der Kern der Challenge. Entscheidend ist der vertrauenswürdige Natural-Language-to-SPARQL-Zugang.
Demo-Idee
Eine überzeugende Demo wäre:
- Eine Person fragt im Chat: "Vergleiche die Strompreise von Biel/Bienne, Zürich und Lugano seit 2020."
- Hermes erkennt, dass es um Energie-/ElCom-Daten in LINDAS geht.
- Das System generiert eine geprüfte SPARQL-Abfrage.
- Die Antwort zeigt eine kurze Zusammenfassung, eine Tabelle, ein kleines Diagramm und den Link zur SPARQL-Abfrage.
- Bei einer unklaren Frage fragt Hermes zurück, z.B. ob Gemeinde, Kanton oder Netzbetreiber gemeint ist.
Damit zeigt der Prototyp nicht nur Chat, sondern vertrauenswürdige, nachvollziehbare Nutzung offizieller Daten.
Gesuchte Kompetenzen
Für das Team wären besonders hilfreich:
- SPARQL, RDF oder Linked Data
- UX/UI für verständliche Datenantworten
- Data Visualization und Tabellen/Charts
- Python, Rust oder TypeScript für Agent- und Tool-Integration
- Public-Sector- oder Open-Data-Domänenwissen
- Deutsch/Französisch für mehrsprachige Fragen und Antworten
Nachhaltigkeit
Das Projekt soll nach dem Hackathon als offener Hermes-LINDAS-Adapter bzw. als wiederverwendbare Natural-Language-to-SPARQL-Komponente weitergeführt werden.
Konkret:
- Veröffentlichung der LINDAS-spezifischen Komponenten, Templates und Beispielabfragen in einem offenen Repository
- Dokumentation der Architektur, Beispielqueries und Demo-Flows
- Weiterentwicklung der unterstützten LINDAS-Domänen
- Möglichkeit für Teilnehmer:innen, über Issues und Pull Requests weiter mitzuarbeiten
- Langfristiges Ziel: ein vertrauenswürdiger, mehrsprachiger Zugangskanal zu LINDAS, der mit dem Bundesarchiv bzw. LINDAS-Betreibern weiter diskutiert werden kann
Previous
GovTech Hackathon 2026
Next project