Trending Topics — heute für morgen
Demonstration, wie ein gemeinsamer Datenraum datengestützte Politikgestaltung ermöglicht.
Bedarf/Problem und Zielgruppe
Sie Schweiz produziert jährlich viele Millionen offener Dokumente — parlamentarische Vorstösse, Urteile, Gesetze, Vernehmlassungen, Forschungspublikationen — verteilt auf unzählige Quellen in 4 und mehr Sprachen. Zwei Beispiele:
Lea, Legistik und Justiz Kanton Solothurn, arbeitet an der Umsetzung des Stimmrechts für Menschen unter umfassender Beistandschaft. Genf hat 2020 als erster Kanton die politischen Rechte geöffnet (75% Ja), Appenzell Innerrhoden und Glarus folgten an Landsgemeinden, Zug nahm 2025 knapp an, Waadt lehnte deutlich ab. Das Parlament hat den Bundesrat per Motion beauftragt, eine Verfassungsänderung auszuarbeiten. Der Prozess ist eingeleitet, die eigentliche Vorlage steht aber noch aus. Lea muss wissen: Welche Kantone haben mit welchem Wortlaut legiferiert, welche Modelle wurden gewählt, wo laufen Vorlagen? Heute durchsucht sie dafür Fedlex, Lexfind, Swisslex etc., einzeln - keine Trendansicht, kein Überblick. Marc, Politikwissenschaftler UniBE, untersucht die kantonale Klimagesetzgebung. Seit 2021 hat sich eine dynamische Welle entfaltet: Bern schrieb Klimaschutz in die Verfassung (2021, 64% Ja), Basel-Stadt setzte mit Netto-Null 2037 das ehrgeizigste Ziel (2022), Freiburg verabschiedete das erste kantonale Klimarahmengesetz (2023), Wallis lehnte seines per Referendum ab (2024, 56% Nein). Marc codiert die Adoptionsdaten manuell aus 26 kantonalen Rechtssammlungen - monatelange Arbeit für eine einzige Studie. Ob gerade eine neue Diffusionswelle läuft, sieht er erst zwei Jahre später. Beide brauchen dasselbe: einen einheitlichen, analysierbaren Zugang zu Schweizer Rechts- und Politikdaten mit Trendanalyse. Heute existiert das nicht, obwohl alle Einzeldaten offen verfügbar sind. Betroffen sind: Verwaltungen (Bund, Kantone, Gemeinden), Parlamentsdienste, Forschende, Medien und Zivilgesellschaft.
(Nicht) verfügbare Daten
- Verfügbar (bereitgestellt durch Challenge Owner) Scigate-Datenraum: Aktuell über 4 Mio. Dokumente aus 200+ Schweizer Quellen, in einem einheitlichen Index durchsuchbar; der Datenraum wächst laufend durch neue Connectoren und Quellen. Die verschiedenen Datenanbieter pflegen jeweils ihre eigene Domäne, Scigate verbindet sie zu einem analysierbaren Ganzen: a. Gerichtsurteile (Bundesgericht, alle 26 Kantonsgerichte, Bundesverwaltungsgericht) b. Bundesgesetzgebung (Fedlex, alle SR-Nummern) c. Parlamentarische Vorstösse aus 78 Parlamenten (OpenParlData.ch als Datenanbieter für die parlamentarische Domäne) d. 72 Open-Access-Journals und Repositorien Die Trending-Topics-Analyse wird erst durch diese Kombination möglich: Ein Thema taucht als Motion auf, wird zum Gesetzesentwurf, führt zu Urteilen. Dieser Lebenszyklus ist heute in keinem Schweizer Tool sichtbar. Weitere Ressourcen: a. REST API mit Volltextsuche (BM25 + kNN), Facetten und Zeitreihen-Aggregationen b. MCP-Server (17 Tools) für KI-Agenten-Integration (Claude, ChatGPT etc.) c. Über 5 Mio. Embedding-Vektoren (1024-dim) für semantische Analyse, mit wachsender Abdeckung d. Fertige Klassifikationsmodelle auf HuggingFace: ParlaCAP (21 Themen, multilingual), EP EuroVoc Classifier (7000 Deskriptoren, 24 Sprachen) e. Starter-Kit mit Beispielcode (BERTopic, Streamlit-Dashboard, Kantons-Heatmap, Diffusionskarte) f. Sample-Export (JSONL) als Offline-Fallback
- Nicht verfügbar / wünschenswert a. Statistische Daten (BFS, Kantone); der Datenraum ist erweiterbar: neue Domänen können durch weitere Datenanbieter und Community-Connectoren integriert werden b. Medien-/Nachrichtendaten (GDELT, Media Cloud)
Erwarteter Nutzen
Lea könnte mit einer einzigen Abfrage sehen, welche Kantone das Stimmrecht bei Beistandschaft bereits geändert haben, mit welchem Wortlaut und Ergebnis, statt 26 Rechtssammlungen einzeln zu durchsuchen. Marc könnte die Klimagesetzgebungs-Welle in Echtzeit beobachten statt sie zwei Jahre später aus Akten zu rekonstruieren. Darüber hinaus: Kantone könnten voneinander lernen, statt das Rad neu zu erfinden. Forschende könnten messen, wie lange ein Thema vom Paper zum Gesetz braucht. Die Schweiz hätte ein offenes, transparentes Früherkennungsinstrument. Und es wäre gezeigt, dass ein gemeinsamer Datenraum funktioniert: Verschiedene Datenanbieter pflegen jeweils ihre Domäne, die analytische Infrastruktur verbindet sie - Infrastruktur einmal bauen, statt in jeder Organisation von vorne anfangen. Das Modell ist erweiterbar: weitere Domänen (Statistik, Umwelt, Gesundheit) können von ihren jeweiligen Domänenverantwortlichen integriert werden, ohne die bestehende Infrastruktur neu zu bauen.
Ziel für den Hackathon
Ein funktionierender Prototyp, der über den Scigate-Datenraum aufsteigende Themen identifiziert — als Dashboard mit: a. Trending Topics der letzten 6/12/24 Monate (Burst Detection) b. Themen-Diffusion über Kantone/Institutionen (Kantons-Heatmap) c. Optional: Cross-Domain-Signale (Motion → Gesetz → Urteil) Nicht das Ziel: ein Orakel, das die Zukunft vorhersagt. Sondern ein evidenzbasiertes Werkzeug, das zeigt, was in den Daten bereits sichtbar ist, aber heute niemand sieht.
Lösungsansätze
- International FiscalNote, Quorum, Plural Policy (US, kommerziell) erkennen legislative Trends mit NLP. Polit-X (DE) monitort 12 Mio. politische Dokumente. Lobium (EU Datathon 2022 Gewinner) analysiert EU-Gesetzgebungsarenen. Alle sind proprietär, keines deckt die Schweiz ab. Westlaw/LexisNexis integrieren Hansard + Gesetze + Urteile, aber hinter Paywall.
- In der Schweiz OpenParlData.ch (78 Parlamente, API) liefert parlamentarische Daten als Datenanbieter, bietet aber keine Trendanalyse. Geplante Klassifikationen ergänzt sich hervorragend mit unserer Challenge. POLITmonitor und politik.ch bieten manuelles Themen-Filtering, kein algorithmisches Trend-Surfacing. RestructFeedback (GovTech 2023) analysierte Vernehmlassungsantworten mit ChatGPT.
- Bereits ausprobiert in Scigate Zeitreihen-Aggregationen (date_histogram), Zitier-Trend-Berechnung (steigend/fallend), Embedding-basierte Ähnlichkeitssuche, Cross-lingualer Thesaurus (25'000 Konzeptgruppen DE/FR/IT). Was fehlt: die analytische Schicht darüber: BERTopic-Clustering, Burst Detection, Diffusions-Visualisierung. Weltweit zeigt sich: Integration von Parlament + Gesetzgebung + Gerichte in einer Suche ist der Trend (EUR-Lex/CELLAR, UK i.AI Lex+Parlex, Finnland LawSampo). Die Schweiz hat diese Integration noch nicht.
Einschränkungen
a. Alle Daten sind öffentlich zugänglich (Open Access / Public Domain, Art. 5 URG). Kein Datenschutz-Problem. b. Die Volltexte im Index dienen dem Ranking und der Analyse, werden aber nicht direkt exponiert (Architektur-Prinzip: Scigate verlinkt zur Originalquelle). Teams arbeiten mit Titeln, Abstracts, Metadaten und Embedding-Vektoren. c. Ergebnisse müssen unter offener Lizenz veröffentlicht werden (gemäss Hackathon-Regeln). Scigate selbst: EUPL-1.2 (Code), CC0 (Anreicherungen), CC-BY-4.0 (Dokumentation).
Nachhaltigkeit
Der Prototyp wird weitergepflegt und in die Scigate-Plattform integriert (Open Source, EUPL-1.2). Das Modell eines offenen Datenraums mit verschiedenen Domänenverantwortlichen ist bewusst generisch und übertragbar. Der Challenge Owner (UZH) stellt Entwicklungskapazität bereit und betreibt die Infrastruktur (UZH ScienceCloud). Evtl. folgt eine Anschlussbewerbung beim Prototype Fund (opendata.ch), derselbe Weg, den Demokratis, owlly und Baloti erfolgreich gegangen sind. Der Datenraum wächst durch seine Teilnehmenden: Wer eine Datendomäne verantwortet, kann sie über einen Connector einbringen und alle profitieren davon. Teilnehmer:innen des Hackathons können als Contributors am Open-Source-Projekt weiterarbeiten und werden als Co-Autoren genannt.
Previous
GovTech Hackathon 2026
Next project