Das Projekt
In vielen Städten und Gemeinden in Baden-Württemberg gibt es bereits seit vielen Jahren informelle Formen der Bürgerbeteiligung, die über die gesetzlich vorgeschriebenen Formen hinaus gehen. Möchte man einen Überblick über die Beteiligungslandschaft in Baden-Württemberg erhalten, so findet sich aber keine zentrale Dokumentationsstelle, bei der systematisch zu Art und Umfang der vielfältigen Beteiligungsverfahren recherchiert werden kann. Während zu Bürgerbegehren und Bürgerentscheiden über die Datenbank Bürgerbegehren der Forschungsstelle Bürgerbeteiligung ein guter Zugang zu deutschlandweiten Daten besteht, gibt es im Bereich der informellen Beteiligungsverfahren noch keinerlei systematische Ansätze zur Dokumentation und Erfassung der unterschiedlichen, konkret stattfindenden Verfahren. Stattdessen bestehen vereinzelte Sammlungen, die sich jedoch hinsichtlich Umfang (räumlich wie inhaltlich) und Zweck unterscheiden. Hinzu kommen mangelnde Aktualität und Vollständigkeit der Daten, die es nicht nur der Forschung erschweren, einen umfassenden Blick auf die Beteiligungslandschaft in Baden-Württemberg - über die Betrachtung des Einzelfalles hinaus - zu erhalten.
Die Beteiligungsforschung verfolgt drei Ziele. Das erste ist, die Beteiligungslandschaft zu beschreiben: Die Forschung soll Auskunft darüber geben, wann, wo, in welcher Form und zu welchen Themen Bürgerbeteiligung stattfindet und welche Entwicklungen sich im Zeitverlauf darstellen. Das zweite Ziel besteht darin, Theorien über Ursachen und Wirkungen im Kontext Beteiligungsverfahren zu entwickeln und zu testen. Drittens sollen schließlich aus den gewonnenen Erkenntnissen praktische Empfehlungen abgeleitet werden, die auf einer breiten und belastbaren Datenbasis beruhen. Erfahrungen mit Leuchtturmprojekten, Einzelfallstudien und einige Vergleichsstudien mit kleinen Fallzahlen bieten zwar erste Erkenntnisse - um die genannten Ziele zu erreichen ist jedoch erforderlich, dass die Grundgesamtheit der Beteiligungsverfahren bekannt ist, oder zumindest valide abgeschätzt werden kann. Beides ist bisher nicht der Fall, mit Folgen für das Forschungsdesign und insbesondere für die Auswahl der (Vergleichs-)Fälle.
Das Projekt der Universität Stuttgart versucht diese Lücke zu schließen, indem es eine Vollerhebung der Beteiligungslandschaft in Baden-Württemberg anstrebt. Mit einer teilautomatisierten onlinebasierten Erhebung, sollen sattfindende Beteiligungsverfahren identifiziert werden. Die gewonnenen Daten werden rekursiv genutzt, um den Suchalgorithmus zu optimieren und mittels maschinellem Lernen den Automatisierungsanteil der Datenerhebung zu erhöhen. Als Datenbank sollen die gefundenen Treffer schon während der Erhebungsphase der (Fach-)Öffentlichkeit zur Verfügung stehen.
Die Umsetzung
Ausgangspunkt für die Erhebung der Beteiligungsverfahren ist eine Recherchematrix, nach welcher sich Suchanfragen systematisch abarbeiten lassen. Die Recherchematrix bildet die Grundlage für die Suchstrategie und besteht aus den drei Vektoren: Verfahrensbezeichnung, Ort und Suchraum. Die Elemente der Vektoren werden durch Permutation ohne Wiederholung kombiniert und bilden so die jeweiligen Suchanfragen. Die Vektoren selbst bestehen aus den folgenden Inhalten, die zuvor festgelegt werden müssen:
- Verfahrensbezeichnung: Wortliste möglicher Bezeichnungen von Beteiligungsverfahren
- Ort: Namen der Kommunen, einschließlich Teilorte und Stadtteile
- Suchraum: Liste der für die Anfrage zu nutzenden Online-Quellen, defacto: Google und Bing
Zur Suche werden die Anfragen in http-Requests überführt, die dann von der Suchmaschine beantwortet werden. Aufgrund der hohen Anzahl an Suchanfragen (~70.000) erfolgt die Abfrage bereits automatisiert mittels Skript und Programmierschnittstelle (API - Application Programming Interface). Die Suchanfragen zu Google werden mittels „Google Custom Search API“ durchgeführt, die Suche mit Bing wird mittels „Microsoft Azure Marketplace - Bing Search API – Web Results Only“ umgesetzt.Die automatisierten Suchanfragen geben jeweils einen Datensatz aus Suchtreffern zurück (theoretische max. 1,5 Mio.), die für jede gefundene Webseite deren URL, den Seitentitel und einen Textschnipsel („Snippet“) enthalten. Der Textschnipsel ist ein kurzer Ausschnitt aus der Webseite, der den Kontext der Suchbegriffe auf der Webseite wiedergibt. Die Struktur der Ergebnisse der automatisierten Abfrage gleicht also der einer manuellen Recherche. Der Unterschied ist, dass direkt ein Datensatz produziert wird.
Die Resultate aller Anfragen werden dann in einer relationalen Datenbank zusammengeführt und dem jeweiligen Ort und Suchbegriff zugeordnet. Die vorliegenden Suchtreffer werden zuerst automatisch mit einer Blacklist abgeglichen. Danach werden mit Hilfe eines Klassifikations-Algorithmus alle Treffer ausgeschlossen, die mit sehr großer Wahrscheinlichkeit keine Beteiligungsverfahren beinhalten. Hierzu wurde auf Basis der im ersten Teil des Projektes bereits manuell kodierten Treffer ein sogenanntes Transformer-Modell trainiert. Dieses Machine Learning Verfahren aus der Klasse der Deep-Learning Verfahren, berechnet für jeden Treffer auf Basis der enthaltenen semantischen Bedeutung eine Wahrscheinlichkeit für das Vorliegen eines potentiell relevanten Treffers. Die verbleibenden Treffer werden anhand des Titels der Webseite und dem Inhalt des Textschnipsels durch Hilfskräfte manuell kodiert. Bei der ersten Kodierung wird unterschieden zwischen eindeutig irrelevanten Treffern und potentiell relevanten Treffern. Nur die Webseiten der potentiell relevanten Treffer werden einzeln aufgerufen und durchgesehen. Treffer die dann inhaltlich nicht relevant sind, werden ausgeschlossen. Treffer die tatsächlich relevant sind werden redaktionell ausgewertet, d.h., die dort vorgefundenen Beteiligungsverfahren werden in einer neuen Tabelle gesammelt und die zu erhebenden Merkmale dokumentiert. Werden mehrere Beteiligungsverfahren identifiziert die zu einem übergeordneten Beteiligungsprozess gehören, wird in einer separaten Tabelle ein Eintrag für den Beteiligungsprozess angelegt.
Ansprechpartner im Projekt
Angelika Vetter
Prof. Dr.Apl. Professorin
Uwe Remer
Dr.Research Fellow