Die Openknowledge Foundation Deutschland ist ein gemeinnütziger Verein, der sich für offenes Wissen, offene Daten, Transparenz und Beteiligung einsetzt.
Der Zusammenschluss betreibt die Plattform Offener Haushalt, in der Haushaltsdaten der öffentlichen Hand grafisch dargestellt werden.
Die Foundation hat die Website im Dezember des letzten Jahres relauncht. An der Website kann sich jeder beteiligen.
In einem Blogbeitrag beschreibt die Foundation, wie Daten für Offener Haushalt gewonnen werden können.
Die Haushaltsdaten meiner Heimatstadt Ahaus werden in einer PDF-Datei veröffentlicht.
Ende des letzten Jahres habe ich privat getestet, wie schwierig es ist, die Daten aus diesem Haushaltsplan zu extrahieren. Es ging recht einfach, so dass ich die Daten aus dem Plan gespeichert habe.
Herausgekommen ist eine CSV-Datei mit ca. 540 Datensätzen. Die Datei lässt sich bei OpenSpending herunterladen.
In dem Plan auf Offener Haushalt sind nur ordentliche Erträge und ordentliche Aufwendungen berücksichtigt. Es sind das Ergebnis 2016, die Ansätze für 2017 und 2018 sowie die Planungen für 2019, 2020 und 2021 aufrufbar.
Aber wie lassen sich die Daten aus einer Haushaltsdatei extrahieren und bei Offener Haushalt visualisieren?
Zunächst habe ich die Haushalts-PDF heruntergeladen, und zwar von der Website der Stadt Ahaus:
haushalt2018_stadtahaus_endg_entwurf_20171206.pdf .
Diese Datei umfasst 458 Seiten.
Für den Export der Erträge und Aufwendungen waren aber nur Einzelbudgets interessant, die in Tabellenform die ordentlichen Erträge und ordentlichen Aufwendungen von 2016 bis 2021 listeten.
Mit PDF Split and Merge habe ich die Datei bearbeitet, so dass nur noch Tabellen vorhanden waren. Andere Tools lassen sich ggf. ebenfalls dafür nutzen, zum Beispiel pdftk unter Linux.
Schließlich kommt das wichtigste Tool: Tabula. Das Tool gewinnt aus einer PDF-Datei strukturierte Daten.
Der Output ist eine CSV-Datei.
Diese CSV-Datei habe ich noch mit Planmaker und LibreOffice sowie mit anderen Tools und Skripten bearbeitet, damit die Datei folgende Struktur hatte:
Produktbereich,Produktbereichsname,Produktgruppe,Produktgruppenbezeichnung,Richtung,<br></br>HHArt,Jahr,Betrag
Produktbereich 01,Innere Verwaltung,Produktgruppe 01.01,Politische Gremien,<br></br>Ord. Erträge,Ergebnis,2016,0
Damit war die Datenquelle erzeugt. ;-)
Um die Daten bei Offener Haushalt zu visualisieren, müssen sie zunächst bei dem Projekt OpenSpending hochgeladen werden. Dazu ist ein Google-Konto erforderlich.
Die Openknowledge Foundation hat hierzu ein Video veröffentlicht.
Die Zuordnung bei Openspending sieht für den Ahauser Plan wie folgt aus:
Wenn die Daten bei Openspending gespeichert sind, können sie bei Offener Haushalt visualisiert werden. Dazu gibt es ebenfalls ein Video.
Toll ist, dass die Finanzdaten in Relation zur Einwohnerzahl gesetzt werden können, hier war es die Einwohnerzahl am 31.12.2017.
Falls Interesse besteht, den Haushalt der eigenen Kommune aufzubereiten, und Hilfe dabei benötigt wird, hinterlasse einen Kommentar. ;-)