Die Bereitstellung von Daten über GovData

Hier finden sich Informationen rund um die Frage, wie Daten der Verwaltung geöffnet und über GovData zur Verfügung gestellt werden können.

Die Öffnung von Verwaltungsdaten

[Hinweis: Dieser Artikel liegt auch als PDF-Datei und als ODT-Datei vor.]

Informationen sind der Rohstoff des 21. Jahrhunderts. Der offene und strukturierte Zugang zu frei verfügbaren Datenbeständen der öffentlichen Hand ist ein wichtiger Beitrag für die Weiterentwicklung einer Wissensgesellschaft. Er stärkt das Vertrauen zwischen Politik und Zivilgesellschaft, zwischen Verwaltung, Wirtschaft und Medien. Darüber hinaus birgt die Öffnung solcher „Datenschätze" der Verwaltung ein enormes wirtschaftliches Potential – gemäß einer im Auftrag der EU-Kommission erstellten Studie in Höhe von bis zu 40 Mrd. € für die EU. Offene Verwaltungsdaten steigern also nicht nur die Akzeptanz öffentlicher Entscheidungsprozesse. Sie ermöglichen es auch, neues Wissen zu gewinnen und durch ihre Nutzung in innovativen Anwendungen den Alltag zu erleichtern.

Ob die offene Bereitstellung von Daten für die jeweilige Verwaltungseinrichtung mit zusätzlichem Aufwand verbunden ist, hängt vom Einzelfall ab. In einigen Fällen liegen Datensätze bereits in Formaten und unter Nutzungsbestimmungen vor, welche eine offene Bereitstellung sehr einfach ermöglichen. In anderen Fällen sind z.B. Fragen zur Urheberschaft an den Datensätzen oder der Nutzung durch Dritte noch nicht hinreichend geklärt. In wieder anderen Fällen sind technische Fragen zu beantworten, zum Beispiel die Frage nach geeigneten Dateiformaten.

Generell gilt: Die Bereitstellung offener Verwaltungsdaten ist ein Prozess, der von Mitarbeitern einzelner öffentlicher Stellen ausgeführt werden kann – natürlich nur, wenn die Einrichtung einer solchen Veröffentlichung zugestimmt hat. Ein paar wichtige Punkte gilt es aber dennoch zu beachten, um Open Data auch in Ihrer Institution mit Erfolg voranzubringen.

Der folgende Text unterstützt Sie dabei, Datensätze als offene Verwaltungsdaten verfügbar zu machen und weist auf wichtige Schritte hin, die bei der Datenbereitstellung beachtet werden müssen. Um Ihnen auch weiteres Hintergrundwissen zur Verfügung zu stellen, wird bei den einzelnen Fragen und Aspekten auf bereits existierende Informationsquellen verwiesen.

Open Data ist ein stufenweiser Prozess. Beginnen Sie daher am besten mit der Bereitstellung einzelner „einfacher" Datensätze über Ihre eigenen Webseiten und entwickeln so ein Gespür, wie Sie weitere Daten sinnvoll öffnen können. Um ihre Daten einem noch größeren Nutzerkreis bekannt zu machen, bietet es sich an, sie dann in den Datenkatalog von GovData, dem Datenportal für Deutschland, einzutragen. So werden Ihre Datensätze für Bürgerinnen und Bürger, Wissenschaft, Wirtschaft und nicht zuletzt auch andere Verwaltungseinrichtungen einfacher auffindbar. Im Einzelfall können auch andere Datenportale auf Länder- oder kommunaler Ebene gut für eine Bekanntmachung Ihrer Datensätze geeignet sein.

Geeignete Datensätze identifizieren und auswählen

Zu Beginn ist es wichtig zu klären, über welche Daten eine öffentliche Stelle verfügt und welche sie davon als offene Daten bereitstellen kann. Grundsätzlich gilt, dass öffentliche Stellen auf freiwilliger Basis Daten als offene Daten bereitstellen können, soweit es keine entgegenstehende gesetzliche Regelung gibt. Demnach sind etwa personenbezogene oder sicherheitsrelevante Datensätze von der Veröffentlichung ausgeschlossen. Auch können Fachgesetze eine Veröffentlichung eigenständig regeln oder Dritte können Rechte an Daten haben.

Bei der Auswahl geeigneter Datensätze sollten u.a. der Aufwand berücksichtigt werden, der notwendig ist, um Datensätze zu veröffentlichen. So bieten sich in einem ersten Schritt beispielsweise Datensätze an, die bereits online verfügbar sind, aber nur in wenig geeigneten technischen Formaten oder zu eingeschränkten Nutzungsbedingungen.

Wichtige Fragen für die Identifikation und Auswahl von Datensätzen

  • Über welche Daten verfügt meine Organisation?
  • Welche dieser Daten sind bereits heute online verfügbar?
  • Welche dieser Daten darf ich als offene Daten bereitstellen?

Datensätze für die Weiterverwendung aufbereiten

Einige Datenformate schränken eine einfache Weiterverarbeitung ein. Andere Datenformate machen gerade eine automatisierte Weiterverwendung deutlich einfacher. Für die Bereitstellung von Verwaltungsdaten als offene Daten müssen diese in möglichst offenen Formaten bereitgestellt werden. Zum Beispiel sind tabellarische Daten zwar im Portable Document Format (PDF) gut für Menschen lesbar, jedoch schwierig für Maschinen zu interpretieren.

Damit Daten sinnvoll von Dritten weiterverwendet werden können, sollten sie möglichst in einer feingranularen Auflösung bereitgestellt werden. Achten Sie aber gleichzeitig darauf, dass dabei keine bestehenden Datenschutzbestimmungen verletzt werden.

Zudem ist es bei sich laufend in kurzen Intervallen aktualisierenden Datensätze hilfreich, diese über eine Programmierschnittstelle bereitzustellen, dies kann den Zugriff gerade für technisch versierte Datennutzer wesentlich verbessern.

Fragen zur Prüfung bei der Aufbereitung:

  • In welchen Formaten liegen meine Datensätze vor?
  • Für welche, für die Weiterverwendung geeigneten, Dateiformate hat meine Organisation Transformationswerkzeuge?
  • Welche Datenformate sind in meinem Einzelfall für die automatisierte Weiterverwendung besonders geeignet?

Bei Fragen zur technischen Aufbereitung von Datensätzen sprechen Sie am besten auch mit den IT-Verantwortlichen Ihrer Organisation.

Die Weiterverwendung von Datensätzen regeln

Neben der Aufbereitung der eigenen Datensätze ist es wichtig, sich über die Ausgestaltung der Weiterverwendung Gedanken zu machen. Zuerst gilt es zu klären, ob Ihre Organisation die Rechte an den in Frage kommenden Daten überhaupt besitzt und Sie die Weiterverwendung der Daten durch Dritte frei regeln dürfen. Bei Daten, die z.B. durch einen Dienstleister im Auftrag Ihrer Organisation erhoben wurden, können vertragliche Regelungen bestehen, die die Weitergabe und Weiterverwendung der Daten einschränken. Hier wären entsprechende Verhandlungen Ihrer Organisation mit den Rechteinhabern notwendig.

Besitzt Ihre Organisation die Rechte an den in Frage kommenden Datensätzen, können Sie das Augenmerk auf Regelungen zur Weiterverwendung legen, um Nutzern Klarheit zu bieten, wie sie Ihre Daten weiterverarbeiten dürfen. Zusätzliche Beschränkungen für die Weiterverwendung Ihrer Datensätze schränken die Nutzer in ihren Möglichkeiten ein, Ihre Daten (sinnvoll) zu verwenden. Die Regelungen sollten daher eine freie Weiterverwendung erlauben.

Denken Sie daran, dass Datennutzer von Ihnen bereitgestellte Datensätze eventuell mit Daten anderer öffentlicher Stellen kombinieren wollen. Daher sollten die Nutzungsbestimmungen möglichst mit existierenden Vorgaben zur Datenweiterverwendung aus dem Bereich offener Daten kompatibel sein.

Um Ihre Daten als offene Daten bereitzustellen, müssen Sie diese also unter offenen Nutzungsbestimmungen (offenen Lizenzen) bereitstellen. Als hierfür geeignete Lizenz wird die „Datenlizenz Deutschland – Namensnennung – Version 2.0" empfohlen.

Wichtige Fragen zur Prüfung bei der Regelung der Weiterverwendung von Datensätzen:

  • Gehören die Datensätze, die ich veröffentlichen möchte, meiner Organisation?
  • Welche Stelle in meiner Organisation kann über die Regelungen zur Weiterverwendung von Datensätzen entscheiden?
  • Gibt es in meiner Organisation bereits Vorgaben für offene Nutzungsbestimmungen?

Datensätze für Dritte online verfügbar machen

In diesem Schritt geht es darum, die eigenen Datensätze auf eine geeignete Webseite zu stellen und dann leicht online auffindbar zu machen.

Um die Auffindbarkeit zu erleichtern und eine Weiterverwendung zu vereinfachen, sollten Sie die einzelnen Datensätze nach einem einheitlichen Schema beschreiben. Hier bietet sich die in GovData verwendete und bereits mit Bund und Ländern abgestimmte Metadatenstruktur an (die Beschreibung Ihrer Datensätze nach diesem Schema ist Voraussetzung, wenn Ihre Datensätze z.B. über GovData verzeichnet werden sollen). Zur Zeit wird die OGD-Metadatenstruktur weiterentwickelt, so dass voraussichtlich noch in 2016 eine überarbeitete Metadatenstruktur veröffentlicht werden wird. Über diesen Standardisierungsprozess und die Ergebnisse werden wir hier im Portal informieren. 

Die Entscheidung für eine bestimmte Webseite, auf der die eigentlichen Datensätze veröffentlicht werden sollen, hängt vom Einzelfall ab. Wird der Datensatz neu veröffentlicht, so hängt die Entscheidung für den Ort der Online-Veröffentlichung von der eigenen Online-Strategie der jeweiligen Organisation ab. Bereits existierende Open-Data-Portale aber auch der bestehende Internetauftritt Ihrer Organisation sind z.B. geeignete Orte, um Ihre offenen Datensätze bekannt zu machen. Wenn der Datensatz bereits vor seiner Öffnung auf einer Webseite der eigenen Organisation online verfügbar war, können Mitarbeiter öffentlicher Stellen auch – in Absprache mit ihrer Organisation – diesen Datensatz mittels Beschreibung und Verlinkung im nationalen Datenkatalog von GovData verzeichnen und somit bekannt machen.

Natürlich sind nicht alle Datensätze für Nutzer selbsterklärend. Durch die Veröffentlichung als offene Daten und Weiterverwendung der Datensätze können sich daher Fragen zum Inhalt oder den technischen und rechtlichen Aspekten bei Datennutzern ergeben. Ein gutes Verständnis ist unerlässlich für bspw. die Entwicklung von intelligenten Anwendungen auf Basis ihrer Daten. Helfen Sie daher den Nutzern bei Fragen im Rahmen Ihrer Möglichkeiten.

Wichtige Fragen zur Online-Veröffentlichung von Datensätzen:

  • Können die Datensätze in technisch weiterverwendbaren Formaten und unter offenen Nutzungsbestimmungen online gestellt werden (siehe Abschnitte 2 und 3)?
  • Habe ich die administrativen Rechte am technischen Online-Auftritt meiner Organisation, um Datensätze zu veröffentlichen? An wen muss ich mich andernfalls wenden?
  • Sind die Datensätze bereits online verfügbar? Müssen eventuell nur die Nutzungsbestimmungen oder Metadaten überarbeitet werden?
  • Verfügt meine Organisation über eine Webseite/Internetportal auf der offene Verwaltungsdaten gesammelt veröffentlicht werden?

Nutzen Sie GovData – Das Datenportal für Deutschland

Je mehr Datensätze offen zur Verfügung stehen, umso größer ist die Möglichkeit potentieller Nutzer, diese miteinander zu kombinieren und sinnvolle und innovative Anwendungen zu entwickeln. Wichtig ist zudem, dass die Daten nicht nur verfügbar, sondern auch für die Interessenten auffindbar sind. Gute maschinenlesbare Daten sind wenig wert, wenn niemand weiß, dass sie existieren. Ein zentrales Datenportal mit einem einheitlichen Metadatenschema, das einen zentralen Zugang zu Datensätzen von Bund, Ländern und Kommunen bietet, vereinfacht es Nutzern, benötigte Datensätze ausfindig zu machen. Nutzen Sie daher zur Veröffentlichung Ihrer Daten GovData als zentrales Datenportal für Deutschland.

Kommunizieren Sie Ihre Open-Data-Aktivitäten

Machen Sie zusätzlich zu Ihren offiziellen Pressemitteilungen auch von anderen verfügbaren Kommunikationswegen, wie Bekanntmachungen auf Ihrer Webseite oder Newslettern Gebrauch, um auf Ihre Open-Data-Aktivitäten aufmerksam zu machen. Neben einer Imageverbesserung als innovative Verwaltungsorganisation haben Sie so zudem die Möglichkeit, wichtige Rückmeldungen zu Ihren Aktivitäten zu erhalten, über Innovationen zu diskutieren und somit Ihren Service für Bürger und die Nutzer Ihrer Daten weiter zu verbessern.

Die Datenbereitstellung über GovData

Über GovData bieten öffentliche Stellen aus Bund, Ländern und Kommunen Daten der Verwaltung an. So können Verwaltungsmitarbeiter, Bürger, Unternehmen und Wissenschaftler über einen zentralen Einstiegspunkt auf Daten und Informationen der öffentlichen Verwaltung in Deutschland zugreifen. Im Folgenden wird vorgestellt, auf welche verschiedenen Arten Daten Ihrer Verwaltungs-Institution in GovData aufgenommen werden können.

Bislang beteiligen sich neben dem Bund die folgenden Länder an GovData:

  • Baden-Württemberg
  • Berlin
  • Brandenburg
  • Bremen
  • Hamburg
  • Mecklenburg-Vorpommern
  • Nordrhein-Westfalen
  • Rheinland-Pfalz
  • Sachsen
  • Schleswig-Holstein

Verwaltungsinstitutionen dieser Länder, ihrer Kommunen und des Bundes können Daten auf GovData veröffentlichen. Wenn Sie Ihr Land nicht in dieser Liste finden, aber trotzdem Ihre Daten bei GovData veröffentlichen möchten, sprechen Sie mit dem Verantwortlichen aus Ihrem Land über den Beitritt zur Verwaltungsvereinbarung.

 

Unabhängig davon, für welche Variante Sie sich entscheiden: Bevor Sie GovData zur Datenbereitstellung nutzen können, benötigen Sie ein entsprechendes Nutzerkonto. Dafür sind vier Schritte erforderlich:

  1. Registrieren Sie sich unter govdata.de als Nutzer.
  2. Senden Sie eine (formlose) E-Mail an das Redaktionsteam von GovData. Die E-Mail sollte Ihren Nutzernamen, Institution sowie die Bitte um Umwandlung Ihrer Nutzerkontos in ein Datenbereitsteller-Konto enthalten.
  3. Das Redaktionsteam wird prüfen, ob Sie als Datenbereitsteller zugelassen werden. Hierzu werden Sie gebeten, verschiedene Voraussetzungen zu bestätigen.
  4. Sobald Sie alle Voraussetzungen bestätigt haben, wird Ihr Konto in ein akkreditiertes Datenbereitsteller-Konto umgewandelt. Ab diesem Zeitpunkt können Sie Ihre Daten über GovData verfügbar machen.

Für die Datenbereitstellung bieten sich – in Abhängigkeit von der Anzahl der Datensätze und den eigenen technischen Voraussetzungen – unterschiedliche Varianten an.

Variante 1: (Manuelle) Bereitstellung per Webformular

Dies ist die einfachste, aber bei einer größeren Anzahl von Datensätzen auch aufwändigste Bereitstellungs-Variante. Daher sollten sie diese nur nutzen, wenn Sie gerade erst mit der Öffnung Ihrer Daten starten oder nur wenige Daten bereitstellen wollen. Mittelfristig sollten Sie jedoch versuchen, eine der drei automatisierten Varianten zu wählen.

Für eine Nutzung des Webformulars müssen Sie sich als akkreditierter Datenbereitsteller auf dem Portal angemeldet haben (siehe oben). Auf den Seiten „Daten" bzw. „Dokumente" finden Sie dann den Link „Datensatz/Dokumente hinzufügen". Hierunter ist ein Eingabeformular eingestellt, über das alle erforderlichen Angaben abgefragt werden. Sobald Sie alle Felder ausgefüllt haben, klicken Sie auf „Absenden". Ihre Angaben werden dann noch einmal durch das Redaktionsteam geprüft und anschließend veröffentlicht.

Um die Angaben zu bereits veröffentlichten Datensätzen im Nachhinein zu bearbeiten, besuchen Sie die Detail-Seite des jeweiligen Datensatzes und klicken dort auf "Bearbeiten". Hier können Sie nun einzelne Angaben ändern oder auch weitere Ressourcen hinzufügen.

Diese Funktion wird zur Zeit überarbeitet und steht voraussichtlich ab April wieder zur Verfügung.

Variante 2: (Automatisierte) Bereitstellung per CKAN-API

Sollten Sie einen eigenen Datenkatalog besitzen, können Sie Ihre Daten hierüber auch automatisiert zur Verfügung stellen. CKAN, das auch die Grundlage von GovData bildet, bietet dazu eine Programmierschnittstelle (englisch „application programming interface", API) an, über die neue Datensätze oder Aktualisierungen direkt ausgetauscht werden können. Sie müssen dafür für Ihren Katalog ein Skript schreiben, das diese Schnittstelle anspricht.

Die URL der Schnittstelle von GovData ist https://www.govdata.de/ckan/api. Die Datensätze müssen der Metadaten-Struktur von GovData entsprechen. Darüber hinaus benötigen Sie für die Nutzung einen so genannten API-Key. Bitte wenden Sie sich hierzu an das Redaktionsteam. Weitere allgemeine Informationen zur Schnittstelle finden Sie in der Dokumentation auf der CKAN-Website .

Variante 3: (Automatisierte) Bereitstellung per „JSON-Dump"

Falls Sie Ihre Datensätze in einem anderen Katalog registriert haben, aber nicht die CKAN-API verwenden wollen, besteht die Möglichkeit, dass Sie uns einen Export Ihres Katalogs über eine statische URL bereitstellen. Diesen können wir dann in regelmäßigen Abständen in GovData importieren.

Voraussetzung dafür ist, dass Ihr Datenkatalog-Export im JSON-Format und gemäß der Metadaten-Struktur von GovData erfolgt. In der Beschreibung der Metadaten-Struktur finden Sie u.a. auch Hinweise, wie Sie prüfen können, ob Ihr Export den Anforderungen der GovData-Metadatenstruktur entspricht.

Variante 4: (Automatisierte) Bereitstellung CKAN

Zu guter Letzt besteht die Möglichkeit, dass Ihre Daten von GovData über einen so genannten „Harvester" eingesammelt werden. Dies setzt voraus, dass Ihre Datensätze in einem anderen CKAN-basierten Katalog registriert sind. Dieses Verfahren bietet sich an, wenn Ihre Metadaten-Struktur nicht der Struktur von GovData entspricht. Allerdings ist die Entwicklung eines solchen Harvesters mit zusätzlichen Aufwänden verbunden, besonders wenn Ihre Struktur der von GovData nicht entspricht. Sollten Sie Interesse an dieser Variante haben, kontaktieren Sie bitte das Redaktionsteam von GovData.

Tools zur Qualitätskontrolle für Datenbereitsteller

Die Qualität der Datensätze ist maßgeblich für die Qualität der Wahrnehmung des Portals. Die Geschäfts- und Koordinierungsstelle GovData wird als Portalbetreiber in steigendem Maße auf die Qualität der Datensätze achten und zunehmend auf Fehler in den Metadaten oder auf nicht funktionierenede Links hinweisen und reagieren. Datenbereitsteller haben die Möglichkeit sich selbst regelmäßig im von uns bereitgestellten Verweis- oder Schemaprüfer von der Qualität der Datensätze zu informieren. 

Weitere Hilfestellungen für Datenbereitsteller

Neben den oben stehenden Artikeln gibt es natürlich noch eine Vielzahl weiterer Informationen für Datenbereitsteller. Eine Auswahl an Links finden Sie im Folgenden:

(Stand: 16.01.2016)