Hochwertige Datensätze
Wir bekommen verstärkt Nachfragen zu Hochwertigen Datensätzen (HVD). Diese Infoseite werden wir nach und nach mit Inhalt dazu füllen. Einen ersten ausführlichen Blogpost haben wir bereits verfasst. Anregungen und Fragen nehmen wir gerne entgegen.
- Anregung Die Liste der Hochwertigen-Datensätze als CSV-Liste bereistellen. Diese könnte als Arbeitsinstrument dienen und man könnte damit auch die Fachabteilungen informieren. Dieser Bedarf wird sicher in vielen Kommunen und anderen öffentlichen Stellen auftreten. Daher wäre es gut, wenn diese Datei zentral bereitgestellt wird.
- Aktueller Stand: Unbekannt
- Frage In welchen Feldern muss ich bei CKAN- bzw. DKAN-Portalen die neuen Eigenschaften für Hochwertige Datensätze hinterlegen?
- Aktueller Stand: Derzeit im Gespräch sind 2
Extras
-Felder fürhvdCategory
undapplicableLegislation
.
Hier der aktuellen Stand des Diskurses zur Auszeichnung und Beschreibung von sogenannten Hochwertigen Datensätzen (HVD) mittels eines DCAT-AP konformen Metadatensatzes (folgend HVD-Metadaten) zusammengefasst. Dabei beziehen wir uns auf DCAT-AP HVD dessen Status momentan „Candidate Recommendation“ ist. Grundsätzlich lässt die Durchführungsverordnung zu HVD (HVD DVO) den Weg der Umsetzung offen, es gibt allerdings einen standardisierte Umsetzungsvorschlag durch die SEMIC, den GovData unterstützt und auf den sich das Folgende bezieht.
Allgemein
Die HVD-Metadaten müssen, neben grundsätzlichen Angaben wie bspw. Titel, Beschreibung, Zuständigkeit und Adresse zum Abruf, nur wenige zusätzliche Angaben enthalten. Maßgeblich sollen HVD als solche gekennzeichnet sein, die jeweilige Kategorie muss gemäß der HVD DVO ausgewiesen werden und die HVD-Metadaten müssen die für die jeweilige Kategorie angegebenen Eigenschaften umfassen. Letztere können je nach Kategorie auch durch andere jeweils referenzierte Verordnungen bzw. domänenrelevante Standards beschrieben werden (z.B. INSPIRE). Die aus der HVD DVO entstehende Pflicht zur Berichterstattung kann über die Kataloge der nationalen Datenportale, hier GovData, erfolgen.
Relevante Standards und technische Grundlagen
Die im folgenden beschriebenen Strukturen basieren auf DCAT3, einem Standard des W3C. GovData erfasst, wie viele europäische Portale, DCAT-AP konforme Metadaten. Der abgeleitete nationale Standard ist DCAT-AP.de. Im Sinne der Durchführungsverordnung können verschiedene Ressourcen als HVD ausgewiesen werden, die wichtigsten sind Datensätze und Datenservices. Die Anforderungen an Datenservices sind dabei tendenziell umfassender und komplexer, weswegen sich die folgenden Angaben auf die Angaben konzentrieren die alle Ressourcen betreffen.
DCAT-AP-konforme Kennzeichnung von Hochwertigen Datensätzen und Zuordnung zur HVD-Kategorie
Eine Bedingung ist, dass HVD als solche ausgewiesen werden. Dies geschieht mittels der Eigenschaft dcatap:applicableLegislation
die auf eine dcatap:LegalResource
(bevorzugt eli:LegalResource
) verweisen muss. Im Kontext von HVD muss deren Wert mindestens den ELI Identifikator (http://data.europa.eu/eli/reg_impl/2023/138/oj) der HVD DVO enthalten. Zusätzlich muss die HVD-Kategorie gemäß des Anhang I der Verordnung ausgewiesen werden. Dazu wird dcatap:hvdCategory
verwendet, das als Wert den Eintrag der (Haupt-)Kategorie aus EU Vocabularies HVD Categories verlangt. Beide Eigenschaften dürfen mehrfach vorkommen (z.B. ein Datensatz erfüllt verschiedene Richtlinien und/oder gehört zu mehreren Kategorien).
Berichterstattung
Eine (automatisierte) Bereitstellung eines Katalogs, bestehend aus allen Einträgen der nationalen Datenportale, die als HVD ausgezeichnet sind, bietet sich als Berichterstattung an. Diesen Katalog kann GovData automatisch bereitstellen. Der Katalog kann mittels eines Profils DCAT-AP HVD auf formale Kriterien hin validiert werden. Neben den genannten Kriterien der Auszeichnung sind das für Datensätze allgemein beispielsweise das Vorhandensein einer Distribution (dataset distribution, dcat:distribution
) mit einer Adresse zum Abruf (dcat:accessURL
).
Beispiel eines HVD-Metadatensatzes
Im Folgenden ein Minimalbeispiel für einen validen HVD-Metadatensatz im Format Turtle. Zu beachten ist, dass diese Anforderungen nicht, die sich aus der jeweiligen Kategorie (z.B. „Georaum“) ergebenden, domänenspezifischen Anforderungen an HVD erfüllt, sondern nur die abstrakten Anforderungen, die sich zusätzlich aus der Tatsache ergeben, dass es sich um einen HVD handelt. Beispielsweise gelten für verschiedene Datensätze, die aus der INSPIRE Richtlinie hervorgehenden Angabe der Metadatenelemente als verpflichtend, die in der entsprechenden Verordnung (Seite 12 ff.) festgelegt sind.
(Beispiel angelehnt an die offizielle DCAT-AP Dokumentation)
#Anmerkungen sind durch das „#“-Symbol gekennzeichnet. Die beiden fett hervorgehobenen Eigenschaften sind dabei HVD spezifisch und gemäß DCAT-AP HVD.
prefix : <http://www.example.org/rdf#> #Beispielnamensraum
prefix dcat: <http://www.w3.org/ns/dcat#> #DCAT3 Vokabular
prefix dcatap: <http://data.europa.eu/r5r/> #Namensraum für DCAT-AP definierte Eigenschaften
prefix dct: <http://purl.org/dc/terms/> #Dublin Core Vokabular
#Weist das Objekt http://www.example.org/rdf#/dataset_bienen als Datensatz aus.
:dataset_bienen a dcat:Dataset;
#Titel des Datensatzes
dct:title "Erhebung der Bienenpopulation"@de;
#Beschreibung des Datensatzes
dct:description "Der Datensatz umfasst die Bienenpopulation gemäß einer jährlichen Umfrage von Imker:innen und Landwirt:innen.“@de;
#HVD DVO zur Bereitstellung von HVD
dcatap:applicableLegislation <http://data.europa.eu/eli/reg_impl/2023/138/oj>;
#HVD Kategorie „Erdbeobachtung und Umwelt“
dcatap:hvdCategory <http://data.europa.eu/bna/c_dd313021>;
#HVD müssen Distributionen angeben.
dcat:distribution :distribution_bienen.
#Weist das Objekt als Distribution aus.
:distribution_bienen a dcat:Distribution;
#Auch für die Distribution muss auf die Kategorie und Rechtsakt verwiesen werden.
dcatap:applicableLegislation <http://data.europa.eu/eli/reg_impl/2023/138/oj>;
dcatap:hvdCategory <http://data.europa.eu/bna/c_dd313021>;
#URL für direkten Zugriff auf die Distribution (Download)
dcat:accessURL <http://download.example.org/bulk/distribution_bienen>.
(Stand: 23.10.2023)