Selecteer een pagina

Gooi de archieven open!

Open data en hergebruikverzoeken

Algemeen, Beleid, Communicatie, Management, Open Data, Organisatie

Open Archieven: openarch.nl

Archiefinstellingen beheren veel informatie. In papieren vorm, gedigitaliseerd en in toenemende mate digital born; veelal voorzien van beschrijvingen, metadata en indexen. Archieven horen deze documenten niet alleen te beheren, maar ook beschikbaar te stellen aan de buitenwereld. De komst van de Wet Hergebruik Overheidsinformatie heeft direct invloed op deze taak. Op verzoek moeten er gegevens in machine leesbaar formaat geleverd worden. Maar waarom wachten op hergebruikverzoeken, als er nu al voordeel met open data te halen valt? Archieven zijn van oudsher te typeren als datamonopolies. De archieven hadden alle informatie en maakte dus een eigen website, waarbij een beperkt aantal leveranciers de benodigde software en diensten leverden. Archieven steken miljoenen in software projecten, vaak met een niet-open architectuur die slecht aansluit bij de wensen van de beoogde gebruikers. Technisch gezien is er heel veel mogelijk, maar zonder de juiste data begin je weinig.

Innovatie door hergebruik van data lod-datasets_2007-11-10

Sommige archieven zien open data – waarbij de gegevens in een machine leesbaar formaat, volgens open standaard en onder open licentie ter beschikking worden gesteld voor hergebruik – als logische invulling van hun missie. Archieven als Erfgoed Leiden en omstreken, gemeentearchief Ede, Regionaal Archief Tilburg en het Nationaal Archief bieden nu al enige tijd open data. Met deze data ben ik aan de slag gegaan, resulterende in de website Open Archieven. De website heeft verschillende doelen: om de archiefsector (als secundaire doelgroep) te laten zien dat open data niet eng is, dat er behoefte is aan herbruikbare data, dat er goed met bronvermeldingen wordt omgegaan, dat kwaliteit belangrijk is en bovenal dat op deze wijze innovatie tot stand komt.

De akten op Open Archieven worden waar mogelijk voorzien van contextuele informatie, veelal uit weer andere open databronnen. Zo kan de datum in akte gekoppeld worden aan het historisch weer zoals het KMNI deze verschaft. Ruimtelijke gegevens kunnen verrijkt worden vanuit volkstellingen en beter gevisualiseerd worden met historische kaarten. Ook blijkt in de nadere toegang tot de akten (waarbij de focus ligt op genealogisch materiaal) veel informatie te zitten. Zo kunnen automatisch gerelateerde akten gepresenteerd worden, kunnen familierelaties grafisch in beeld gebracht worden en kan de frequentie van beroepen over de tijd heen in een grafiek geplaatst worden, over de grenzen van de archiefinstellingen heen! De primaire doelgroep van Open Archieven zijn de (stamboom)onderzoekers.

Zonder enige subsidie moet de website in de lucht blijven en groeien, een abonnementsmodel waarbij het gratis gebruik uitgebreid wordt met extra functies was al snel geboren. Ook hier om aan te tonen dat je met de open data zelf niets kan verdien, maar er wel diensten mee kan maken die toegevoegde waarde bieden en waarvoor gebruikers willen betalen. De website kreeg ondanks deze kwaliteiten relatief weinig aandacht en bezoek, hetgeen helaas was terug te voeren op het aspect kwantiteit. Websites met meer informatie zijn geliefder. Uitbreiding op het vlak van data was dus nodig. Hoewel Open Archieven archiefinstellingen geen kosten rekent (in tegenstelling tot de diensten die archiefinstellingen nu gebruiken), kwam er niet altijd een positief antwoord op informele vragen om data.

Archieven aan de slag met hergebruikverzoeken

Op 18 juli 2015 is de Wet Hergebruik Overheidsinformatie (Who) en de hierop aangepaste Archiefwet in werking getreden. Op basis van deze wetten kan er aan een overheidsinstelling gevraagd worden om bestaande informatie in machine leesbaar formaat ter beschikking te stellen voor hergebruik, mits het openbaar materiaal betreft dat niet privacy- of concurrrentiegevoelig ligt. Begin 2016 hebben een zestigtal archiefinstellingen een hergebruikverzoek van mij ontvangen. Deze spitste zich toe op de indexen (ook wel nadere toegangen genoemd) op akten van bronnen als Burgerlijke Stand, doop-, trouw- en begraafboeken, bevolkingsregisters, militieregisters, enzovoorts Niet geheel onverwacht waren de reacties zeer verschillend en vaak niet als formeel besluit beschreven, maar toch overwegend positief. Een enkel archief reageerde binnen één dag met de locatie waar zij al hun data als open data beschikbaar hadden gemaakt.

Bij een hergebruikverzoek vraag je strikt gezien niet om open data, maar open data is natuurlijk wel het slimste antwoord. Bij elk individueel hergebruikverzoek kun je namelijk eenvoudig verwijzen naar die open data. Voor de meeste archiefinstellingen betekende het hergebruikverzoek echter dat ze naar hun leverancier moesten stappen. Deels doordat er onvoldoende ICT-kennis meer aanwezig is, deels omdat er producten worden gebruikt waar de gegevens niet eenvoudig uit gehaald kunnen worden, of, waarvan de archiefinstelling niet wist hoe dat moest. Sommige archieven maakten zelf een export van hun data, of leverden de bronbestanden aan mij. Gevolg was dat ik een bonte verzameling aan XML-, CSV-, XLS-, MDB- en TXT-bestanden ontving, in de meeste gevallen niet volgens een open standaard. In tegenstelling tot open data, hoeven de gegevens die worden verzocht via een hergebruikverzoek niet te voldoen aan een standaard (er is slechts een inspanningsverplichting). Ik heb het op me genomen om alle informatie om te zetten in de A2A standaard, die via Open Archieven weer als open data worden aangeboden aan andere hergebruikers (de tertiaire doelgroep).

Resultaat van de hergebruikverzoeken

Nu, medio 2016, heeft ongeveer de helft van de hergebruikverzoeken nog niet geleid tot het ter beschikbaar stellen van data. Enkele archieven willen de kosten voor aanpassing van hun systeem of het uitvoeren van exports doorberekenen als marginale kosten. Dergelijke kosten vind ik onacceptabel; ik wacht dan maar tot dat ook zij het “open data licht” zien. Sommige archieven zitten in een reorganisatie of hebben 0.5 fte voor het gehele archief, die krijgen meer tijd. Andere archieven willen wel en hebben een leverancier die hiervoor een oplossing biedt, maar moeten nog ruimte op de begroting vinden. Als de wil er is, ben ik tevreden en heb ik geduld (waarbij ik wel de vinger aan de pols houdt). De andere helft van de hergebruikverzoeken heeft al wel geleid tot herbruikbare data, via open data of directe aanleveringen. Op de website Open Archieven prijken begin juni 2016 ruim 138 miljoen historische persoonsgegevens van 46 archiefinstellingen. Het gebruik van de website stijgt, inclusief betalende gebruikers. Ook internationale partijen geven aan geïnteresseerd te zijn in de data. Een sprekend voorbeeld van de kracht van open data.

De voordelen van open data

  • De gegevens (zoals inventarissen, indexen en beeldmateriaal) kunnen worden getoond op andere platforms en in door derden nieuw te bouwen websites en apps, hetgeen meer “views” oplevert van het materiaal.
  • Als er in de gegevens ook referenties worden opgenomen naar de eigen website, zal dit vaak leiden tot meer bezoekers naar de eigen website doordat deze links in de website/app van de derde worden opgenomen.
  • De gegevens kunnen op andere wijzen gevisualiseerd en geanalyseerd worden, niet alleen op de manier die het eigen archiefsysteem toestaat.
  • De gegevens kunnen door derden met andere ogen bekeken worden wat kan leiden tot nieuwe inzichten, foutopsporing (dus kwaliteitsverhoging) of koppelingen met ander(soortig)e collecties.
  • De gegevens kunnen worden gebruikt door particulieren, verenigingen en bedrijven, hetgeen tot verhoogde participatie, economische bedrijvigheid en innovatie kan leiden.

Is uw organisatie klaar voor een hergebruikverzoek?

  • Zorg dat er kennis is op het gebied van wetgeving, waaronder de Wet Hergebruik Overheidsinformatie en Archiefwet (de meest recente versie stamt van 18 juli 2016).
  • Zorg dat de te volgen procedure bekend is, bij formele verzoeken dient er een besluit genomen te worden, kan er bezwaar worden gemaakt, kan men in beroep en gelden er termijnen (Wet Dwangsom).
  • Zorg dat u weet welke informatie waar beschikbaar is en hoe het staat zaken als openbaarheid, privacy en auteursrechten.
  • Zorg dat er kennis is van de gebruikte systemen, ook op het vlak van export en uitwisselingsmogelijkheden.
  • Zorg dat uw applicaties gebaseerd zijn op een open architectuur en dat er open standaarden gebruikt worden.
  • Tip: ben hergebruikverzoeken vóór, door een ’open, tenzij‘ beleid te hanteren!
[Redactie: Bob Coret zijn presentatie over dit onderwerp op de KVAN dagen is hieronder te bekijken:]

BMC logo[UITGEVER:] Dit artikel is onderdeel van de Special Edition voor de BMC CultuurConferentie 2016 over Participatie en Community building.

468

Reactie verzenden

Share This