Skip to main content

Hackathon 2024: samen bouwen aan een digitale professorendatabase

Geplaatst op 1 april 2025

Op een koude decemberochtend verzamelen erfgoedspecialisten, dataspecialisten en ontwikkelaars zich in de Universiteitsbibliotheek Utrecht (UBU). Hun missie? De historische Catalogus Professorum Academiae Rheno-Traiectinae digitaliseren en verrijken met Linked Open Data (LOD). Drie dagen lang dompelen ze zich onder in datamodellen, Wikibase en OpenRefine. Dit is Hackathon 2024: een unieke samenwerking tussen de UBU, Wikimedia Nederland en andere erfgoedinstellingen. Maar zoals bij elke hackathon, zijn er onverwachte uitdagingen en waardevolle ontdekkingen.

Waarom deze hackathon?

De Catalogus Professorum bevat gegevens over hoogleraren van de Universiteit Utrecht sinds de oprichting in 1636. Het doel van deze hackathon is om deze rijke historische dataset om te zetten in Linked Open Data (LOD) volgens de vijfsterrencriteria van Tim Berners-Lee. Dit zorgt ervoor dat de informatie niet alleen open, maar ook interoperabel en herbruikbaar wordt voor onderzoek en onderwijs. 

Dit project biedt niet alleen een kans om LOD-methodieken te verkennen en kennis binnen de bibliotheek te vergroten, maar ook om de professorendata in Wikibase te verrijken én effectief te integreren met Wikidata. Veel professoren staan al op Wikidata, maar de bijbehorende afbeeldingen worden vaak niet gedeeld onder de juiste auteursrechtelijke licentie.Door deze gegevens te koppelen aan bestaande Wikidata-items en rechtenvrije of licentie-compatibele portretten toe te voegen via Wikimedia Commons, draagt het project bij aan de versterking van open kennisnetwerken. Zo wordt de historische professorendatabase niet alleen verrijkt, maar ook gedeeld en herbruikbaar gemaakt binnen de bredere Wikimediaprojecten. Dit bevordert zowel de interoperabiliteit als de toegankelijkheid van deze waardevolle gegevens.

Een diverse groep deelnemers

Zo’n 25 professionals met uiteenlopende achtergronden nemen deel:

  • Erfgoed- en dataspecialisten die werken met bijzondere collecties;
  • Technische specialisten en ontwikkelaars;
  • Beleidsmakers die zich richten op duurzame digitale infrastructuren.

Deze mix van expertise leidt tot dynamische discussies en innovatieve oplossingen.

De hackathon in actie

Tijdens de hackathon werken de deelnemers drie dagen intensief met Linked Open Data en Wikibase om de Catalogus Professorum te digitaliseren. Het programma bestaat uit een combinatie van trainingen en hands-on werksessies.

Dag 1: De basis leggen

Deelnemers krijgen een introductie in Linked Open Data en het vijfsterrenmodel. Samen stellen ze een datamodel op en verfijnen ze het, terwijl ze leren hoe ze relaties tussen hoogleraren en andere entiteiten kunnen vastleggen in Wikibase.

Dag 2: Publicatie en strategie

De focus ligt op manifestconfiguratie en publicatie. Deelnemers leren hoe ze een manifest kunnen opstellen voor datatoegang en hergebruik. Daarnaast vinden er discussies plaats over de toekomst van de dataset en mogelijke uitbreidingen.

Dag 3: Data cleaning en verrijking

Deze dag draait om het opschonen en afstemmen van de professorendata met OpenRefine. Ook wordt er gewerkt aan het koppelen van gegevens met Wikidata en andere externe bronnen.

Toch blijkt al snel dat een manifest alleen niet genoeg is. Er is een gegevenskoppeling nodig om de data correct te koppelen aan bestaande gegevens in Wikibase. Binnen de scope van de hackathon is dit niet haalbaar, maar het vormt de basis voor een volgende fase.

Deelnemers aan het woord

De hackathon blijkt een inspirerende ervaring. Eén deelnemer zegt:

"Ontzettend leuk om het abstracte concept van LOD concreet te maken en tot zichtbare resultaten te komen!"

Een ander voegt toe:

"Het was goed om na alle theorie ook echt iets in de praktijk te brengen. Dat helpt om de tools goed onder de knie te krijgen."

Uitdagingen en lessen

Zoals bij elk innovatief project zijn er ook obstakels. Het belang van duidelijke regels voor data cleaning en een valide datamodel wordt extra benadrukt. Ook blijkt het uploaden van de opgeschoonde data naar Wikibase complexer dan verwacht. De noodzaak van een reconciliatieservice wordt pas op de laatste dag ontdekt, waardoor dit als prioriteit op de lijst voor fase 2 komt te staan.

Concrete resultaten

Ondanks de uitdagingen levert de hackathon veel op:

  • Een werkend datamodel voor professorendata in Wikibase;
  • Schoongemaakte en verrijkte datasets die beter aansluiten op externe bronnen;
  • Een eerste versie van een manifest voor datagebruik en doorontwikkeling;
  • Versterkte samenwerking tussen instellingen en experts op het gebied van LOD.

En nu? Fase 2 en de toekomst

Na deze succesvolle eerste fase gaat het werk door:

  • Technische infrastructuur: Het opzetten van een Docker-omgeving en een reconciliatieservice;
  • Data-upload: Het verwerken van de opgeschoonde data in Wikibase;
  • Dataset-uitbreiding: Toevoegen van promotiegegevens uit het Album Promotorum en afbeeldingen uit het Universiteitsmuseum;
  • Integratie met WorldCat: Bibliografische koppelingen maken met bestaande catalogi.

Ook wordt samengewerkt met studenten binnen de werkgroep Universiteitsgeschiedenis, zodat zij praktijkervaring kunnen opdoen met digitale erfgoedverwerking.

PICA-aanvraag: Catalogi Professorum verbinden

Een belangrijk vervolgproject is de PICA-aanvraag, die zich richt op het verbinden van verschillende Catalogi Professorum van universiteiten via Linked Open Data. Dankzij de inzichten uit de hackathon komt deze ambitie steeds dichterbij.

Conclusie: een waardevolle ervaring

Hackathon 2024 was intensief, leerzaam en inspirerend. Er zijn concrete stappen gezet om de Catalogus Professorum als Linked Open Data te publiceren, en de samenwerking tussen instellingen is versterkt. De komende maanden worden de eerste resultaten verder verfijnd en doorontwikkeld. Eén ding is zeker: deze hackathon heeft de basis gelegd voor een duurzame, open en toegankelijke digitale professorendatabase. We kijken uit naar de volgende stappen!

Meer weten?

Voor meer informatie over de hackathon en de uitkomsten kun je contact opnemen met Michelle Boon van de Universiteitsbibliotheek Utrecht.

Deel dit artikel op: