Back to top

Het Fries Verzetsmuseum heeft als eerste deelnemer de WO2-thesaurus gekoppeld aan hun Adlib collectieregistratiesysteem. Hiermee kunnen zij op geautomatiseerde wijze termen ontlenen uit de WO2-thesaurus en staan zo met twee benen in de wereld van Linked Open Data en het semantisch web.

Het Netwerk Oorlogsbronnen gebruikt de WO2-thesaurus om de brondata van deelnemers te verrijken en aan elkaar te koppelen. Dat gebeurt nu – behalve dus bij de collectie van het Fries Verzetsmuseum - door ‘matching’. Dat wil zeggen: het geautomatiseerd toekennen van WO2-trefwoorden aan bronnen. Hierbij zoekt een computer naar identieke of vergelijkbare termen in exports van objectbeschrijvingen uit collectiebeheersystemen en de WO2-thesaurus. Als termen in een objectbeschrijving worden gevonden dan maakt de computer (in een extern bestand) verwijzingen aan. We leggen vast dat in object X, van organisatie Y, term Z uit de WO2-thesaurus gebruikt is. Door dit te doen kunnen we bij ieder bronobject extra context informatie tonen uit de thesaurus.

Zelf verwijzen

Idealiter zou echter deze verrijkings-stap worden overgeslagen. In de wereld van linked open data en het semantisch web slaat iedere instelling een verwijzing op naar het concept van een woord, in plaats van het woord zelf. Door naar concept te verwijzen wordt ondubbelzinnig duidelijk wat er bedoeld wordt. Een woord kan soms verschillende betekenissen (concepten) hebben, homoniemen. ‘Bank’ kan bijvoorbeeld verwijzen naar een zitmeubel, financiële instelling of een aarden wal. Maar het kan natuurlijk ook zijn dat de ene registrator ‘bunker’ als term gebruikt en de ander ‘kazemat’, oftewel synoniemen.

Om bovenstaande problemen te ondervangen biedt het collectieregistratiesysteem Adlib de mogelijkheid om een gevalideerde termenlijst te gebruiken, oftewel een thesaurus, waarin je beide termen opneemt, het concept beschrijft en aangeeft welke term de voorkeur heeft. De medewerker kan dan op basis van beide termen het object beschrijven of vinden, maar Adlib verwijst naar hetzelfde concept met een uniek id (de ‘linkref’ in Adlib jargon).

Advanced External Source

Het volgende probleem ontstaat echter wanneer je collecties van verschillende instellingen met elkaar wilt verbinden (dat wat Netwerk Oorlogsbronnen doet). De ene thesaurus is namelijk niet de andere thesaurus (en zullen de linkrefs niet overeenkomen), en kan er dus geen ‘match’ plaatsvinden. Gelukkig bestaat er in Adlib ook een oplossing voor dit probleem: ‘Advanced External Source’.

Dit is vergelijkbaar aan de interne thesaurus, alleen maak je nu gebruik van een externe bron van waaruit Adlib de termen en unieke id’s ontleent. Tot voor kort bestond er echter nog geen mogelijkheid om de WO2-thesaurus aan Adlib te koppelen. Inmiddels is er echter met dank aan Rolf Blijleven een interface ontwikkeld. Hierdoor is het mogelijk om termen uit de WO2-thesaurus direct te koppelen aan Adlib op de manier die je gewend bent. Naast de interne linkref in Adlib wordt er dan ook een unieke url (oftewel de uri: uniform resource identifier) aan het te beschrijven object toegevoegd: https://data.niod.nl/WO2_Thesaurus/3563. 

Wie volgt?

Op deze manier kunnen collecties onderling met elkaar ‘praten’ en ook begrijpen welk concept er bedoeld wordt. Het streven is dat meer instellingen de WO2-thesaurus gaan gebruiken. Uiteraard blijft daarnaast het gebruik van een interne thesaurus waarschijnlijk nodig voor collectie/instelling specifieke termen, maar het zou fantastisch zijn als voor minder specifieke termen de WO2-thesaurus wordt gebruikt.