Back to top

In de interviewserie 'De mensen van TRIADO' komen betrokkenen bij het project Tribunaalarchieven als digitale onderzoeksfaciliteit aan het woord. Ze vertellen over hun expertise en rol in het project. Maar ook over hun verwachtingen en het belang van TRIADO. In deze tweede aflevering: Marian Hellema, zelfstandig ICT-erfgoedspecialist. 

 

Hellema heeft een workflow-document opgesteld voor de digitalisering van het Centraal Archief Bijzondere Rechtspleging (CABR, collectie Nationaal Archief). Daarin staan alle stappen van het digitaliseringstraject beschreven, van de dossier-selectie tot het scannen en verrijken van digitale objecten. Binnen TRIADO wordt een kleine steekproef uit het CABR gedigitaliseerd. Aan de hand van die testset worden methoden ontwikkeld om de grote verscheidenheid aan documenten in archieven als deze, digitaal beter doorzoekbaar te maken.

Scannen, OCR'en, verrijken

Om (wetenschappelijke) vragen te kunnen stellen aan het archief, is alleen scannen - een ‘plaatje’ van een document maken - niet voldoende. Daarom worden documenten ook ge-OCR’d (naar ALTO-bestanden) en de data uit de CABR-steekproef verrijkt door middel van o.m. Named Entity Recognition. Hiermee wordt informatie over bijvoorbeeld personen en plaatsen geclassificeerd, en vervolgens gekoppeld aan referentiedata uit o.m. de WO2-thesaurus en BAG (Basisregistraties Adressen en Gebouwen).

Deze verrijkingsfase binnen TRIADO wordt uitgevoerd door het Huygens ING, met betrokkenheid van Hellema als adviseur. Het doel is te komen tot één testset verrijkt met persoons-entiteiten, locaties, organisaties, domeinspecifieke termen (concepten) en datumaanduidingen. Ook wordt er metadata aan de OCR-data toegevoegd over o.m. documenttypen; informatie die uit een geautomatiseerd proces van document-classificatie wordt gehaald.

Meer mensen van TRIADO

VIDEO | In de interviewserie 'De mensen van TRIADO' komen betrokkenen bij het project Tribunaalarchieven als digitale onderzoeksfaciliteit aan het woord. In deze eerste aflevering: Marten Düring, lid van de wetenschappelijke adviescommissie. 

VIDEO | In de interviewserie 'De mensen van TRIADO' komen betrokkenen bij het project Tribunaalarchieven als digitale onderzoeksfaciliteit aan het woord. In deze derde aflevering: Anne Gorter, projectmanager bij het Nationaal Archief. 

VIDEO | In de interviewserie 'De mensen van TRIADO' komen betrokkenen bij het project Tribunaalarchieven als digitale onderzoeksfaciliteit aan het woord. In deze vierde aflevering: Rutger van Koert, software ontwikkelaar bij de afdeling Digital Infrastructure van het Humanities Cluster (KNAW). 

VIDEO | In de interviewserie 'De mensen van TRIADO' komen betrokkenen bij het project Tribunaalarchieven als digitale onderzoeksfaciliteit aan het woord. In deze vijfde aflevering: Edwin Klijn, programmamanager Netwerk Oorlogsbronnen.