Automatische metadata met AI
Metadata is de sleutel voor een goed functionerend archief. Het verbetert de vindbaarheid en de betrouwbaarheid van jouw informatie. Zonder consistente metadata wordt het steeds moeilijker om documenten terug te vinden of om hun waarde te begrijpen. Toch blijkt het bijhouden van metadata in de praktijk best lastig: systemen veranderen, standaarden evolueren en collega’s interpreteren regels verschillend. Als Pouw Solutions bouwden wij daarom een Large Language Model (LLM) om automatisch de metadata uit de documenten te halen.

Ons AI-model biedt de nieuwe technische oplossingen die nodig zijn voor elk modern archief. Dit doen we:
- veilig en ‘on premise’;
- volgens alle standaarden;
- flexibel en ‘up-to-date’.
Veilig en ‘on premise’
Ons model is ‘on premise’, wat grofweg betekent dat het draait op jouw eigen lokale infrastructuur. Dat verschilt van de meeste LLM’s (zoals ChatGPT), die draaien in de cloud. Wanneer je zulke modellen gebruikt, upload jij jouw eigen data naar een plek waar je er zelf geen controle meer over hebt. Daarom werkt ons model andersom: in plaats van dat wij de data naar het model brengen, brengen we het model naar jouw data. Doordat het model dan lokaal draait, behoud je volledige controle over de opslag en de verwerking, zonder hierin afhankelijk te zijn van externe cloudleveranciers.
Volgens alle standaarden
Standaarden in metadata (zoals METS en MODS) zijn essentieel om informatie duurzaam toegankelijk, uitwisselbaar en begrijpelijk te houden. Zowel binnen een organisatie, als over systeem- en tijdsgrenzen heen. Denk hierbij aan een titel en aan keywords. Ons model zorgt er daarom voor dat de metadata wordt opgesteld volgens de door jou gekozen structuur. Daarmee wordt de kwaliteit van jouw archief verhoogd en wordt het makkelijker om in de toekomst gegevens te koppelen, te migreren en te doorzoeken. Daarnaast markeert ons model de metadatering als “gegenereerd door AI”. Zodat jij, als LLM’s over twintig jaar weer aanzienlijk zijn verbeterd, de metadata eenvoudig opnieuw kan genereren.
Flexibel en ‘up-to-date’
Voor ons model gebruiken wij en ‘open source’ LLM. Dit biedt jou namelijk meer flexibiliteit, doordat het model volledig kan worden aangepast aan jouw specifieke wensen. Zo kan het model worden aangepast of worden uitgebreid op de manier die het beste aansluit bij jouw wensen. Bovendien is het bij een open source LLM mogelijk om het onderliggende model eenvoudig te vervangen voor nieuwere en betere varianten, zonder dat dit de bestaande infrastructuur of workflows ingrijpend veranderd. Hierdoor blijft ons model schaalbaar, toekomstbestendig en volledig onder de controle van jouw organisatie.


