Condividi: Share to Friend Share on Facebook Share on X Share on X
Cattolica Library
Cattolica Library
 
La Biblioteca d’Ateneo alla Transkribus User Conference
Lorenzo Babini, Matteo Ruggeri  |  26 marzo 2024

Nelle giornate di giovedì 15 e venerdì 16 febbraio, alcuni bibliotecari dell’Università Cattolica hanno partecipato come uditori alla Transkribus User Conference 24 - The future of information extraction, tenuta da READ COOP presso una delle sedi dell’Università di Innsbruck con la presenza, tra speaker e uditori, di più di 120 professionisti del settore provenienti da tutto il mondo.
La conferenza è stata dedicata ai progressi tecnici e scientifici raggiunti negli ultimi anni nel campo della trascrizione automatica dei documenti manoscritti e, in modo particolare, di Transkribus, un applicativo di Intelligenza Artificiale basato su reti neurali messo a punto da READ-COOP, società cooperativa europea che conta tra i suoi membri più di 150 università, biblioteche, archivi e altri istituti di cultura di livello mondiale.



A partire dal 2023, anche la Biblioteca dell’Università Cattolica ha avviato una sperimentazione di Transkribus e delle sue diverse funzioni di analisi e trascrizione, vagliando in particolare la possibilità di utilizzare questo software (o altri similari) per la valorizzazione degli archivi culturali. Per il 2024 è prevista l’adesione a READ-COOP.

La prima giornata dell’evento ha illustrato aggiornamenti e sviluppi futuri del software e – tema principale dell’intera kermesse – i progressi dell’information extraction, ossia delle tecniche di estrazione automatica delle informazioni da grandi quantità di dati non strutturati, come, per esempio, i testi digitalizzati.
Dopo una mattinata d’avvio dedicata alla presentazione della tematica e della tabella di marcia per lo sviluppo delle nuove funzioni di Transkribus, sempre più in grado di unire abilità di riconoscimento dei caratteri a capacità di analisi del layout e del testo, il pomeriggio ha visto i congressisti impegnati in una serie di workshop teorici e pratici sull’uso dell’applicativo e in cicli di presentazioni di casi di successo nel suo utilizzo: dalle integrazioni con altri software per l’estrapolazione dei dati, alla soluzione di situazioni complesse (scritture e lingue asiatiche, documenti multilingui, etc.), fino ai risvolti etici legati all’uso di queste tecnologie.

Nella seconda giornata, dopo un nuovo momento introduttivo che ha affrontato nel dettaglio le potenzialità offerte da nuove tecniche e strumenti di information extraction, numerosi esperti del settore sono intervenuti in due diverse tavole rotonde: nella prima è stato trattato il tema del riconoscimento automatico delle scritture asiatiche, nella seconda si è discusso dell’integrazione di Transkribus con tecniche e potenzialità offerte da altri sistemi basati su Intelligenza Artificiale e dai Large Language Models – tra cui BERT e il celebre GPT – che rende possibile espandere e sfruttare i risultati di trascrizione ottenuto con Transkribus in molteplici modi. La Biblioteca d’Ateneo ha già avviato delle sperimentazioni anche su questi temi, che saranno oggetto di approfondimento in articoli successivi.
A questi momenti di alta elaborazione teorica sono seguite le presentazioni di progetti concreti di ricerca e borse di studio che hanno riguardato l’inclusione di Transkribus in differenti progetti formativi (di livello superiore o universitario) o il suo utilizzo per potenziare le ricerche nel campo della filologia e della paleografia.

Questo articolato programma è stato intervallato da diversi momenti informali o conviviali in cui i partecipanti hanno potuto “fare rete”, scambiando liberamente pareri ed esperienze e condividendo impressioni sui progetti presenti e futuri. Proprio in questi momenti è stato possibile raccogliere un primo (positivo) feedback sul progetto in fase di sviluppo nella Biblioteca dell’Università Cattolica: una postazione per l’accessibilità che consenta di scansionare e ottenere in tempo reale le trascrizioni di documenti d’archivio. Concepito con un occhio di riguardo verso gli utenti con qualsiasi tipo di difficoltà di approccio alla documentazione manoscritta, il software che gestisce la postazione sarà integrato con un motore di sintesi vocale in grado di leggere il documento.
Gli studiosi interessati al software Transkribus attualmente testato dalla Biblioteca d’Ateneo possono richiedere ulteriori informazioni scrivendo a biblioteca.informazioni-mi@unicatt.it.


_____________


* In alto, immagine da transkribus.org.

 

 
 
Seguici su: Facebook X Instagram Telegram