Giovedì 27 novembre alle ore 15.00, in Aula 301 dell'Edificio D della Scuola superiore di studi avanzati Sapienza, si apre il ciclo di seminari di studio dedicati al potenziale applicativo dei modelli di intelligenza artificiale nella ricerca linguistica (sincronica e diacronica), con particolare riferimento alla gestione di database testuali non-standard caratterizzati da forte variazione interna.
I seminari Clali - Corpus linguistico autografi dei letterati italiani, a vocazione interdisciplinare, intendono promuovere una riflessione sulle tecniche di gestione di grandi volumi di dati interrogabili su più livelli; sull’ottimizzazione dei processi di trascrizione; sui sistemi di sincronizzazione tra testo e immagine; sull’implementazione di sistemi avanzati di lemmatizzazione e interrogazione testuale, con un’attenzione particolare all’impiego delle più recenti tecnologie di AI.
A inaugurare il ciclo è Sara Tonelli, linguista computazionale e responsabile del gruppo di ricerca in Digital humanities presso la Fondazione Bruno Kessler, con un intervento dedicato al tema dell’Historical data processing. Tonelli si occupa dell’integrazione tra discipline umanistiche e strumenti computazionali, con particolare riferimento all’uso del Natural language processing e del Machine learning. Il suo lavoro mira a sviluppare e applicare metodologie avanzate per l’analisi automatizzata di dati eterogenei, dai social media ai testi storici. Tra i suoi progetti legati alla misurazione della complessità testuale e all’estrazione di informazioni strutturate da Big Data si ricorda ALCIDE (Analysis of Language and Content In a Digital Environment) e l’edizione nazionale dell'Epistolario di De Gasperi e di Moro.

