LibMovIt: text corpus of travel literature

LibMovIt: text corpus of travel literature è una risorsa creata nell’ambito del progetto LibMovIt con l’obiettivo di mettere a disposizione un primo corpus testuale della letteratura sul viaggio in Italia in età moderna.

La versione 1.0 del corpus contiene 52 opere per un totale di 7,9 milioni di parole: 27 in inglese (3.590.000 di parole), 12 in francese (2.065.000), 8 in tedesco (1.550.000), 4 in italiano (450.000) e 1 in spagnolo (255.000). Una descrizione dettagliata del corpus e dello status della trascrizione di ciascun testo (tag: “Revision completed” o “Revision to be completed”) è disponibile all’interno della raccolta pubblica di Zotero intitolata “Corpus LibMovIt”.

Il corpus è stato pubblicato ed è scaricabile attraverso Zenodo al seguente link: https://zenodo.org/records/16096335

I testi sono stati pubblicati in formato .txt. Essi sono stati acquisiti sia da progetti che li hanno pubblicati in formati riutilizzabili (indicati attraverso dei tag nella descrizione del corpus), sia attraverso riconoscimento automatico del testo. L’output del riconoscimento automatico è stato revisionato con script per correggere gli errori più comuni ed eliminare alcuni elementi paratestuali (numeri di pagina, parole chiave, segni di firma, ecc.). Gli editori del corpus hanno inoltre apportato correzioni manuali a tutti i testi (anche attraverso la piattaforma libmovitprin.it), tuttavia, data la lunghezza di alcuni di essi, talvolta necessitano ancora di ulteriori revisioni.

Per questo motivo, saranno rilasciati regolarmente aggiornamenti minori del corpus per migliorare i testi con ulteriori correzioni, l’aggiunta di marcatura nel testo e la conversione in altri formati; una volta all’anno sarà rilasciato un aggiornamento maggiore del corpus che includerà anche nuovi testi.

Ulteriori informazioni sullo sviluppo del corpus sono descritte nel saggio L. Mancini, La letteratura di viaggio tra corpora e analisi computazionali: primi risultati e prospettive future, in Biblioteche in movimento: studiosi, idee, libri in viaggio nel XVIII secolo, Milano, Ledizioni, 2025, p. 297-309.

Tags:

No responses yet

Rispondi