{"id":644,"date":"2025-10-16T14:55:36","date_gmt":"2025-10-16T12:55:36","guid":{"rendered":"https:\/\/www.libmov.it\/?p=644"},"modified":"2025-10-16T14:55:36","modified_gmt":"2025-10-16T12:55:36","slug":"libmovit-text-corpus-of-travel-literature","status":"publish","type":"post","link":"https:\/\/www.libmov.it\/?p=644","title":{"rendered":"LibMovIt: text corpus of travel literature"},"content":{"rendered":"\n<p><em>LibMovIt: text corpus of travel literature<\/em> \u00e8 una risorsa creata nell&#8217;ambito del progetto LibMovIt con l&#8217;obiettivo di mettere a disposizione un primo corpus testuale della letteratura sul viaggio in Italia in et\u00e0 moderna.<\/p>\n\n\n\n<p>La versione 1.0 del corpus contiene 52 opere per un totale di 7,9 milioni di parole: 27 in inglese (3.590.000 di parole), 12 in francese (2.065.000), 8 in tedesco (1.550.000), 4 in italiano (450.000) e 1 in spagnolo (255.000). Una descrizione dettagliata del corpus e dello status della trascrizione di ciascun testo (tag: \u201cRevision completed\u201d o \u201cRevision to be completed\u201d) \u00e8 disponibile all&#8217;interno della raccolta pubblica di Zotero intitolata <a href=\"https:\/\/www.zotero.org\/groups\/5540957\/libmovit\/library\">&#8220;Corpus LibMovIt&#8221;<\/a>.<\/p>\n\n\n\n<p>Il corpus \u00e8 stato pubblicato ed \u00e8 scaricabile attraverso Zenodo al seguente link: <a href=\"https:\/\/zenodo.org\/records\/16096335\">https:\/\/zenodo.org\/records\/16096335<\/a><\/p>\n\n\n\n<p>I testi sono stati pubblicati in formato .txt. Essi sono stati acquisiti sia da progetti che li hanno pubblicati in formati riutilizzabili (indicati attraverso dei tag nella descrizione del corpus), sia attraverso riconoscimento automatico del testo. L&#8217;output del riconoscimento automatico \u00e8 stato revisionato con script per correggere gli errori pi\u00f9 comuni ed eliminare alcuni elementi paratestuali (numeri di pagina, parole chiave, segni di firma, ecc.). Gli editori del corpus hanno inoltre apportato correzioni manuali a tutti i testi (anche attraverso la piattaforma <a href=\"https:\/\/www.libmov.it\/?page_id=633\" data-type=\"page\" data-id=\"633\">libmovitprin.it<\/a>), tuttavia, data la lunghezza di alcuni di essi, talvolta necessitano ancora di ulteriori revisioni.<\/p>\n\n\n\n<p>Per questo motivo, saranno rilasciati regolarmente aggiornamenti minori del corpus per migliorare i testi con ulteriori correzioni, l&#8217;aggiunta di marcatura nel testo e la conversione in altri formati; una volta all&#8217;anno sar\u00e0 rilasciato un aggiornamento maggiore del corpus che includer\u00e0 anche nuovi testi.<\/p>\n\n\n\n<p>Ulteriori informazioni sullo sviluppo del corpus sono descritte nel saggio L. Mancini, <em>La letteratura di viaggio tra corpora e analisi computazionali: primi risultati e prospettive future<\/em>, in <em>Biblioteche in movimento: studiosi, idee, libri in viaggio nel XVIII secolo<\/em>, Milano, Ledizioni, 2025, p. 297-309.<\/p>\n\n\n\n<p><\/p>\n","protected":false},"excerpt":{"rendered":"<p>LibMovIt: text corpus of travel literature \u00e8 una risorsa creata nell&#8217;ambito del progetto LibMovIt con l&#8217;obiettivo di mettere a disposizione un primo corpus testuale della letteratura sul viaggio in Italia in et\u00e0 moderna. La versione 1.0 del corpus contiene 52 opere per un totale di 7,9 milioni di parole: 27 in inglese (3.590.000 di parole), [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":660,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"saved_in_kubio":false,"jetpack_post_was_ever_published":false,"_jetpack_newsletter_access":"","_jetpack_dont_email_post_to_subs":false,"_jetpack_newsletter_tier_id":0,"_jetpack_memberships_contains_paywalled_content":false,"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[14],"tags":[],"class_list":["post-644","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-pubblicazioni"],"jetpack_featured_media_url":"https:\/\/www.libmov.it\/wp-content\/uploads\/2025\/10\/zenodo-gradient-1000.png","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/www.libmov.it\/index.php?rest_route=\/wp\/v2\/posts\/644","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.libmov.it\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.libmov.it\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.libmov.it\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.libmov.it\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=644"}],"version-history":[{"count":7,"href":"https:\/\/www.libmov.it\/index.php?rest_route=\/wp\/v2\/posts\/644\/revisions"}],"predecessor-version":[{"id":661,"href":"https:\/\/www.libmov.it\/index.php?rest_route=\/wp\/v2\/posts\/644\/revisions\/661"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.libmov.it\/index.php?rest_route=\/wp\/v2\/media\/660"}],"wp:attachment":[{"href":"https:\/\/www.libmov.it\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=644"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.libmov.it\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=644"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.libmov.it\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=644"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}