Annotazione e attività di preparazione dei testi

Annotazione ed attività di preparazione delle opere

Per le attività di preparazione dei testi il progetto ha sviluppato un ambiente web di marcatura, che recepisce le linee guida del Comitato Scientifico. La codifica dei testi avviene a cura dei ricercatori all'interno dell'ambiente stesso, secondo modalità di marcatura e metadatazione semi-automatiche.

L'ambiente di marcatura

La struttura dell'ambiente presenta come tecnologia di back-end Node.js, affiancato da npm per la gestione dei pacchetti e delle librerie utilizzate dalla piattaforma.

Per lo sviluppo front-end il progetto si è appoggiato principalmente sull'utilizzo di framework quali JQuery per la manipolazione dell'HTML e Bootstrap per lo stile CSS.

La memorizzazione dei metadati relativi ai documenti è stata affidata al database management system MongoDB, attualmente in utilizzo da moltissimi sistemi informatici.

Per garantire una maggiore sicurezza dei dati, l'accesso alla piattaforma è controllato da un sistema di autenticazione tramite JSON web token e la registrazione è possibile solo attraverso gli autori dell'ambiente.

L'edizione sarà invece sviluppata principalmente mediante l'utilizzo del framework Vue.js, relativamente giovane, ma che è ben presto entrato a far parte delle principali librerie di front-end utilizzate insieme a React e Angular. Inoltre, per ora inutilizzato nell'edizioni digitali, presentandosi così come un'innovazione sia nel dominio d'interesse che nel campo tecnologico. Come back-end la scelta è ricaduta sempre su Node.js, sia per una maggiore familiarità con esso, che per le sue potenzialità.

Il modello di marcatura

L'attività di preparazione dell'ambiente ha visto la costruzione di modelli di marcatura basati su standard aperti e ampiamente utilizzati dalla comunità scientifica.

 La codifica degli elementi intratestuali e strutturali dei testi segue lo standard Resource Description Framework in Attributes (RDFa, https://www.w3.org/TR/rdfa-primer/), un modello basato sul Resource Description Framework (RDF, https://www.w3.org/TR/rdf11-primer/) che permette di incorporare dati semantici strutturati e leggibili dalle macchine direttamente nel codice HTML attraverso l'utilizzo di specifici attributi di marcatura.

La codifica dei metadati, delle informazioni paratestuali, e in generale del contesto correlato ai testi, segue lo standard RDF.

I file HTML-RDFa sono utilizzati per visualizzare i singoli documenti e contenere le informazioni interne a questi, mentre un dataset RDF esterno è predisposto per aggregare ed esporre le informazioni esterne e contestuali relative ai testi. Data la possibilità di scaricare i testi anche in formato XML, è stato costruito anche un modello di marcatura basato sulle Linee Guida del consorzio Text Encoding Initiative (TEI, https://tei-c.org/), in modo da fornire anche una modellazione dei dati e metadati alternativa al paradigma RDF.