Riferimento:
GRANDI, Nicola, BALLARÈ, Silvia, CHIUSAROLI, Francesca, GALLINA, Francesca, PASCOLI, Matteo, PISTOLESI, Elena; Corpus Univers-ITA. 2023, DOI: https://doi.org/10.60760/unibo/univers-ita
Nel corso dell'anno accademico 2020/2021 è stata condotta la raccolta dati per la costruzione del corpus.
In prima istanza, è stato creato un campione che fosse rappresentativo della popolazione universitaria italiana, utilizzando come parametri la localizzazione geografica dell'ateneo e l'area disciplinare del corso di laurea.
Complessivamente, sono stati coinvolti nella raccolta dati 2160 studenti del secondo anno per le seguenti aree disciplinari e dei seguenti atenei:
In fase di raccolta, al fine di mantenere controllo del campione, sono stati consegnati uno user-name e una password a tutti gli studenti e le studentesse per accedere al sito web creato ad hoc per la raccolta dati.
La raccolta dati è stata strutturata in due parti:
1. La stesura del testo
Nella prima fase della raccolta, gli studenti e le studentesse si sono dedicati alla stesura di un breve testo. Di seguito, si riportano le indicazioni fornite ai rispondenti.
2. Il questionario socio-biografico
Il questionario socio-biografico era costituito da oltre 50 domande, suddivise in 4 sezioni:
Le risposte raccolte attraverso il questionario hanno permesso di tracciare un profilo socio-biografico molto approfondito dei vari rispondenti. I metadati dei rispondenti potranno poi essere utilizzati in fase di analisi per verificare la presenza di eventuali correlazioni tra caratteristiche extralinguistiche e tratti linguistici rintracciabili nelle produzioni.
Il corpus è attualmente costituito complessivamente da 810.715 tokens. I testi del corpus sono accompagnati da un ampio corredo di metadati (ricavati attraverso la somministrazione del questionario). Inoltre, è possibile interrogare il corpus utilizzando diversi filtri di ricerca, come mostrato nell'immagine e nel vademecum per la consultazione.
Il corpus è consultabile a questo link.