Riferimento:
GRANDI, Nicola, BALLARÈ, Silvia, CHIUSAROLI, Francesca, GALLINA, Francesca, PASCOLI, Matteo, PISTOLESI, Elena; Corpus Univers-ITA-ProUniv. 2023, DOI: https://doi.org/10.60760/unibo/univers-ita-prouniv
I due corpora di testi scritti non ad hoc (ovvero Univers-ITA-ProUniv e Univers-ITA-ProGior) sono stati costruiti grazie alla collaborazione dei e delle tirocinanti dell'Università di Bologna.
Il corpus UniverS-Ita-ProUniv è costituito soprattutto da tesi (nella versione non corretta dal relatore) e da relazioni universitarie (773 testi, per un totale di 6.267.765 tokens). Per questi testi, come indicato nel vademecum di consultazione, sono disponibili alcuni metadati come, ad esempio, la collocazione geografica dell'ateneo, l'area disciplinare del corso di laurea dello scrivente, il sesso e la regione di nascita dello scrivente, etc.).
È possibile consultare una sottosezione del corpus, bilanciata in modo da rappresentare la popolazione universitaria italiana, utilizzando come parametri la localizzazione geografica dell'ateneo e l'area disciplinare del corso di laurea (analogamente a quanto fatto per la sezione dei testi ad hoc.
Il corpus è consultabile a questo link.