È attualmente in fase di allestimento un corpus di testi scritti non ad hoc, grazie alla collaborazione dei e delle tirocinanti dell'Università di Bologna.
Sono in raccolta diversi tipi di testi (v. oltre) che vengono ripuliti e classificati.
In particolare, al momento il corpus è costituito da:
NOTA BENE
Al momento, i due corpora sono consultabili solo dai membri del progetto. Le risorse saranno rese pubbliche sulla piattaforma NoSketch Engine alla conclusione del progetto.