Progetti

AdoC – Adopt a Construction

2023 - in corso

 

 

 

 

Descrizione:

...

Referenti:

Franceca Masini (Unibo)

Collaboratrici e collaboratori:

...

Dati e Materiali:
...

KIParla

Sito Web 
2018 - in corso

Descrizione:

Il corpus KIParla è una risorsa per lo studio dell'italiano parlato.

Il corpus KIParla permette l'accesso a trascrizioni (conversazionali e ortografiche) di parlato, registrazioni audio e metadati (relativi ai parlanti e alla situazione comunicativa) attraverso l'interfaccia di ricerca NoSketch Engine.

Il corpus ha una struttura modulare e incrementale e, ad oggi, sono stati pubblicati 4 moduli:

  • KIP (2019 - 69h23m08s - 661.175 tokens): interazioni in ambito universitario (lezioni, ricevimenti, esami, conversazioni libere e interviste semi-strutturate) raccolte a Bologna e a Torino.
  • ParlaTO (2020 - 48h51m14s - 561.388 tokens): interviste semi-strutturate a parlanti con diversa caratterizzazione sociale registrate a Torino.
  • KIPasti (2024 - 42h49m19s - 482.892 tokens): registrazioni di interazioni a tavola raccolte in 13 regioni italiane.
  • ParlaBO (2024 - 65h43m25s - 703.392 tokens): interviste semi-strutturate a parlanti con diversa caratterizzazione sociale registrate a Bologna.

È possibile consultare i moduli singolarmente oppure avere accesso all'intero KIParla (modalità congiunta).

Attualmente, sono in fase di allestimento altri due moduli (Stra-ParlaBO e Sra-ParlaTO nell'ambito del progetto DiverS-Ita) e sono in corso collaborazioni con la Libera Università di Bolzano, l'Università di Napoli Federico II e l'Università di Milano Bicocca.

 

Referenti:  

Caterina Mauri (LILEC - UniBo), Silvia Ballarè (FICLIT - UniBo), Eugenio Goria (Studium - UniTo), Massimo Cerruti (Studium - UniTo)

Collaboratrici e collaboratori:   

Tirocinanti del Laboratorio Sperimentale, tirocinanti KIParla, studenti del Seminario di Tecnologie del Linguaggio (oltre a collaborazioni con studiosi dell’Università di Torino e Bolzano).

RadioCast-it, Corpus di italiano della radio e dei podcast 

Sito Web
2020 - in corso

Descrizione:

Costruzione di un corpus di italiano parlato proveniente da trasmissioni radiofoniche e podcast. Il progetto, in corso, ha portato alla creazione un corpus di circa 1 milione di parole che è attualmente in fase di revisione e uniformazione. 

Referenti:

Francesca Masini (uniBo), Silvia Ballarè (UniBo), Claudia Roberta Combei (UniPv)

Collaboratrici e collaboratori:

 Tirocinanti del Laboratorio Sperimentale, studenti del Seminario di Tecnologie del Linguaggio.

UNICittà – RiScopriamo Bologna attraverso l'Alma Mater

Sito Web
2020-2023

 

Descrizione:

 Il progetto verte sulla raccolta e la disseminazione di un corpus di testimonianze passate e contemporanee sul patrimonio materiale e immateriale dell’Università di Bologna, in quanto esempio unico di heritage. L’obiettivo finale è valorizzare la conoscenza e la fruizione del patrimonio artistico della città di Bologna proprio attraverso l’Università. 

Referenti:

Valeria Zotti (UniBo), Ana Pano Alaman (UniBo), Antonella Luporini (UniBo), Monica Perotto (UniBo), Monica Turci (UniBo), Carmelo Caruso  (UniBo)

Collaboratrici e collaboratori:

 tirocinanti del Laboratorio Sperimentale

Dati e Materiali: