STATO: in corso
LINGUE:
plurilingue (inglese, cinese, giapponese, arabo, spagnolo, tedesco, italiano, francese)
DESCRIZIONE: Il corpus di italiano parlato KIParla è una risorsa innovativa, disponibile gratuitamente per tutti coloro che lavorano sull’italiano parlato. La sua principale caratteristica è quella di contenere campioni di vari tipi di interazione osservabili in ambito universitario, in particolare lezioni, ricevimento studenti, esami, conversazione libera fra studenti, interviste semistrutturate a studenti. Il corpus KIParla consiste di due moduli (KIP e ParlaTO) e si prevede di implementarne a breve anche un terzo (ParlaBO)
OBIETTIVI/ATTIVITà:
Il tirocinio prevede tre diverse tipologie di attività più un’attività collaterale di focus sulle lingue straniere presenti nella città di Bologna:
1. Raccolta dati sul campo (italiano e lingue straniere presenti nella città di Bologna): i tirocinanti, singolarmente o in gruppi, raccoglieranno dati di parlato, individuando situazioni comunicative adatte e soggetti da coinvolgere nelle registrazioni
2. Trascrizione del parlato: i tirocinanti parteciperanno alla trascrizione delle interviste secondo il sistema Jefferson, applicato all’italiano e alle lingue straniere
3. Preparazione dei dati per il trattamento automatico: i tirocinanti predisporranno le interviste trascritte per l’inserimento sulla piattaforma NoSketchEngine, si occuperanno della codifica dei dati in formato XML con l’aiuto di editor (Oxygen), e se necessario si relazioneranno con il personale tecnico per il caricamento dei dati
4. Focus sulle lingue straniere presenti nella città di Bologna: analisi approfondite di singole lingue: i tirocinanti effettueranno analisi approfondite di singole lingue, che varieranno in relazione alle loro competenze e alle lingue di migrazione presenti nei dati; ricorreranno a diverse risorse linguistiche e corpora di parlato per le lingue in questione, sia per monitorare l’uso di specifiche costruzioni, che per individuare fenomeni di contatto nel sistema e nel discorso.
Il tirocinio permetterà di acquisire competenze di carattere altamente interdisciplinare e applicativo, che potranno essere utilmente impiegate nei seguenti ambiti lavorativi:
• Traduzione per il doppiaggio e sottotitolatura
• Realizzazione di sondaggi e interviste per agenzie private
• Utilizzo di dati linguistici a scopo commerciale (data mining, sentiment analysis, …)
• Trattamento automatico di dati linguistici
• Costruzione e gestione di database linguistici
• Conoscenza approfondita e utilizzo di software nell’ambito delle digital humanities
Aperto a:
LT LLS Sì
LT LMCA Sì
LM LMCP Sì
LM LCIS Sì
LM LSC Sì