Massimo Cerruti
Università di Torino
Come si parla a Torino? Che differenze ci sono fra l’italiano dei giovani e l’italiano degli anziani? E fra parlanti con livelli di istruzione diversi? Chi usa ancora il dialetto? Quali lingue ha portato con sé l’immigrazione da paesi stranieri? In che cosa differisce l’italiano dei nativi dall’italiano dei non nativi? Domande come queste hanno ispirato la creazione di ParlaTO (Cerruti & Ballarè 2020) un archivio di testi orali spontanei per documentare e indagare la realtà linguistica torinese nelle sue varie componenti: italiano di nativi, italiano di non nativi, dialetto piemontese, altri dialetti e lingue di recente immigrazione.
ParlaTO, avviato all’Università di Torino nell’ambito di un progetto finanziato dalla Fondazione CRT, è costituito da una serie di conversazioni che coinvolgono parlanti con diversa provenienza geografica e diversa collocazione sociale, raccolte per mezzo di interviste individuali e di gruppo su esperienze di vita personale (studio, lavoro, attività nel tempo libero o in pensione, ricordi del passato, vita in città, ecc.).
ParlaTO ha le caratteristiche di un corpus linguistico. Consente quindi agli utenti di cercare ed estrarre dati linguistici (una parola specifica, il contesto in cui essa compare, la sua frequenza, insiemi o sequenze di parole, ecc.) ed è dotato di un insieme di informazioni di natura extralinguistica, dette metadati, relative alle caratteristiche socio-demografiche degli informatori, quali l’età, il titolo di studio, il genere, l’occupazione, il luogo di nascita, la lingua materna e, per chi è originario di un paese straniero, il tempo di permanenza e gli anni di studio in Italia. Il corpus offre così la possibilità di esplorare il parlato di Torino per come si presenta in gruppi sociali differenti: anziani dialettofoni, giovani universitari e non, parlanti di origine straniera, ecc.
ParlaTO si inserisce nel corpus KIParla, di cui dunque condivide, oltre a un nucleo di metadati, le modalità di raccolta, trattamento e consultazione dei dati linguistici. Cercando ad esempio una singola parola, come mica nella schermata qui di seguito, si possono ottenere le singole occorrenze di quella parola all’interno del contesto più ampio in cui compaiono e, per ciascuna occorrenza, sia i metadati associati al parlante che l’ha prodotta sia i link alla porzione di sonoro rilevante e alla trascrizione ortografica e conversazionale dell’interazione completa.
La lingua delle conversazioni è per la maggior parte l’italiano. In primo luogo, quindi, con il corpus ParlaTO si ha l’opportunità di osservare come l’italiano parlato in città si manifesti ‘concretamente’ in una serie di varietà di lingua. Negli estratti seguenti si può ad esempio riscontrare, segnalata in grassetto, la presenza di fenomeni linguistici tipici dell’italiano di Torino, da (1) a (3), e di altri italiani regionali, da (4) a (6); dell’italiano popolare, da (7) a (10); e dell’italiano colloquiale, da (11) a (13).
Altre lingue compaiono il più delle volte in alternanza con l’italiano, secondo la fenomenologia del code-switching. Nel corpus si può fra l’altro notare, per rimanere in ambito italo-romanzo, la presenza di discorso bilingue italiano/dialetto; ne sono esempi gli estratti seguenti, caratterizzati dall’avvicendarsi di italiano e piemontese (14) e italiano e lucano (15) (il segno # è posto all’inizio di un’unità di trascrizione che contenga almeno una parola in una lingua diversa dall’italiano).
Al momento è disponibile online soltanto una prima sezione del corpus, composta da interazioni fra parlanti di origine italiana. Questa coinvolge 88 informatori e consiste di poco meno di 50 ore di parlato (552.461 tokens), raccolte fra il 2018 e il 2020. Sin dall’inizio del progetto è stata però concepita anche una seconda sezione, di dimensioni analoghe alla prima, costituita da interazioni con parlanti di origine straniera. Quest’ulteriore sezione, che è in fase di allestimento, conterrà in particolare materiali per lo studio dell’italiano di non nativi e dell’uso di lingue di recente immigrazione. Vi confluiranno, ad esempio, le interazioni da cui sono tratte le produzioni in (16) e (17): le prime, di un parlante ispanofono, contraddistinte dall’impiego di parole funzionali dello spagnolo; le seconde, di una parlante arabofona, caratterizzate da discorso bilingue italiano/arabo egiziano.
ParlaTO è destinato in primo luogo alla comunità scientifica dei linguisti, interessati ad esplorare il parlato di una città nelle sue varie componenti e/o ad analizzare singole strutture linguistiche o fenomeni del discorso, anche bilingue (in Cerruti 2021 si discutono i risultati di alcuni primi studi condotti sul corpus), ma è rivolto altresì a un’utenza più ampia di studiosi e potenziali interessati: i contenuti delle interviste, ad esempio, possono rivelare opinioni e atteggiamenti della cittadinanza su temi d’attualità e fatti di vita sociale. Il corpus è inoltre fruibile, tra gli altri, da studenti e insegnanti di vari ordini di scuole, così come da traduttori, per integrare le risorse a disposizione per lo studio, l’insegnamento e l’interpretazione e produzione di testi.
Per approfondire
Cerruti, Massimo. 2021. ParlaTO: la variazione (e il repertorio) in un corpus di parlato. In Miola, Emanuele & Rosa Pugliese (a cura di), CLUB Working Papers in Linguistics. Volume 5. Bologna, Circolo Linguistico dell’Università di Bologna. 23-40.
Cerruti, Massimo & Silvia Ballarè. 2020. ParlaTO: Corpus del parlato di Torino. Bollettino dell’Atlante Linguistico Italiano 44: 171-196.
0 Commenti
Lascia un commento