...indietro 

Codifica dei materiali dialettali

In ALT-Web, a ciascuna attestazione dialettale raccolta sul campo (sia essa risposta a domanda del questionario, materiale integrativo così come fraseologia di varia natura) sono associati diversi livelli di rappresentazione articolati come segue: 

  • rappresentazione in trascrizione fonetica, racchiusa tra parentesi uncinate <...>; 
  • rappresentazioni normalizzate in ortografia italiana suddivise in: 
    • traslitterazione in ortografia italiana (racchiusa tra parentesi quadre [...]): questa rappresentazione è stata concepita come guida alla lettura e alla decodifica della forma in trascrizione fonetica per l'utente che non abbia familiarità con rappresentazioni fonetiche; 
    • normalizzazione di primo livello (racchiusa tra parentesi graffe {...}), che neutralizza tratti specifici della realizzazione fonetica del dato come riportati dalla trascrizione ortografica (ad es. variazioni fonetiche produttive sul territorio toscano) senza fare astrazione da variazioni morfologiche.

Questo complesso e articolato schema di rappresentazione dei materiali dell'ALT crea i presupposti per ricerche "intelligenti" che astraggono progressivamente da dettagli della realizzazione fonetica del dato da parte del parlante.

 

Rappresentazione in trascrizione fonetica

Il sistema di trascrizione fonetica adottato nell'ALT si rifà al sistema di trascrizione cosiddetto "Ascoli-Merlo", nella configurazione a suo tempo stabilita per le inchieste della Carta dei Dialetti Italiani (CDI) ed in versione specializzata per la codifica di materiali relativi ai dialetti toscani. Ne riportiamo di seguito una breve descrizione:

 

Vocalismo

Il triangolo vocalico tipico dei dialetti toscani è indicato nella tabella che segue:

Semivocali:

Si noti che:

  • con /ä/ è indicata la /a/ palatalizzata della zona aretina
  • un punto sottoscritto indica la vocale chiusa, come nell'italiano séra e cóme;
  • un gancio, aperto verso destra, sottoscritto indica la vocale aperta, come nell'italiano apèrto e assòrto.

Inoltre:

  • il suono vocalico indistinto è indicato graficamente con una e capovolta;
  • con il titolo ~ sono indicate le vocali nasalizzate;
  • due punti sottoscritti indicano vocale molto chiusa;
  • due puntini soprascritti caratterizzano la serie dei suoni vocalici turbati o palatalizzati.

Consonantismo

 

Si noti che:

  • nella trascrizione fonetica delle parlate toscane hanno particolare rilievo i segni “tagliati” delle fricative, con i quali si mette in evidenza la pronuncia spirantizzata delle occlusive in posizione debole, cioè tra vocali o vocale e vibrante (in corpo di parola e in fonosintassi): ;

  • il segno k’ rende la lieve spirantizzazione di k che, ad esempio, nel fiorentino è delle persone colte, mentre h trascrive la spirantizzazione più accentuata, di carattere popolare: si veda ;

  • analoga opposizione si ha tra rispettivamente in posizione forte e in posizione debole: si veda ad esempio il pistoiese   A questa situazione fonetica fa riscontro nella Toscana sud-orientale una opposizione tra ;

  • nella Toscana settentrionale può essere difficile percepire la differenza tra che può anche rispecchiare pronunce occasionali: si veda . Da segnalare anche la possibilità di uno spostamento dell'articolazione verso una pronuncia dentale: in questi casi si scriverà .

Inoltre:

  • le consonanti lunghe o intensamente articolate sono segnalate con la ripetizione di due segni uguali. Ciò vale sempre - anche per l'inizio di parola - per la trascrizione della nasale e della laterale palatale, nonché della sibilante palatale: (che sono esempi di parole italiane perché i dialetti possono presentare - anche occasionalmente - variazioni significative).

 

Accento

Tutte le parole recano l'indicazione dell'accento, segnato tramite un accento acuto sulla vocale della sillaba accentata. L'accento principale è sempre indicato; l'accento secondario solo quando è stato registrato dal rilevatore.

 

Casi particolari
  • Articolazioni intermedie o "oscillanti"

Le articolazioni intermedie o "oscillanti" sono indicate nella grafia CDI mediante la sovrapposizione, a cavallo della riga di due segni, con prevalenza del valore espresso in alto. Questa sovrapposizione è stata qui codificata su di un'unica riga secondo la convenzione che segue: i due segni "oscillanti" sono separati da un simbolo, ^ , che individua un'articolazione intermedia tra ciò che lo precede, e che anche prevale, e ciò che lo segue. Ad esempio: per indicare la pronuncia leggermente lenita delle occlusive sorde in certe zone della Toscana.

  • Articolazioni attenuate o ridotte

Le articolazioni attenuate o ridotte, realizzate cioè con intensità minore, indicate nella grafia CDI in carattere minore e sollevato rispetto alla riga, sono qui riportate alla stessa riga e fatte seguire da una marca, - , che ne simbolizza il grado ridotto. Ad esempio: dove v è realizzato in modo attenuato.

  • Trascrizioni ricostruite

Nel corpus dei materiali ALT, in rari casi non si disponeva della realizzazione fonetica delle forme o della fraseologia attestata. Al fine di garantire la comparabilità tra tutte le testimonianze raccolte, in trascrizione e non, l'attestazione è stata riportata anche in questi casi tra parentesi uncinate e codificata secondo una grafia fonetica larga "ricostruita" seguendo la trascrizione fonologica dell'italiano di Toscana. A tale ricostruzione è imputabile l'assenza di specificazioni relative, ad esempio, al grado di apertura delle vocali. Le singole parole costituenti tali attestazioni con trascrizione fonetica ricostruita sono immediatamente precedute da una marca, * . Ad esempio: . La necessità di marcare come ricostruita la trascrizione delle singole parole piuttosto che dell'attestazione nel suo complesso deriva dai casi di fraseologia "mista", finalizzati ad illustrare i contesti di uso del termine fornito in risposta, dove la sola realizzazione fonetica registrata è appunto quella della risposta. Si noti infine che vi sono forme in cui l'assenza di diacritico non è accompagnata dal segno di forma ricostruita: in questi casi si tratta di errore del raccoglitore che la preedizione non ha voluto correggere.

 

 

Traslitterazione in ortografia italiana

La forma in trascrizione ortografica, racchiusa tra parentesi quadre [...], è stata concepita come guida alla lettura della forma originaria in trascrizione fonetica che in effetti non sostituisce ma affianca. Nella traslitterazione in ortografia italiana delle forme dialettali registrate in trascrizione fonetica si è cercato, ove possibile (ovvero quando consentito dalle convenzioni ortografiche italiane), di rendere conto della variabilità effettivamente rilevata con le inchieste sul campo. Tuttavia, in questa operazione di transcodifica non si è raggiunto il rapporto auspicabile di 1:1 pena la riproposizione delle difficoltà di decodifica dell'attestazione dialettale che la traslitterazione stessa si proponeva di eliminare. Per quanto si sia cercato di riprodurre tutti i tratti di pronuncia registrati, a questo livello intervengono una serie di inevitabili neutralizzazioni dovute all'indisponibilità dei corrispondenti grafemi nell'ortografia italiana. Ad esempio, nella traslitterazione non si riesce più a rendere conto della spirantizzazione di grado lieve-medio delle occlusive: alle trascrizioni viene associata la medesima trascrizione ortografica, [abéto]

La tipologia di neutralizzazioni operate nel passaggio dalla trascrizione fonetica a quella ortografica trova la sua principale motivazione in quanto si riesce a restituire con i grafemi dell'ortografia italiana. A questo livello non è stato possibile rendere conto di fenomeni ampiamente diffusi nella regione come ad esempio la spirantizzazione di occlusiva (con l'eccezione del grado h dell'occlusiva velare che viene mantenuto distinto), o la perdita di occlusione nelle affricate palatali; fenomeni, comunque, che proprio per la forte caratterizzazione come marca di toscanismo possono considerarsi un'informazione quasi universalmente acquisita e per così dire essere "dati per scontati" come sottostanti alla traslitterazione. 

Neutralizzazioni operate nel passaggio dalla resa in trascrizione fonetica all'ortografia italiana includono casi di: 

E' stato invece possibile mantenere a questo livello di rappresentazione la distinzione tra s e z sorde e sonore ([zzòlla] vs [ZZòlla], [eSòSo] vs [esòso]), che registra in Toscana un progressivo incremento degli esiti con realizzazione sonora, e l'affricazione di s post-consonantica ([bórsa] vs [bórza]), fenomeno in espansione anche in area fiorentina. L'ortografia italiana ha permesso di rendere conto di un fenomeno molto diffuso come il rotacismo ([pàlko] vs [pàrko]) e di uno al contrario territorialmente assai limitato come la realizzazione cacuminale ([pàda] vs [pàlla]), traslitterata in modo purtroppo parziale in d. Inoltre si è mantenuta l'indicazione del raddoppiamento fonosintattico ([a ppovènta] vs [a povènta]) e dell'accento (anche secondario). Per ciò che riguarda il sistema vocalico, vengono mantenute le sette vocali di base, oltre alle turbate ö, ü ed ë che indica l'indistinta; scelta, questa, utile a rendere immediatamente percepibile il peso della non toscanità linguistica di aree come la Lunigiana. 

A questo livello avviene anche la ricostruzione delle consonanti nasali in posizione finale, rappresentate al livello della trascrizione fonetica nei termini di vocali nasalizzate. Questa soluzione si motiva con esigenze di trasparenza in quanto una resa priva dell'indicazione di nasalità poteva dar luogo a incomprensioni: ci è parso infatti che [pán] fosse preferibile rispetto a [pá] per pane e inoltre svolgesse la non trascurabile funzione di (parziale) decodifica del diacritico usato per indicare la realizzazione nasale della vocale. 

La volontà di adesione alla trascrizione fonetica ha implicato anche alcune deroghe alla norma ortografica italiana, per cui si è rimandato al livello successivo di normalizzazione l'aggiustamento all'ortografia italiana di zzi+voc e di zz in posizione iniziale; inoltre, forme del tipo sono state traslitterate come [cèlo], [scènza] così come è stato sempre reso come [qu] (da cui la legittimità a questo livello di forme come [quòre]). Infine, si sono sempre rese con accento ([à], [ò], [ài], [ànno]) le voci del verbo avere

Abbiamo visto che nel passaggio dalla trascrizione fonetica alla sua codifica in ortografia italiana si sono rese necessarie alcune neutralizzazioni; al contempo, è stato possibile rappresentare adeguatamente un'ampia gamma di fenomeni del toscano, quali il rotacismo, l'affricazione di s post-consonantica, il raddoppiamento fonosintattico, ecc. Alcuni dati numerici possono aiutarci a questo punto a capire l'impatto delle inevitabili neutralizzazioni sulla resa in ortografia italiana della trascrizione fonetica. Il corpus delle attestazioni dialettali in trascrizione fonetica nell'ALT è costituito da 380.348 occorrenze (che includono anche fraseologia di vario tipo), corrispondenti a 84.075 attestazioni diverse (con una frequenza media per attestazione di 4,5). Nel passaggio all'ortografia italiana, le attestazioni diverse si sono ridotte a 74.105, con un fattore di normalizzazione di 1,13 (calcolato come rapporto tra il numero di attestazioni diverse in trascrizione fonetica e in ortografia italiana). Tale fattore mostra che, per quanto in questo passaggio si sia verificata una forma alquanto ridotta di normalizzazione, la resa in ortografia italiana dei materiali dialettali dell'ALT ha permesso di riprodurre in modo abbastanza fedele le caratteristiche della realizzazione fonetica da parte dei parlanti.

 

 

Normalizzazione di primo livello

La normalizzazione di primo livello è stata intesa come un primo passo di astrazione rispetto a tratti specifici della realizzazione fonetica del dato come riportati dalla trascrizione ortografica. A questo stadio sono state neutralizzate variazioni fonetiche produttive sul territorio toscano: ad esempio, [stiacciàta] e [schiacciàta] sono state ricondotte alla medesima forma normalizzata ({schiacciàta}), lo stesso vale per [vìholo] e [vìcolo] (> {vìcolo}), [schiacciàha], [schiacciàda] e [schiacciàta] (> {schiacciàta}), [fidanzàdo] e [fidanzàto] (> {fidanzàto}), [diacciàia] e [ghiacciàia] (> {ghiacciàia}), [cìgghio] e [cìglio] (> {cìglio}), [mérma] e [mélma] (> {mélma}), e così via. Non si è fatto invece astrazione da variazioni morfologiche: [schiacciàta] e [schiacciàte] sono rimaste attestazioni distinte così come [schiàccia], [schiaccétta] e [schiaccìna]. E sono rimaste distinte forme come [gàglio] e [càglio] che hanno sì la loro motivazione in una variazione fonetica che oggi non è però più operante in quel particolare territorio della Toscana in cui sono attestate. 

Ricapitoliamo di seguito la tipologia di normalizzazioni operate a questo livello, organizzate in due insiemi disgiunti: quelle basate su regole generali, che sono state applicate "a tappeto" sul corpus dei materiali ALT, e quelle per le quali ci siamo avvalsi di conoscenza specifica, in particolare lessicale. 

Regole generali di normalizzazione: 

  • ricostruzione di vocali in corpo di parola: <bìgli>/[bìg-li] ricondotto a {bìgoli};

  • riconduzione a {schi-} di /[s-c(i)]: [s-ciafón] ricondotto a {schiaffóne}; 

  • ricostruzione della velare sottoposta a spirantizzazione (grafia h): [ahàcia], [abbahàre], [albihòcca] ricondotti a {acàcia}, {abbacàre}, {albicòcca}; 

  • ricostruzione della dentale sorda intervocalica realizzata come fricativa velare (grafia h): [abbandonàho], [aggrankìho], [battùho] ricondotti rispettivamente a {abbandonàto}, {aggrankìto}, {battùto}; 

  • la cacuminale (traslitterata in d) è stata ricondotta a ll: [agnèdo], [badòtti], [pipistrèdo] ricondotti a {agnèllo}, {ballòtti}, {pipistrèllo}; 

  • eliminazione del rafforzamento sintattico: [a cciancanèlla], [a ppaggìno], [tu ccapìssi] ricondotti a {a ciancanèlla}, {a paggìno}, {tu capìssi}; 

  • ricostruzione di n in luogo di m derivante da assimilazione in fonosintassi davanti a p/b o m: [im bìlico], [nom prèsta], [pam mòlle] ricondotti a {in bìlico}, {non prèsta}, {pan mòlle}; 

  • neutralizzazione del tratto di sonorità per s/S e z/Z: [abbòzza] e [abbòZZa] convergono su {abbòzza}; 

  • zz in posizione iniziale è stata rappresentata come z: [zzòlla], [zzàzzera] e [ZZitèlla] resi come {zòlla}, {zàzzera} e {zitèlla}. 

Regole lessicali di normalizzazione: 

  • le vocali turbate sono state ricondotte alla vocale etimologica: [lüna], [cunöta] ricondotti a {lùna}, {cunétta}; 

  • l'indistinta viene ricondotta alla vocale etimologica: [prìmo quàrtë], [cùntravöntë] ricondotti a {prìmo quàrto}, {controvènto}; 

  • ricostruzione delle vocali finali: [làmp], [balén], [lùm] ricondotti a {làmpo}, {baléno}, {lùme}; 

  • ricostruzione delle vocali iniziali: [ntepàtiho], [ncòtta], [mbròdola] ricondotti a {antepàtiho}, {incòtta}, {imbròdola}; 

  • ricostruzione di l preconsonantica passata ad i e scempiamento della consonante: [aibbatrèllo], [góippe],  [càiddu] ricondotti a {albatrèllo}, {gólpe}, {càldo}; 

  • (t)ti viene mantenuto tale oppure ricondotto a (c)chi a seconda dei casi: [béstie] mantenuto tale, {gragnolìstio} ricondotto a {gragnolìschio}; 

  • (d)di viene mantenuto tale oppure ricondotto a (g)ghi o a gl(i) a seconda dei casi: [àddio] ricondotto a {àglio}, [cìndia] a {cìnghia}; 

  • la postpalatale sonora viene ricondotta a gli a seconda dei casi: [cìgghio], [bargègghi] ricondotti a {ciglio} e {bargègli}; 

  • nni+voc viene ricondotta a gn a seconda dei casi: [granniòla] passa a {gragnòla}; 

  • ricostruzione della sibilante in luogo dell'affricata dopo l/r/n: [gèlzo], [addormìrzi], [ànzia] ricondotti a {gèlso}, {addormìrsi}, {ànsia}; 

  • ricostruzione di t in contesto voc-d-voc in fine di parola (caso tipico costituito dalla desinenza del participio passato): [venùdo], [nformigolìdo], [acchittàdo] ricondotti a {venùto}, {informigolìto}, {acchittàto}; 

  • riconduzione a l di r dovuta a rotacismo: [vórpe], [àrba], [càrdo] ricondotti a {vólpe}, {àlba}, {càldo}; 

  • zzi seguito da vocale passa a zi+vocale: [agitazzióne], [barbuzziènte] ricondotti a {agitazióne}, {balbuziènte}; 

  • adeguamento alla norma italiana per {cièlo}, {cièco} e {cuòre}; 

  • inserimento degli apostrofi: [c è] e [l àrba] normalizzati rispettivamente in {c' è} e {l' àlba}.

 

...indietro