|
Codifica dei
materiali dialettali
In ALT-Web, a ciascuna attestazione dialettale raccolta sul
campo (sia essa risposta a domanda del questionario, materiale
integrativo così come fraseologia di varia natura) sono
associati diversi livelli di rappresentazione articolati come
segue:
- rappresentazione
in trascrizione fonetica, racchiusa tra parentesi
uncinate <...>;
- rappresentazioni normalizzate in ortografia italiana
suddivise in:
- traslitterazione in ortografia italiana (racchiusa
tra parentesi quadre [...]): questa rappresentazione
è stata concepita come guida alla lettura e alla
decodifica della forma in trascrizione fonetica per
l'utente che non abbia familiarità con
rappresentazioni fonetiche;
- normalizzazione di primo livello (racchiusa tra
parentesi graffe {...}), che neutralizza tratti
specifici della realizzazione fonetica del dato come
riportati dalla trascrizione ortografica (ad es.
variazioni fonetiche produttive sul territorio
toscano) senza fare astrazione da variazioni
morfologiche.
Questo complesso e articolato schema di rappresentazione
dei materiali dell'ALT crea i presupposti per ricerche
"intelligenti" che astraggono progressivamente da
dettagli della realizzazione fonetica del dato da parte
del parlante.
Rappresentazione
in trascrizione fonetica
Il sistema di trascrizione fonetica adottato nell'ALT si
rifà al sistema di trascrizione cosiddetto "Ascoli-Merlo",
nella configurazione a suo tempo stabilita per le inchieste
della Carta dei Dialetti Italiani (CDI) ed in versione
specializzata per la codifica di materiali relativi ai
dialetti toscani. Ne riportiamo di seguito una
breve descrizione:
Vocalismo
Il
triangolo vocalico tipico dei dialetti toscani è indicato
nella tabella che segue:
Semivocali:
Si noti che:
- con /ä/ è indicata la /a/ palatalizzata della zona aretina
- un punto sottoscritto indica la vocale chiusa, come
nell'italiano séra e cóme;
- un gancio, aperto verso destra, sottoscritto indica la
vocale aperta, come nell'italiano apèrto e assòrto.
Inoltre:
- il suono vocalico indistinto è indicato graficamente
con una e capovolta;
- con il titolo ~ sono indicate le vocali nasalizzate;
- due punti sottoscritti indicano vocale molto chiusa;
- due puntini soprascritti caratterizzano la serie dei
suoni vocalici turbati o palatalizzati.
Consonantismo
Si noti che:
Inoltre:
-
le
consonanti lunghe o intensamente articolate sono segnalate
con la ripetizione di due segni uguali. Ciò vale sempre -
anche per l'inizio di parola - per la trascrizione della
nasale e della laterale palatale, nonché della sibilante
palatale:
(che sono esempi di parole italiane perché i dialetti
possono presentare - anche occasionalmente - variazioni
significative).
Accento
Tutte le parole recano l'indicazione dell'accento,
segnato tramite un accento acuto sulla vocale della sillaba
accentata. L'accento principale è sempre indicato; l'accento
secondario solo quando è stato registrato dal rilevatore.
Casi particolari
Le
articolazioni intermedie o "oscillanti" sono
indicate nella grafia CDI mediante la sovrapposizione, a
cavallo della riga di due segni, con prevalenza del valore
espresso in alto. Questa sovrapposizione è stata qui
codificata su di un'unica riga secondo la convenzione che
segue: i due segni "oscillanti" sono separati da un
simbolo, ^ , che individua un'articolazione intermedia tra
ciò che lo precede, e che anche prevale, e ciò che lo segue.
Ad esempio:
per indicare la pronuncia leggermente lenita delle occlusive
sorde in certe zone della Toscana.
Le
articolazioni attenuate o ridotte, realizzate cioè con
intensità minore, indicate nella grafia CDI in carattere
minore e sollevato rispetto alla riga, sono qui riportate alla
stessa riga e fatte seguire da una marca, - , che ne
simbolizza il grado ridotto. Ad esempio:
dove v è realizzato in modo attenuato.
Nel
corpus dei materiali ALT, in rari casi non si disponeva della
realizzazione fonetica delle forme o della fraseologia
attestata. Al fine di garantire la comparabilità tra tutte le
testimonianze raccolte, in trascrizione e non, l'attestazione
è stata riportata anche in questi casi tra parentesi uncinate
e codificata secondo una grafia fonetica larga
"ricostruita" seguendo la trascrizione fonologica
dell'italiano di Toscana. A tale ricostruzione è imputabile
l'assenza di specificazioni relative, ad esempio, al grado di
apertura delle vocali. Le singole parole costituenti tali
attestazioni con trascrizione fonetica ricostruita sono
immediatamente precedute da una marca, * . Ad esempio:
.
La necessità di marcare come ricostruita la trascrizione
delle singole parole piuttosto che dell'attestazione nel suo
complesso deriva dai casi di fraseologia "mista",
finalizzati ad illustrare i contesti di uso del termine
fornito in risposta, dove la sola realizzazione fonetica
registrata è appunto quella della risposta. Si noti infine
che vi sono forme in cui l'assenza di diacritico non è
accompagnata dal segno di forma ricostruita: in questi casi si
tratta di errore del raccoglitore che la preedizione non ha
voluto correggere.
Traslitterazione
in ortografia italiana
La
forma in trascrizione ortografica, racchiusa tra parentesi
quadre [...], è stata concepita come guida alla lettura della
forma originaria in trascrizione fonetica che in effetti non
sostituisce ma affianca. Nella traslitterazione in ortografia
italiana delle forme dialettali registrate in trascrizione
fonetica si è cercato, ove possibile (ovvero quando consentito
dalle convenzioni ortografiche italiane), di rendere conto della
variabilità effettivamente rilevata con le inchieste sul campo.
Tuttavia, in questa operazione di transcodifica non si è
raggiunto il rapporto auspicabile di 1:1 pena la riproposizione
delle difficoltà di decodifica dell'attestazione dialettale che
la traslitterazione stessa si proponeva di eliminare. Per quanto
si sia cercato di riprodurre tutti i tratti di pronuncia
registrati, a questo livello intervengono una serie di
inevitabili neutralizzazioni dovute all'indisponibilità dei
corrispondenti grafemi nell'ortografia italiana. Ad esempio,
nella traslitterazione non si riesce più a rendere conto della
spirantizzazione di grado lieve-medio delle occlusive: alle
trascrizioni
viene
associata la medesima trascrizione ortografica, [abéto].
La
tipologia di neutralizzazioni operate nel passaggio dalla
trascrizione fonetica a quella ortografica trova la sua
principale motivazione in quanto si riesce a restituire con i
grafemi dell'ortografia italiana. A questo livello non è stato
possibile rendere conto di fenomeni ampiamente diffusi nella
regione come ad esempio la spirantizzazione di occlusiva (con
l'eccezione del grado h dell'occlusiva velare che viene
mantenuto distinto), o la perdita di occlusione nelle affricate
palatali; fenomeni, comunque, che proprio per la forte
caratterizzazione come marca di toscanismo possono considerarsi
un'informazione quasi universalmente acquisita e per così dire
essere "dati per scontati" come sottostanti alla
traslitterazione.
Neutralizzazioni
operate nel passaggio dalla resa in trascrizione fonetica
all'ortografia italiana includono casi di:
E'
stato invece possibile mantenere a questo livello di
rappresentazione la distinzione tra s e z sorde e
sonore ([zzòlla] vs [ZZòlla], [eSòSo] vs [esòso]), che
registra in Toscana un progressivo incremento degli esiti con
realizzazione sonora, e l'affricazione di s
post-consonantica ([bórsa] vs [bórza]), fenomeno in espansione
anche in area fiorentina. L'ortografia italiana ha permesso di
rendere conto di un fenomeno molto diffuso come il rotacismo ([pàlko]
vs [pàrko]) e di uno al contrario territorialmente assai
limitato come la realizzazione cacuminale
([pàda] vs [pàlla]), traslitterata in modo purtroppo parziale
in d. Inoltre si è mantenuta l'indicazione del
raddoppiamento fonosintattico ([a ppovènta] vs [a povènta]) e
dell'accento (anche secondario). Per ciò che riguarda il
sistema vocalico, vengono mantenute le sette vocali di base,
oltre alle turbate ö, ü ed ë che indica l'indistinta; scelta,
questa, utile a rendere immediatamente percepibile il peso della
non toscanità linguistica di aree come la Lunigiana.
A
questo livello avviene anche la ricostruzione delle consonanti
nasali in posizione finale, rappresentate al livello della
trascrizione fonetica nei termini di vocali nasalizzate. Questa
soluzione si motiva con esigenze di trasparenza in quanto una
resa priva dell'indicazione di nasalità poteva dar luogo a
incomprensioni: ci è parso infatti che [pán] fosse preferibile
rispetto a [pá] per pane e inoltre svolgesse la non
trascurabile funzione di (parziale) decodifica del diacritico
usato per indicare la realizzazione nasale della vocale.
La
volontà di adesione alla trascrizione fonetica ha implicato
anche alcune deroghe alla norma ortografica italiana, per cui si
è rimandato al livello successivo di normalizzazione
l'aggiustamento all'ortografia italiana di zzi+voc e di zz
in posizione iniziale; inoltre, forme del tipo
sono state traslitterate come [cèlo], [scènza] così come
è
stato sempre reso come [qu] (da cui la legittimità a questo
livello di forme come [quòre]). Infine, si sono sempre rese con
accento ([à], [ò], [ài], [ànno]) le voci del verbo avere.
Abbiamo
visto che nel passaggio dalla trascrizione fonetica alla sua
codifica in ortografia italiana si sono rese necessarie alcune
neutralizzazioni; al contempo, è stato possibile rappresentare
adeguatamente un'ampia gamma di fenomeni del toscano, quali il
rotacismo, l'affricazione di s post-consonantica, il
raddoppiamento fonosintattico, ecc. Alcuni dati numerici possono
aiutarci a questo punto a capire l'impatto delle inevitabili
neutralizzazioni sulla resa in ortografia italiana della
trascrizione fonetica. Il corpus delle attestazioni dialettali
in trascrizione fonetica nell'ALT è costituito da 380.348
occorrenze (che includono anche fraseologia di vario tipo),
corrispondenti a 84.075 attestazioni diverse (con una frequenza
media per attestazione di 4,5). Nel passaggio all'ortografia
italiana, le attestazioni diverse si sono ridotte a 74.105, con
un fattore di normalizzazione di 1,13 (calcolato come rapporto
tra il numero di attestazioni diverse in trascrizione fonetica e
in ortografia italiana). Tale fattore mostra che, per quanto in
questo passaggio si sia verificata una forma alquanto ridotta di
normalizzazione, la resa in ortografia italiana dei materiali
dialettali dell'ALT ha permesso di riprodurre in modo abbastanza
fedele le caratteristiche della realizzazione fonetica da parte
dei parlanti.
Normalizzazione di primo livello
La
normalizzazione di primo livello è stata intesa come un primo
passo di astrazione rispetto a tratti specifici della
realizzazione fonetica del dato come riportati dalla
trascrizione ortografica. A questo stadio sono state
neutralizzate variazioni fonetiche produttive sul territorio
toscano: ad esempio, [stiacciàta] e [schiacciàta] sono state
ricondotte alla medesima forma normalizzata ({schiacciàta}), lo
stesso vale per [vìholo] e [vìcolo] (> {vìcolo}), [schiacciàha],
[schiacciàda] e [schiacciàta] (> {schiacciàta}), [fidanzàdo]
e [fidanzàto] (> {fidanzàto}), [diacciàia] e [ghiacciàia]
(> {ghiacciàia}), [cìgghio] e [cìglio] (> {cìglio}), [mérma]
e [mélma] (> {mélma}), e così via. Non si è fatto invece
astrazione da variazioni morfologiche: [schiacciàta] e [schiacciàte]
sono rimaste attestazioni distinte così come [schiàccia], [schiaccétta]
e [schiaccìna]. E sono rimaste distinte forme come [gàglio] e
[càglio] che hanno sì la loro motivazione in una variazione
fonetica che oggi non è però più operante in quel particolare
territorio della Toscana in cui sono attestate.
Ricapitoliamo
di seguito la tipologia di normalizzazioni operate a questo
livello, organizzate in due insiemi disgiunti: quelle basate su
regole generali, che sono state applicate "a tappeto"
sul corpus dei materiali ALT, e quelle per le quali ci siamo
avvalsi di conoscenza specifica, in particolare lessicale.
Regole
generali di normalizzazione:
-
ricostruzione
di vocali in corpo di parola: <bìgli>/[bìg-li]
ricondotto a {bìgoli};
-
riconduzione
a {schi-} di
/[s-c(i)]:
[s-ciafón] ricondotto a {schiaffóne};
-
ricostruzione
della velare sottoposta a spirantizzazione (grafia h):
[ahàcia], [abbahàre], [albihòcca] ricondotti a {acàcia},
{abbacàre}, {albicòcca};
-
ricostruzione
della dentale sorda intervocalica realizzata come fricativa
velare (grafia h): [abbandonàho], [aggrankìho], [battùho]
ricondotti rispettivamente a {abbandonàto}, {aggrankìto},
{battùto};
-
la
cacuminale (traslitterata in d) è stata ricondotta a
ll: [agnèdo], [badòtti], [pipistrèdo] ricondotti a
{agnèllo}, {ballòtti}, {pipistrèllo};
-
eliminazione
del rafforzamento sintattico: [a cciancanèlla], [a
ppaggìno], [tu ccapìssi] ricondotti a {a ciancanèlla}, {a
paggìno}, {tu capìssi};
-
ricostruzione
di n in luogo di m derivante da assimilazione
in fonosintassi davanti a p/b o m: [im
bìlico], [nom prèsta], [pam mòlle] ricondotti a {in
bìlico}, {non prèsta}, {pan mòlle};
-
neutralizzazione
del tratto di sonorità per s/S e z/Z:
[abbòzza] e [abbòZZa] convergono su {abbòzza};
-
zz
in posizione iniziale è stata rappresentata come z:
[zzòlla], [zzàzzera] e [ZZitèlla] resi come {zòlla}, {zàzzera}
e {zitèlla}.
Regole
lessicali di normalizzazione:
-
le
vocali turbate sono state ricondotte alla vocale
etimologica: [lüna],
[cunöta] ricondotti a {lùna}, {cunétta};
-
l'indistinta
viene ricondotta alla vocale etimologica: [prìmo quàrtë], [cùntravöntë]
ricondotti a {prìmo quàrto}, {controvènto};
-
ricostruzione
delle vocali finali: [làmp], [balén], [lùm] ricondotti a {làmpo},
{baléno}, {lùme};
-
ricostruzione
delle vocali iniziali: [ntepàtiho], [ncòtta], [mbròdola]
ricondotti a {antepàtiho}, {incòtta}, {imbròdola};
-
ricostruzione
di l preconsonantica passata ad i e scempiamento della
consonante: [aibbatrèllo], [góippe], [càiddu] ricondotti a
{albatrèllo}, {gólpe}, {càldo};
-
(t)ti
viene mantenuto tale oppure ricondotto a (c)chi a seconda
dei casi: [béstie] mantenuto tale, {gragnolìstio} ricondotto a
{gragnolìschio};
-
(d)di
viene mantenuto tale oppure ricondotto a (g)ghi o a
gl(i) a
seconda dei casi: [àddio] ricondotto a {àglio}, [cìndia] a
{cìnghia};
-
la
postpalatale sonora viene ricondotta a gli a seconda dei
casi: [cìgghio], [bargègghi] ricondotti a {ciglio} e {bargègli};
-
nni+voc
viene ricondotta a gn a seconda dei casi: [granniòla] passa a
{gragnòla};
-
ricostruzione
della sibilante in luogo dell'affricata dopo l/r/n:
[gèlzo], [addormìrzi], [ànzia] ricondotti a {gèlso}, {addormìrsi},
{ànsia};
-
ricostruzione
di t in contesto voc-d-voc in fine di parola (caso tipico
costituito dalla desinenza del participio passato): [venùdo],
[nformigolìdo], [acchittàdo] ricondotti a {venùto},
{informigolìto}, {acchittàto};
-
riconduzione
a l di r dovuta a rotacismo: [vórpe], [àrba],
[càrdo]
ricondotti a {vólpe}, {àlba}, {càldo};
-
zzi
seguito da vocale passa a zi+vocale: [agitazzióne],
[barbuzziènte] ricondotti a {agitazióne}, {balbuziènte};
-
adeguamento
alla norma italiana per {cièlo}, {cièco} e {cuòre};
-
inserimento
degli apostrofi: [c è] e [l àrba] normalizzati rispettivamente
in {c' è} e {l' àlba}.
|