Recupero dei materiali dialettali in ALT-WEB
I diversi
livelli di rappresentazione associati ai materiali
dialettali contenuti nella base di dati di ALT-WEB creano i
presupposti per ricerche che astraggono progressivamente da
dettagli della realizzazione fonetica del dato da parte del
parlante. Cerchiamo ora di mostrare attraverso lausilio di
esempi lutilitą di questo complesso e articolato schema di
codifica ai fini dellinterrogazione e del recupero dei
materiali dialettali dalla banca dati dellALT. Come vedremo,
la tipologia dei risultati della ricerca varia in modo
considerevole a seconda del livello di rappresentazione sul
quale viene proiettata linterrogazione.
Supponiamo di
voler recuperare le attestazioni diverse ottenute in risposta
alla domanda 331 del questionario ALT, finalizzata alla raccolta
dei termini designanti il caglio. Proiettando questa
richiesta sul livello della rappresentazione fonetica, si
ottiene quanto segue:
ovvero, 90
risposte diverse, con una frequenza di attestazione nelle
localitą indagate che oscilla tra 182 (nel caso della risposta
maggioritaria) e 1 (i casi di risposte con attestazione unica
sono ben 56, corrispondenti al 62% dellinsieme delle
risposte). Vale la pena notare che solo le prime 7 risposte
della lista ordinata per frequenza decrescente presentano pił
di 4 attestazioni.
Situazione analoga si osserva proiettando
la stessa interrogazione sul livello della traslitterazione in
ortografia italiana. In questo caso, le forme diverse appaiono
essere 85 (contrapposte alle precedenti 90) con una
distribuzione di frequenza alquanto simile.
Passando
allinterrogazione del livello di rappresentazione successivo,
ovvero quello dei materiali normalizzati, si constata invece una
differenza notevole nella tipologia dei risultati ottenuti.
Infatti, a partire dalla stessa richiesta, le risposte diverse
ottenute in relazione alla domanda 331, si riducono a poco pił
della metą di quelle registrate originariamente in trascrizione
fonetica, ovvero 51. Questo deriva dallaccorpamento di
risposte diverse che sono state ricondotte alla stessa forma
normalizzata secondo i criteri illustrati nella pagina
sulla codifica dei materiali.
Nel passaggio
dalla traslitterazione in ortografia italiana alla
rappresentazione normalizzata, ovvero il livello che astrae da
tratti specifici della realizzazione fonetica corrispondenti a
variazioni fonetiche produttive sul territorio toscano, abbiamo
visto che la tipologia delle risposte si č ridotta quasi alla
metą. Vediamo alcuni esempi: alla forma normalizzata cąglio
sono state ricondotte forme alquanto diverse come cąio, cąiė,
cągio, cąddiė, cąiio, cągghio, cąiiu,
cąi e cągliu; in relazione alla forma
normalizzata gąglio si osservano simili neutralizzazioni
in quanto essa sussume forme come gąi, gąddio, gągghio.
Rimangono tuttavia distinte a questo livello attestazioni come presurąia,
presąme, presģna, presłra, presłri,
presłria, presłro, presóia, presóio,
presóre, presóro, presģna catterizzate
da diverse suffissazioni e tenute distinte da présa cosģ
come da parsłro e persłro.
Abbiamo visto limpatto dei diversi
livelli di rappresentazione del dato su una ricerca incentrata
sulla domanda dove abbiamo osservato la tipologia dei risultati
ridursi progressivamente nel passaggio da un livello
allaltro.
Passiamo ora a una ricerca di tipo
diverso, incentrata sulla forma dialettale raccolta sul campo, e
vediamo la progressione della produttivitą della ricerca
attraverso i diversi livelli.
Supponiamo di
voler recuperare al livello di rappresentazione in trascrizione
fonetica le attestazioni della forma .
Grazie al tipo
di codifica
semplificato adottato per l'interrogazione in trascrizione fonetica, il sistema
restituisce risposte diverse: la forma oggetto
dellinterrogazione e una sua variante spirantizzata
(precisamente con la fricativa dentale in sillaba finale),
ovvero
per un totale di 60 occorrenze.
Lutente č a
questo punto chiamato a decidere se circoscrivere il recupero
alle attestazioni corrispondenti alla richiesta di partenza, con
un risultato di 33 occorrenze, oppure se concentrarsi su
unaltra delle alternative recuperate (ad esempio, le
attestazioni relative alla variante con fricativa dentale in
sillaba finale) oppure se valutare il risultato globale.
Passando a
interrogare il livello di rappresentazione successivo
(traslitterazione in ortografia italiana), si constata uno
scarto nella produttivitą della ricerca. Infatti, a partire
dalla richiesta schiacciata le forme diverse in
trascrizione fonetica recuperate sono numerose, tra cui:,
ecc.
Ovvero, le forme
recuperate a questo livello presentano diversi gradi di
palatalizzazione del nesso
e della /s/
preconsonantica, combinati tra di loro e con la realizzazione
fricativa dellocclusiva dentale. Nel caso specifico, si
raggiungono 173 attestazioni, ampliando di ben tre volte il
risultato ottenuto tramite linterrogazione operante al
livello di rappresentazione precedente.
Procedendo
infine al livello delle rappresentazioni normalizzate, quello
che astrae da variazioni di tipo fonetico produttive sul
territorio della regione, la mole dei risultati della ricerca
effettuata a partire dalla forma normalizzata schiacciata
aumenta ulteriormente, passando a 310 attestazioni recuperate
(da confrontarsi con le 60 recuperate al livello della
trascrizione fonetica e le 173 recuperate al livello della
traslitterazione ortografica). A questo livello, vengono
ricondotte allo stesso tipo astratto forme alquanto diverse
quali schiacciąta, schiacciąda, stiacciąta,
schiacciąha cosģ come s-ciasséda. Rimangono
invece distinte a questo livello attestazioni quali schiaccia,
schiaccina, schiaccetta, ecc.
Per quanto ulteriori livelli di
normalizzazione siano auspicabili, crediamo che la codifica dei
materiali dialettali in ALT-WEB sia gią allo stato attuale
funzionale sia al non addetto ai lavori, che interrogherą la
base di dati rendendo attraverso le convenzioni
dellortografia italiana la pronuncia locale, sia al
dialettologo e al linguista che troveranno in questa codifica
stratificata in livelli caratterizzati da astrazioni
incrementali un primo, sebbene elementare, livello di
tipizzazione dei materiali dellALT.
|