Codifica dell'interrogazione di materiali
dialettali in trascrizione fonetica
In linea di principio, i calcolatori
rappresentano strumenti che facilitano e rendono più
efficiente l’accesso a grandi archivi di dati. In pratica,
ciò non è più totalmente vero nel caso di un corpus di
materiali dialettali trascritti foneticamente. In questo caso,
il dettaglio imposto dalla trascrizione fonetica nella
rappresentazione del dato dialettale può costituire una
ulteriore difficoltà per il suo recupero tramite procedure
automatiche. Infatti, il recupero di materiali in trascrizione
fonetica si scontra con una
difficoltà di fondo: proprio per il fatto di essere
trascritte secondo un sistema di rappresentazione grafica che
tende a riprodurre differenze fonetiche anche minute, le forme
assunte localmente da una stessa parola possono essere (anche
molto) distanti tra di loro. Ciò implica che l’utente
dovrebbe essere in grado di prefigurarsi in anticipo la varietà
di possibili esiti di un dato tipo lessicale nell’area
dialettale coperta dalle testimonianze raccolte. In altre
parole, ci troviamo di fronte alla situazione – per certi
versi paradossale – in cui l’utente deve prefigurarsi in
partenza il risultato della propria ricerca.
In ALT-WEB abbiamo cercato di
affrontare questo problema tipico dell'interrogazione e del
recupero di materiali in trascrizione fonetica mettendo a
punto uno schema di codifica semplificato dell'interrogazione.
In questo schema ad uno stesso codice possono essere associati
diversi segni dell’alfabeto fonetico adottato. Ad esempio,
per quanto riguarda le vocali lo stesso codice è usato per vocali accentate e non, chiuse o aperte, e/o palatalizzate e/o
nasalizzate. Ciò implica che una serie di distinzioni
presenti nella grafia ALT sono neutralizzate da questo schema
di codifica semplificato che, ad esempio, astrae dal grado di apertura
delle vocali o dalla spirantizzazione di occlusive: ad
esempio, a partire dall’interrogazione proda
vengono recuperate attestazioni diverse come ,
ecc.
In questo modo, la ricerca da parte
dell’utente è resa più efficiente in quanto non devono
essere ricercate singolarmente le possibili varianti in cui
una data forma dialettale può apparire. D’altra parte, se
l’interesse dell’utente si limita ad una forma
particolare, questa - se attestata - apparirà tra le
possibili varianti reperite e sarà possibile selezionarne i
contesti separatamente. Un maggiore grado di astrazione da
realizzazioni fonetiche particolari è possibile quando
l'interrogazione venga proiettata sugli altri livelli di
rappresentazione del dato dialettale (traslitterazione
ortografica e rappresentazione normalizzata).
Per codificare la propria interrogazione in trascrizione
fonetica, l'utente ha a disposizione una tastiera virtuale
contenente i simboli dell'alfabeto fonetico dell'ALT
riprodotta di seguito:
cliccando con il mouse sul carattere
della grafia ALT che si intende digitare per formulare
l’interrogazione, si ottiene la digitazione automatica del
codice corrispondente nel riquadro grigio sottostante. Ogni simbolo
fonetico selezionato è automaticamente convertito nella sua
codifica corrispondente, dando così luogo a una
interrogazione "astratta" che permette il recupero
simultaneo di più varianti di una stessa parola.
A questo livello è anche possibile
formulare ricerche
parzialmente specificate; ad esempio possono essere
richieste tutte le forme inizianti o terminanti con una data
sequenza di caratteri (corrispondenti ad un dato prefisso o
suffisso). A tal fine viene fatto uso dei cosiddetti
“caratteri jolly”, costituiti da:
“ * ” [asterisco]: sta per una
qualsiasi sequenza di caratteri ed anche per nessun carattere;
“ $ ” [dollaro]: sta per un
solo carattere.
Esempi
di ricerche parzialmente specificate sono:
-
libr*:
recupera tutte le forme che iniziano con libr-
(cioè: libraio, libreria, libretto, libro, libri ecc.);
-
*mento:
recupera tutte le forme che terminano con -mento
(cioè armamento, giovamento, parlamento ecc.);
-
libr$:
recupera libro,
libri.
|