(Logo Regione Toscana)
HOME PERCHE' PROGETTO DOCUMENTAZIONE NAVIGAZIONE CREDITI LINKS UTILI CONTATTI

Codifica dell'interrogazione di materiali dialettali in trascrizione fonetica

In linea di principio, i calcolatori rappresentano strumenti che facilitano e rendono più efficiente l’accesso a grandi archivi di dati. In pratica, ciò non è più totalmente vero nel caso di un corpus di materiali dialettali trascritti foneticamente. In questo caso, il dettaglio imposto dalla trascrizione fonetica nella rappresentazione del dato dialettale può costituire una ulteriore difficoltà per il suo recupero tramite procedure automatiche. Infatti, il recupero di materiali in trascrizione fonetica si scontra con una  difficoltà di fondo: proprio per il fatto di essere trascritte secondo un sistema di rappresentazione grafica che tende a riprodurre differenze fonetiche anche minute, le forme assunte localmente da una stessa parola possono essere (anche molto) distanti tra di loro. Ciò implica che l’utente dovrebbe essere in grado di prefigurarsi in anticipo la varietà di possibili esiti di un dato tipo lessicale nell’area dialettale coperta dalle testimonianze raccolte. In altre parole, ci troviamo di fronte alla situazione – per certi versi paradossale – in cui l’utente deve prefigurarsi in partenza il risultato della propria ricerca. 

In ALT-WEB abbiamo cercato di affrontare questo problema tipico dell'interrogazione e del recupero di materiali in trascrizione fonetica mettendo a punto uno schema di codifica semplificato dell'interrogazione. In questo schema ad uno stesso codice possono essere associati diversi segni dell’alfabeto fonetico adottato. Ad esempio, per quanto riguarda le vocali lo stesso codice è usato per vocali accentate e non, chiuse o aperte, e/o palatalizzate e/o nasalizzate. Ciò implica che una serie di distinzioni presenti nella grafia ALT sono neutralizzate da questo schema di codifica semplificato che, ad esempio, astrae dal grado di apertura delle vocali o dalla spirantizzazione di occlusive: ad esempio, a partire dall’interrogazione proda vengono recuperate attestazioni diverse come , ecc.

In questo modo, la ricerca da parte dell’utente è resa più efficiente in quanto non devono essere ricercate singolarmente le possibili varianti in cui una data forma dialettale può apparire. D’altra parte, se l’interesse dell’utente si limita ad una forma particolare, questa - se attestata - apparirà tra le possibili varianti reperite e sarà possibile selezionarne i contesti separatamente. Un maggiore grado di astrazione da realizzazioni fonetiche particolari è possibile quando l'interrogazione venga proiettata sugli altri livelli di rappresentazione del dato dialettale (traslitterazione ortografica e rappresentazione normalizzata).

Per codificare la propria interrogazione in trascrizione fonetica, l'utente ha a disposizione una tastiera virtuale contenente i simboli dell'alfabeto fonetico dell'ALT riprodotta di seguito:

cliccando con il mouse sul carattere della grafia ALT che si intende digitare per formulare l’interrogazione, si ottiene la digitazione automatica del codice corrispondente nel riquadro grigio sottostante. Ogni simbolo fonetico selezionato è automaticamente convertito nella sua codifica corrispondente, dando così luogo a una interrogazione "astratta" che permette il recupero simultaneo di più varianti di una stessa parola.

A questo livello è anche possibile formulare ricerche parzialmente specificate; ad esempio possono essere richieste tutte le forme inizianti o terminanti con una data sequenza di caratteri (corrispondenti ad un dato prefisso o suffisso). A tal fine viene fatto uso dei cosiddetti “caratteri jolly”, costituiti da:

“ * ” [asterisco]: sta per una qualsiasi sequenza di caratteri ed anche per nessun carattere;

“ $ ” [dollaro]: sta per un solo carattere.

Esempi di ricerche parzialmente specificate sono: 

  • libr*: recupera tutte le forme che iniziano con libr- (cioè: libraio, libreria, libretto, libro, libri ecc.); 

  • *mento: recupera tutte le forme che terminano con -mento (cioè armamento, giovamento, parlamento ecc.);

  • libr$: recupera libro, libri.

 

 
Parole di Toscana


HOME PERCHE' PROGETTO DOCUMENTAZIONE NAVIGAZIONE CREDITI LINKS UTILI CONTATTI