(Logo Regione Toscana)
HOME PERCHE' PROGETTO DOCUMENTAZIONE NAVIGAZIONE CREDITI LINKS UTILI CONTATTI

Accesso ai materiali dialettali su base concettuale

Una delle chiavi canoniche di accesso ai materiali di un atlante linguistico, quando la rilevazione sia stata condotta sulla base di un questionario, è per domanda: all’interno del corpus dei materiali raccolti si ricercano tutte le attestazioni che sono state reperite in risposta alla domanda prescelta, oppure che sono emerse in relazione ad essa (nel caso di materiali integrativi ad essa correlati). Una ricerca di questo tipo presuppone però la conoscenza del questionario usato per le inchieste, spesso articolato in centinaia di domande: nel caso specifico dell’ALT, il questionario di raccolta conteneva 745 domande.

Al fine di facilitare ulteriormente il consultatore di ALT-Web nell’identificazione della domanda o delle domande oggetto del proprio interesse, abbiamo costruito un’ontologia che organizza i concetti indagati dall’ALT in gerarchie e reti semantiche articolate su diversi livelli. Il termine “ontologia” è qui usato nell’accezione corrente nell’ambito delle tecnologie dell’informazione per denotare un repertorio strutturato di concetti rilevanti per la descrizione e organizzazione di un certo dominio di conoscenza. 

In particolare, la tipologia dei concetti indagati dall’ALT è stata organizzata in 13 macro-classi derivate dall’originaria strutturazione del questionario in settori, più una classe miscellanea che raccoglie domande non immediatamente riconducibili alle macro-classi identificate.

Al livello alto dell’ontologia dell’ALT abbiamo le macro-classi listate nella prima colonna della tabella che segue:

Macro-classe

N. raggruppamenti semantici associati

N. domande associate

agricoltura

40

378

alimentazione

31

331

allevamento

16

182

animali selvatici

12

106

bosco e raccolta della legna

24

233

casa e attività domestiche

38

290

forme del terreno

27

143

piante e frutti

23

185

tempo cronologico

8

40

tempo meteorologico

17

107

uomo: attività e relazioni sociali

32

178

uomo: comportamento e sentimenti

73

464

uomo: corpo e abbigliamento

55

407

varia

9

26

Per ciascuna macro-classe (o “settore”) sono stati identificati un insieme di classi intermedie o raggruppamenti concettuali più specifici (la cui entità numerica relativamente a ciascun settore è riportata nella seconda colonna della tabella), per un totale di 405 associazioni: ciascuna macro-classe è articolata, in media, in 29 classi concettuali di livello intermedio. Scendendo nell’ontologia, a ciascuna classe concettuale di livello medio sono associati: a) concetti elementari espressi attraverso parole italiane singole o espressioni polirematiche, oppure b) parole dialettali. I nodi terminali dell’ontologia sono costituiti dalle domande del questionario. Nella terza colonna della tabella sono riportate il numero di domande ricondotte a ciascun settore, per un totale di 3070 associazioni macro-classe > raggruppamento concettuale intermedio > parola italiana o dialettale > domanda.

I criteri di associazione tra le domande del questionario ALT e le classi concettuali dell’ontologia variano a seconda del tipo di domanda. Le domande onomasiologiche sono ricollegate ai concetti elementari da esse indagati, a loro volta associati a raggruppamenti concettuali progressivamente più ampi fino a raggiungere i nodi alti dell’ontologia. Nel caso delle domande semasiologiche, ovvero le domande volte a indagare i significati associati a uno o più termini dialettali, la tipologia di associazioni al livello dei nodi terminali e preterminali dell’ontologia varia in modo significativo rispetto al caso delle domande onomasiologiche: le domande semasiologiche sono collegate alla classe concettuale più ampia attraverso la parola dialettale indagata. Queste associazioni sono state stabilite sulla base dei risultati ottenuti per quella domanda sul territorio toscano.

Nel caso delle domande onomasiologiche una domanda viene classificata di pertinenza di una sola macro-classe ed eventuali polisemie sono catturate attraverso l’associazione della domanda a diversi raggruppamenti semantici intermedi: ad esempio, la domanda 2a “Al crepuscolo della mattina”, ricondotta alla macro-classe di tempo cronologico, è al contempo associata a diverse chiavi semantiche intermedie come 'luce', 'porzione_del_giorno', 'sole' che ne evidenziano diverse sfaccettature di significato. Una stessa domanda semasiologica può essere invece stata classificata come di pertinenza di diverse macro-classi. Ad esempio, la domanda 11 volta a verificare i significati assunti dal termine dolco è stata ricondotta, in virtù dell’accentuata polisemia del termine in ambito toscano, alle macro-classi alimentazione, casa e attività domestiche, forme del terreno, tempo meteorologico, uomo - comportamento e sentimenti, uomo - corpo e abbigliamento.

Mostriamo ora l’utilità di quanto illustrato con un esempio concreto. Supponiamo di essere interessati alla terminologia alimentare della castagna. Dopo aver selezionato la macro-classe alimentazione e successivamente il raggruppamento concettuale di 'castagna', si arriva al livello pre-terminale della gerarchia (rappresentato nella Figura che segue) articolato in:

  •  sei concetti elementari (“castagnaccio”, “farina di castagne”, “farinata di castagne”, “caldarrosta”, “castagna bollita” e “polenta di castagne”) indagati attraverso otto domande onomasiologiche distinte (il concetto di castagna bollita è indagato da tre domande distinte, incentrate su diverse modalità di cottura e conservazione delle castagne);

  • quattro termini dialettali indagati attraverso tre domande semasiologiche distinte.

Una tale strutturazione del questionario risulta utile in quanto permette il recupero dei materiali dialettali su base concettuale: l’accesso su base concettuale può essere attivato in entrambe le modalità di accesso ai materiali dell’ALT, quella guidata e quella avanzata. 

In prima istanza all’utente viene sottoposta la lista di macro-classi concettuali o settori; una volta selezionata la macro-classe rilevante ai fini della propria ricerca, l’utente otterrà una lista di parole chiave corrispondenti a raggruppamenti concettuali più granulari, che esprimono concetti più specifici. Con la selezione di un singolo concetto si arriva all’identificazione dell’insieme delle domande riconducibili al concetto selezionato, articolato in due sottoinsiemi: quello delle domande onomasiologiche, volte a indagare istanze più specifiche del concetto selezionato; quello delle domande semasiologiche, le cui risposte possono includere attestazioni rilevanti per la propria ricerca. Nel caso delle domande semasiologiche, le associazioni attivate tengono conto della tipologia di significati raccolti sul campo per il termine indagato.

Il valore aggiunto derivante dall’uso dell’ontologia illustrata sopra nell’interrogazione della base di dati dell’ALT (accesso per domanda) pare evidente: si può pensare alla differenza esistente tra la consultazione di un semplice elenco di parole italiane e un dizionario concettuale. Il primo ci fornisce la lista delle parole chiave per l’accesso alla base di dati, il secondo fornisce un sostrato concettuale che lega le parole tra loro, mostrandone le relazioni e facendone quindi emergere il significato.

 

 
Parole di Toscana


HOME PERCHE' PROGETTO DOCUMENTAZIONE NAVIGAZIONE CREDITI LINKS UTILI CONTATTI