Press4U

DBT Faccette

TextPower

DBTficio

Il Grafo.

Tutti gli elementi che possono essere significativi in quanto portatori di valori semantici (Faccette), vengono individuati nei testi degli articoli di stampa; questi elementi vengono raccolti, valutati statisticamente e proiettati in un grafo connesso i cui nodi rappresentano la singola faccetta con una dimensione proporzionale alla loro presenza nell'insieme di notie raccolte. Gli archi di connessione tra nodi diversi costituisce l'indicazione della copresenza dei due elementi negli stessi articoli e lo spessore dell'arco rappresenta la frequenza di questa copresenza.

Inoltre i nodi vengono caratterizzati con colori diversi: ogni colore rappresenta un raggruppamento, statisticamente determinato, di faccette che può stare a determinare un legame preferenziale tra elementi semantici fino a suggerire classificazioni semantiche di settori, categorie, elementi ontologici che la procedura identifica automaticamente. Tali classificazioni semantiche non necessariamente rispecchiano le classificazioni strutturali del sistema lessicale/linguistico generale ma rappresentano quanto rilevato nell'insieme di testi disponibili.

I nodi possono essere usati per richiedere nuovi livelli di grafo a partire dal nodo selezionato oppure per richiedere la visualizzazione contestuale di quei termini nei testi stessi.

I raggruppamenti (detti cluster) evidenziati dai diversi colori possono essere oggetto di una funzione di ricerca specifica che provvede alla ricerca nei testi di tutti i termini del singolo cluster con opportuna funzione di ranking.


Spiegazione delle varie funzioni disponibili:
Ricerca Si parla di ...  Il grafo I cluster
Le categorie Le Topiche Le fonti