OKPEDIA RICERCA SEMANTICA

Le entità ( search entities )

Le entità ( o entity ) sono oggetti di conoscenza, cose, persone, concetti o argomenti. Si tratta di oggetti della conoscenza che esistono indipendentemente dalle parole, in quanto possono essere definiti o chiamati in modi diversi. L'entità esiste indipendentemente dalle parole che lo definiscono. Le entità sono un concetto utilizzato nella rappresentazione della conoscenza e negli algoritmi di ricerca delle informazioni.

Un esempio di entità

Tutti sanno cosa è un albero. Tuttavia, le persone potrebbero chiamare lo stesso oggetto in modo diverso ( tree, arbre, albero, ecc. ) oppure potrebbero comprendere di cosa si tratta dalle sue proprietà o dai suoi componenti ( es. verde, foglie, radici, ecc. ). In conclusione, l'albero è una entità mentre la parola "albero" non lo è.

un esempio pratico di entità

Dalla ricerca classica alla ricerca semantica

Nei motori di ricerca semantici le entità sono insieme di parole e di frasi, unite tra loro da un particolare schema di relazioni di vicinanza semantica, che consente di definire il concetto su un testo scritto. Le entità sono uno dei fattori di ricerca all'interno dei search engine e dei motori di ricerca semantici.

L'uso delle entità permette al motore di ricerca di stabilire il contesto semantico di un documento, andando oltre la mera analisi delle parole chiave ( keywords ). Ad esempio, nel seguente testo una parola chiave è presente con maggiore frequenza rispetto alle altre ma non è collegata all'entità più significativa del documento.

un esempio di analisi delle entità

Le entità più significative del documento sono individuate dalla combinazione dei termini presenti nel documento o nelle singole frasi. In questo modo, pur essendo meno frequenti, l'insieme delle parole del testo consentono di associare il testo a un significato e/o a un determinato campo della conoscenza ( es. entità A ). Viceversa, la parola più frequente ( parola 4 ) viene esclusa in quanto non ha una solida relazione con l'entità più significativa del documento, bensì con un'altra entità.

La tecnica Entity Salience

Una tecnica di ricerca basata sulle entità è la entity salience. La tecnica consiste nel cercare dei termini rilevanti in un documento, analizzando le relazioni semantiche con le varie entità già presenti in una base di conoscenza. L'analisi del testo consente di stabilire il grado di vicinanza di un testo alle varie entità. Quanto più è alto il grado di vicinanza a un'entità, tanto più il testo potrebbe parlare dell'argomento dell'entità. L'entità più forte è quella più significativa nel documento.

un esempio di entità con la logica fuzzy

Generalmente si tende ad assegnare il testo all'entità con la relazione più forte. Talvolta, in ottica fuzzy, si può assegnare un testo a diverse entità con diversi pesi, sulla base del peso delle relazioni. In questo modo non si esclude l'ipotesi che un documento possa affrontare più argomenti al suo interno.

La relazione tra le entità e le macro entità

Le entità possono anche avere delle relazioni con altre entità differenti. Queste macro relazioni consentono di definire una macro entità. Ogni macro entità è composta da entità di grado inferiore, da oggetti e relazioni tra oggetti.

le macro entità nella ricerca semantica

E' quindi possibile costruire una base di conoscenza su diversi gradi. Le entità con grado più alto sono le più ampie, poiché integrano molti concetti intorno a un macro argomento o a una materia. Viceversa le entità con grado più basso sono più specifiche, poiché sono dedicate a un singolo concetto, micro-argomento o tema.

https://www.okpedia.it/entita_search_entities


Segnala un errore o invia un suggerimento per migliorare la pagina


Semantic search engine

Fluidità e comprensibilità del testo


FacebookTwitterLinkedinLinkedin