Trust Rank
Il trust rank è un algoritmo e una tecnica di analisi semi-automatica dell'utilità e della credibilità dei link contenuti in una pagina web, al fine di distinguere i link utili dallo spam. L'algoritmo analizza i collegamenti presenti in una pagina per misurare l'attendibilità delle informazioni. L'algoritmo del trust rank viene sviluppato da Zoltan Gyongyi ed è brevettato da Yahoo! come sistema per identificare lo spam e i contenuti non rilevanti per l'utente.
Il funzionamento dell'algoritmo Trust Rank
L'algoritmo trust rank associa a ogni sito web un valore di trust in funzione della qualità dei link che il sito ospita. L'euristica è molto semplice, un sito di alta qualità ( A ) non linka siti di bassa qualità o di spam, bensì linka altri siti di alta qualità ( C ). Le pagine linkate dalle good page sono considerate autorevoli e ottengono un incremento nel valore di trust in modo diretto ( C ) o indiretto ( D ).
D'altra parte vale anche il processo inverso ( bad rank ). Se un sito linka una bad page ( es. sito E ), molto probabilmente è anch'esso un sito di scarsa qualità poiché non controlla i propri outbound link e non ha cura dei propri utenti. Se una pagina ( F ) è simile a una bad page, potrebbe essere considerata anch'essa come una bad page da parte dell'algoritmo ed essere penalizzata in termini di trust.
Per identificare le pagine di qualità o pagine seme ( seed page ) l'algoritmo utilizza il seguente processo di selezione:
- Selezione pagine seed. In una fase iniziale l'algoritmo seleziona un piccolo insieme di pagine web a campione da analizzare ( pagine seed o seme ).
- Analisi umana delle pagine seed. Un esperto le analizza e associa a ciascuna pagina seed lo status bad page (0) o good page (1). Nella fase di analisi sono presi in considerazione molti fattori. Ad esempio, l'anzianità del sito web, l'aggiornamento dei contenuti, la presenza di contenuti unici ad elevato valore aggiunto per l'utente, la qualità dei link in uscita, la grafica, il mix di pubblicità/contenuti, le tecniche pubblicitarie utilizzate nel sito, l'anzianità del nome di dominio, la presenza di un certificato di sicurezza SSL o del protocollo HTTPS, l'indicazione dei canali di contatto ( indirizzo postale, email, telefono), la presenza di una pagina dedicata alla privacy policy, ecc.
- Analisi automatica di altre pagine web. Sulla base della classificazione effettuata dall'esperto umano, l'algoritmo Trust Rank è in grado di assegnare lo status good o bad alle altre pagine web senza dover ricorrere nuovamente al giudizio dell'esperto umano. Ad esempio, se una nuova pagina, ancora sconosciuta al search engine, somiglia a una bad-page ( es. spam page ), anch'essa viene considerata automaticamente come tale. Lo stesso accade se una pagina linka una bad-page. Viceversa, una pagina web, ancora sconosciuta, è quasi sicuramente considerata autorevole se è linkata da più good-page.
Un algoritmo simile al trust rank viene sviluppato e utilizzato anche dal motore di ricerca Google per verificare la presenza di link phishing o spam-engine sulle pagine web presenti nelle SERP. Il trust rank consente di affinare il Page Rank dell'algoritmo di Google e di evitare tecniche SEO utilizzate per aumentare la Link Popularity di una pagina web in modo artificiale ( non naturale ). Anche altri motori di ricerca, directory e filtri anti-spam sviluppano algoritmi simili basati sulla tecnica del trust rank per ridurre lo spam.
Trust dumpering
Il trust dumpering è il trasferimento del valore di trust da un sito web a un altro tramite i link. Quanto più aumenta la distanza dal sito ad alto trust, tanto più si riduce il valore del trust trasferito indirettamente ed aumenta la probabilità di trovare spam sul sito. Ad esempio, il sito web A è ad alto trust (ta=1) e pubblica tre link esterni, uno dei quali verso il sito B. Quest'ultimo (B) beneficia di un valore di trust pari a 1/3 ( il valore di trust diviso per il numero dei link esterni di A ) che associamo alla variabile tb. A sua volta il sito B ha due link esterni, uno dei quali verso il sito C. Quest'ultimo beneficia di un valore di trust pari a 1/2 di tb, ossia 1/6. Il valore del trust si è ridotto da 0,33 (B) a 0,16 (C) e si riduce man mano che ci si allontana dal sito ad alto trust (A).
Trust splitting
Il trust splitting è la ripartizione del trust value sulla base del numero dei link esterni di un sito web. Quanti più link esterni ci sono su una pagina, tanto più si riduce il valore di trust trasferito da ciascun link. Il valore del trust è inversamente proporzionale al numero dei link esterni nella pagina.
Ad esempio, il sito A e il sito B hanno il medesimo valore di trust (1) ed entrambi linkano il sito C. Il sito A trasferisce un valore di trust pari a 1/2, in quanto ha due link esterni, mentre il sito B trasferisce un valore di trust pari a 1/3 poiché ha tre link esterni. I due valori di trust si cumulano e contribuiscono a determinare il trust rank del sito C che, in questo caso, è pari a 5/6.

- Domini con estensione .gov o .edu. I siti con estensione .gov sono generalmente privi di spam. Lo stesso accade, seppure in misura inferiore, per i domini con estensione .edu e per alcuni siti web ad elevato trust ( es. Wikipedia ). Qualsiasi link proveniente da queste fonti ha un elevato valore di trust.
- Topical trust rank. Il topical trust rank permette di correggere la valutazione del trust rank sulla base del contenuto e del tema ( topic ) delle pagine. Il trust rank è ridimensionato se la pagina linkante e la pagina linkata affrontano argomenti differenti, mentre viene confermato se affrontano lo stesso argomento.
- Spam nelle community online e forum. Le community online sono spesso considerate delle bad page poiché è maggiore la probabilità di trovare spam link o contenuti spam, copiati da altre fonti. Il rischio spam è generalmente elevato anche se alcune community si distinguono dalle altre per l'elevato valore aggiunto dei partecipanti e per l'attività di controllo e di moderazione degli amministratori.
- Yahoo! Webrank 2004. E' un algoritmo utilizzato da Yahoo! per organizzare i risultati della ricerca. La popolarità viene misurata sulla base dei dati di navigazione degli utenti, raccolti tramite la toolbar di Yahoo! sul browser. L'importanza dei siti web viene misurata tramite il principio del trust rank. Ad esempio, la presenza di un sito sulle directory più autorevoli, ad esempio Dmoz o Yahoo! stessa, è un indicatore di qualità e di autorevolezza. Un altro segnale preso in considerazione dal portale è la quantità di inserimento nei siti preferiti, questo dato è ottenibile analizzando il comportamento degli utenti che possiedono e navigano online con il proprio Yahoo! ID.

- Come trovare i siti ad alto trust rank? Molto probabilmente, in un motore di ricerca che utilizza il trust rank, i siti ad alto trust sono quelli che compaiono nei primi venti posizioni sulle pagine dei risultati ( serp ).