Page rank

Il Page Rank è l'algoritmo di analisi utilizzato dal motore di ricerca Google per assegnare un valore numerico ad ogni pagina web sulla base dei collegamenti ipertestuali (link) verso la pagina stessa ( backlink ). L'algoritmo di analisi Page Rank è anche conosciuto mediante la sigla PR ed è alla base della link popularity. La validità di una informazione (pagina web) viene determinata in base al numero e alla reputazione delle altre pagine web che la linkano. Google è il primo motore di ricerca ad utilizzare il Page Rank come indicatore di popolarità di un sito web o di una singola pagina web. Il valore definito dal Page Rank indica sia la popolarità del sito web o della pagina web in questione, sia il suo grado di autorevolezza sul Web. Di conseguenza, il Page Rank è un fattore determinante per il posizionamento sui motori di ricerca: più questo è elevato, più sarà alta la posizione della pagina. Si utilizza il termine Page Rank anche per indicare la posizione raggiunta da una determinata pagina web o sito web, questa informazione è indicata dal motore di ricerca nel browser tramite la toolbar di Google.

PAGE RANK

Come funziona il page rank. L'algoritmo assegna ad ogni link ipertestuale e ad ogni documento. In tal modo si cerca di quantificare la validità (qualità) di una informazione su internet. Quanto più una pagina web viene linkata da altre pagine web, tanto maggiore sarà il suo valore di Page Rank e quindi il suo posizionamento nei risultati delle ricerche dei search engine (SERP). Ogni link verso una pagina web contribuisce ad aumentare il suo Page Rank ma non tutti i link hanno lo stesso valore, i link verso l'esterno dalle pagine ad elevato page rank hanno un peso maggiore rispetto alle altre. All'aumentare del numero di link complessivi dei siti che puntano ad una pagina web il Page Rank di quest'ultima aumenta. Qui di seguito riportiamo la formula di base del primo algoritmo di Page Rank.

FORMULA <a href='/page' _fcksavedurl='/page' title='PAGE'>PAGE</a> RANK

Il Page Rank della pagina Px è determinato dalla somma del rapporto tra il Page Rank e il numero di link presenti nelle pagine Pn che la linkano. Quanto maggiore è il Page Rank della pagina Pn, tanto maggiore è il peso del link verso la pagina Px. Quanto minore è il numero di link presenti nella pagina Pn, tanto maggiore è il peso del link verso la pagina Px. Il risultato viene, infine, controllato dal motore di ricerca tramite il parametro dumping factor (d), un parametro di rettifica rel risultato che in origine è pari a 0,85. Un esempio di calcolo del page rank è il seguente:

esempio di calcolo del page rank

Nel page rank il numero dei link in uscita ( outbound link ) è molto importante e influisce sulla link popularity del collegamento. Anche in questo caso si tratta di un'euristica. Una pagina con pochi link verso l'esterno è indice di maggiore cura. Quanto meno sono i link in uscita, tanto più è facile controllare nel tempo se sono ancora validi. Viceversa, le pagine di spam hanno spesso molti outbound verso altri siti. Ad esempio, il sito P1 ha tre outbound link e la popolarità ( 4 ) per ciascuno di essi è divisa per tre ( 4/3 ). Il sito P2 ha due link in uscita e la popolarità ( 3 ) di ciascuno di essi è divisa per due ( 3/2 ). Pur avendo una popolarità inferiore, i link in uscita dal sito P2 apportano un valore maggiore di link popularity rispetto a quelli del sito P1.

La scala del page rank

Il page rank della pagina è un punteggio numerico e non va confuso con il page rank del sito sulla toolbar che mostra una scala di valori del page rank ( PR ) da zero a dieci ( 0-10 ). Si tratta di una scala non lineare e, pertanto, il passaggio da un livello a un altro richiede più del doppio della link popularity del livello precedente. Ad esempio, è molto più facile passare da PR 3 a PR 4 che da PR4 a PR5, e così via. La seguente figura mostra un esempio di scala di valore del page rank e delle proporzioni indicative tra i vari livelli di PR sulla toolbar di Google.

esempio di proporzioni della scala del page rank (PR) di Google

Storia del Page Rank. L'algoritmo viene brevettato dalla Stanford University nel 1998 e successivamente utilizzato dall'allora sconosciuto motore di ricerca Google, ottenendo risultati qualitativamente superiori a quelli degli altri search engine dell'epoca.

Problema dei link artificiali. Il Page Rank "puro" della fine degli anni '90 ha alimentato la nascita dello scambio link e dei link artificiali tra siti web. Questi comportamenti hanno progressivamente ridotto la qualità dei risultati naturali delle SERP, costringendo Google ad affiancare al Page Rank anche altri parametri di valutazione.


 
 
commenti



note

  • Page rank di Google. Il Page Rank è alla base dell'algoritmo di Google alla fine degli anni '90. Nel corso dei primi anni duemila viene progressivamente migliorato ed affiancato da altri parametri di valutazione. Tra i miglioramenti merita d'essere citato il principio della pertinenza del contenuto tra la pagina di partenza del link e quella di destinazione (landing page). Oggi il page rank rappresenta soltanto uno degli indicatori utilizzati dall'algoritmo di Google per analizzare l'importanza di una pagina web.
  • Link non rilevanti. Il Page Rank non elimina il problema dei link non rilevanti. Un link non rilevante è un collegamento ipertestuale proveniente da una pagina al di fuori del contesto, del tema e dell'argomento trattato nella pagina di destinazione ( off-topic ). I link non rilevanti non hanno alcun valore per gli utenti e, pertanto, non dovrebbero essere usati nel computo della link popularity.
  • Algoritmo Hilltop. L'algoritmo Hilltop viene introdotto da Google nel 2004 su alcune serp molto popolari, al fine di ridurre il fenomeno della spam popularity, ossia la falsa popolarità acquisita tramite backlink provenienti da risorse ad elevato page rank ( PR ) ma dedicate ad argomenti diversi rispetto alla pagina linkata ( link non rilevanti ). L'algoritmo prende in considerazione un elenco di pagine esperte per ogni argomento ( topic ) e, sulla base dei link verso l'esterno di queste ultime, genera un elenco di pagine autorità che utilizza per correggere i risultati organici della ricerca.

faq

  1. Come vedere il page-rank? Il page-rank di Google è visibile sulla toolbar del motore di ricerca, un'applicazione installabile sui principali browser.
  2. Quando viene aggiornato il PR? È aggiornato in tempo reale da Google. Il page-rank visibile sulla toolbar è, invece, aggiornato ogni tre mesi.
  3. Il page-rank è l'unico fattore Seo off-page? No, il page-rank è soltanto un fattore tra tanti altri.
  4. Cosa significa il page-rank zero? Un valore di PR uguale a 0 può essere generato dal fatto che il sito web non è ancora indicizzato da Google, non ha molti backlink oppure è stato bannato, ossia il sito è stato escluso dalle serp a seguito di una violazione.
  5. Il page rank è influenzato dai link esterni verso altre pagine? No, in teoria il page rank considera soltanto i link in entrata verso la pagina, provenienti da siti esterni, e non anche i link in uscita dalla pagina. Tuttavia, il page rank è soltanto un fattore di ranking, altri algoritmi del search engine potrebbero tenere conto dei link in uscita ( outbound link ). Ad esempio, quando una pagina contiene una quantità eccessiva di link verso l'esterno, può essere considerata come un'attività di spam.
    quantità di link esterni e rischio spam
    Alcuni algoritmi anti-spam analizzano anche la qualità degli outbound link. Un link in uscita può valorizzare la pagina linkante quando è indirizzato verso fonti esterne autorevoli sull'argomento che la pagina sta affrontando, poiché il collegamento migliora l'esperienza di navigazione dei lettori/utenti.
    link esterno di qualità e valorizzazione della pagina linkante
    Viceversa, un link in uscita verso risorse di scarsa qualità oppure off-topic, poste in zone non visibili della pagina ( es. footer ), non apporta alcun valore aggiunto agli utenti e può essere considerato come un segnale di una link building artificiale o di spam, con conseguente penalizzazione della pagina linkante.
    analisi della qualità dei link esterni