Meta Name Robot ( Tag Html )
ll Meta Name Robot è un tag del linguaggio Html. È utilizzato per indicare agli spider dei motori di ricerca le direttive e le regole di indicizzazione da seguire per una singola pagina. Il tag Meta Name Robot è inserito all'interno nella sezione Head del documento Html ( pagina web ). Nel tag possono essere dichiarate le seguenti voci:
- Index. La voce Index autorizza gli spider dei search engine a indicizzare il documento. Quando non è indicata nessun'altra voce, lo status Index viene associato di default dagli spider bot.
- Noindex. La voce Noindex comunica agli spider di non indicizzare la risorsa. Gli spider non hanno l'autorizzazione a procedere all'indicizzazione e all'archiviazione del documento html.
- Follow. La voce Follow indica agli spider il permesso a seguire tutti i link,interni ed esterni, presenti nel documento html. Quando non è espressamente dichiarata la voce contraria ( Nofollow ) ogni documento si intede Follow di default.La voce Follow può essere combinata sia con il parametro Index che Noindex.
- Follow, Index. Lo spider può seguire i link nella pagina e può indicizzare la pagina.
- Follow, Noindex. Lo spider può seguire i link nella pagina ma non può indicizzare la pagina.
- Nofollow. La voce Nofollow comunica allo spider di non seguire i collegamenti ipertestuali ( link interni e/o esterni ) presenti nella pagina html. La voce Nofollow può essere associata sia al parametro Index che Noindex.
- Nollow, Index. Lo spider non può seguire i link nella pagina ma può indicizzare/archiviare la pagina.
- Nollow, Noindex. Lo spider non può né seguire i link nella pagina, né indicizzare/archiviare la pagina.
A differenza del file robots.txt, il tag Meta Name Robot si trova all'interno della risorsa / file, è utilizzabile esclusivamente nei documenti Html ( es. pagine web ) e applica le direttive di indicizzazione soltanto sulla singola pagina web che lo contiene. Il file robots.txt, invece, può applicare le regole di indicizzazione anche su più file e su intere cartelle del server. La sintassi del tag Meta Name Robot nel linguaggio Html è la seguente:
<meta name="robots" content="[ index / noindex ], [ follow / nofollow ]">
Il Meta Name Robot deve essere inserito in ogni pagina web, dove si vuole applicare una regola di indicizzazione. Laddove non specificato, vale di default la combinazione index, follow. Un esempio di combinazione noindex/follow è la seguente:
<meta name="robots" content="noindex, follow">
In questo esempio si comunica allo spider del search engine di non voler indicizzare la pagina, autorizzando comunque lo spider a seguire i collegamenti ipertestuali della pagina verso le altre pagine. È una combinazione particolarmente utile nelle pagine che aggregano le news di un sito poiché evita la duplicazione di indicizzazione del testo di una pagina ma non impedisce al search engine di seguire la raccolta dei link tematici verso le altre risorse del sito web.