Laurent Gloagen reprend l'information. Google, soutenu par les acteurs du blogage et ses principaux concurrents, propose une méthode de codage des liens hypertextes pour tenter de limiter le spamming des commentaires de blog. Il s'agit de faire perdre l'intérêt pour le spammeur d'y rajouter des liens en neutralisant le gain de popularité qu'aurait dû apporter l'inclusion dudit lien dans la page indexée. Cela se fait à l'initiative de l'auteur de la page qui indique au robot qui indexe la page quels liens ne doivent pas compter dans le calcul du PageRank (algorithme de Google) ou de son équivalent dans les autres technologies de classement des pages Web indexées.

L'application de blog ajoutera automatiquement un attribut « rel="nofollow" » aux liens (éléments HTML « a »).

<a href="http://www.mon_site.com/ma_page.html" rel="nofollow">Texte du lien</a>

Les spécifications HTML du W3C autorisent l'invention de nouveaux types de relation pour les éléments « a » et « link », en plus de ceux conseillés : « Les auteurs peuvent souhaiter définir des types de liens supplémentaires qui ne sont pas décrits dans cette spécification. »

Les « types de liens sont insensibles à la casse ». C'est-à-dire que l'on peut écrire sans que ça ait de conséquences « nofollow » aussi bien que « NoFollow ».

La valeur « nofollow » est reprise d'une des valeurs conseillées pour l'attribut « content » d'un élément d'en-tête « meta » à l'attribut « name="robots" » afin de limiter l'indexation d'une page. « Noindex » indique au robot de ne pas indexer le document et « Nofollow » lui interdit de suivre les liens de la page à la recherche de nouveaux documents à indexer. Le choix de reprendre ce dernier terme ne me semble pas très logique d'ailleurs. L'autre posait peut-être des problèmes d'implémentation ou des risques de confusion.

L'annonce de Google n'indique pas si le robot acceptera la valeur « nofollow » dans une liste de types de liens dans l'attribut « rel » comme le permettent les spécifications par l'élément « a » (et l'élément « link » également).

rel = types-de-lien [CI]
Cet attribut décrit la relation partant du document courant vers l'ancre spécifiée par l'attribut href. La valeur de cet attribut est une liste de types de lien séparés par des espaces.

Par ailleurs, les applications de forums Web, de livres d'or, de listes de réferrants ou de statistiques pourront aussi tirer profit de cette méthode.

Embruns : Une réponse au spam : “NoFollow”, 19 janv. 2005, Laurent Gloaguen

Google Blog, Preventing comment spam, 18 janv. 2005, Matt Cutts et Jason Shellen