J'ai depuis longtemps installé Spamplemousse (aussi sur MozillaZine-fr Revue). Spamplemousse est un plugin pour le gestionnaire de blog DotClear qui permet de lutter contre le spam de commentaires et de trackbacks (rétroliens) en mettant en quarantaine les commentaires et trackbacks suspects. Il les détecte grâce à la comparaison de l'adresse IP de leur expéditeur avec des listes d'adresses signalées comme à l'origine de sapmming et grâce à une liste de termes à trouver dans leur contenu. Les développeurs de Spamplemousse sont Zeubeubeu et Alain Vagner (Biou), à remercier en passant.

Spamplemousse est donc très efficace pour arrêter le spam courant et connu. Il m'a en effet mis en quarantaine plusieurs centaines de commentaires et trackbacks indésirables ces derniers jours. Mais quand il s'agit d'une nouvelle attaque, elle n'est pas arrêtée. Si elle ne contient aucun mot ni ne provient d'une adresse IP repérés 3, les commentaires indésirables se déversent dans le blog jusqu'à soit que vous fermiez les commentaires, exaspéré par cette pollution, soit que d'autres ne les ai signalées aux bases d'adresses spammeuses, soit que vous ayez inscrit dans votre liste le ou les termes à retrouver.

Pour éviter de courir après les mots suspects, on pourrait se servir d'un système bayésien de reconnaissance automatique comme celui de Thunderbird pour le courriel qui remonte à Mozilla 1.3. C'est ce que propose le plugin expérimental SpamClear. Cependant, les techniques bayésiennes sont connues pour mobiliser beaucoup de ressources. Il semble que ce soit le cas pour l'implémentation actuelle de ce filtre bayésien indviduel. Connaissant la promptitude de l'administrateur des serveurs de pages perso de Free à éliminer les comptes trop gourmands, je ne prendrai pas le risque.

L'idéal serait une liste centrale comme pour les IP spammeuses, mais ça demanderait une logistique hors de portée d'une petite communauté comme celle de DotClear. Le plugin actuel pourrait déjà être amélioré en ajoutant quelques règles de blocage pour mettre en quarantaine des courriels typiques comme par exemple ceux qui contiennent de nombreux liens.

La bataille entre les mesures d'endiguement et la marée, avec ses tempêtes, est, chaque année, de génération en génération, à renouveler et à réinventer.

MÀJ : Ploum propose quelques techniques intéressantes pour hacker son DotClear pour lutter contre les robots spammeurs. Ainsi, il propose un bout de code pour cacher un champ qui ne piègera que les robots.


Note 1 : Conformément à la nouvelle orthographe.

Note 2 : Ce serait bien de pouvoir différencier les deux. Par ex., trois semaines pour les trackbacks et pas de délai pour laisser des commentaires.

Note 3 : Les spammeurs contrôlent des PC zombies pour envoyer leur pourriel. Cela peut conduire votre FAI à être blacklisté s'il n'a pas pris les mesures nécessaires pour filtrer l'envoi de spam même involontaire par ses clients.

Sources et références