Comment supprimer proprement une page des moteurs de recherche ?

Comment supprimer proprement une page des moteurs de recherche ?

Il arrive parfois qu’un site internet se retrouve piraté (très souvent des WordPress) et que des pages soient créées dans un nombre assez important pour pénaliser le référencement. Toutes ces pages inutiles vont mener à un grand nombre de pages non trouvées, ce qui va également pénaliser le référencement, quelle solution mettre en place pour contenir ce phénomène sans être pénalisé ?

Le code HTTP 410 à la rescousse

Il existe plusieurs codes HTTP qu’un serveur HTTP peut envoyer au client et donc au robot d’indexation du moteur de recherches (Bing, Google ou bien encore le robot d’Apple), en fonction de ces codes HTTP, le moteur de recherches va réagir d’une certaine façon.

Dans la liste des codes HTTP, il y en a un qui est très intéressant, c’est celui du code HTTP 410 qui signifier Gone, à savoir que la ressource demandée n’existe plus (en HTTP, on met à disposition des ressources)

Et le code HTTP 301 ou 302 ?

Le code HTTP 301 ou 302 sont utilisés pour faire des redirections définitives (301) ou bien temporaires (302). Ce qui signifie au moteur de recherches que le contenu qu’il cherche a été déplacé à un autre endroit et qu’il devrait prendre en considération le nouveau contenu. La grosse différence est qu’il revient régulièrement vérifier que la redirection n’a pas changé et donc l’ancienne page existe encore.

Et si je ne fais rien ?

Vous aurez une sanction de la part des moteurs de recherches. En effet, ceux-ci considèrent qu’une page non trouvée (code retour HTTP 404) n’est pas normal, vous le signalerons dans leur console et plus vous avez d’erreurs et plus vous êtes pénalisés

En conclusion

Un de nos clients a malheureusement eu l’occasion de tester tout ceci, des petits malins ont profité de failles de sécurité pour introduire des malwares et faire en sorte de créer des pages en grand nombre allant même jusqu’à plus de 300 000 pages alors que d’ordinaire, nous sommes au maximum dans les 1500 pages. Cela a eu pour conséquences de faire baisser la qualité du référencement et nous avons alors déployé la stratégie de retourner un code HTTP 410 sur les mauvaises pages créées. Nous avons pu observer la diminution régulière du nombre de pages indexées et un retour à la normal progressif du référencement.