3 solutions pour détecter et supprimer les liens brisés sur votre site (30/77)

Me voici de retour après quelques semaines d’absence… toutes mes excuses pour cela…. j’ai été distrait par… d’autres projets 😀

Bon, retournons sans attendre au sujet : lorsqu’ils scannent un site, les moteurs de recherche n’aiment pas les liens brisés, aussi appelé « liens morts », ou encore « liens cassés ».

C’est pour eux une sorte d’indicateur de la qualité de finition de votre site, et ces dernières années cet indicateur a pris de plus en plus d’importance. C’est en raison de ce que les anglophones appellent la « user experience », qui doit être la meilleure possible.

Avoir des liens cassés ne va certes pas vous poser de problèmes majeurs dans votre référencement, il n’y a aucun risque que Google vous sorte de son index ni aucune chose de ce genre, mais… vous allez assurément être pénalisé d’une façon ou d’une autre. C’est un peu le même problème que si votre site est lent à s’afficher par exemple.

Pour vous donner un ordre d’idée plus précis, imaginez tout simplement que pour un mot-clef donné, le moteur de recherche sélectionne une dizaine de sites à afficher comme résultats. Si tous ces sites obtiennent un classement identique sur tous les autres critères de classement, hé bien… il y a fort à parier que le site ayant le plus de liens cassés soit mis en bas de la liste.

C’est finalement assez logique si l’on se place d’un point de vue qualitatif car, pour l’utilisateur, quoi de plus frustrant que de tomber sur un « 404 error page not found » lorsque, piqué par une curiosité incontrôlable il décide de cliquer sur un lien à priori hyper-intéressant 🙂

Cela vous est déjà arrivé j’en suis sur… ^^

Illustration d'une erreur 404 not found

Alors comment faire pour éviter à vos fidèles lecteurs ce genre de mésaventure ? Car n’oubliez pas que votre objectif est de gagner des visiteurs, pas d’en perdre !

Je vous propose 3 solutions que j’ai pu expérimenter. Naturellement selon la taille et la nature de votre site vous vous orienterez plutôt vers l’une ou l’autre, ou même plusieurs pourquoi pas.

Solution 1 : utiliser un logiciel

C’est sans doute la meilleure approche, car il vaut mieux prévenir que guérir. Les logiciels vont tenter de naviguer sur toutes les pages de votre site et suivre tous les liens. Selon la complexité du logiciel, certains sont même capables de remplir les formulaires, de naviguer dans des zones membres après avoir entré automatiquement un mot de passe, etc. Et vous pouvez réaliser tout ça avant même d’avoir mis en ligne votre site.

Un très bon logiciel gratuit que je vous recommande c’est Xenu’s Link Sleuth (TM) si l’anglais ne vous fait pas peur. Le développeur est très sympa et connait très bien le sujet puisque son logiciel est disponible depuis de nombreuses années et qu’il l’améliore sans cesse.

En anglais toujours, il y a le service en ligne LinkAlarm. Super simple, et super efficace. Vous n’avez rien à installer il fonctionne directement dans le navigateur. Vous pouvez faire un test gratuit si votre site fait moins de 100 pages.

Enfin si vous préférez le français, il existe le site http://www.verification-des-liens.com/ mais je dois vous dire que je n’ai jamais testé leurs services au delà de la démo disponible en haut à droite de leur site. D’ailleurs si quelqu’un d’entre vous à fait l’expérience qu’il/elle n’hésite pas à nous faire un petit feedback ci-dessous 😉

Solution 2 : étudier les statistiques de fréquentation fournies par votre hébergeur

C’est une approche qui n’est pas spécialement pro-active car vous allez devoir attendre que des visiteurs et/ou des moteurs viennent naviguer sur vos pages pour voir apparaître dans vos stats les références aux fichiers non trouvés. A peu près tous les logiciels de statistique vont vous donner l’information par contre, que ce soit webalizer, awstats, etc.

La condition est que le logiciel utilise les logs du serveur web pour construire les stats – par opposition aux systèmes (tels quel Google Analytics) vous demandant d’insérer un javascript dans vos pages, qui ne peuvent pas vous donner les pages manquantes, par le fait.

Cette méthode est cependant à réserver aux petits sites, car cela peut vite devenir fastidieux. En effet vos statistiques vont vous donner la page non trouvée, mais pas la page sur laquelle il y a le lien qui y conduit. De plus vos stats ne ferons pas apparaître les liens brisés sortants (c-à-d les liens qui pointent sur un site externe, vers une page qui n’existe plus par exemple).

Autre cas de figure si j’appelle la page blablabla.html sur votre site il y a fort à parier qu’elle n’existera pas. Vous allez alors voir apparaître cette page inexistante dans vos stats, et pourtant il n’y a aucun lien vers cette page inexistante dans votre site… vous l’aurez compris, c’est assez imparfait.

Solution 3 : utiliser une sitemap

La mise en place d’une sitemap est fortement conseillée sur votre site, pour un certain nombre de raisons dont nous reparlerons bientôt. Dans l’immédiat, cela va vous aidez à trouver beaucoup plus facilement les liens brisés.

La condition est de faire figurer dans votre sitemap l’ensemble des pages de votre site. Il arrive parfois que ce ne soit pas souhaitable par contre, pour des raisons de duplicate-content notamment. Nous y reviendrons.

Donc, en mettant en place votre sitemap, vous allez automatiquement indiquer au moteurs de recherche d’indexer toutes les pages de votre site. En tant que webmaster vous pourrez alors obtenir plusieurs informations de ces moteurs, via par exemple Google Webmaster Tools ou Yahoo Site Explorer, et en particulier la liste des pages qu’ils n’auront pas pu indexer ou qui contiennent des liens brisés. C’est-y pas beau ça ! Et gratuitement en plus…

L’inconvénient de la méthode la réactivité, car vous n’aurez souvent l’information que plusieurs jours après le passage du robot indexeur, et sur un site qui change beaucoup ces quelques jours peuvent représenter une petite éternité.

Pour conclure :

Dans la majorité des situations je préconise cette 3ème solution, car c’est un bon compromis, surtout compte tenu du fait que la constitution de la sitemap est très profitable par ailleurs.

Inutile de préciser que dès que vous avez identifié les liens brisés, il convient de les réparer au plus vite pour éviter qu’ils soient mis en cache par les moteurs de recherche.

Voilà, donc comme dirait Mademoiselle K. : « J’espère que ça vous à plu! » et, admirez la transition puisque la prochaine fois nous parlerons… musique !

Quel est le rapport entre la musique et le référencement d’un site… suspense héhé, je vous invite à vous abonner au flux RSS pour ne pas rater l’info 😉

 

 

4 Responses to “3 solutions pour détecter et supprimer les liens brisés sur votre site (30/77)”

  1. A propos de  » le site http://www.verification-des-liens.com/ mais je dois vous dire que je n’ai jamais testé leurs services au delà de la démo disponible en haut à droite de leur site »,
    j’ai testé : très bien mais pour UNE page ! Pour davantage c’est payant.
    🙂

  2. Pascal dit :

    Bonjour,

    Merci pour ces infos !

    Je viens de tester mon blog, j’ai beaucoup de liens brisés.

    Comment puis-je remédier à cela ? Par exemple, mes mots clés
    situés en dessous des images sur ma HomePage renvoient sur des erreurs 404.

    Comment puis je faire ?

  3. Bus Ratp dit :

    2 Millions de Visiteurs par An sur votre Site Web, gratuitement ! je voudrait bien; comment ça marche ?
    Ça fait 5500 visiteur par jour, c’est donc faisable; mais c’est pas sur que j’y arriverait avec mes 150 pages 404 ! Merci pour ton aide et tes conseils ! moi j’opte pour le logiciel, je suis K.O, les robots sont la pour sa ! merci encore !

  4. aude dit :

    Bonjour ,

    Vous avez l’air de pouvoir m’aider mais mon pb d’erreur 404 est un peu différent
    C’est à partir de mon moteur de recherche habituel, Google, que je ne peux plus avoir accès à aucune recherche, avant même que j’ai fini de la taper , Google change de page et affiche :
    404. That’s an error.
    The requested URL /-7890*sfxd*0*sfxd*0 was not found on this server. That’s all we know.

    En revanche, j’ai changé pour Yahoo, et la je n’ai plus de problème..mais je regrette Google ! Pouvez vous m’aider?

    En vous remerciant
    Aude

Leave a Response