Audit de sitemap, pages orphelines et pages zombies

SEO

Comme nous l’avons vu dans un précédent article, créer un sitemap pour votre site est absolument indispensable afin d’assurer la meilleure indexation possible de vos pages.

Mais il est également important de réaliser des audits réguliers de ce sitemap afin justement de repérer les pages présentant de moins bonnes performances et les corriger.

Dans cet article, nous examinerons les problèmes les plus courants qui peuvent être repérés grâce à un audit de sitemap, puis nous verrons comment réaliser un audit de façon efficace.

 

Pages inactives ou pages zombies

L’un des principaux avantages de réaliser un audit de sitemap est d’identifier les pages générant peu voire pas du tout de trafic. Ces pages, que l’on qualifie souvent de « pages zombies », viennent « plomber » les performances de votre site et n’offrent aucune valeur ajoutée à celui-ci. Il est donc important de les identifier afin de corriger le problème, ou plus simplement les supprimer si rien ne peut être fait pour les faire remonter dans les résultats des moteurs de recherche.

 

Petite typologie des pages zombies

Les pages zombies peuvent se diviser en plusieurs types :

Les pages non indexées : Ce sont des pages que Google a choisi de ne pas indexer. Les raisons peuvent être multiples, comme un temps de réponse du serveur trop long par exemple. Il peut ne pas les indexer du tout ou reporter l’indexation à une date ultérieure. En général, ce sont des pages présentant des problèmes techniques. Il est donc important d’examiner la nature du problème et d’y répondre le plus vite possible. Ces pages, n’étant pas présentes dans l’index de Google, ne produiront donc pas de visites.

Il est très facile de visualiser ces pages dans la Search Console, dans la rubrique Couverture Exclues.

Les pages au contenu obsolète ou de faible qualité : Si une page a été créée il y a plusieurs années, il y a de fortes chances pour que son contenu ne soit plus à jour. De plus, la date de publication d’un article est un facteur important dans la capacité de la page à se placer haut dans les moteurs de recherche. Plus la date est lointaine, plus la page aura tendance à être moins performante, voire à ne plus attirer de visiteurs du tout.

Autre cas de figure : le contenu, sans être particulièrement obsolète, est peut-être de faible qualité. C’est le cas souvent des articles courts (moins de 300 mots) qui ne font qu’effleurer un sujet sans entrer dans les détails. Google pénalise de plus en plus ce type de contenu, dans ses efforts constants pour offrir aux utilisateurs une information qui soit la plus complète et détaillée possible.

Faites une rapide évaluation de vos concurrents sur le même sujet. Regardez les pages qui se placent en première page de résultats de Google et analysez leur contenu. Puis, faites-mieux qu’eux !

Les pages qui n’apportent aucune information intéressante : C’est par exemple le cas des pages de tags de WordPress. Si vous utilisez un grand nombre de tags et que chaque tag ne renvoie que vers un seul article, vous allez générer des pages de tags inutiles (un tag est sensé renvoyer vers plusieurs articles, c’est pour cela que les tags ont été créés) qui n’apportent rien à l’utilisateur et qui seront de toute façon mal positionnées dans les moteurs de recherche.

Le mieux est de limiter le nombre de tags par page, voire ne plus en utiliser du tout. Si vous désirez tout de même les conserver, vous pouvez faire en sorte qu’ils ne soient pas indexés. Les différents plugins SEO pour WordPress (Yoast SEO, All in One SEO par exemple) permettent de faire cela très facilement.

Les pages non (ou pas assez optimisées) pour le SEO : Ce sont des pages avec un contenu intéressant mais dont l’optimisation SEO est insuffisante, voire inexistante. Dans ce cas, il importe de réaliser une recherche de mots-clés afin de trouver l’expression qui permettra de bien positionner la page. Puis de retravailler le titre, la description de la page en fonction de cette expression. Veiller également à bien renseigner les balises alt des images, des liens, à ajouter des sous-titres à l’aide des balises adéquates (h2, h3…) et à augmenter la diversité sémantique de la page en ajoutant le plus grand nombre d’expressions dérivées du mot-clé principal.

Les pages qui présentent des problèmes techniques : C’est le cas des pages qui mettent trop de temps à s’afficher ou qui présentent une mauvaise compatibilité mobile. Google prenant en compte ce type de critère, il va sans dire que ces pages partent avec un désavantage certain dans la course au positionnement, d’autant plus qu’ils offrent une expérience utilisateur dégradée.

Les pages « annexes » : Ce sont les pages qui présentent peu de valeur ajoutée mais dont un site ne peut se passer : les pages contact, mentions légales, CGV… En général, ces pages sont peu consultées, mais vous pouvez en profiter pour ajouter des liens depuis ces pages vers d’autres pages qui pourraient avoir un rapport et qui elles offrent un contenu intéressant.

 

Les pages orphelines

On appelle « pages orphelines » les pages ne recevant aucun lien depuis un site extérieur ou même depuis les autres pages du même site. Étant donné que le nombre et la qualité des backlinks (liens reçus depuis un autre site) sont des facteurs déterminants pour être bien positionné sur les moteurs de recherche, les pages n’en recevant aucun vont être fortement handicapées.

De plus, comme les moteurs « trouvent » les pages en suivant des liens depuis d’autres pages, la page orpheline a de grandes chances de ne même pas être indexée ! Dans ce cas, le nombre de visiteurs qu’elle recevra sera proche de 0…

La solution est donc de faire en sorte que les autres sites pointent vers ces pages. Il est donc important de proposer un contenu de grande qualité afin de « donner envie » aux autres webmasters de pointer vers son site.

Une page orpheline est également une page qui ne recevra aucun lien interne. Outre le fait que cette page ne pourra pas être trouvée par l’utilisateur, cela pose également des problèmes en SEO car le maillage interne est un facteur non négligeable pour un bon positionnement dans les moteurs de recherche. C’est le problème le plus simple à régler, puisque les liens internes peuvent être créés à volonté et gratuitement !

 

Réaliser un audit de sitemap pour identifier et corriger les problèmes

Vérifier l’indexation des pages avec la Search Console
Tous ces problèmes peuvent être identifiés en réalisant un audit complet SEO du site. Rendez-vous sur la Search Console de Google pour vérifier que vos pages sont bien toutes indexées. Comparez le nombre de pages indexées par Google au nombre de pages de votre site. Si vous trouvez d’importantes différences, isolez les pages non indexées et tentez de comprendre pourquoi. Vérifiez également que vous n’avez pas reçu de pénalité. Google vous prévient alors en vous envoyant un message via la Search Console. Google peut également vous envoyer des messages s’il constate un problème technique sur les pages du site.

Vérifier le positionnement de vos mots-clés
Votre trafic dépend grandement du positionnement de vos mots-clés dans les moteurs de recherche. Pour ce faire, vous pouvez également utiliser la Search Console ou des outils spécialisés comme SemRush ou Ahrefs. Les mots-clés à travailler sont ceux situés entre la 5e et la 15e position. Ces mots-clés, en optimisant vos pages et en créant des backlinks, peuvent être assez facilement remontés dans les premières positions et ainsi générer du trafic.

 

Mesures d’ordre technique à prendre pour améliorer le positionnement

Les redirections
Si vous souhaitez vous débarrasser d’une page, la meilleure méthode est de la rediriger vers une page au thème similaire en créant une redirection 301 (redirection permanente). Ainsi, si la page possédait des backlinks intéressants, son autorité sera intégralement passée à la nouvelle page et vous ne perdrez pas de « jus » SEO.
 
Les URLs
Vérifiez que l’écriture de vos URL est optimisée. Une URL doit être courte, claire et comporter vos mots-clés principaux. Faites néanmoins attention à ne pas ajouter trop de mots-clés à votre URL. Cette pratique, nommée keyword-stuffing, peut vous valoir d’être pénalisé par Google.
 

Le sitemap
Vérifiez que le sitemap est bien présent sur votre site et qu’il est correctement renseigné. Un sitemap correct va grandement faciliter l’exploration de votre site par Google et donc son indexation.

Le fichier robots.txt
Ce fichier gère la façon dont Google doit explorer vos pages. Parfois, certaines pages sont bloquées dans le fichier robots.txt et ne sont donc pas explorées. Vérifiez que ce n’est pas le cas (sauf si bien sûr vous souhaitez que certaines pages ne soient pas explorées).

La vitesse de chargement des pages
Ce critère a une importance non négligeable dans le référencement. On estime qu’un temps de chargement correct est inférieur à 2 secondes. Le temps de chargement est également important pour l’expérience utilisateur : une page trop lente à charger découragera l’internaute et fera augmenter le temps de rebond.

 

N'hésitez pas donc à réaliser un audit de sitemap pour votre site afin d’identifier les pages qui n’attirent pas (ou plus) les visiteurs. Cette opération doit être effectuée régulièrement, surtout si votre site comporte un grand nombre de pages, afin d’avoir une vision claire de celles ayant besoin d’être retravaillées.