La question de cette semaine vient de Xaris, qui demande :

« Pourquoi, même si j’ai correctement composé et lié le plan du site au site Web d’un client et que j’ai tout vérifié, ai-je des problèmes d’indexation avec certains articles, pas tous, même après des demandes répétées à Google et à Google Search Console. Quel pourrait être le problème ? Je n’arrive pas à le comprendre. « 

C’est loin d’être un problème unique ; nous l’avons tous vécu ! « J’ai fait tout ce à quoi je pouvais penser, mais Google n’indexe toujours pas mes pages. »

N’est-il définitivement pas indexé ?

Le tout premier aspect à vérifier est si la page n’est vraiment pas indexée ou si elle n’est tout simplement pas bien classée.

Il se peut que la page apparaisse non indexée parce que vous ne parvenez pas à la trouver pour ce que vous considérez comme des mots-clés pertinents. Cependant, cela ne veut pas dire qu’il n’est pas indexé.

Pour les besoins de cette question, je vais vous donner des conseils sur la façon de gérer les deux circonstances.

Quel pourrait être le problème ?

Il existe de nombreuses raisons pour lesquelles une page peut ne pas être indexée ou bien classée sur Google. Discutons des principaux.

Problème technique

Il existe des raisons techniques, à la fois des erreurs et des décisions conscientes, qui pourraient empêcher Googlebot d’accéder à votre page et de l’indexer.

Bots bloqués dans Robots.txt

Google doit être en mesure d’accéder au contenu d’une page s’il veut comprendre la valeur de la page et, à terme, la servir de résultat de recherche pour des requêtes pertinentes.

Si Googlebot ne peut pas visiter ces pages via le fichier robots.txt, cela pourrait expliquer pourquoi il ne les indexe pas.

Il peut techniquement toujours indexer une page à laquelle il ne peut pas accéder, mais il ne pourra pas déterminer le contenu de la page et devra donc utiliser des signaux externes comme des backlinks pour déterminer sa pertinence.

S’il ne peut pas explorer la page, même s’il sait qu’elle existe via le plan du site, il sera toujours peu probable qu’elle soit classée.

La page ne peut pas être rendue

De la même manière, si le robot peut explorer la page mais ne peut pas restituer le contenu, il peut choisir de ne pas l’indexer. Il sera certainement peu probable qu’il classe bien la page car il ne pourra pas lire le contenu de la page.

La page a une balise sans index

Un problème évident, mais souvent négligé, est qu’une balise noindex a été appliquée à la page. Cela demandera littéralement à Googlebot de ne pas indexer la page.

Il s’agit d’une directive, c’est-à-dire quelque chose que Googlebot s’engage à mettre en œuvre.

Blocage des robots au niveau du serveur

Il se peut qu’un problème au niveau de votre serveur empêche Googlebot d’explorer votre page Web.

C’est un problème qui peut être assez courant lorsque des équipes peu familiarisées avec le référencement sont responsables de la maintenance technique d’un site Web.

Codes de réponse du serveur autres que 200

Les pages que vous avez ajoutées au plan du site peuvent très bien renvoyer un code d’état du serveur qui confond Googlebot.

Par exemple, si une page renvoie un code 4XX, même si vous pouvez voir le contenu de la page, Googlebot peut décider qu’il ne s’agit pas d’une page en ligne et ne l’indexera pas.

Page à chargement lent

Il se peut que vos pages Web se chargent très lentement. En conséquence, la perception de leur qualité peut être diminuée.

Il se peut également qu’ils mettent si longtemps à se charger que les robots doivent tellement prioriser les pages qu’ils explorent que vos pages les plus récentes ne sont pas explorées.

Qualité des pages

Il existe également des problèmes liés au contenu du site Web lui-même qui pourraient empêcher l’indexation d’une page.

Liens internes faibles suggérant une page de faible valeur

L’un des moyens par lesquels Google déterminera si une page mérite un classement élevé consiste à utiliser les liens internes pointant vers elle. Les liens entre les pages de votre site Web peuvent à la fois indiquer le contenu de la page vers laquelle le lien est lié, mais également si la page constitue une partie importante de votre site. Une page contenant peu de liens internes peut ne pas sembler suffisamment précieuse pour être bien classée.

Les pages n’ajoutent pas de valeur

L’une des principales raisons pour lesquelles une page n’est pas indexée par Google est qu’elle n’est pas perçue comme étant de qualité insuffisante.

Google n’explorera pas et n’indexera pas toutes les pages possibles. Google donnera la priorité au contenu unique et engageant.

Si vos pages sont minces ou n’ajoutent pas vraiment de valeur à Internet, elles risquent de ne pas être indexées même si elles pourraient techniquement l’être.

Ce sont des doublons ou des quasi-doublons

De la même manière, si Google perçoit vos pages comme étant des versions exactes ou très proches de pages existantes, il se peut qu’il n’indexe pas vos nouvelles.

Même si vous avez signalé que la page est unique en l’incluant dans votre plan de site XML et en utilisant une balise canonique auto-référencée, Google évaluera toujours si une page mérite d’être indexée.

Action manuelle

Il est également possible que votre page Web ait fait l’objet d’une action manuelle, c’est pourquoi Google ne l’indexe pas.

Par exemple, si les pages que vous essayez de faire indexer par Google sont ce qu’il considère comme des « pages d’affiliation légères », vous ne pourrez peut-être pas les classer en raison d’une pénalité manuelle.

Les actions manuelles sont relativement rares et affectent généralement des zones de site plus larges, mais il vaut la peine de consulter le rapport sur les actions manuelles de la Search Console pour exclure cette possibilité.

Identifiez le problème

Savoir quelle pourrait être la cause de votre problème ne représente que la moitié de la bataille. Voyons comment vous pourriez potentiellement réduire le problème, puis comment vous pourriez le résoudre.

Vérifiez les outils pour les webmasters Bing

Ma première suggestion est de vérifier si votre page est indexée dans Bing.

Vous ne vous concentrez peut-être pas beaucoup sur Bing dans votre stratégie de référencement, mais c’est un moyen rapide de déterminer s’il s’agit d’un problème lié à Google, comme une action manuelle ou un mauvais classement, plutôt que quelque chose sur votre site qui empêche l’indexation de la page.

Accédez à Bing Webmaster Tools et entrez la page dans son outil d’inspection d’URL. À partir de là, vous verrez si Bing indexe la page ou non. Si tel est le cas, vous savez que cela n’affecte que Google.

Consultez le rapport « Page » de Google Search Console

Ensuite, accédez à Google Search Console. Inspectez la page et voyez si elle est véritablement marquée comme non indexée. S’il n’est pas indexé, Google doit expliquer pourquoi.

Par exemple, il se pourrait que la page soit :

Exclus par « Noindex »

Si Google détecte une balise noindex sur la page, il ne l’indexera pas. Sous les résultats de l’outil d’inspection d’URL, il vous indiquera que « la page n’est pas indexée : exclue par la balise ‘noindex’ »

Si tel est le résultat que vous obtenez pour vos pages, votre prochaine étape consistera à supprimer la balise noindex et à soumettre à nouveau la page à explorer par Googlebot.

Découvert – Actuellement non indexé

L’outil d’inspection peut vous indiquer « la page n’est pas indexée : actuellement non indexée ».

Si tel est le cas, vous savez avec certitude que c’est un problème d’indexation, et non un problème de mauvais classement, qui empêche votre page d’apparaître dans la recherche Google.

Google explique qu’une URL apparaissant comme « Découverte – actuellement non indexée » est :

« La page a été trouvée par Google, mais pas encore explorée. Généralement, Google voulait explorer l’URL mais cela devait surcharger le site ; donc Google a reprogrammé l’exploration. C’est pourquoi la date de la dernière exploration est vide dans le rapport. « 

Si vous voyez ce statut, il y a de fortes chances que Google ait examiné d’autres pages de votre site Web et ait jugé qu’elles ne méritaient pas d’être ajoutées à l’index et, en tant que tel, ne dépense pas de ressources pour explorer ces autres pages dont il a connaissance, car il s’attend à ce qu’elles soient d’aussi mauvaise qualité.

Pour résoudre ce problème, vous devez signifier la qualité et la pertinence d’une page à Googlebot. Il est temps de jeter un regard critique sur votre site Web et d’identifier s’il existe des raisons pour lesquelles Google peut considérer vos pages comme étant de mauvaise qualité.

Pour plus de détails sur la façon d’améliorer une page, lisez mon article précédent : « Pourquoi mes pages sont-elles découvertes mais non indexées ? »

Exploré – Actuellement non indexé

Si votre page inspectée renvoie le statut « Explorée – actuellement non indexée », cela signifie que Google connaît la page, l’a explorée, mais ne voit pas l’intérêt de l’ajouter à l’index.

Si vous obtenez ce code d’état, il est préférable de chercher des moyens d’améliorer la qualité de la page.

Dupliquer, Google a choisi un canonique différent de celui de l’utilisateur

Vous pouvez voir une alerte pour la page que vous avez inspectée, qui vous indique que cette page est un « Duplicata, Google a choisi un canonique différent de celui de l’utilisateur ».

Cela signifie qu’il considère l’URL comme une copie proche d’une page existante et qu’il choisit l’autre page à afficher dans les SERP au lieu de la page inspectée, même si vous avez correctement défini une balise canonique.

La façon d’encourager Google à afficher les deux pages dans les SERP est de s’assurer qu’elles sont uniques et qu’elles ont un contenu suffisant pour être utiles aux lecteurs.

Essentiellement, vous devez donner à Google une raison pour indexer les deux pages.

Résoudre les problèmes

Bien que vos pages puissent ne pas être indexées pour une ou plusieurs raisons, les correctifs sont tous assez similaires.

Il est probable qu’il y ait un problème technique avec le site, comme une balise canonique errante ou un bloc robots.txt, qui a empêché l’exploration et l’indexation correctes d’une page.

Ou bien, il y a un problème avec la qualité de la page, ce qui fait que Google ne la considère pas comme suffisamment précieuse pour être indexée.

Commencez par examiner les causes techniques potentielles. Ceux-ci vous aideront à identifier rapidement s’il s’agit d’une solution « rapide » que vous ou vos développeurs pouvez modifier.

Une fois que vous avez exclu les problèmes techniques, vous êtes probablement confronté à des problèmes de qualité.

Selon ce que vous pensez maintenant qui empêche la page d’apparaître dans les SERP, il se peut que la page elle-même présente des problèmes de qualité, ou qu’une plus grande partie de votre site Web en ait.

Si c’est le premier cas, pensez à EEAT, au caractère unique de la page dans le cadre d’Internet et à la manière dont vous pouvez signifier l’importance de la page, par exemple via des backlinks pertinents.

Si tel est le dernier cas, vous souhaiterez peut-être effectuer un audit de contenu pour vous aider à affiner les moyens d’améliorer la perception globale de la qualité de votre site Web.

Résumé

Une petite enquête sera nécessaire pour déterminer si votre page n’est vraiment pas indexée ou si Google choisit simplement de ne pas la classer en haut pour les requêtes que vous jugez pertinentes.

Une fois que vous avez identifié cela, vous pouvez commencer à déterminer s’il s’agit d’un problème technique ou de qualité qui affecte vos pages.

Il s’agit d’un problème frustrant, mais les correctifs sont tout à fait logiques et l’enquête devrait, espérons-le, révéler d’autres moyens d’améliorer l’exploration et l’indexation de votre site.

Plus de ressources :


Image principale : Paulo Bobita/Search Engine Journal