Bloqué pour indexation mais dans le sitemap.xml
Un fichier Sitemap.xml est essentiellement une carte de votre site Web conçue spécifiquement pour faciliter la navigation et l'indexation de votre site par les moteurs de recherche. Il se trouve dans votre dossier public_html (ou racine du site) et inclut des instructions importantes pour les robots d'exploration des moteurs de recherche qui précisent quelles pages doivent être visitées, dans quel ordre et à quelle fréquence.
Cela accélère considérablement le processus d'indexation des pages importantes et permet aux robots d'exploration d'allouer leur temps d'exploration aux pages de haute importance pour vous et vos utilisateurs.
Créer un sitemap.xml n'est pas toujours nécessaire, mais toujours recommandé, surtout pour les grands sites comportant des milliers de pages. Avec des sites plus grands, il est essentiel de s'assurer que les robots d'exploration des moteurs de recherche passent leur temps sur les pages à forte valeur ajoutée, avec un contenu approfondi et une intention commerciale, plutôt que sur des pages secondaires qui offrent peu de valeur.
En règle générale, lorsque des logiciels et des CMS génèrent automatiquement un fichier sitemap.xml, ils incluent toutes les pages disponibles pour l'indexation. Un propriétaire de site typique n'est pas susceptible d'être conscient de cela, et bien qu'il ait pu définir noindex pour certaines pages, leurs sitemaps générés automatiquement incluent probablement ces pages et gaspillent des budgets d'exploration précieux !
Il est fortement recommandé d'utiliser des plugins, des logiciels personnalisés ou des générateurs de sitemap pour configurer des URL spécifiques à afficher dans votre sitemap, certaines URL à éviter, l'ordre d'exploration des URL et la fréquence d'exploration.
Erreurs de sitemap trouvées par Labrika
Attention ! Le rapport d'erreur de sitemap ne sera accessible que si des autorisations suffisantes pour scanner l'ensemble du site Web sont configurées correctement. Sinon, Labrika ne pourra voir que les pages spécifiquement répertoriées dans le sitemap.xml plutôt que de pouvoir voir toutes les pages du site Web et les comparer avec les pages répertoriées dans le sitemap.
L'analyse du sitemap par Labrika aide à trouver les types d'erreurs suivants :
- Pages qui existent dans le sitemap mais ne sont pas accessibles pour l'indexation.
- Pages qui existent dans le sitemap mais ont une balise noindex.
- Pages qui n'existent pas dans le sitemap mais sont indexables.
Veuillez noter : différents moteurs de recherche traitent les règles de sitemap de différentes manières. Google, le plus souvent, n'indexera que les pages pouvant être atteintes par l'exploration automatique sans sitemap. C'est-à-dire, les pages accessibles via des liens internes dans le temps et la profondeur d'exploration alloués pour votre site ce jour-là. Ils ne consulteront pas votre fichier sitemap.xml pour déterminer quels liens explorer, mais utiliseront plutôt le sitemap comme guide pour la fréquence d'exploration des pages répertoriées dans le sitemap.