Yoast SEO : Une mise à jour cause une mauvaise surprise
Connecter son site aux outils d’analyse de Google est important et vous le savez probablement déjà. Nous faisons référence de façon plus précise à Google Analytics et de Search Console. Notre expérience nous a malheureusement permis de constater que ce dernier est plus méconnu que le premier.
Un autre aspect qui est souvent laissé pour compte, une fois votre site connecté auxdits services, est de prendre le temps de se connecter sur ces plateformes de temps à autres et d’y analyser les données présentes.
Pourquoi parler de ces deux services alors qu’il est question de mise à jour de plugins et de Yoast SEO ? Car grâce à Google Search Console, nous avons pu découvrir une augmentation importante des pages indexées sur notre site :
Votre site est une cible…
Nous sommes tous dans la mire des pirates. Obtenez une analyse gratuite de votre situation en moins de 5 minutes.
Le problème
Ce genre de hausse fulgurante de pages indexées – qui pourrait être vu comme une bonne chose – cache souvent une mauvaise surprise. Une des attaques les plus rencontrées depuis les dernières années est ce qu’on appelle communément le « SEO Spam », aussi connu sous les termes pharma hack.
Ce type d’attaque vise à prendre possession d’un site afin d’indexer une grande quantité de pages qui n’ont rien à voir avec le contenu habituel du site. De plus, ces attaques sournoises sont très souvent invisibles aux yeux du visiteur moyen car elles sont conçues pour n’influencer que les moteurs de recherches tels Google et Bing.
À moyen termes, ces attaques ont un impact négatif sur le site, ce dernier pouvant même être ajouté aux blacklists des différents engins de recherche du web.
Vous comprenez maintenant pourquoi cette hausse soudaine de pages indexées peut apparaître effrayante!
L’investigation
La première question qui nous est venu à l’esprit : Qu’est-ce qui a pu causer cela ?
Poussant l’analyse un peu plus loin, toujours grâce à Google Search Console, nous avons remarqué ce tableau :
Search Console nous donne maintenant 2 pistes d’informations très utiles afin de nous aider à comprendre si nous avons été, ou non, victime d’une attaque de type SEO Spam.
- Les URLs ajoutés
- La date à laquelle ils ont été ajoutés.
Nous sommes en mesure de constater que plusieurs erreurs 404, en référence à des « attachement_id » (les pages que WordPress génère pour les fichiers présents dans la bibliothèque de médias), sont récemment apparues dans nos rapports.
Ensuite, la date est fort utile lorsque vient le temps d’analyser les journaux serveurs et autres rapports d’activités du site. Cela nous permet d’éviter de passer à travers des centaines, voire des milliers de lignes d’informations. Il est toujours une bonne idée de partir de la date et de reculer d’une à deux journées comme point de départ.
La pression tombe… quelque peu
Grâce aux informations ci-haut, nous savons maintenant que nous n’avons pas été victime d’une attaque SEO Spam. Par contre, le travail n’est pas terminé pour autant. Cette nouvelle situation va à l’encontre des configurations que nous avions mises en place pour notre stratégie d’optimisation pour les engins de recherches.
Il va sans dire, nous devons corriger le tout.
La suite des choses
Maintenant que nous avons des pistes de solutions, nous pouvons continuer nos recherches. Notre premier arrêt : le fichier sitemap.xml. C’est ce dernier qui agit, en quelque sorte, comme table des matières pour les bots de Google et autres engins de recherches afin de leur indiquer quel contenu existe et où le trouver.
Dans la majorité des situations, le fichier sitemap est présent à la racine du site (monsite.com/sitemap.xml). Dans le cas de SatelliteWP, nous utilisons Yoast SEO. Ce dernier utilise une approche quelque peu différente où le fichier sitemap pointe vers des fichiers enfants pour chacun des types de données présents dans WordPress.
C’est à ce moment que nous avons eu une autre surprise.
Nous avons constaté l’apparition d’un nouveau fichier XML qui n’était pas présent par le passé: attachment-sitemap.xml.
La deuxième surprise s’est produite lorsque nous avons accédé à la section de gestion des fichiers sitemap dans Yoast SEO. Le système de gestion des fichiers XML a complètement changé au niveau de son interface. Avec les observations que nous avons fait depuis le début, tout porte à croire que le fonctionnement aussi a été impacté.
Nous nous attendions à voir ceci :
Et c’est cela qui était affiché :
Nous avons donc trouvé ce qui a causé l’apparition soudaine de centaines de nouvelles pages indexées par Google. Quelques changements au niveau de la configuration et tout est rentré dans l’ordre et seulement les fichiers sitemap désirés sont générés.
On voit maintenant que notre fichier principal de sitemaps ne contient plus attachment-sitemap.xml.
Que faut-il retenir de tout ça?
Toute mise à jour, aussi bénigne elle peut paraître à première vue, peut avoir d’étonnantes répercussions à moyen terme.
Le plus choquant dans tout ça, c’ est que même en lisant les rapports de changements (appelés communément les changelogs) pour se tenir informé des nouveautés, les gens ou entreprises derrières ces plugins ne nous rendent pas toujours la vie facile.
Pour illustrer ce point, voici la page où Yoast SEO publie toutes les ajouts, modifications et corrections effectués lors de la publication des mise à jour de l’extension: https://yoast.com/wordpress/plugins/seo/change-log-wordpress-seo/.
Pour la version 7.0, j’apporte votre attention sur le 6e point de la section « Interface »
Removes the option to exclude an author from the XML sitemap in favor of a broader option. Instead, we now have an option to set whether this author’s archive should be visible in the search results. If you choose not to allow this archive in the search results, it’s also excluded from the author sitemap.
et le 2e point de la section « Copy »…
Introduces the question: “Allow search engines to show this in search results?” and bases both the
noindex
and the inclusion in XML sitemaps on this decision.
Ce genre d’événement illustre parfaitement pourquoi il est primordial d’avoir une procédure de mise à jour en place et une gestion automatisée de sauvegardes (utile dans le cas de conséquences plus destructrices). C’est pour ces raisons que plusieurs entreprises nous font confiance avec un forfait d’entretien WordPress afin de gérer ces aspects pour eux.
Ne pas avoir à gérer l’infrastructure de son site et bénéficier de l’expertise cumulative d’un groupe d’experts WordPress s’avère être un excellent investissement. Vous passerez donc plus de temps à gérer votre entreprise et faire fructifier vos talents et moins de temps à plonger à travers les différents changelogs de chacune de vos extensions !