Helpful Content : et si Google avait trouvé le moyen d’évaluer l’expérience de vos contenus ?
Jeudi 18 août 2022, Google annonçait par l’intermédiaire de Danny Sullivan, Public Liaison for Search, le lancement imminent de l’une de ses plus grandes mises à jour algorithmiques depuis dix ans, appelée Helpful Content Update (HCU). Son objectif : évaluer l’utilité des milliards de contenus de son index, fournis en réponse aux demandes des internautes, pour en écarter la part jugée inutile. Cette mise à jour survient au moment où Google fait de plus en plus l’objet de critiques quant à la qualité de son expérience utilisateur.
Mountain View, nous avons un problème de qualité !
Le 20 juin dernier, juste avant l’été, c’est Charlie Warzel de The Atlantic qui tirait la sonnette d’alarme, avec un titre percutant que l’on pourrait traduire ainsi : « Le secret de polichinelle de la recherche Google : l’un des outils les plus utilisés sur Internet n’est plus ce qu’il était ». Dans cet article, l’auteur nous fait part de son expérience personnelle avec la recherche Google. Après avoir subi un dégât au niveau de sa fosse septique, il interroge Google frénétiquement à la recherche d’une solution d’urgence. Malheureusement Google ne lui retourne que des sites « à l’emporte-pièce, dont la plupart semblaient générés à la hâte et étaient étouffés par suffisamment de mots répétitifs à la mode pour être à peine lisibles ». Résultat, Charlie Warzel procède « à l’ancienne » : il prend son bottin, son téléphone et appelle un professionnel qui règlera son problème.
Des problèmes de qualité récurrents et croissants
Après cette expérience frustrante, Charlie Warzel décide de pousser les investigations plus loin et se rend compte, en consultant des forums, qu’il est loin d’être le seul à douter de la qualité des réponses de Google. En février 2022, Dmitri Brereton, un ingénieur, décrivait déjà une situation qui se dégrade d’après lui dans bien des secteurs, dont ceux de la santé et du shopping. Il qualifiait même de « spam SEO » les résultats (inutiles) qui remontent en première page et n’apportent aucune solution concrète.
Pour justifier sa critique, Dmitri Brereton pointe par exemple la montée en flèche ininterrompue de l’audience du principal site d’entraide entre particuliers, le forum Reddit, bien connu outre-Atlantique. D’après Dmitri Brereton les requêtes exprimées sur Google incluant le terme « reddit » montreraient une augmentation spectaculaire. C’est pour lui la preuve que « la majeure partie du web est devenue trop inauthentique pour lui faire confiance », Google en tête. En effet, d’après Charlie Warzel, la situation est telle sur Google qu’« au lieu de faire défiler de longs messages jonchés de publicités pop-up et de paragraphes à peine cohérents rédigés par des SEO, pour accéder à une critique ou à une recette quelconque, les internautes intelligents ont obtenu des fils de discussion animés avec des témoignages de vraies personnes débattant et interagissant les uns avec les autres » grâce à Reddit ou Quora (et ironiquement via Google).
Quelles demandes sont concernées par ces problèmes de qualité ?
Je n’ai pas conscience d’un problème de qualité d’une telle ampleur en France, même s’il m’arrive régulièrement d’être frustré lors d’une expérience de recherche infructueuse. Bien entendu, on devine à travers les retours d’expérience de nos deux auteurs que les demandes impliquant un choix avant un achat sont particulièrement concernées par ce qu’ils qualifient de « spam SEO ».
On parle de pages de résultats dont les réponses émanent de sites sans proposition de valeur claire, sinon des contenus qui tournent autour du pot. Ceux-ci listent surtout des produits (avec un système de rétribution pour chaque vente effectuée #affiliation…), plutôt que d’apporter une réponse concrète et des solutions réelles aux problèmes des internautes. Le tout est truffé de publicités plus ou moins bien ciblées. Sur mobile, naviguer dans un tel contenu peut tout bonnement devenir un parcours du combattant.
Tous les sites de choix et de comparaison de produits ne sont évidemment pas concernés par cette description au vitriol, mais les exemples sont légions. Chacun en a d’ailleurs déjà fait l’expérience, en particulier pour des recherches précises qui sont censées apporter une réponse pragmatique, un retour d’expérience construit et argumenté dans une volonté de partage désintéressé d’informations, au moins en première approche.
C’est dans ce contexte que Google a annoncé, jeudi 18 août 2022, sa volonté de s’attaquer à ces problèmes de qualité de contenu. Pour se convaincre de l’importance du sujet « qualité » chez Google, le moteur de recherche a lancé successivement deux mises à jour. D’abord, le 12 septembre, une « Core Update » (une mise à jour principale) affectant également la qualité globale des contenus de son index, sans en dire plus. Ensuite, la mise à jour qui touche les avis sur les produits, le 20 septembre. Une façon habile, dirons-nous, de créer un écran de fumée, pour rendre encore plus vaine toute tentative de rétro-ingénierie ou « Reverse Engineering » de la part des SEO sur les algorithmes de Google.
Revenons à notre sujet du jour, la Helpful Content Update ou « HCU », et regardons de plus près ce que Google est en train de mettre en place.
Qu’est ce que la mise à jour Helpful Content et à quoi peut-on s’attendre ?
L’objectif de cette mise à jour centrée sur l’utilité du contenu est de récompenser plus justement les pages qui offrent aux internautes une expérience positive, contrairement aux pages qui ne répondent pas aux attentes des utilisateurs. En d’autres termes, privilégier les contenus axés sur l’utilisateur plutôt que ceux axés sur le référencement.
« Qu’est ce qu’une expérience positive avec une page de contenu ? », me répondrez-vous. Pour le savoir, nous avons d’abord consulté la page consacrée à la mise à jour Helpful content sur Google et voici ce qu’indique l’aide aux webmasters pour évaluer la qualité d’un contenu : « Si vous répondez oui aux questions ci-dessous, cela signifie que vous êtes probablement sur la bonne voie avec une approche centrée sur l’humain :
- De par votre entreprise ou votre site, avez-vous une audience existante ou ciblée qui trouverait votre contenu utile si elle s’adressait directement à vous ?
- Votre contenu démontre-t-il clairement une expertise et des connaissances sans égal (expertise acquise après avoir utilisé un produit ou un service, ou après avoir visité un lieu, par exemple) ?
- Votre site a-t-il un objectif principal ?
- Un internaute qui lit votre contenu se sentira-t-il suffisamment instruit sur un sujet pour atteindre son objectif ?
- Un internaute qui lit vos contenus aura-t-il l’impression d’avoir vécu une expérience positive ? »
Pour illustrer le type de site concerné, Google a évoqué la situation d’un utilisateur qui recherche des informations sur un film dont on lui a parlé et trouve une page bien positionnée. Celle-ci ne fait toutefois que regrouper les critiques émanant d’autres sites, sans fournir de perspectives uniques. Voilà le type de site qui ne devrait plus être visible dans Google, après la mise à jour Helpful Content.
Pour se faire une idée encore plus précise et concrète de ce que Google entend par « qualité de contenu », nous vous invitons à prendre connaissance des consignes de rédaction de Google pour ses mises à jour principales, ainsi que celles dédiées à la production d’avis de haute qualité sur les produits. Toutes ont en commun l’unicité du contenu et la valeur délivrée à son lecteur.
À quoi peut-on s’attendre ?
À l’aide des premières informations fournies par Google, on peut commencer à en déduire que certains types de sites verront, tôt ou tard, leur visibilité dans Google s’affaisser de façon importante par les prochaines mises à jour, et en particulier Helpful Content. On parle bien de sites entiers et non de pages ou de sections isolées d’un site.
D’après Marie Haynes, SEO indépendante aux États-Unis, spécialiste des questions de qualité, plusieurs sites seront particulièrement visés par Helpful Content.
- Les sites dont le contenu est généré grossièrement ou exclusivement par l’IA, comme Jasper, GPT-3, Copymatic. Mais attention, Google sait parfaitement détecter cette pratique, comme le démontre Kevin Indig dans son article.
- Les sites de « niche », dont le business model est focalisé sur la monétisation de leur audience via l’affiliation, à moins qu’ils ne mènent un sérieux travail de démonstration d’expertise et qu’ils satisfassent pleinement les besoins de l’utilisateur (cf réponses positives aux questions listées plus haut).
- Les sites qui ne font guère plus que regrouper des informations provenant d’autres sites (simples agrégateurs sans contenu exclusif pour l’utilisateur).
À ce stade, on commence à se faire une idée plus concrète des velléités de Google. Et si l’on se remémore un instant les expériences de recherche vécues par nos deux auteurs, Charlie Warzel et Dmitri Bereton, décrites en introduction de ce contenu, on comprend mieux la déception qu’ils ont pu ressentir en tombant sur ce type de sites en tête des résultats.
Le fait est que Google fait l’objet de plus en plus de tentatives de spam, sous toutes ses formes, tant la valeur des premières positions dans ses résultats est devenue élevée pour les éditeurs. Il suffit d’observer de quelle façon les prix au clic ont augmenté dans tous les secteurs depuis quelques années. Rien qu’en 2020, les divers systèmes automatisés de détection de spams de Google ont trouvé plus de 40 milliards de pages de spam chaque jour. Un chiffre colossal.
Quelles différences entre « Core update », « Product Review update » et « Panda update » ?
Toutes ces mises à jour, actuelles ou passées (Panda date de février 2011) ont en commun de se focaliser sur la valeur desservie par un contenu pour son lecteur… et c’est tout ! Le reste n’est que littérature.
Comme expliqué plus haut, à travers les consignes de Google, la valeur délivrée à l’utilisateur est la seule chose qui doit retenir votre attention en tant qu’éditeur, que vous soyez une marque ou non. C’est d’autant plus vrai que Google ne délivre quasiment plus de détails sur la façon concrète dont il procède. Si nous savons quelle mise à jour à eu lieu et à quelle date, Google n’apporte en revanche que très peu d’indications concrètes.
Cependant, quelle que soit la mise à jour, celle-ci concerne toujours les principaux facteurs clés de positionnement officiels de Google :
- comprendre le sens de la requête de l’utilisateur ;
- analyser les contenus pour savoir s’ils contiennent l’information utile et pertinente qui répond à l’utilisateur ;
- analyser la qualité de chaque contenu pour hiérarchiser ceux qui semblent les plus utiles à l’utilisateur ;
- en cas d’égalité sur le précédent point, Google les départagera en analysant la performance de la page en termes d’expérience utilisateur ;
- la prise en compte du contexte de recherche de l’utilisateur (historique de recherches, localisation, paramètres de recherche).
La mise à jour Helpful content est-elle une composante de l’E.A.T de Google ?
Absolument. Rappelons au passage ce qu’est l’E.A.T de Google.
Qu’est ce que l’E.A.T de Google ?
C’est un concept qui existe depuis 2014 mais que Google a mis en avant lors de la mise à jour de son algorithme à l’été 2018. L’évaluation E.A.T sert à sélectionner les pages et sites dignes de confiance, selon l’intention de recherche de l’utilisateur. Cette évaluation se fait à travers trois piliers :
- l’expertise – quel est le niveau d’expertise des contenus du site, dans son domaine ?
- l’autorité – sa voix porte-t-elle dans son écosystème ?
- la fiabilité – l’entité est-elle fiable ?
La prise en compte de ces trois critères par Google est le résultat du travail effectué par des contractuels que l’on appelle les Quality Raters (QR). Google demande en effet à plus de 10 000 Quality Raters dans le monde d’évaluer ses résultats de recherche. Les évaluateurs reçoivent des recherches effectives à partir de recherches réelles effectuées sur Google. Ils évaluent ensuite la qualité des pages qui apparaissent dans les premiers résultats – d’où le nom « évaluateur de qualité ».
Les évaluateurs de qualité ne peuvent pas modifier directement les résultats de Google. L’action d’un évaluateur sur une page n’a pas de prise directe sur son classement dans Google. En revanche, les données générées par les évaluateurs de qualité sont utilisées pour améliorer le système automatisé de classement des pages.
Concrètement, les données de ces évaluations et expérimentations font l’objet d’un examen approfondi par les ingénieurs et les analystes Search de Google, ainsi que par d’autres experts juridiques qui déterminent si le lancement du changement est approuvé. Ainsi, en 2021, Google indique avoir mené plus de 700 000 tests qui ont abouti à plus de 4 000 améliorations de la recherche.
On parle bien d’une évaluation et non d’un algorithme ! Bien que E.A.T ne soit pas un algorithme spécifique, les algorithmes de Google recherchent des signaux en corrélation avec de bons ou de mauvais E.A.T, tels que le PageRank, « qui utilise des liens sur le web pour comprendre l’autorité », ou encore Helpful Content, qui analyse l’utilité d’un contenu pour une demande d’utilisateur.
Pour finir, les Quality Raters doivent évaluer la rencontre d’une réponse avec une requête, une intention de recherche. On le voit dans cette illustration tirée des directives aux QR.
Rating | Description |
---|---|
Fully Meets (FullyM) | Tous les utilisateurs mobiles seraient immédiatement et pleinement satisfaits du résultat et n’auraient pas besoin de voir d’autres résultats pour satisfaire leurs besoins. |
Highly Meets (HM) | Très utile pour beaucoup ou la plupart des utilisateurs mobiles. Certains utilisateurs peuvent souhaiter voir des résultats supplémentaires. |
Moderately Meets (MM) | Utile pour de nombreux utilisateurs ou très utile pour certains utilisateurs mobiles. Certains ou plusieurs utilisateurs peuvent souhaiter voir des résultats supplémentaires. |
Slightly Meets (SM) | Utile pour moins d’utilisateurs mobiles. Il y a un lien entre la requête et le résultat, mais pas un lien fort ou satisfaisant. Beaucoup ou la plupart des utilisateurs souhaiteraient voir plus de résultats. |
Fails to Meet (FailsM) | Ne répond pas complètement aux besoins des utilisateurs mobiles. Tous ou presque tous les utilisateurs souhaiteraient voir des résultats supplémentaires. |
Comment savoir si les contenus de mon site seront concernés par la mise à jour Helpful Content ?
Avant toute chose, voici ce que l’on sait à ce stade du déploiement du signal Helpful Content.
- Il est appliqué à l’ensemble d’un site. Si Google applique ce signal à votre site, c’est l’ensemble du site qui en souffrira en termes de classement.
- L’effet est pondéré, donc certains sites le ressentiront plus que d’autres.
- Il s’applique aux sites qui ont « des quantités relativement élevées de contenu inutile ».
- Le modèle qui applique ce signal aux sites fonctionne en continu, ce qui lui permet de surveiller les sites nouvellement lancés et les sites existants.
- Le processus est automatisé, il ne s’agit donc pas d’une action manuelle. Il est automatisé à l’aide d’un modèle d’apprentissage automatique, ce qui signifie qu’il apprend et change continuellement.
- On peut donc s’attendre à des impacts graduels.
- Cela n’affecte que les recherches en anglais pour le moment (à l’échelle mondiale).
Google a mis en place un sujet dédié à la mise à jour Helpful Content sur son forum d’aide, afin de permettre aux éditeurs, SEO et webmasters de sites d’échanger avec des spécialistes du sujet, chez Google ou en externe.
En complément, si vous pensez que votre site est pris à tort dans les filets de la mise à jour Helpful Content de Google, vous pouvez soumettre votre cas grâce à un formulaire spécialement créé. Retenez cependant que pour l’heure, la mise à jour Helpful Content n’a concerné que les contenus anglais.
Comment remédier à une pénalité Google sur la qualité des contenus ?
Le meilleur moyen de remédier à un problème, c’est de l’éviter ! Alors, pour dormir tranquille, voici trois conseils à appliquer dès à présent :
- restez dans votre expertise en écrivant sur des sujets qui concernent votre entreprise (vos services, vos produits, les besoins qu’ils recouvrent), dont vous êtes un réel expert et qui s’adressent à votre public ;
- répondez concrètement à la question de l’utilisateur en fournissant une perspective unique d’expert, ainsi que des réponses aux questions les plus fréquentes pour chacun de vos sujets ;
- ne spammez pas l’algorithme, en privilégiant des contenus longs, de qualité, qui répondent aux attentes de vos utilisateurs. Vouloir aller vite (par exemple à l’aide d’une intelligence artificielle), c’est prendre le risque d’être pris tout aussi rapidement dans les mailles du filet Helpful Content.
Toutefois, d’ici quelques mois, si vous pensez que votre site a été touché par le déploiement de l’update Helpful Content, voici quelques étapes de travail que vous pourrez envisager pour évaluer la situation et la corriger.
- Procédez à une analyse éditoriale (et non pas SEO) objective de vos contenus, pour évaluer leur qualité et leur capacité à répondre aux attentes des utilisateurs (en répondant aux questions citées plus haut). Vous devrez peut-être faire appel à des tiers pour procéder à des tests utilisateurs.
- Éliminez tous les contenus jugés inutiles ou « SEO-first », comme des pages locales proposant des textes à trous avec le nom des villes. Vous pouvez aussi les mettre à jour avec un effort significatif pour les rendre uniques.
- Envisagez de supprimer ou de ne pas indexer les contenus inutiles qui n’apportent aucune valeur (trafic, conversions, tout autre indicateur clé de performance) à votre site.
- Faites appel à des experts pour vous accompagner dans votre stratégie de contenu, afin de faire augmenter votre évaluation E.A.T (comme précisé plus haut).
Évitez de vous fier « les yeux fermés » aux outils d’optimisation de contenu, de recherche mots-clés ou d’idées de sujets, ou tout autre outil qui prétend effectuer de la rétro-ingénierie. N’oubliez pas que ces outils indiquent à tous les expressions où il faut se positionner. Bien qu’il faille les traiter, suivre ces outils à la lettre reviendrait à standardiser le contenu entre concurrents alors que le but est justement de se distinguer par le contenu.
En complément, Google a prévenu que les sites impactés par le Helpful Content devront probablement travailler dur pour améliorer la situation de leur site et retrouver un classement solide, puisque ce processus de réévaluation prendra plusieurs mois, comme le rapporte Glenn Gabe dans son article très complet sur le sujet.
Que pensent les SEO de la mise à jour Helpful Content ?
Dans le contexte de la mise à jour HCU à l’été 2022, nous avons demandé à une partie de l’équipe SEO de l’Agence WAM ce qu’elle attendait de cette mise à jour à travers quelques questions.
Que pensez-vous de la qualité globale des réponses / contenus remontés en page 1 de Google ?
Google a-t-il les moyens de parvenir à ses fins ?
Quels sont les types de contenus visés par cette mise à jour ?
D’après vous, à quelles intentions sont liées les contenus potentiellement touchés par cette mise à jour ?
Quels secteurs seront les plus affectés selon vous ?
Pensez-vous que les résultats de vos projets SEO seront affectés par cette mise à jour ?
Google va-t-il infléchir les pratiques de spam SEO les plus douteuses ?
Quels sont les premiers résultats de la mise à jour Helpful Content ?
Au moment de rédiger cet article, le mercredi 5 octobre 2022, le premier déploiement Helpful Content est terminé aux États-Unis. Pour autant, il n’a jamais été aussi difficile de tenter d’analyser les effets d’une mise à jour sur le positionnement d’un site. Il y a plusieurs raisons à cela.
- Google a lancé successivement 3 mises à jour d’ampleur : Helpful Content, Core update et Product Reviews.
- Ces mises à jour sont gérées par l’apprentissage automatique et incluent des centaines de critères qui changent constamment. De plus, à mesure que la compréhension des requêtes et de l’intention des utilisateurs par Google évolue, la composition du classement peut également changer. Enfin, Google a indiqué dans ces communications que les effets de la mise à jour Helpful Content étaient pondérés (des effets différents par site selon la quantité de contenus jugée inutile…).
- Enfin, comme annoncé au Search On 2022, Google propose de plus en plus de résultats personnalisés.
Dans ce contexte, toute tentative d’isoler les effets d’une mise à jour sur le positionnement d’un site est vaine, comme le soulignait John Mueller, qui coordonne les relations du Search Google avec les webmasters, dans le podcast Google Search Off the Record. Le Reverse Engineering est l’un des mythes les plus répandus dans la sphère SEO. C’est le plus souvent un abus de langage pour évoquer des recherches et des tests aboutissant à la corrélation entre la présence d’un élément et le déclenchement d’un événement.
Ce que l’on peut dire en revanche, c’est que la communication de Google a été largement relayée par les principaux canaux de communication de la sphère SEO. Bien entendu, à chacune des grosses annonces de Google, la sphère SEO s’anime mais les éventuelles craintes d’un « HelpfulContentGeddon » se sont totalement dissipées après quelques semaines. Comme l’indiquait Google, il faut voir Helpful Content comme un nouveau signal SEO qui vient s’ajouter à l’ensemble des autres signaux déjà utilisés pour calculer le classement d’une page de contenu. Cela signifie que sa mise en place va être progressive mais s’inscrire dans le temps.
Toutefois, avant de conclure, j’ai trouvé pertinente l’étude de Will Reynolds de Seer Interactive. Après avoir analysé 31 550 933 URLs à travers 2 703 210 domaines, Will Reynolds partage de premiers indices expliquant une perte ou, au contraire, une augmentation de la visibilité organique. Voici en deux mots ce qu’il faut en retenir :
- Seront prioritairement touchés les sites construits de toutes pièces pour attraper de l’audience, c’est-à-dire sans marque, avec une autorité de domaine très faible, proposant une table des matières disproportionnée par rapport au sujet. Il s’agit avant tout de contenus très segmentés (beaucoup de paragraphes, sous forme de questions, avec des réponses courtes de 4 lignes…).
- D’après l’analyse de Will Reynolds, sur les 2,7 millions de domaines analysés, très peu de domaines de qualité ont été touchés (sur la base de l’analyse du TrustFlow de Majestic).
En conclusion
Au risque de rappeler une évidence, notre message principal à propos de la mise en place de Helpful Content est de ne pas se soucier des pénalités et des éventuelles fluctuations de Google. Si vous concentrez vos efforts de rédaction sur la réponse à fournir à l’utilisateur, à partir d’un contenu unique, avec un point de vue d’expert, rédigé par un humain pour les humains, il n’y a rien à craindre de ces mises à jour. Les updates de Google cherchent précisément à valoriser l’utilité des contenus pour leur utilisateurs. Considérez plutôt ces avancées algorithmiques comme une opportunité de progresser : si vous vous en tenez à cette ligne de conduite, les effets pour vos écrits seront très positifs.
De façon complémentaire, les utilisateurs font confiance aux marques et Google favorisera toujours les marques. Si vous n’êtes pas un site de contenus dont le modèle repose uniquement sur de l’affiliation (coucou les Made For Adsense 👋), vous n’avez rien à craindre.
More content by people, for people in Search
par Danny Sullivan
Google’s Helpful Content Algorithm Update: Hypotheses from 23 Years of SEO Experience
par Will Reynolds, Seer Interactive
Google’s ‘Helpful Content Update’ to Devalue ‘Search-Engine First’ Content and Elevate Authentic, Expert Voices in Search
par Lily Ray, Amsive Digital
Google’s Helpful Content Update Introduces A New Site-wide Ranking Signal Targeting “Search engine-first Content”, and It’s Always Running
par Glen Gabe, G-Squared Interactive
What is helpful content, according to Google
par Danny Goodwin, Search Engine Land & SMX
The Open Secret of Google Search, one of the most-used tools on the internet is not what it used to be
par Charlie Warzel, journaliste et contributeur pour The Atlantic
Google’s Helpful Content Update – A full analysis
par Marie Haynes