ChatGPT, un faux-ami du SEO

L’année 2022 a été mouvementée dans le monde du référencement avec la sortie de GPT-3 et le succès de ChatGPT. Va-t-il changer le SEO ? Dokey est-il toujours utile ?

ChatGPT, un faux-ami du SEO
Photo by Mauro Sbicego / Unsplash

L’année 2022 a été mouvementée dans le monde du référencement avec la sortie de GPT-3 et le succès de ChatGPT. Les années à venir le seront encore plus avec la sortie de nouveaux modèles comme GPT-4. ChatGPT va-t-il changer le SEO ? Dokey est-il toujours utile ?

TL;DR :

  • L’intelligence artificielle a un impact non négligeable pour le web et le SEO.
  • ChatGPT ne peut pas remplacer un rédacteur web car il est limité à des données de 2021, sa fonction est seulement de prédire les mots les plus probables en fonction d'un contexte. Par conséquent, il génère du contenu générique et n'est pas fiable.
  • Dokey analyse la SERP et évolue avec les normes de SEO. Son utilisation est toujours d'actualité pour gagner du temps en rédigeant du contenu performant.
  • Les modèles de langages sont des outils formidables à exploiter (tout en gardant à l’esprit leurs limites) et qui feront bientôt partie de notre quotidien, il est important de comprendre ce qu’ils font réellement.
  • La meilleure façon d’utiliser ChatGPT est de savoir à l’avance ce qu’il doit écrire.

La rédaction de contenu est importante pour le référencement

Les contraintes de google pour donner un résultat

Outre le spam et les contenus inappropriés, Google doit satisfaire 2 contraintes: les utilisateurs doivent trouver l’information qu’ils cherchent le plus simplement possible et les entreprises qui paient doivent avoir un meilleur trafic. La première contrainte sera au cœur de cet article.

L’algorithme de Google est complexe et repose en grande partie sur le machine learning. De ce fait, peu de personnes (aucune ?) seraient capables de l’expliquer entièrement. Il est cependant possible de comprendre ce qu’il met en avant d’après ses résultats.

La démocratisation du machine learning et la mise en avant du contenu

La technologie évolue et si les algorithmes étaient auparavant programmés pour suivre des règles écrites par leurs créateurs, ils sont devenus capables de créer automatiquement les règles à suivre pour donner un résultat attendu.

L'apprentissage machine (machine learning ou ML), abusivement qualifié d'intelligence artificielle, est un ensemble de techniques permettant à un système de prédire des réponses à partir des données auxquelles il a été exposé. Ici, nous parlerons des modèles de langage. Ce sont des modèles statistiques résultant d'un algorithme de machine learning entraîné sur des données textuelles de langage naturel, c'est-à-dire le langage que les humains utilisent pour communiquer. GPT-3, ChatGPT et BERT sont des exemples typiques de modèle de langage.

Les moteurs de recherche doivent trier des milliards de milliards de données et il est impossible d’écrire une règle pour chaque chose à interdire ou mettre en avant. Google utilise le ML pour trier le contenu spam du contenu légitime depuis longtemps. Mais en 2017, un article de recherche a changé la donne : “Attention is All Your Need”. À la suite de ce dernier, Google a dévoilé son modèle BERT et a annoncé sa mise en application dans son moteur de recherche. L’objectif est de mieux comprendre les requêtes des utilisateurs et d'accorder plus d’importance au contenu sémantique des pages.

Dokey pour répondre à ce besoin

La compréhension croissante du langage par l’algorithme de Google nécessite maintenant plus d’effort pour rédiger un article valorisé par ce dernier. Il faut faire des recherches sur les thèmes abordés, le contenu des meilleures pages, estimer ce qu’attend l’utilisateur, et donc ce que Google met en avant. Les contenus de mauvaise qualité sont pénalisés plus durement et les mots clés ne suffisent pas à se positionner.

Dokey permet de s’affranchir de ce travail de recherche pour que le rédacteur se focalise sur la qualité et la création dans une interface qui lui apporte toute les informations nécessaires pour se positionner sur Google tout en laissant parler sa créativité.

L’intelligence artificielle au service du SEO, ou pas.

L'utilisation des IA dans le référencement

Les modèles de langages peuvent exécuter différentes tâches connues comme générer, annoter, résumer ou traduire du texte.

La politique de Google concernant le contenu découle en partie de sa capacité à annoter du texte. Ces annotations permettent d’avoir des indicateurs précis sur ce qui démarque les contenus pertinents du reste. Par exemple, il permet de trouver la réponse à une question dans un texte, ce qui donne les People Also Ask et la position 0 sur la SERP.

Les derniers modèles de langage ont montré un potentiel très intéressant pour générer du texte. Rapidement, les rédacteurs et grandes entreprises les ont utilisés pour rédiger du contenu sans qu’il soit aisé de le détecter comme du spam car très proche d’un contenu humain. (Les avis sur Amazon viennent souvent de là !) C’est le principal problème que rencontre Google et que des entreprises exploitent. Cependant un contenu rédigé artificiellement n'est pas fiable et reste trop générique. Il n’apporte finalement pas grand-chose pour les utilisateurs de Google.

Que peut vraiment faire chatGPT ?

ChatGPT est un modèle de langage dérivé de GPT-3 et optimisé pour les discussions par chat. Il a été entraîné sur des données d’internet datant de 2021 triées et améliorées par des humains. Développé et entraîné par OpenAI, il suffit de se créer un compte sur leur site internet.

En 2022, sa puissance remet sur la table le débat sur l’utilisation de l’IA pour rédiger du contenu SEO. Pourtant, cette "IA" ne sait faire qu'une seule tâche et c'est très important de le comprendre. Elle prédit quelles sont les suites la plus probable à écrire en fonction du contexte qu'on lui donne. Même si les résultats sont parfois remarquables, c'est la seule chose que fait un modèle de langage.

Si vous avez des doutes concernant sa capacité à raisonner voici un exemple assez parlant.

Elle ne se trompe pas vraiment dans la réponse, c'est la réponse la plus probable qu'aurait écrit un humain à cette question piège. Elle aurait prédit la bonne réponse si on lui demandait ce qu'aurait répondu un mathématicien.

Comment bien utiliser ChatGPT ?

En voilà une bonne question. Une réponse de ChatGPT est donc l'ensemble des caractères les plus probables en fonction d'un contexte donné. Cela peut paraître réducteur, mais cette seule fonction lui permet tout de même d'effectuer des tâches complexes et diverses. Le mot "caractère" n'est pas utilisé au hasard car vous pouvez demander à ChatGPT de générer du code informatique, des tableaux ou encore des emojis.

Par exemple, vous pouvez l'utiliser pour classifier les caractéristiques de différents produits donnés dans un tableau puis de convertir ce tableau en HTML. Il existe beaucoup de possibilités, laissez libre cours à votre imagination.

La règle d’or pour utiliser cet outil de la meilleure façon est de savoir à l’avance ce que ChatGPT doit écrire. De cette façon, vous pouvez gagner du temps sur différentes tâches fastidieuses impossibles à réaliser autrement. Sinon, il y a trois principes à respecter du mieux possible:

  • Fournir un maximum de contexte (Voir l'exemple du problème de l'âge ci-dessus)
  • Vérifier toutes les affirmations de ChatGPT
  • Garder en tête son fonctionnement: c'est un outil de prédiction, pas un cerveau artificiel.

Comment Dokey utilise-t-il l'IA ?

La politique de Dokey par rapport aux modèles de langage

La percée et l’efficacité de l’IA a ouvert une boîte de Pandore et elle est maintenant utilisée partout et pour tout. Un peu trop à notre goût. Il y a un paradoxe avec la puissance du machine learning, elle est à la fois surestimée et sous-estimée. D’un côté, nous sous-estimons très largement la capacité des algorithmes des réseaux-sociaux à analyser et vendre notre comportement en ligne, de l’autre quand une IA telle que GPT-3 (ou ChatGPT) est à l'oeuvre publiquement, certains pensent qu’elle est super-intelligente voire consciente.

La vérité est qu’elles sont très efficaces pour exécuter des tâches précises et complexes mais qu’elles peuvent vite perdre pied quand on attend d’elles autre chose qu’une réponse probable. (Par exemple une réponse juste.)

Chez Dokey, nous l’utilisons pour effectuer des tâches précises comme annoter le texte et coupler les résultats avec nos propres règles, indépendantes d’une IA, choisies par nos chercheurs et ingénieurs. Ce croisement de données nous permet d’avoir le contrôle sur les suggestions de mots clés que l’on fait et d’éviter les mauvaises surprises. De plus, nous limitons son utilisation aux seuls cas où aucun algorithme classique n’est capable de traiter une information.

Dokey utilise-t-il GPT-3 ou des modèles équivalents ?

Nous n’utilisons pas GPT-3 car nous n’en avons pas encore l'utilité. Cependant nous utilisons différents modèles de langage pour pouvoir correctement analyser les articles en fonction de la langue. Ces modèles sont couplés à nos algorithmes et bases de données linguistiques pour avoir un maximum de contrôle sur les résultats que l’on vous suggère.

Notre politique est d’utiliser “l’intelligence artificielle” pour accompagner les rédacteurs dans leur travail de façon utile, intuitive et performante.

ChatGPT ne va pas remplacer Google

La course au meilleur modèle de langage est lancée depuis 2017 et les résultats sont de plus en plus impressionnants. ChatGPT a fait beaucoup de bruit car facilement accessible et beaucoup de personnes ont découvert où en était cette course depuis lors. Mais on parle déjà de GPT-4 qui pourrait encore dépasser de très loin les capacités de GPT-3.

Dans ce cas, les moteurs de recherche et un outil comme Dokey seront-ils encore pertinents ?

Oui, pour plusieurs raisons:

  • Open AI cherche à permettre la détection des textes générés par ses modèles de différentes manières, en laissant une signature dans les textes par exemple. Si cela est fait, ces textes seront facilement détectables par les moteurs de recherche.
  • Google discrimine de mieux en mieux les pages de mauvaise qualité et a sorti un papier de recherche pour le faire a partir de ces mêmes modèles de langage.
  • Un modèle de langage ne peut pas raisonner, faire preuve d'originalité et donc apporter une nouvelle information pertinente pour les utilisateurs
  • Même si certains articles rédigés par des intelligences artificielles apparaissent dans les meilleures positions de la SERP, Dokey les analysera comme n’importe quel article et vous proposera les thèmes et mots clés mis en avant par le moteur de recherche.
  • Nous évoluons en même temps que le SEO, c'est-à-dire tout le temps.

Enfin, si vous pensiez malgré tout remplacer les moteurs de recherche par ChatGPT. N'oubliez pas que c'est un outil qui donne une réponse sans source alors qu'un moteur de recherche est un outil qui donne des sources et à vous de trouver la réponse avec un vrai raisonnement. Par ailleurs, Google développe un outil allant dans ce sens appelé Sparrow. Il serait une sorte de mélange entre moteur de recherche et chatbot qui donnerait des réponses aux utilisateurs en citant ses sources.

La création de contenu n'est pas faite pour ChatGPT

ChatGPT ne peut pas raisonner pour créer du contenu original, précis et pertinent. Il est cependant capable de rédiger des articles génériques sur des sujets consensuels. Toutefois la véracité du contenu n'est pas du tout garantie et encore moins pour les domaines d'expertise. Le modèle est entraîné à pouvoir répondre à une question de façon à ce que la réponse soit la plus naturelle possible. Il n’est pas entraîné à avoir raison. De plus, il n’évolue pas avec le temps et donc ne connaît pas les sujets d’actualité, il le dit lui-même.

Dokey analyse les meilleurs résultats de la SERP en temps réel. Peu importe qui ou quoi l’a rédigé, il vous donnera ce que Google préfère et a un bel avenir devant lui pour continuer de vous proposer une interface facilitant et accélérant la rédaction de vos pages web.

ChatGPT et les nouveaux modèles de langage sont des outils formidables et prometteurs. Pour répondre à des questions précises ou remplacer les technologies actuelles comme les chatbot, ils vont probablement continuer à faire parler d'eux. On pourrait aussi imaginer des modèles capables de générer, non seulement du texte, mais aussi des images et vidéos associés.

Cependant leur impact sur le SEO est questionable en raison du développement de techniques pour détecter les contenus générés et le besoin des utilisateurs d’avoir du contenu original et pertinent sur internet. Il y a de grandes chances pour que la signature de contenu généré devienne une norme. Ce qui ne serait pas forcément pénalisant pour un moteur de recherche mais permettrait au moins d’avoir la source d’un contenu. De plus, des outils émergent déjà pour détecter ce type de texte comme GPTZero ou le classificateur d'OpenAI. On peut facilement imaginer qu'un domaine contenant une tonne d'articles détectés comme générés ne sera pas vu comme digne de confiance.

Dokey évolue continuellement et privilégie une utilisation raisonnée de l’IA, mais lorsque de tels modèles seront pertinents pour aider à la rédaction dans des tâches précises, vous pourrez compter sur nous pour les intégrer dans l’outil !