Le web tel qu’on le connaît va disparaître

Vous vous souvenez de l’époque où on cherchait des sites via Google?.. Cette époque est bientôt révolue, alors que les IA génératives se répandent comme une traînée de poudre. Les moteurs de recherche vont se transformer en moteurs de réponse, et les chercheurs se demandent déjà comment différencier l’information artificielle de l’information d’origine humaine sur le web.

Anas Shahid, pour Heidi.news
Anas Shahid, pour Heidi.news

L'IA se développe à une vitesse vertigineuse, annonçant l'émergence de moteurs de recherche de nouvelle génération qui remettent en cause la dominance traditionnelle de Google. Le verbe «googler», autrefois incontournable, pourrait bientôt rejoindre le lexique des termes obsolètes comme «cyberespace», «autoroute de l'information» et «surfer sur le web». Dans la même veine, on ne dira plus moteur de recherche, mais moteur de réponse.

ChatGPT, déployé en novembre 2022 avec un succès sans précédent — 100 millions d'utilisateurs en deux mois — a réinventé l'accès à l'information, en transformant radicalement les pratiques courantes de recherche en ligne. Ses réponses aux questions posées sont si pertinentes et complètes que les utilisateurs n'éprouvent plus le besoin de cliquer sur les contenus proposés.

ChatGPT et ses concurrents, comme Copilot de Microsoft, Gemini de Google, Claude 3 d'Anthropic, Llama de Meta et bientôt SGE de Google, auront tous un impact profond sur le trafic Internet ainsi que sur les structures économiques qui s'appuient sur la publicité, redéfinissant les stratégies dans tous les domaines qui reposent sur l'optimisation des sites web pour attirer des visiteurs.

Pourquoi chercher quand l’IA s’en charge?

Perplexity.ai est plutôt un nouveau venu dans le paysage des IA génératives, et il se positionne clairement comme un moteur de réponse. C’est-à-dire qu’il répond directement aux questions des utilisateurs à partir des données du web, rendant la navigation effective pratiquement caduque pour celui-ci.

À titre personnel, il est devenu mon moteur de recherche par défaut, et selon le magazine Wired, je suis en bonne compagnie. Le PDG de Nvidia, Jensen Huang, affirme l'utiliser presque tous les jours et celui de Shopify, Tobi Lütke, déclare qu'il a remplacé Google. Mark Zuckerberg l'utiliserait également.

Perplexity a été évalué à plus de 500 millions de dollars, ce qui en fait l'une des start-up les plus en vue dans le domaine de l'IA à l'heure actuelle. Le produit compte plus d'un million d'utilisateurs quotidiens et continue sa progression. Son modèle puise ses réponses dans une large gamme de sources sur le web en direct et dans des bases de données, garantissant ainsi que les utilisateurs reçoivent les informations les plus à jour et précises disponibles.

ChatGPT est plus versatile que Perplexity: il peut générer des poèmes, du code, des scripts, des images, toutes sortes de tâches «créatives». Mais bien qu’il ait été mis à jour pour inclure la capacité de navigation sur le web, il continue de fournir des informations qui sont souvent obsolètes ou inexactes.

La contre-attaque de Google

Bien que Perplexity et ses homologues chatbots aient été les pionniers dans leur domaine, ils doivent maintenant se préparer à l’arrivée imminente d’un concurrent de poids: la Search Generative Experience (SGE) de Google. La position dominante du géant du web sur le terrain de la recherche lui confère un avantage incommensurable.

La fonctionnalité SGE, actuellement testée par Google Labs avant d’être proposée à tous les utilisateurs, est adossé à une IA générative et pourvue d'une interface conversationnelle. De quoi permettre au géant du web d’évoluer vers la fonction «moteur de réponse».

Selon les explications du Blog du Modérateur, plutôt que de se limiter à un ensemble de liens vers des sites web, la SGE propose directement des contenus textuels et multimédias. Avec la fonctionnalité «Interroger pour en savoir plus», les utilisateurs peuvent approfondir leurs recherches en posant des questions supplémentaires directement à l'intelligence artificielle de la plateforme.

Pour les requêtes commerciales, la SGE génère une sélection automatique de produits, complète avec les avis des consommateurs, les prix et les photographies des articles, le tout pour assister l'utilisateur dans ses décisions d'achat. Conçue pour être versatile, elle intègre aussi un système de génération d'images, à l’instar du moteur concurrent Bing de Microsoft (qui utilise Dall-E).

Google compte intégrer de la publicité: «Dans cette nouvelle expérience générative, les annonces continueront d'apparaître dans des emplacements publicitaires dédiés tout au long de la page». Si Google procède avec prudence avant de déployer son nouveau moteur auprès du grand public, c'est pour limiter les inexactitudes produites par l'IA – les fameuses «hallucinations».

Quand l’IA hallucine

Les hallucinations des chatbots d'IA génératives se réfèrent à des réponses ou à des informations générées qui semblent plausibles, mais sont en réalité incorrectes, trompeuses ou totalement inventées. Ce phénomène peut survenir pour diverses raisons: rareté des données, lacunes en matière d'information, ou une classification erronée des données lors de l'entraînement des modèles d'IA.

Elles posent des défis significatifs, car elles peuvent mener à la diffusion de fausses informations et affecter la fiabilité et la crédibilité des chatbots d'IA. OpenAI a réussi à réduire les hallucinations avec GPT-4, et Anthropic affirme que la nouvelle version de son modèle, Claude 3, a deux fois plus de chances de répondre correctement à une question.

Mais le sujet reste sensible, car les IA génératives reposent sur des modèles de langage de nature statistique, elles ne possèdent pas – ou pas encore – de modèle du monde ni de logique structurée qui permettrait de filtrer la validité de leurs réponses.

La maladie de l’IA folle

Un article publié dans The Telegraph met l’accent sur un problème qui pourrait avoir des répercussions majeures: le risque de contamination des IA, lesquelles s’affaibliraient en se nourrissant de leurs propres résultats, ce qui renforcerait leurs failles au lieu de les rendre plus efficaces. Nigel Shadbolt, spécialiste en IA, compare le problème à la maladie de la vache folle, transmise lorsque les bovins consomment des farines animales issues de leur propre espèce.

Si l'information artificielle produite par l'IA continue de s'accumuler sur le web, dans les bases de données, un peu partout, elle pourrait devenir aussi courante que l'information authentique. Il sera difficile de distinguer le vrai du faux, et l'ensemble du système d'information risque d’être dominé par des énoncés d’origine artificielle. Comment, dès lors, trouver des données assez «propres» pour entraîner les grands modèles de langage derrière les IA génératives?

Des solutions sont en cours d'étude pour distinguer le contenu original, généré par l'homme, du contenu créé par les modèles de grands langages (LLM), comme le marquage des données synthétiques ou l'utilisation de la blockchain pour créer un enregistrement vérifiable de la création de contenu. Mais elles ne sont pas encore standardisées.

La fin du SEO

Le Search Engine Optimization (SEO) désigne l'ensemble des stratégies et techniques employées pour accroître la visibilité d'un site web en améliorant son classement dans les pages de résultats des moteurs de recherche. Cette pratique a connu une évolution significative au gré des évolutions des algorithmes de Google, leader incontesté des moteurs de recherche.

Le but principal du SEO a toujours été de pousser les sites web à figurer en bonne place dans les résultats de recherche, en ciblant notamment les «10 liens bleus» qui dominent la première page de Google. Cette position est cruciale, car elle entraîne une augmentation de la visibilité et, par conséquent, du trafic en direction de ces sites. Tous les sites, y compris celui que vous consultez présentement, sont optimisés à cette fin.

L'émergence des moteurs de réponse va placer le domaine du SEO face à la nécessité absolue de s'adapter en Answer Engine Optimization (AEO). Les professionnels du SEO doivent désormais tenir compte de la façon dont les IA interprètent et référencent leurs contenus s’ils veulent continuer à visibiliser leurs contenus. Mais même dans cette hypothèse, il faut s’attendre à une diminution du trafic sur les sites secondaires.

Les principales IA du marché


Chatbots


Disponible en Europe:


Pas encore disponible en Europe, du fait des contraintes imposées par loi européenne sur l'IA:

  • Claude 3 d'Anthropic

  • xAI Grok d'Elon Musk —  fourni avec la version premium (payante) de X (Twitter)


Moteurs de réponse


Disponible en Europe:

  • Perplexity.ai

  • Arc Search  — compliqué, il faut télécharger le modèle avant de pouvoir l'utiliser, mais l'application mobile est facile d'accès.