Image : StockSnap via Pixabay

Misinformation Monitor: juin 2023

Note de la rédaction : Depuis février 2024, la newsletter mensuelle de NewsGuard – appelée Misinformation Monitor – a laissé place à Reality Check, une newsletter hebdomadaire en anglais, sur les tendances de la mésinformation en ligne. Pour en savoir plus, et vous inscrire sur Substack, c’est par ici.

Certains des sites UAINs sur lesquels sont apparues des publicités de grandes marques ont visiblement utilisé des outils d’intelligence artificielle pour réécrire des articles publiés par des médias traditionnels et grand public. Cela était souvent fait sans mention de la source originale. Par exemple, des publicités pour un site américain de location d’appartements, un site international de e-commerce, une imprimante de bureau japonaise et un fabricant chinois d’électronique sont apparues à côté d’un article publié par l’UAIN AlaskaCommons.com qui semblait être une version réécrite par l’IA d’un article publié par l’édition américaine du tabloïd britannique The Sun. L’article comportait les mêmes images et des tournures de phrase similaires. Vers la fin de l’article d’AlaskaCommons.com, on pouvait lire “Comment obtenir des paris gratuits sur le football” (“How to Get Free Bets on Football”), le même sous-titre que The Sun, au-dessus d’un paragraphe répétant un message d’erreur de chatbot: “En tant que modèle de langage d’IA, je ne peux pas fournir d’informations sur les paris gratuits sur le football. Veuillez vous référer à des sources d’information fiables ou à des sites de paris pour plus d’informations”. En juin 2023, Le Sun n’a pas répondu à deux emails de NewsGuard cherchant à savoir si AlaskaCommons.com avait l’autorisation de reprendre des contenus provenant de son site web.

Là encore, les marques dont les publicités apparaissent à côté de ce contenu de mauvaise qualité ou en apparence plagié n’auraient aucun moyen facile de savoir par elles-mêmes qu’elles soutiennent ces sites.

La plupart des publicités ont été présentées aux analystes de NewsGuard sur des sites générés par l’IA qui sont de piètre qualité mais qui ne diffusent pas de fausses informations. Cependant, NewsGuard a également trouvé des publicités pour deux services américains de vidéo en streaming, une marque de fournitures de bureau, un constructeur automobile japonais, une banque mondiale basée à New York, une animalerie, un magasin en ligne vendant des vitamines, une société de produits diététiques et un fabricant d’aspirateurs sur MedicalOutline.com, un site UAIN qui a fait la promotion de remèdes naturels non prouvés et potentiellement dangereux, avec des titres tels que “Le citron peut-il guérir les allergies cutanées ?”, “Quels sont les 5 remèdes naturels contre le TDAH ?”, et “Comment prévenir le cancer naturellement”.

Google : l’entreprise de technologie publicitaire au cœur de la machine UAIN

Les règles publicitaires de Google stipulent que les sites ne doivent pas “insérer d’annonces diffusées par Google sur des pages” diffusant du “contenu généré automatiquement qui inclut du spam”, que Google définit notamment comme du “contenu généré de manière programmatique sans produire quoi que ce soit d’original ni apporter de valeur ajoutée”.

Néanmoins, comme indiqué ci-dessus, plus de 90% des publicités identifiées par NewsGuard sur les sites UAINs ont été présentées aux analystes de NewsGuard par Google. NewsGuard a envoyé quatre emails à Google l’interrogeant sur la monétisation des sites UAIN. Après avoir reçu cette requête, un porte-parole de Google a demandé à NewsGuard de fournir davantage de contexte par email, ce que NewsGuard a fait. Cependant, au 25 juin 2023, NewsGuard n’avait toujours pas reçu de réponse.

Certains des sites UAINs sur lesquels les grandes marques sont apparues publient des centaines d’articles par jour, sans doute avec l’aide d’un chatbot. (Il est souvent difficile de détecter si un article a été rédigé à l’aide de l’IA s’il ne contient pas les messages d’erreur que l’on trouve habituellement dans les textes générés par l’IA).

Par exemple, World-Today-News.com, un UAIN d’actualité et de contenus lifestyle, a publié environ 8.600 articles — soit environ 1.200 par jour en moyenne — au cours de la semaine du 9 juin 2023 au 15 juin 2023. À titre de comparaison, le New York Times publie généralement autour de 150 articles par jour, selon un questions-réponses publié en avril 2022. NewsGuard a trouvé des publicités programmatiques pour une compagnie aérienne américaine, une place de marché en ligne et un grand magasin américain sur ce site, qui ne donne pas les noms de ses auteurs ni aucune information concernant sa direction éditoriale. NewsGuard a constaté que l’UAIN précédemment mentionné, AlaskaCommons.com, ainsi qu’un autre site UAIN, Time.news, avaient publié respectivement 5.867 et 6.108 articles au cours de la même période.

Alors que Time.news, un site d’actualités internationales, ne fournit pas de noms d’auteurs, AlaskaCommons.com attribue régulièrement des articles à une série d’auteurs dont les profils semblent inauthentiques. “Ingrid Taylor”, l’un des noms qu’AlaskaCommons.com identifie fréquemment comme auteur de ses articles, a ainsi publié 4.364 articles depuis le début de l’année, dont 108 pour la seule date du 15 juin 2023. NewsGuard a trouvé des publicités pour un site américain de location d’appartements, un site mondial de commerce en ligne, une imprimante de bureau japonaise et un fabricant chinois d’électronique sur AlaskaCommons.com, et des publicités pour deux grandes banques américaines, un service de musique en ligne, une marque de vêtements de sport, une société de médias de la Silicon Valley, et d’autres encore sur Time.news.

D’autres sites UAINs contenaient jusqu’à une douzaine, voire plus, de “widgets” publicitaires sur des articles contenant des messages d’erreur de chatbots. Les widgets publicitaires sont des éléments de code que les développeurs web peuvent placer sur leurs sites pour diffuser des annonces programmatiques. Google ne semble pas avoir fixé de limite au nombre de widgets publicitaires qu’un site peut placer sur une page donnée, selon la rubrique “Aide” du site du groupe

Un article généré par l’IA et contenant un message d’erreur de chatbot sur le site UAIN FoodingWorld.com, un site expliquant l’histoire des aliments et leurs ingrédients, contenait 15 widgets publicitaires Google. Les publicités présentées à NewsGuard sur le site provenaient de marques telles qu’une société internationale de location de voitures, une banque américaine, un magasin de matelas et une société de commerce électronique.

Une publicité pour une société internationale de location de voitures est apparue sur FoodingWorld.com, un site UAIN qui publie des articles sur l’alimentation générés par l'IA. NewsGuard a bloqué les publicités programmatiques à l'aide de boîtes noires. (Capture d’écran réalisée par NewsGuard)

Il est aussi facile pour les sites UAINs que pour n’importe quel autre site de monétiser rapidement leur contenu. Sur la page d’accueil de Google AdSense, le nom du produit des widgets publicitaires que Google fournit aux éditeurs, la société vante la facilité avec laquelle les sites peuvent commencer à gagner de l’argent grâce à la publicité programmatique : “Il suffit d’insérer le code AdSense sur votre site Web, et ça fonctionne immédiatement”.

Depuis que NewsGuard a commencé à suivre la prolifération des sites UAIN en mai 2023, ses équipes ont identifié quelque 25 nouveaux sites par semaine. Le nombre total de ces sites est probablement beaucoup plus élevé que les 217 identifiés à ce jour par NewsGuard, étant donné que NewsGuard n’est généralement en mesure d’en trouver de nouveaux que s’ils ont publié des articles contenant des messages d’erreur typiques de chatbots.

NewsGuard a envoyé des emails à 40 des 141 marques pour lesquelles il a trouvé des publicités sur des sites UAINs, pour leur demander si elles savaient que celles-ci apparaissaient sur des sites non fiables générés par l’IA. Quatre marques ont répondu mais n’ont pas souhaité faire de commentaire.

NewsGuard a envoyé des emails à quatre des six sites UAINs mentionnés dans ce rapport, pour s’enquérir de leur utilisation de l’IA et des messages d’erreur d’IA que NewsGuard a trouvés dans les articles publiés. Aucun des sites n’a répondu. NewsGuard n’a pas été en mesure de trouver de coordonnées pour les deux autres sites UAIN, NoticiasDeEmprego.com.br et AlaskaCommons.com.

Note : NewsGuard vend des licences d’accès à ses évaluations de plus de 30.000 sources d’actualité et d’informations, dont plus de 9.000 sites web, afin d’aider les marques à éviter de placer involontairement des publicités programmatiques sur des sites de mauvaise qualité et de mésinformation. Les listes d’exclusion de NewsGuard sont utilisées par des annonceurs, des agences de publicité et des sociétés de technologie publicitaire pour s’assurer qu’ils ne soutiennent pas certains sites, tandis que ses listes d’inclusion servent à encourager le placement de publicités sur des sites généralement dignes de confiance, soutenant ainsi le journalisme de qualité.

 

Méthodologie :

En mai et juin 2023, des analystes de NewsGuard basés aux États-Unis, en Allemagne, en France et en Italie ont examiné 55 sites affichant de la publicité programmatique et identifiés comme sites d’actualité non fiables générés par l’IA (voir ci-dessous). Les analystes ont utilisé différents navigateurs, le mode de navigation privée, ainsi que des réseaux privés virtuels (VPN), un outil permettant aux utilisateurs de naviguer sur internet comme s’ils se trouvaient dans un autre pays. Les analystes ont réalisé des captures d’écran de leurs résultats. Seules les publicités des entreprises dont le chiffre d’affaires annuel est supérieur ou égal à 500 millions de dollars ont été prises en compte dans ce rapport.

NewsGuard considère qu’un site peut être défini comme un site d’information non fiable généré par l’IA s’il répond aux quatre critères suivants : 

  1. Il existe des preuves évidentes qu’une part importante du contenu du site est produite par l’IA.
  2. Tout aussi important, il y a de fortes raisons de penser que le contenu est publié sans contrôle humain notable. Par exemple, de nombreux articles peuvent contenir des messages d’erreur ou d’autres termes propres aux réponses des chatbots, ce qui indique que le contenu a été produit par des outils d’IA sans avoir été correctement édité. (Il est probable qu’aujourd’hui ou à l’avenir, de nombreux sites d’information utiliseront des outils d’IA mais déploieront également une supervision humaine efficace ; ils ne seront alors pas considérés comme des sites UAINs).
  3. Le site est présenté de telle sorte qu’un lecteur moyen pourrait supposer que son contenu est produit par des rédacteurs ou des humains, du fait de sa mise en page, d’un nom générique ou anodin, ou d’autres éléments typiques des sites d’actualité et d’information.
  4. Le site n’indique pas clairement que son contenu est produit par l’IA.
In the center, a screenshot of a 2017 video that shows the Wagner fighter, who executed a Syrian citizen with a sledgehammer. On the left and right, unidentified young men mimic the appearance of the executioner.(Screenshots via NewsGuard)