L'IA, les algorithmes et le turc mécanique

Ou lorsque la "technologie" n'est qu'une forme élaborée de tromperie.

Daidalos
5 min ⋅ 31/10/2024

L'homme dans la machine

Le turc mécanique1 était un prétendu automate doté de la faculté de jouer aux échecs. Construit en 1770 par l'inventeur Johann Wolfgang von Kempelen, il avait pour but d'impressionner la cour de l'Impératrice d'Autriche Marie-Thérèse. L'automate était de taille humaine et habillé de manière à ressembler à un "sorcier oriental", placé derrière un meuble de jeu.Subséquemment à son succès à la cour d'Autriche, l'automate a entamé des tournées en Europe et dans les Amériques. Battant la plupart de ses adversaires, y compris des hommes d'État tels que Napoléon Bonaparte et Benjamin Franklin.

Loin d'être un objet conscient, le turc était en réalité manipulé de l'intérieur par un maître des échecs, via un pointeur et un système de leviers. Des aimants, placés sous les pièces et associés à d'autres placés sous l'échiquier, permettaient au maître de visualiser les déplacements de ces dernières et les répliquer sur un second échiquier.

Par Joseph Racknitz - Humboldt University LibraryPar Joseph Racknitz - Humboldt University Library

La clef de l'illusion ? Un ingénieux tour de passe-passe. Le meuble sur lequel résidait l’échiquier comportait diverses portes, qui une fois ouvertes permettaient de voir à travers la machine, et en observer le cœur : un habile mélange de rouages et poulies. Ce que von Kempelen oubliait d’indiquer, c’est que ce cœur n’était qu’une façade (littéralement), derrière laquelle le joueur placé dans le turc pouvait se réfugier lors de l’ouverture des portes.

L’homme est la machine

Loin d’être un artéfact des siècles derniers, le turc mécanique, ou du moins son concept, fait partie intégrante de nos technologies modernes. Dans le cadre contemporain, l’automate Otomman est remplacé par le terme d’IA et le maître des échecs par des travailleurs contractuels aux quatre coins du globe. Une seule constante, la prestidigitation.

Amazon et l’avènement de l’intelligence artificielle artificielle

C’est Amazon qui, en premier a ressuscité l’invention de von Kemplen. En ouvrant sa marketplace à d’autres produits que les livres, la firme Washingtonienne a rencontré un problème de taille : supprimer les dizaines de milliers de duplicatas apparaissant sur le site. Ne réussissant pas à développer un algorithme permettant d’automatiser cette suppression de manière efficace, ses ingénieurs se sont tournés vers l’humain.

Un système mixte a donc été créé : un logiciel décompose les tâches en petites unités, puis les distribue à un réseau de travailleurs humains. Payés par tâche, pour la plupart aux alentours de 2$/h, et pour les plus chanceux 7,25$/h.

Jeff Bezos, en fin businessman, décida d’ouvrir ce système au public en 2005, sous le nom d’Amazon Mechanical Turk2. En faisant, de fait, une “marketplace pour les travailleurs”, dont l’objectif est d’invisibiliser ces derniers. Représentés par des nombres et non des noms, formant une “intelligence artificielle artificielle”, dans laquelle chaque “turker” est analogue à une instruction/étape logicielle.

Le rôle des turkers a évolué au fil du temps. De la simple identification de textes et d’images, ils sont passés à l’identification en temps réel de produits – Les magasins sans caissiers d'Amazon fonctionnaient grâce à mille personnes en Inde pour surveiller les achats -3, puis à l’étiquetage de données d’entraînement pour l’IA.

Optimus, le turc mécanique moderne

Les vidéos/photos du robot humanoïde d’Elon Musk ont fait le tour du monde. Observer un robot danser, faire un cocktail, ou parler avec vous dans la foule (de manière quasi instantanée) peut apparaître trop beau pour être vrai. C’était le but de l’évènement “We, Robot” de Tesla, créer un engouement pour les futurs projets de Musk : Optimus (robot humanoïde), le Robotaxi et le Robovan (véhicules autonomes).
“Regardez ce que le futur a à vous offrir ! ”

Sauf que si l’on gratte un peu le vernis futuriste, on se rend compte de la supercherie. Optimus n’est pas autonome4, pour l’instant, bien que Tesla veuille nous faire croire le contraire. Durant l’événement, les robots étaient télé opérés par des humains pour les tâches complexes (c.-à-d. autres que marcher et rester en équilibre).5

La modération, du Nord vers le Sud global

L’extension de la sphère publique à internet — via les réseaux sociaux, blogs,… — a donné lieu à une explosion du nombre de contenus disponibles en ligne. Problème : dans ce flux incessant d’images, de textes et de données se cachent de “mauvais acteurs”, partageant des contenus/propos en contradiction avec les conditions d’utilisation des plateformes. Les modérer est une nécessité. Oui, mais comment ?

On pense naïvement qu’un algorithme, paramétré à cet effet, fait le sale boulot. Mais en réalité, une bonne partie de cette tâche est “outsourcée” à des milliers de travailleurs précaires du Sud global, qui vont identifier manuellement les contenus haineux ou à caractère sexuel afin de nourrir/entraîner un algorithme.6

On parle ici de contenus décrivant des situations impliquant des abus sexuels sur mineurs, des actes de violence extrême, d'automutilation ou portant atteinte à la dignité humaine. Rien de bien traumatisant…

Un contrat de ce type avait été signé fin 2021 entre OpenAI et Sama (une entreprise spécialisée dans l’étiquetage de données pour l’IA) pour étiqueter des descriptions de cette teneur, afin de rendre ChatGPT plus sûr7. Conformément ce contrat, les employés de Sama au Kenya devaient lire entre 150 et 250 passages de texte par jour de travail, allant d'une centaine de mots à plus de mille. Le tout pour environ 1,32$/h.

"C'était de la torture. Vous lisez plusieurs déclarations de ce genre tout au long de la semaine. D'ici au vendredi, vous êtes perturbés à force de penser à ça." - Un employé de Sama, au Times

La modération sur les réseaux sociaux ajoute à ces descriptions textuelles l’image et la vidéo, formant un cocktail malsain. Qui pourrait rester sain d'esprit après avoir catalogué des vidéos/images de meurtres, d’agressions, ou de viol à longueur de journée8 ? Personne, je présume. C’est pourtant le quotidien d’un nombre grandissant de personnes, fourmis ouvrières des algorithmes.

Nous admirons avec enthousiasme le visage de la « machine intelligente » autonome, tout en ignorant, sinon en dissimulant activement, le travail humain qui la rend possible. - Oscar Schwartz, IEEE Spectrum

La machine est l’homme

Entre 33 et 46% des turkers utiliseraient une IA comme ChatGPT pour effectuer des tâches liées à la production de texte. C’est ce qu’ont découvert les chercheurs Veniamin Veselovsky, Manoel Horta Ribeiro et Robert West9.

Le serpent se mord la queue. L'utilisation de données générées par l'IA pour former l'IA pourrait introduire des erreurs supplémentaires dans des modèles déjà sujets aux erreurs. Les LLM (Large Language Model -) présentant régulièrement des informations fausses ou non vérifiées comme des faits. En témoigne la citation, par l’IA de Bing, de propos générés par ChatGPT comme source10.

Il faudra attendre de nouvelles études pour déterminer si cette tendance s’est propagée à d’autres domaines (analyse d’images, d’audios, de vidéos,…). Et si les effets de cette auto-alimentation en/auto-évaluation des données vont se faire sentir, ou s’il ne s’agit que d’un épiphénomène. Dans l’hybride homme-machine d’Amazon, la seule partie qui semble inexorablement gagner du terrain, c’est la machine.


Lorsque quelque chose semble sorti tout droit d'un film de science-fiction, il faut jouer à “où est charlie l'humain ?”. Ou du moins s’interroger sur son fonctionnement. Afin de ne pas se faire avoir par les vendeurs d'huile de serpent du far-west numérique, qui semblent pulluler depuis quelques années.


Sources :

1 https://en.wikipedia.org/wiki/Mechanical_Turk#cite_ref-18

2 Untold History of AI: How Amazon’s Mechanical Turkers Got Squeezed Inside the Machine

3 Amazon’s Just Walk Out stores relied on ‘1,000 people in India watching,’ not AI

4 Un prototype du robot humanoïde d’Elon Musk, censé être autonome, assure qu’il est “assisté par un humain

5 The Optimus robots at Tesla’s Cybercab event were humans in disguise

6 Moderating in Obscurity: How Indian Content Moderators Work in Global Content Moderation Value Chains

7 Exclusive: The $2 Per Hour Workers Who Made ChatGPT Safer

8 The secret lives of Facebook moderators in America

9 Artificial Artificial Artificial Intelligence: Crowd Workers Widely Use Large Language Models for Text Production Tasks

10 AI is eating itself: Bing’s AI quotes COVID disinfo sourced from ChatGPT

Daidalos

Par Jean Mousseau