Des milliers de travailleurs filment leurs propres gestes pour apprendre aux robots à les remplacer, une révolution silencieuse qui redéfinit le sens du travail humain
Quand l'Humain Devient le Professeur des Machines : L'Économie Secrète des Données Gestuelles
Des travailleurs en Inde portent des caméras sur la tête pour filmer leurs gestes du quotidien, cuisine, couture, nettoyage, et alimenter des bases de données destinées à entraîner des robots humanoïdes. Derrière ce phénomène émergent se cachent des enjeux économiques, éthiques et sociaux majeurs. Analyse approfondie.
Un atelier textile quelque part dans le Tamil Nadu, dans le sud de l'Inde. Des rangées de travailleurs, assis côte à côte, manipulent du tissu avec des gestes précis et répétitifs. Rien d'inhabituel dans ce tableau, sauf une chose : fixée sur la tête de chacun, une paire de lunettes équipées d'une petite caméra enregistre, en temps réel et en vue subjective, chaque mouvement de leurs mains.
Ces images ont commencé à circuler en ligne au printemps 2026 et ont immédiatement suscité une onde de choc numérique. Sur X (anciennement Twitter), des milliers d'internautes ont exprimé leur malaise face à ce qu'ils interprétaient comme le symptôme d'une époque nouvelle : des êtres humains, payés quelques centaines de roupies de l'heure, en train d'enseigner méticuleusement leurs propres savoir-faire à des systèmes d'intelligence artificielle destinés, peut-être, à les remplacer.
Ce n'est pas de la science-fiction. La firme Objectways, implantée en Inde et aux États-Unis, emploie des travailleurs dans l'État du Tamil Nadu pour filmer des tâches du quotidien, plier des vêtements, préparer un café, cuisiner un sandwich, nettoyer une surface, à l'aide de caméras embarquées. Ces enregistrements en vue à la première personne, appelés données égocentrées (egocentric data), sont ensuite transmis via une application spécialisée à des entreprises qui les utilisent pour entraîner des modèles d'IA et des robots. La firme compte parmi ses clients des multinationales figurant au classement Fortune 500.
Parallèlement, la startup Build Artificial Intelligence Inc. (Build AI), fondée par deux adolescents américains et acquéreuse en 2026 de la société indienne , a constitué une base de données de plus d', issues de 14 228 ouvriers d'usine répartis en Asie du Sud-Est, la progression est vertigineuse : 10 000 heures en novembre 2025, 100 000 en décembre, un million en avril 2026.
Cette scène, d'une banalité apparente, pose une question centrale : sommes-nous en train d'entraîner les systèmes qui accompliront demain notre propre travail ?
Pour comprendre ce phénomène, il faut d'abord déconstruire une idée reçue profondément ancrée dans l'imaginaire collectif : l'intelligence artificielle ne s'est pas construite seule, dans les serveurs froids d'un datacenter, à partir d'algorithmes abstraits. Elle s'est construite, et continue de se construire, sur une quantité astronomique de travail humain.
Avant qu'un modèle d'IA puisse reconnaître un objet, comprendre une phrase ou guider un bras robotique, des milliers de personnes ont dû étiqueter des images, transcrire des conversations, valider des réponses, corriger des erreurs, tâche après tâche, heure après heure. Ce travail, souvent réalisé dans des pays à bas salaires (Inde, Kenya, Philippines, Madagascar), a été qualifié par les chercheurs de "travail fantôme de l'IA" (ghost work), en référence au livre éponyme de Mary Gray et Siddharth Suri publié en 2019.
Le processus se décompose en plusieurs étapes :
La collecte : des données brutes sont rassemblées — textes, images, vidéos, sons, capteurs. C'est ici qu'interviennent les travailleurs indiens filmant leurs gestes.
L'annotation : des humains étiquettent les données pour les rendre compréhensibles par les machines. Une image d'une main qui attrape un verre reçoit des marqueurs : "main gauche", "préhension cylindrique", "verre transparent", "surface lisse", "mouvement de saisie".
La validation : d'autres travailleurs vérifient la qualité des annotations, corrigent les erreurs, écartent les données inutilisables.
L'entraînement : ces données traitées alimentent des modèles d'apprentissage automatique qui apprennent à reconnaître des patterns, à prédire des comportements, à reproduire des actions.
Ce circuit économique souterrain est massif. Les estimations citées dans les rapports sectoriels chiffrent les dépenses des laboratoires de robotique en données égocentrées à entre 1,5 et 50 milliards de dollars sur les deux à trois prochaines années. Ce chiffre, aussi large soit son intervalle, donne la mesure de l'appétit des entreprises technologiques pour ces nouvelles matières premières.
Et l'Inde s'est positionnée comme le hub mondial de cette industrie naissante. Avec une main-d'œuvre anglophone, compétente techniquement et moins coûteuse, le pays fournit depuis des années une part considérable des données d'entraînement consommées par les géants de la tech mondiale. La rémunération de 250 roupies par heure (environ 2,60 dollars) pour filmer ses gestes domestiques peut sembler dérisoire — mais comme le confie Sriramyachandra, travailleuse à Chennai interrogée par l'AFP : "Qui d'autre vous donnera 250 roupies de l'heure juste pour faire la cuisine ?"
Les systèmes de vision par ordinateur, qui permettent à une machine de "voir" et d'interpréter son environnement, ont fait des progrès spectaculaires depuis l'émergence du deep learning. Mais entraîner un robot à reconnaître une tasse de café dans une cuisine réelle, avec des variations de lumière, des angles différents, des dizaines de types de tasses différents, est une tâche qui exige des millions d'exemples. Les données égocentrées, capturées depuis le point de vue de la personne en train d'agir, fournissent exactement le type de contexte visuel dont les robots ont besoin pour comprendre le monde physique à la façon humaine.
L'une des approches les plus prometteuses de la robotique moderne repose sur l'apprentissage par imitation : au lieu de programmer explicitement chaque comportement d'un robot, on lui montre des milliers d'exemples de la façon dont un humain accomplit une tâche, et il en extrait les règles sous-jacentes. Le chercheur Spandan Roy, professeur associé au Centre de recherche en robotique de l'IIIT Hyderabad, l'explique clairement : "Plus vous pouvez alimenter en données, plus vous intégrez de variété dans les processus, les scènes, les variations, meilleur sera le fonctionnement du robot."
Pour que cette approche fonctionne, il faut des données à la première personne, exactement ce que capturent les lunettes-caméras portées par les travailleurs indiens.
Le marché des robots humanoïdes est entré en 2025-2026 dans une phase de commercialisation réelle, après des décennies d'existence principalement dans les laboratoires de recherche. Le robot Figure 02, déployé à l'usine BMW de Spartanburg depuis mi-2025, accomplit des tâches réelles de production : insertion de composants, tri de pièces, transport de matériaux. L'Optimus Gen 2 de Tesla effectue des opérations d'assemblage dans les propres usines du constructeur. En 2026, douze plateformes humanoïdes commerciales sont disponibles à l'achat ou à la location, contre seulement trois en 2024.
Le marché mondial des robots humanoïdes devrait générer 1,8 milliard de dollars de revenus en 2026 et croître à un rythme de 95 % par an, avec une trajectoire vers 10 à 15 milliards de dollars d'ici 2030. Certaines projections plus agressives estiment le marché total de l'IA embarquée (embodied AI) à 165 milliards de dollars d'ici 2034.
La barrière principale à ce déploiement n'est plus le matériel ni le coût de fabrication, c'est la donnée. Pour apprendre une nouvelle tâche, un robot humanoïde à base d'apprentissage par imitation nécessite entre 50 et 200 démonstrations téléopérées. Une usine comptant 20 tâches distinctes a besoin de 1 000 à 4 000 démonstrations, soit des dizaines à des centaines d'heures de collecte de données.
Au-delà des robots physiques, les agents d'IA autonomes, capables d'agir dans le monde numérique et physique sans supervision humaine, nécessitent eux aussi des données d'entraînement sur les comportements humains complexes. Les modèles Vision-Langage-Action (VLA), qui intègrent la vision, la compréhension du langage et la prise de décision en un seul système, représentent selon le rapport State of Robotics 2026"le tournant architectural le plus significatif dans l'apprentissage robotique depuis l'émergence du deep learning". En 2026, onze déploiements commerciaux utilisent déjà ces modèles comme ossature principale.
La collecte de données gestuelles ne se limite pas aux ateliers textiles indiens. Elle touche un spectre extrêmement large d'activités professionnelles, dans des secteurs aussi variés que :
Industrie manufacturière : assemblage de pièces, soudure, contrôle qualité, manipulation de composants, des gestes précis et répétitifs qui constituent le cœur de l'entraînement des robots industriels.
Agriculture : taille, cueillette, tri, inspection des cultures, des tâches dont la variabilité (formes, couleurs, orientations différentes des fruits et légumes) est précisément ce qui rend leur automatisation difficile et précieuse à enseigner.
Santé : gestes chirurgicaux, soins infirmiers, manipulation du matériel médical, des données filmées permettent d'entraîner des robots chirurgicaux ou des assistants de soins.
Éducation : gestes pédagogiques, manipulation de matériel didactique, interactions en salle de classe, pour alimenter des tuteurs robotiques.
Commerce : mise en rayon, encaissement, gestion de stock, emballage, des tâches déjà partiellement automatisées dans les entrepôts Amazon, qui a déployé plus d'un million de robots dans son réseau logistique en 2025.
Transport et logistique : conduite, chargement, déchargement, triage de colis — des secteurs en première ligne de l'automatisation.
BTP : maçonnerie, plomberie, câblage électrique — des métiers en environnements non structurés, difficiles à automatiser mais de plus en plus dans le viseur des roboticiens.
Hôtellerie et restauration : cuisine, nettoyage, service en salle — parmi les premières cibles de Build AI et Objectways (plier des vêtements, préparer du café, faire la vaisselle).
Artisanat et maintenance industrielle : réparation, assemblage fin, diagnostic — des savoir-faire implicites que seule la captation vidéo permet de formaliser.
Administration et télécommunications : si les gestes physiques y sont moins centraux, la collecte de données s'étend aux interactions humain-ordinateur, aux processus de saisie, aux flux de communication.
Tous les métiers ne sont pas égaux face à la vague d'automatisation. Les économistes et chercheurs en robotique ont identifié plusieurs critères déterminants.
Les tâches physiques répétitives dans des environnements prévisibles sont les premières cibles. Selon McKinsey, les activités qui devraient connaître les plus fortes baisses d'ici 2030 aux États-Unis sont les services alimentaires, le service client, le support administratif et les postes de production, ces quatre catégories représentant 84 % des 12 millions de transitions professionnelles attendues. Plus globalement, d'ici 2030, des activités représentant jusqu'à 30 % des heures travaillées aux États-Unis pourraient être automatisées, et entre 15 et 30 % de la main-d'œuvre mondiale, soit 400 à 800 millions de travailleurs, pourrait être déplacée.
Au rang des plus exposés : les opérateurs de chaînes d'assemblage, les agents de saisie de données, les caissiers, les téléopérateurs, les préparateurs de commandes, les coursiers de livraison, certains assistants médicaux effectuant des tâches protocolaires.
À l'inverse, les métiers qui combinent complexité physique en environnements non structurés, interaction sociale fine et jugement contextuel résistent bien à l'automatisation à court terme. Les plombiers, électriciens, jardiniers, aides à domicile, enseignants, travailleurs sociaux, professionnels de la santé mentale, artisans spécialisés, tous opèrent dans des environnements suffisamment imprévisibles pour que l'IA peine encore à les remplacer.
Il est crucial de distinguer l'automatisation des tâches de la disparition des métiers. La plupart des emplois ne disparaîtront pas d'un seul bloc, ils seront reconfigurés. Un infirmier ne sera peut-être plus chargé de certaines tâches de surveillance ou de saisie de données, mais son rôle relationnel, son jugement clinique et sa capacité d'empathie resteront irremplaçables pour un temps encore. Un mécanicien automobile verra les diagnostics automatisés, mais son expertise tactile et contextuelle pour les cas complexes restera précieuse.
Ce que ces technologies apprennent à faire, c'est reproduire les gestes, pas le sens qu'un être humain y met.
La révolution des données d'entraînement ne génère pas que des craintes, elle crée aussi de nouveaux emplois, même si leur caractère durable et leur rémunération restent à questionner.
Collecteur de données (Data Collector) : comme les travailleurs indiens d'Objectways ou de Build AI, ces personnes réalisent des tâches physiques devant camera pour constituer des bases de données d'entraînement. Un travail aujourd'hui peu qualifié et peu rémunéré (2 à 3 dollars de l'heure), mais en croissance rapide.
Annotateur de données (Data Annotator) : ils étiquettent, classifient et structurent les données brutes pour les rendre exploitables par les algorithmes. Ce métier, déjà massif (le marché mondial de l'annotation de données était estimé à plusieurs milliards de dollars en 2024), est lui-même menacé par l'automatisation partielle.
Superviseur d'IA (AI Supervisor / AI Trainer) : ils supervisent le comportement des systèmes d'IA déployés, identifient les erreurs, les comportements inattendus et les biais, puis les corrigent. Un rôle pivot dans la chaîne de valeur humain-machine.
Auditeur d'algorithmes (Algorithm Auditor) : avec la montée en puissance des réglementations sur l'IA (comme l'AI Act européen entré en application en 2025-2026), ces experts évaluent les systèmes d'IA pour s'assurer qu'ils respectent les exigences légales, éthiques et de non-discrimination.
Formateur de modèles (Model Trainer / Prompt Engineer) : ils conçoivent les méthodes d'entraînement, choisissent les datasets, définissent les objectifs de performance et affinent les modèles en fonction des retours terrain.
Technicien de robots (Robot Technician) : avec la prolifération des robots humanoïdes dans les usines, entrepôts et hôpitaux, des milliers de techniciens seront nécessaires pour les installer, les maintenir et les réparer. Un métier hybride entre électronique, mécanique et informatique embarquée.
Ingénieur en IA incarnée (Embodied AI Engineer) : spécialiste de l'intégration entre perception, décision et action physique dans les systèmes robotiques. Un profil rare, très demandé, pour lequel les salaires ont explosé.
Expert en éthique numérique (AI Ethics Specialist) : peut-être le métier le plus symbolique de cette époque. Ces professionnels, souvent issus de la philosophie, du droit, des sciences sociales ou de l'informatique, contribuent à définir les règles du jeu dans le développement et le déploiement des systèmes d'IA.
La plateforme Instawork résume bien la vision industrielle de cette transition : à terme, les humains portent des caméras et enregistrent les tâches comme exemples, tandis que les robots effectuent le travail physique. "Les humains deviennent formateurs, les robots deviennent travailleurs."
Si la révolution des données gestuelles recèle un potentiel économique indéniable, elle soulève des questions éthiques sérieuses qui ne peuvent être balayées sous le tapis de la disruption technologique.
Le rapport de Scroll.in sur les travailleurs d'Egolab.AI est édifiant : des travailleurs d'une usine indienne ont reçu les lunettes-caméras et les ont portées pendant leurs shifts sans qu'on leur ait demandé leur consentement écrit ou verbal. Ce cas n'est pas isolé. La structure de pouvoir dans les usines, où refuser une directive du contremaître peut signifier perdre son emploi, rend le "consentement" largement théorique.
Filmer en continu depuis un point de vue à la première personne dans un environnement de travail signifie non seulement capturer les gestes du porteur, mais aussi filmer ses collègues, les espaces communs, potentiellement des conversations ou des documents. La frontière entre outil de collecte de données d'entraînement et outil de surveillance du travail est extrêmement poreuse.
Il y a quelque chose de profondément inconfortable dans le modèle économique émergent : des travailleurs pauvres dans les pays en développement fournissent, à bas prix, les données qui entraîneront des systèmes susceptibles de réduire la demande de main-d'œuvre peu qualifiée à l'échelle mondiale, y compris dans leurs propres pays. La chercheuse Aditi Surie, experte en travail numérique à l'Institut indien pour les établissements humains, le reconnaît sans ambages : les services de collecte de données "vont probablement augmenter" , mais à quel bénéfice pour les travailleurs eux-mêmes ?
Quand un geste capturé par une caméra devient une donnée qui alimente un système dont la valeur marchande se chiffre en milliards, quelle part de cette valeur revient au travailleur qui a produit la donnée ? Actuellement : quasi-nulle. Les travailleurs sont payés pour leur temps, non pour la valeur marchande des données qu'ils génèrent. Certains juristes et économistes commencent à plaider pour un modèle de "dividende de données", où les producteurs de données seraient rémunérés proportionnellement à leur contribution à la valeur créée.
Peut-on breveter un geste ? Un savoir-faire corporel accumulé pendant des décennies par un artisan ou un technicien appartient-il à quiconque ? Quand une entreprise capture ces mouvements et les intègre dans un modèle propriétaire, elle extrait une valeur que le travailleur a mis des années à construire — sans compensation ni reconnaissance. Cette question reste, en 2026, largement sans réponse juridique.
Les économistes et prospectivistes divergent sur l'ampleur et la rapidité des transformations à venir. Trois grandes familles de scénarios structurent le débat.
Dans ces scénarios, l'IA et la robotique agissent comme des amplificateurs des capacités humaines. Les tâches dangereuses, pénibles ou répétitives sont prises en charge par les machines, libérant les humains pour des activités à plus haute valeur ajoutée, créativité, relation, jugement complexe, soin. La demande globale de travail se maintient, mais sa composition se transforme radicalement. Selon le Forum économique mondial (Future of Jobs Report 2025), 59 % de la main-d'œuvre mondiale aura besoin d'une formation d'ici 2030, un défi immense, mais pas une catastrophe.
Dans les scénarios les plus sombres, la vitesse de l'automatisation dépasse celle de la reconversion. Les emplois détruits se concentrent dans les classes moyennes et populaires, tandis que les emplois créés requièrent des compétences rares que la majorité des travailleurs ne possèdent pas. Les bénéfices de la productivité s'accumulent chez les détenteurs de capital et les ingénieurs, accentuant les inégalités. Le WEF a formalisé ce risque dans son scénario "L'Ère du Déplacement" : une IA en progression exponentielle conjuguée à un manque de compétences adaptées dans la population active.
La plupart des experts s'accordent sur un scénario de transformation graduelle, sectorielle et géographiquement inégale. Les pays à hauts salaires et à forte automatisation (États-Unis, Allemagne, Japon) seront touchés différemment des pays à bas salaires comme l'Inde. L'Organisation internationale du travail estime que dans les pays à revenus faibles et intermédiaires, seulement 0,4 % des emplois sont directement menacés par l'IA générative, contre 5,5 % dans les pays à hauts revenus, un paradoxe qui s'explique par la structure économique différente de ces pays.
D'ici 2030 : L'automatisation s'accélère dans la logistique, le service client, la saisie de données et certaines lignes d'assemblage. Des millions de postes sont transformés plutôt que supprimés. Les robots humanoïdes restent coûteux et cantonnés à des environnements contrôlés. Le marché de l'annotation de données humaines continue de croître, offrant de l'emploi précaire à grande échelle.
D'ici 2040 : Les robots humanoïdes atteignent une maturité suffisante pour opérer dans des environnements non structurés (maisons, rues, cuisines variées). Les métiers de soins à domicile, de petite restauration et de maintenance commencent à être significativement impactés. La question de la redistribution des gains de productivité devient un enjeu politique majeur.
D'ici 2050 : Si les projections les plus audacieuses se réalisent, et elles sont loin d'être certaines, une proportion significative du travail physique répétitif pourrait être assurée par des machines. Le travail humain se serait concentré sur les activités relationnelles, créatives, spirituelles et politiques. Mais la transition aura exigé des décennies de politiques publiques volontaristes, de formation continue et de filets de sécurité sociale robustes.
Il y a quelque chose de philosophiquement vertigineux dans ce phénomène. Pendant des siècles, le travail humain a été défini par sa singularité irréductible : la façon unique dont un artisan pose son outil, dont une cuisinière tourne sa cuillère dans la marmite, dont un menuisier jauge l'épaisseur d'une planche du bout des doigts. Ces gestes étaient porteurs d'une intelligence implicite, transmise de maître à apprenti, résistant à toute codification formelle.
Aujourd'hui, des caméras les capturent. Des algorithmes les décomposent. Des robots les reproduisent.
Ce qui change fondamentalement avec cette révolution, c'est que l'IA n'apprend plus seulement à penser, elle apprend à faire. Elle n'empiète plus uniquement sur le territoire des avocats, des comptables et des journalistes ; elle s'aventure désormais sur celui des cuisiniers, des couturières, des techniciens, des soignants. La frontière entre "travail cognitif automatisable" et "travail physique protégé" s'efface progressivement.
Mais il serait réducteur de conclure à une catastrophe inéluctable. L'histoire des révolutions industrielles montre que des technologies qui semblaient condamner des pans entiers de l'activité humaine ont finalement généré de nouvelles formes de travail, souvent plus valorisantes. Ce qui est certain, en revanche, c'est que la transition ne se fera pas sans douleur, et que sa gestion, par les entreprises, les gouvernements et les sociétés, déterminera si cette révolution profite au plus grand nombre ou à une minorité.
La question n'est donc pas tant de savoir si les robots apprendront nos gestes, c'est déjà en cours, mais de décider qui bénéficiera de cet apprentissage, dans quelles conditions les travailleurs y contribueront, et comment les sociétés accompagneront ceux dont les savoir-faire auront servi de matière première à la prochaine révolution industrielle.
Dans une économie où chaque geste peut devenir une donnée d'entraînement, la valeur de l'humain ne se mesurera plus à sa capacité de répétition, mais à son irréductible humanité.
McKinsey Global Institute — "A New Future of Work: The Race to Deploy AI and Raise Skills in Europe and Beyond" — 27-30 % d'automatisation des heures de travail d'ici 2030.
Gray, M. & Suri, S. (2019) — Ghost Work: How to Stop Silicon Valley from Building a New Global Underclass — Houghton Mifflin Harcourt. Référence fondamentale sur le travail invisible de l'IA.
Claude Mythos, le modèle d'Anthropic dédié à la cybersécurité, redessine les rapports de force numériques. Architecture, enjeux et controverses expliqués.
Claude MythosProject GlasswingAnthropicAI Securityvulnérabilités zero-day IA