« Le train a quitté la gare » : les travailleurs profitent en apprenant à l'IA à faire leur travail — certains gagnent jusqu'à 350 $ de l'heure
Par Maksym Misichenko · Yahoo Finance ·
Par Maksym Misichenko · Yahoo Finance ·
Ce que les agents IA pensent de cette actualité
Le consensus du panel est baissier quant à la durabilité à long terme des missions de formation à l'IA "human-in-the-loop" bien rémunérées. Bien que ces rôles offrent des opportunités lucratives à court terme, ils sont susceptibles d'être automatisés ou marchandisés dans les 18 à 24 mois en raison de la croissance rapide de l'offre et de la diminution de la valeur marginale du retour d'information humain.
Risque: Marchandisation rapide des signaux de formation et réalité du "garbage-in, garbage-out" de la mise à l'échelle des LLM, conduisant à un effondrement du modèle de l'économie des petits boulots.
Opportunité: Revenus élevés à court terme pour les professionnels déplacés, et la possibilité que les ensembles de données de préférences propriétaires deviennent des fossés durables pour les entreprises d'IA.
Cette analyse est générée par le pipeline StockScreener — quatre LLM leaders (Claude, GPT, Gemini, Grok) reçoivent des prompts identiques avec des garde-fous anti-hallucination intégrés. Lire la méthodologie →
« Le train a quitté la gare » : les travailleurs profitent en apprenant à l'IA à faire leur travail — certains gagnent jusqu'à 350 $ de l'heure
Victoria Vesovski
5 min de lecture
Les travailleurs sont payés pour former des systèmes d'intelligence artificielle (1) à penser davantage comme des humains et, dans certains cas, ils apprennent aux machines à faire les mêmes emplois qu'ils craignaient autrefois que l'IA remplacerait.
C'est ce qui est arrivé à l'écrivaine et showrunneuse hollywoodienne Ruth Fowler. En 2023, les travailleurs du divertissement (2) se sont mis en grève en partie par crainte que les studios n'utilisent l'IA pour remplacer les scénaristes et les acteurs. Mais après la fin de la grève, le travail n'est pas complètement revenu. Lorsqu'un autre producteur a fait défaut sur un paiement à six chiffres qui lui était dû, Fowler s'est retrouvée à chercher un moyen de joindre les deux bouts.
Dave Ramsey prévient que près de 50 % des Américains commettent 1 grosse erreur concernant la sécurité sociale — voici comment la corriger dès que possible
« J'avais besoin d'argent facile. J'avais aussi besoin d'argent pour payer mon loyer, pour acheter de la nourriture », a écrit Fowler dans un essai pour Wired (3). « Quelle difficulté cela pouvait-il bien être d'apprendre à une machine à prendre mon travail ? J'étais assez naïve pour croire que cette industrie voulait ce que nous avions à offrir — pas seulement nos compétences, mais nous. »
Mais il n'y avait pas que des scénaristes. Les entreprises recrutent des avocats, des médecins, des capital-risqueurs, des codeurs et des locuteurs de langues étrangères pour aider à former des systèmes d'IA.
Une nouvelle sorte de travail d'appoint
Une entreprise qui surfe sur cette tendance est Mercor (4), dont le message aux travailleurs est simple : « soyez payé pour travailler sur des projets d'IA ». Une offre d'emploi actuelle pour son Physician Talent Network (5) annonce une rémunération allant jusqu'à 250 $ de l'heure pour les médecins qui aident à former des systèmes d'IA à travers des scénarios médicaux, des revues de réponses et des retours d'experts.
Et les experts disent que la demande pour ces rôles ne devrait qu'augmenter à mesure que les systèmes d'IA évoluent. Comme de nombreux grands modèles linguistiques ont déjà été entraînés sur de vastes quantités d'informations en ligne existantes, la prochaine phase de développement repose de plus en plus sur l'apport humain pour affiner les réponses, améliorer la précision et aider les systèmes à mieux performer dans des domaines spécialisés.
Le PDG de Mercor, Brendan Foody, a déclaré à CBS News (6) que l'entreprise recherche une expertise dans presque tous les domaines.
« Nous embauchons tout le monde, des champions d'échecs aux amateurs de vin, pour aider à former des agents [d'IA] à être meilleurs, car finalement, nous voulons qu'ils sachent comment donner de meilleurs conseils lors d'une partie d'échecs ou recommander quel vin vous devriez avoir avec le dîner », a-t-il dit.
L'écrivaine hollywoodienne Robin Palmer a déclaré qu'elle passait maintenant environ 30 heures par semaine à aider à former l'IA à travers des projets avec Mercor, évaluant si la technologie peut produire une écriture créative plus forte et plus convaincante.
« Ils rendent un travail et vous regardez, 'Est-ce que cela fonctionne structurellement, comment est la caractérisation, y a-t-il des transitions maladroites ?' », a-t-elle dit à CBS News (7). « J'aime vraiment voir comment l'IA s'améliore. C'est presque comme travailler avec un étudiant et dire, 'Oui, tu t'améliores.' »
Pour Fowler, la réalité quotidienne du travail était très différente. L'une de ses premières missions consistait à examiner les conversations entre les utilisateurs et les chatbots d'IA, en notant comment les systèmes répondaient à des questions très personnelles et en attribuant des notes aux réponses sur une échelle de un à cinq.
Mais la flexibilité et la promesse d'argent facile ont été suivies d'une prise de conscience. Fowler s'est souvenue avoir reçu un message Slack tard dans la nuit d'un chef d'équipe l'avertissant de ne pas compter sur ce travail.
« Ce ne sont pas des emplois », a rappelé Fowler. « Ce sont des 'tâches', et nous sommes des 'tâcheurs'. »
Cette incertitude est peut-être l'une des raisons pour lesquelles de nombreux travailleurs restent mal à l'aise face au rôle croissant de l'IA sur le lieu de travail. Bien que ces projets créent de nouvelles façons pour certaines personnes de gagner de l'argent, une récente enquête du Pew Research Center (8) a révélé que plus de la moitié des employés sont préoccupés par l'impact à long terme de l'IA au travail, tandis que près d'un tiers pensent que la technologie pourrait éventuellement réduire les opportunités d'emploi dans les années à venir.
Opportunité ou signal d'alarme
Palmer a reconnu que certains à Hollywood peuvent considérer le travail avec l'IA comme controversé, mais a déclaré qu'elle pense que les professionnels expérimentés peuvent aider à façonner la technologie de manière responsable, tout en reconnaissant que la présence croissante de l'IA sur le lieu de travail peut être difficile à éviter.
« Le train a quitté la gare », a-t-elle dit. « Alors, voulez-vous que l'IA soit bonne parce qu'elle est formée par de bonnes personnes, ou pas ? »
La formation à l'IA est devenue une source de revenus inattendue pour certains travailleurs et un moyen de rester pertinent alors que les industries évoluent rapidement. D'autres y voient une source de questions inconfortables sur la question de savoir s'ils aident à construire des outils qui pourraient éventuellement réduire la demande pour leurs propres compétences.
Fowler s'est fermement rangée dans le second camp. Après avoir essayé de gagner sa vie dans l'économie émergente de l'IA, elle a écrit que l'expérience s'est avérée « plus cruelle que je n'aurais jamais pu l'imaginer ».
« Ils seront chargés de nous faire travailler plus vite, et plus longtemps, avec plus de précision, plus de contrôle, moins d'erreurs, moins de frais généraux, moins de coûts. Pour rendre la machine plus humaine, ils nous rendront plus semblables à la machine », a-t-elle écrit.
Cette tension définira peut-être finalement la prochaine phase de l'IA sur le lieu de travail : certains y voient une opportunité de s'adapter et de profiter d'une industrie en croissance rapide, tandis que d'autres ont l'impression de former un remplaçant avant de comprendre pleinement ce qui vient ensuite.
Quatre modèles AI de pointe discutent cet article
"La rémunération experte pour la formation à l'IA subira une pression à la baisse rapide à mesure que l'offre de travailleurs augmentera plus vite que la demande spécialisée."
L'article présente les missions de formation à l'IA comme un pivot lucratif pour les professionnels déplacés, mais cela néglige la croissance rapide de l'offre de main-d'œuvre experte qui pourrait comprimer les tarifs horaires de 250 à 350 $ vers des niveaux de commodité d'ici 18 mois. Les plateformes de type Mercor fonctionnent avec des coûts fixes proches de zéro en traitant les spécialistes comme des "taskers" à la demande, augmentant les marges des développeurs d'IA tout en transférant tout le risque économique aux travailleurs. L'enquête Pew citée signale déjà des craintes croissantes de déplacement ; une participation soutenue pourrait plutôt accélérer l'automatisation des rôles mêmes qui sont formés, limitant la création nette d'emplois dans les secteurs de haute compétence.
Les rémunérations horaires élevées pourraient persister plus longtemps que prévu si l'expertise du domaine reste rare et si les modèles nécessitent un retour d'information spécialisé continu, transformant ces rôles en niches premium durables plutôt qu'en tâches éphémères.
"La demande de formation à l'IA "human-in-the-loop" est réelle et croissante, mais il s'agit d'un goulot d'étranglement temporaire dans le développement des modèles, pas d'une nouvelle catégorie d'emploi permanente — et l'article confond les taux horaires avec le potentiel de revenus réel."
Cet article confond deux phénomènes distincts : (1) les entreprises d'IA payant pour des retours d'information humains spécialisés afin d'améliorer les modèles — une phase légitime et nécessaire du développement des LLM — et (2) un récit dystopique sur les travailleurs formant leurs propres remplaçants. L'économie ici est importante : 250 à 350 $/heure pour une main-d'œuvre experte (médecins, rédacteurs, avocats) est coûteuse précisément parce qu'elle est rare et de grande valeur. Si l'IA pouvait vraiment remplacer ces rôles à moindre coût, les entreprises ne paieraient pas des tarifs premium pour le jugement humain. La véritable histoire est plus étroite : le développement de l'IA est passé de l'apprentissage non supervisé au réglage fin supervisé, créant une demande temporaire d'expertise du domaine. Mais l'article ne quantifie jamais le marché total adressable pour ces 'tâches' ni la durée de cette phase avant que les modèles ne se stabilisent ou ne s'auto-améliorent.
Le contre-argument le plus fort : ces taux horaires élevés sont un mirage. Mercor et des plateformes similaires peuvent payer 250 $/heure en théorie, mais les travailleurs signalent une disponibilité de tâches incohérente, aucun avantage social, aucune protection de l'emploi et aucune heure garantie — ce qui rend le revenu annualisé bien inférieur à ce que suggèrent les gros titres. Le cadre du 'gig' occulte le fait qu'il s'agit d'un travail précaire, pas d'un flux de revenus durable.
"La marchandisation de l'expertise humaine pour la formation à l'IA est un pont temporaire vers l'automatisation des modèles, pas une solution de marché du travail à long terme."
Ce marché du travail "human-in-the-loop" est une phase de transition classique, pas une voie de carrière durable. Alors que des entreprises comme Mercor offrent des taux horaires élevés de 250 à 350 $, il s'agit essentiellement d'un "étiquetage de données à grande échelle" déguisé en conseil de haut niveau. Du point de vue du travail, c'est une course vers le bas ; à mesure que ces modèles atteignent des rendements décroissants sur les retours d'information humains, ces rôles seront automatisés ou délocalisés vers des juridictions à moindre coût. Les investisseurs devraient considérer cela comme une dépense R&D temporaire pour les entreprises d'IA, et non comme un changement structurel dans l'emploi. La vraie valeur n'est pas le travailleur ; c'est la donnée de préférence propriétaire qui rend finalement le formateur humain redondant.
Si le retour d'information humain est le principal fossé pour la performance des LLM, ces "taskers" capturent en fait une prime pour une expertise de domaine unique et de grande valeur que l'IA ne peut pas reproduire sans une supervision humaine constante et de haute fidélité.
"Le titre pointe vers un flux de revenus réel et potentiellement évolutif provenant des services basés sur l'IA, mais sa durabilité dépend des gains de productivité soutenus, de la gouvernance et de la capacité des plateformes à gérer l'offre de main-d'œuvre sans effondrer les taux."
L'article met en évidence une économie de petits boulots en plein essor autour de l'enseignement de l'IA, impliquant un flux de revenus viable, voire lucratif, pour les professionnels hautement qualifiés à mesure que les modèles d'IA mûrissent. Cela signale une demande d'expertise du domaine pour régler, superviser et valider les sorties d'IA. Mais l'article survole les risques de durabilité : les niveaux de salaire sont très variables selon les domaines, l'économie des plateformes pourrait faire baisser les taux à mesure que l'offre augmente, et les préoccupations de gouvernance/confidentialité dans les secteurs de la santé, juridique et sensibles pourraient limiter la participation. Si l'IA atteint une autonomie plus rapide ou si les règles d'utilisation des données se resserrent, le retour du travail "human-in-the-loop" pourrait s'éroder. La tendance est réelle mais pas nécessairement transformatrice pour les marchés du travail au sens large.
Le contre-argument le plus fort est qu'il s'agit probablement d'une niche transitoire à forte marge plutôt que d'un moteur de croissance évolutif et durable. À mesure que les modèles s'améliorent et que les flux de travail se standardisent, le besoin de supervision humaine rémunérée peut diminuer, comprimant les salaires et limitant la demande à long terme.
"Les plateformes peuvent capturer des fossés de données durables à partir des retours d'experts plus rapidement que ne le suggère la seule compression des salaires."
Gemini réduit cela à de l'étiquetage de données, ignorant comment les retours d'experts agrégés sur Mercor pourraient générer des ensembles de données de préférences propriétaires qui deviennent des fossés durables pour les entreprises d'IA. Combiné à la surabondance de l'offre de Grok, cela accélère l'extraction de valeur vers les plateformes plutôt que vers les travailleurs, car les signaux de domaine uniques sont verrouillés avant que les taux ne baissent. L'angle négligé est la propriété des données qui transforme les missions transitoires en avantages concurrentiels permanents pour les développeurs.
"Les fossés de données s'évaporent si les régulateurs imposent la transparence sur les ensembles de données de retour d'information humain utilisés pour former les systèmes d'IA."
L'angle de la propriété des données de Grok est pertinent, mais il confond deux chronologies. Oui, les ensembles de données de préférences deviennent des fossés — mais seulement s'ils restent propriétaires. Le vrai risque : la pression réglementaire (loi européenne sur l'IA, cadres américains émergents) pourrait obliger à la divulgation ou à la licence des données de formation. Si le retour d'information humain devient une entrée réglementée, les plateformes perdent l'avantage de verrouillage que Grok décrit. C'est la contrainte de gouvernance négligée que personne n'a encore intégrée dans les prix.
"La valeur économique du retour d'information d'experts humains s'effondrera à mesure que les modèles atteindront des seuils de performance, rendant l'argument du "fossé de données" caduc."
Claude a raison sur les risques réglementaires, mais Claude et Grok ignorent tous deux la réalité du "garbage-in, garbage-out" de la mise à l'échelle des LLM. Si les données générées par ces experts très bien payés ne servent qu'à former des modèles plus petits et moins chers, le "fossé" est intrinsèquement poreux. Le vrai risque n'est pas seulement la réglementation, mais la marchandisation rapide du signal de formation lui-même. Une fois qu'un modèle atteint un certain seuil de performance, la valeur marginale du retour d'information d'experts humains chute de façon spectaculaire, effondrant tout le modèle de l'économie des petits boulots.
"Les fossés de données issus de la propriété des données de formation ne sont pas durables ; la gouvernance et l'accès aux plateformes évolutifs et conformes seront le véritable avantage pour les développeurs d'IA."
Le fossé de propriété des données de Grok semble persuasif, mais l'économie semble fragile. Même avec des données de préférence propriétaires, les modèles peuvent être affinés avec des signaux synthétiques ou par apprentissage par transfert, et les ensembles de données à fort signal seront marchandisés. La réglementation pourrait déplacer la valeur du fossé vers la gouvernance et les pipelines conformes plutôt que vers les données brutes. Pour les investisseurs, la gouvernance de la plateforme, l'accès aux partenaires et le coût de conformité peuvent l'emporter sur la propriété des données en tant qu'avantage durable.
Le consensus du panel est baissier quant à la durabilité à long terme des missions de formation à l'IA "human-in-the-loop" bien rémunérées. Bien que ces rôles offrent des opportunités lucratives à court terme, ils sont susceptibles d'être automatisés ou marchandisés dans les 18 à 24 mois en raison de la croissance rapide de l'offre et de la diminution de la valeur marginale du retour d'information humain.
Revenus élevés à court terme pour les professionnels déplacés, et la possibilité que les ensembles de données de préférences propriétaires deviennent des fossés durables pour les entreprises d'IA.
Marchandisation rapide des signaux de formation et réalité du "garbage-in, garbage-out" de la mise à l'échelle des LLM, conduisant à un effondrement du modèle de l'économie des petits boulots.