AgiBot vient de réaliser ce que de nombreux chercheurs en robotique recherchent depuis des années : le premier déploiement dans le monde réel de apprentissage par renforcement (RL) en robotique industrielle. En collaboration avec Technologie Longcheerle nouveau de l’entreprise Apprentissage par renforcement dans le monde réel (RW-RL) Le système est passé des démonstrations en laboratoire à une ligne pilote fonctionnelle – et cela pourrait complètement changer la façon dont les usines forment et adaptent leurs robots.
Crédit photograph : avec l’aimable autorisation d’AgiBot
Pourquoi c’est essential
Les robots industriels traditionnels sont excellents pour les travaux répétitifs mais rigides lorsque les circumstances changent. Si la conception du produit, la place des pièces ou même l’éclairage diffèrent légèrement, les ingénieurs doivent arrêter la manufacturing, ajuster les luminaires et réécrire le code – un processus qui peut prendre des jours, voire des semaines.
L’apprentissage par renforcement renverse cette logique. Au lieu de suivre des directions statiques, les robots apprendre en faisantoptimisant leurs performances en fonction des résultats. Le défi a toujours été que ce processus était trop lent et imprévisible pour les usines du monde réel – jusqu’à présent.
La nouvelle plateforme RL d’AgiBot permet aux robots de acquérir de nouvelles compétences en quelques minutes et s’adaptent automatiquement aux variations telles que les changements de tolérance ou les différences d’alignement. L’entreprise affirme que le système atteint un Taux d’achèvement des tâches de 100 % en fonctionnement prolongé, sans dégradation des performances.
Plus clever, plus rapide et beaucoup plus versatile
Crédit photograph : avec l’aimable autorisation d’AgiBot
La pile d’apprentissage par renforcement dans le monde réel d’AgiBot répond à trois problèmes fondamentaux qui limitent l’automatisation des usines depuis des décennies :
-
Déploiement rapide : Les robots acquièrent de nouvelles tâches en quelques dizaines de minutes plutôt qu’en quelques semaines.
-
Haute adaptabilité : Le système se corrige automatiquement des erreurs de placement des pièces et des perturbations externes.
-
Reconfiguration versatile : Les modifications de la chaîne de manufacturing ne nécessitent qu’une configuration minimale et aucun montage personnalisé.
Cette approche pourrait considérablement améliorer fabrication versatileoù les lignes de manufacturing changent souvent de modèle ou de variante de produit. Dans les secteurs de l’électronique grand public et des composants cars – secteurs réputés pour leurs cycles de produits courts – la possibilité de reconfigurer l’automatisation à la volée pourrait se traduire par une mise sur le marché plus rapide et une réduction des coûts d’intégration.
Le système RL d’AgiBot relie également la notion, la décision et le contrôle des mouvements dans une boucle unifiée. Une fois formé, le robotic fonctionne de manière autonome et ne se recycle que lorsque des changements dans l’environnement ou dans le produit se produisent. L’entreprise décrit cela comme une étape vers « auto-évolutif » systèmes industriels.
De la recherche à la réalité
Cette réalisation s’appuie sur des années de recherche menées par Dr Jianlan Luoscientifique en chef d’AgiBot. Son équipe avait déjà démontré que l’apprentissage par renforcement pouvait permettre d’obtenir des résultats stables et réels sur des robots physiques. La model industrielle étend désormais ce travail aux environnements de manufacturing, combinant des algorithmes robustes avec un contrôle de précision et un matériel de haute fiabilité.
Selon AgiBot, le système était validé dans des circumstances proches de la manufacturingfonctionnant en continu sur une ligne de fabrication Longcheer en direct. Cela boucle la boucle entre la théorie de l’IA et la pratique industrielle – un fossé qui a longtemps limité l’adoption commerciale de l’apprentissage par renforcement.
Un bond en avant pour l’usine du futur

Dans le cadre du projet pilote Longcheer, des robots formés par RL ont exécuté des tâches d’assemblage de précision tout en s’adaptant de manière dynamique aux changements environnementaux, notamment les vibrations, les fluctuations de température et le désalignement des pièces. Lorsque le modèle de manufacturing a changé, le robotic s’est simplement recyclé en quelques minutes et a repris son fonctionnement à pleine vitesse – pas de nouveau code, pas de réglage manuel.
AgiBot et Longue joie prévoient désormais d’étendre la technologie à de nouveaux domaines de fabrication, dans le however d’offrir systèmes robotiques modulaires à déploiement rapide suitable avec les installations industrielles existantes.
Matériel et écosystème
AgiBot n’a pas révélé quelle plate-forme de calcul alimente son système d’apprentissage par renforcement, mais étant donné que son AgiBot G2 le robotic proceed à fonctionner Jetson Thor T5000 de NVIDIA – un 2070 TFLOPS (FP4) module conçu pour l’IA incarnée en temps réel – il est possible que le même GPUL’structure basée sur les applied sciences sous-tend cette nouvelle étape. Le matériel du G2 prend déjà en cost l’exécution locale de grands modèles de langage de imaginative and prescient et de planification avec une latence inférieure à 10 ms, ce qui en fait une base idéale pour l’apprentissage et le contrôle en temps réel.
Cette dernière avancée en matière de RL s’inscrit également dans la feuille de route plus giant de l’IA incarnée d’AgiBot, qui comprend LienCraftune plate-forme sans code qui transforme les vidéos de mouvements humains en actions de robots, et sa famille croissante de robots à utilization général couvrant des rôles dans l’industrie, les companies et le divertissement.
A ma connaissance, Déploiement d’apprentissage par renforcement dans le monde réel d’AgiBot est plus qu’une étape method : cela signale que l’IA incarnée quitte enfin le laboratoire et entre dans l’usine. Alors que L’intrinsèque de Google et Le laboratoire Isaac de NVIDIA développent des cadres d’apprentissage par renforcement depuis des années, AgiBot semble être le premier à déployer un système RL entièrement opérationnel sur une ligne de manufacturing en direct.
Si cette approche se généralise, elle pourrait marquer le début du usine adaptative èreoù les robots apprennent, s’ajustent et optimisent en permanence sans interrompre la manufacturing.
Déposé dans . En savoir plus sur Nvidia.




