
L'équipe de robotique de DeepMind , la société d'intelligence artificielle de Google , a présenté trois nouveaux développements technologiques qui promettent d'améliorer la rapidité, l'efficacité et surtout la sécurité dans la prise de décision des robots dans les environnements naturels et de bureau.
Il s'agit des systèmes AutoRT , SARA-RT et RT-Trajectory , qui sont proposés comme une solution qui cherche à rapprocher un avenir dans lequel les machines pourront comprendre et exécuter facilement des commandes complexes. Autrement dit, ils sont plus intelligents et autonomes .
Bien que Google n'ignore pas le risque que représente le fait d'avoir des robots beaucoup plus performants, c'est pourquoi il inclut un guide de sécurité appelé "Robot Constitution" , qui utilise comme principe les célèbres lois d'Isaac Asimov , pour garantir qu'ils n'essaient jamais de nuire à un être humain. .

Rappelons qu'elles sont constituées d'un ensemble de trois règles développées par l'écrivain de science-fiction russe depuis 1942, qui indiquent que :
- Un robot ne fera pas de mal à un être humain et ne permettra pas non plus, par son inaction, qu'un être humain subisse un danger.
- Un robot doit se conformer aux ordres donnés par les êtres humains, à l'exception de ceux qui entrent en conflit avec la première loi.
- Un robot doit protéger sa propre existence dans la mesure où cette protection n'entre pas en conflit avec la première ou la deuxième loi.
AutoRT, SARA-RT, RT-Trajectory, des machines qui comprennent et s'exécutent de manière autonome

Pour ses robots, le système de collecte de données de Google, AutoRT, peut utiliser un modèle de langage visuel (VLM) et un grand modèle de langage (LLM) travaillant main dans la main pour comprendre son environnement, s'adapter à des environnements inconnus et décider des tâches appropriées.
Et la Robot Constitution propose un ensemble de « directives axées sur la sécurité » qui demandent au LLM d'éviter de choisir des tâches impliquant des humains, des animaux, des objets pointus et même des appareils électriques.
De plus, DeepMind a programmé ses robots pour qu'ils s'arrêtent automatiquement si la force exercée sur leurs articulations dépasse un certain seuil et a inclus un coupe-circuit physique que les opérateurs humains peuvent utiliser pour les désactiver.
Analyse approfondie de la façon dont les robots apprennent

AutoRT est un système basé sur l'utilisation de grands modèles de base, tels qu'un modèle de langage visuel (VLM) et un modèle de contrôle de robot (RT-1 ou RT-2), qui permet aux robots de collecter des données issues d'entraînements dans divers environnements.
Et en orchestrant simultanément plusieurs robots, plus de 77 000 tests robotiques ont été collectés dans des centaines de bureaux sur sept mois.
De même, l'approche SARA-RT a optimisé l'efficacité et la vitesse des modèles RT, permettant d'obtenir des modèles jusqu'à 10,6 % plus précis et 14 % plus rapides que les précédents.
D'autre part, RT-Trajectory contribue à l'entraînement des robots avec un taux de réussite de 63 % sur des tâches inédites, une amélioration significative par rapport aux 29 % précédents.

De plus, les protocoles de sécurité représentent un élément crucial d' AutoRT , car toute intégration de robots dans des environnements humains nécessite un développement responsable.
Les mesures de sécurité, notamment les normes inspirées d'Asimov et les systèmes d'arrêt automatique en cas de forces excessives, garantissent que la collecte de données et les tests ne compromettent pas le bien-être humain ou animal.
Pour sa part, SARA-RT améliore considérablement la capacité des transformateurs robotiques en réduisant la complexité informatique du quadratique au linéaire, tout en maintenant la qualité du traitement.
Tandis que RT-Trajectory contribue à la capacité de généraliser les mouvements du robot, permettant une meilleure compréhension des tâches physiques réelles à partir de démonstrations, qu'elles proviennent d'humains ou de représentations visuelles telles que des vidéos de formation.
Implémentation et test de la technologie robotique

Google a déployé une flotte de 53 robots AutoRT dans quatre immeubles de bureaux pendant sept mois, réalisant plus de 77 000 tâches de test , avec des robots pilotés à distance et fonctionnant également de manière totalement autonome.
Ces machines, qui intègrent une caméra, un bras robotique et une base mobile, utilisent le VLM pour analyser leur environnement. Par la suite, le LLM propose des actions potentielles, fonctionnant comme une sorte de centre de décision pour choisir la tâche la plus appropriée.