Apple dévoile une nouvelle méthode d’entraînement pour robots humanoïdes
- Apple a dévoilé une méthode innovante de formation des robots humanoïdes appelée PH2d.
- Cette méthode combine les démonstrations humaines et robotiques pour améliorer l'efficacité et réduire les coûts.
- Les instructeurs humains ont été utilisés pour exécuter des actions manuelles et enregistrer des instructions audio.
- Le modèle HAT, capable de traiter les données humaines physiques, a montré une performance supérieure dans certaines tâches.

Apple a récemment publié un document de recherche sur une méthode innovante de formation des robots humanoïdes, appelée « PH2d ». Cette approche combine les démonstrations humaines et robotiques pour améliorer l’efficacité et réduire les coûts liés à la formation.
Le mercredi 25 octobre 2023, Apple a présenté son étude après avoir révélé ses modèles Matrix3D et Streambridge AI. Le document, intitulé « Politique humanoïde ~ Politique humaine », critique les méthodes traditionnelles de formation qui reposent uniquement sur des démonstrateurs robotiques, un processus jugé coûteux et intensif en main-d’œuvre. Apple propose ainsi d’intégrer des instructeurs humains dans le processus d’apprentissage des robots.
La recherche souligne que l’utilisation conjointe d’instructeurs humains permettrait de diminuer les dépenses associées à la collecte de données téléopératoires. Les chercheurs ont modifié des produits existants, notamment l’Apple Vision Pro, qui utilise seulement sa caméra inférieure gauche pour l’observation visuelle. Arkit, application d’Apple, a également été employée pour accéder aux poses tridimensionnelles de tête et de main. De plus, un casque Meta Quest modifié avec mini-caméras stéréo a offert une solution économique pour cette formation.
Les instructeurs humains ont été chargés d’exécuter diverses actions manuelles telles que saisir ou soulever des objets tout en versant des liquides. Ces activités étaient accompagnées d’instructions audio enregistrées puis ralenties afin qu’elles puissent servir au développement du matériel d’entraînement destiné aux robots.
L’étude présente également le modèle « transformateur d’action humain-humanoïde » (HAT), capable de traiter simultanément les données issues tant des démonstrateurs humains que robotiques sous le nom collectif « données humaines physiques » ou PH2d. Selon ce modèle, la stratégie combinée proposée améliore significativement la généralisation et la robustesse par rapport aux techniques basées exclusivement sur les démos robotiques.
Les premiers résultats confirment l’efficacité de cette méthode : elle garantit une performance supérieure dans certaines tâches spécifiques par rapport à celles utilisant uniquement des manifestants robotiques. Cependant, cette supériorité est limitée à certaines actions comme la saisie verticale.
À terme, Apple prévoit probablement d’appliquer cette technique à ses futurs produits. Bien qu’elle n’ait jusqu’à présent montré qu’un prototype fictif d’une lampe robotique reliquat mobile destiné aux consommateurs est actuellement en phase développementale et pourrait réaliser diverses tâches simples dans un avenir proche.