Le réarrangement d’objets est une tâche canonique pour l’IA incarnée. Les tâches les plus difficiles sont les tâches de manipulation mobile à long horizon, qui exigent à la fois des capacités de navigation et de manipulation. Les tâches complexes doivent souvent être décomposées en un ensemble de sous-tâches.
Un article récent sur arXiv.org étudie comment formuler des compétences de manipulation mobile. Les chercheurs proposent de remplacer les compétences de manipulation stationnaires par des homologues mobiles, qui permettent à la base de bouger lorsque la manipulation est entreprise. Il est démontré que les compétences mobiles sont plus résistantes aux erreurs aggravantes dans l’enchaînement des compétences.
De plus, les chercheurs étudient comment traduire le début des compétences de manipulation en récompense de navigation. Ils proposent une récompense de navigation par région, qui affiche de meilleures performances et une généralisabilité plus forte que ses homologues. Le pipeline de manipulation mobile multi-compétences amélioré atteint des performances supérieures à celles des lignes de base.
Nous étudions une approche modulaire pour aborder les tâches de manipulation mobile à long horizon pour le réarrangement d’objets, qui décompose une tâche complète en une séquence de sous-tâches. Pour s’attaquer à l’ensemble de la tâche, le travail préalable enchaîne plusieurs compétences de manipulation stationnaire avec une compétence de navigation point-but, qui sont apprises individuellement sur les sous-tâches. Bien que plus efficace que les politiques RL monolithiques de bout en bout, ce cadre souffre d’erreurs aggravées dans l’enchaînement des compétences, par exemple, naviguer vers un mauvais emplacement où une compétence de manipulation stationnaire ne peut pas atteindre sa cible à manipuler. À cette fin, nous proposons que les compétences de manipulation incluent la mobilité pour avoir la flexibilité d’interagir avec l’objet cible à partir de plusieurs emplacements et en même temps, la compétence de navigation pourrait avoir plusieurs points finaux qui conduisent à une manipulation réussie. Nous opérationnalisons ces idées en mettant en œuvre des compétences de manipulation mobiles plutôt que stationnaires et en formant une compétence de navigation entraînée avec un objectif de région au lieu d’un objectif de point. Nous évaluons notre méthode de manipulation mobile multi-compétences M3 sur 3 tâches difficiles de manipulation mobile à long horizon dans le Home Assistant Benchmark (HAB), et montrons des performances supérieures par rapport aux lignes de base.
Article de recherche: Gu, J., Singh Chaplot, D., Su, H. et Malik, J., « Manipulation mobile multi-compétences pour le réarrangement d’objets », 2022. Lien : https://arxiv.org/abs/2209.02778
Site du projet: https://sites.google.com/view/hab-m3