EBench Docs

Lancer l'évaluation

1. Démarrer le serveur

python ray_eval_server.py --host 0.0.0.0 --port 8087

Ou avec une installation locale d’Isaac Sim :

/isaac-sim/python.sh ray_eval_server.py --host 0.0.0.0 --port 8087

2. Soumettre une tâche

Depuis l’environnement client, soumettez une tâche de benchmark :

gmp submit ebench/generalist/test_mini --run_id my_first_run

Paramètres de tâche disponibles :

Paramètre de tâche	Description
`ebench/mobile_manip/<split>`	Pick-and-place avec base mobile
`ebench/table_top_manip/<split>`	Tâches de manipulation fine sur table
`ebench/generalist/<split>`	Tâches mixtes toutes catégories

Splits : val_train, val_unseen, test_mini

Exemples :

Soumettre toutes les tâches en une seule fois : gmp submit ebench --run_id full_run.
Soumettre toutes les tâches d’évaluation de mobile_manip : gmp submit ebench/mobile_manip/test_mini --run_id evaluate_mobile_manip.
Soumettre la tâche d’évaluation collect_coffee_beans dans table_top_manip : gmp submit ebench/table_top_manip/test_mini/collect_coffee_beans --run_id evaluate_only_one_task.

3. Connecter votre modèle

Vérification rapide de la connectivité avec le modèle de référence intégré :

gmp eval -a r5a -g lift2 --worker_ids 0

Pour intégrer votre propre modèle, consultez Intégrer votre modèle.

4. Consulter les résultats

gmp status

Les résultats sont enregistrés dans saved/eval_results/<task>/<run_id>/.

Lorsque le serveur et le client s’exécutent sur des machines différentes, ajoutez --host <ip> --port <port> à toutes les commandes gmp. Consultez la référence GMP CLI pour la liste complète des options.