EBench Docs
Lancer l'évaluation
1. Démarrer le serveur
Section intitulée « 1. Démarrer le serveur »python ray_eval_server.py --host 0.0.0.0 --port 8087Ou avec une installation locale d’Isaac Sim :
/isaac-sim/python.sh ray_eval_server.py --host 0.0.0.0 --port 80872. Soumettre une tâche
Section intitulée « 2. Soumettre une tâche »Depuis l’environnement client, soumettez une tâche de benchmark :
gmp submit ebench/mobile_manip/test --run_id my_first_runParamètres de tâche disponibles :
| Paramètre de tâche | Description |
|---|---|
ebench/mobile_manip/<split> | Pick-and-place avec base mobile |
ebench/table_top_manip/<split> | Tâches de manipulation fine sur table |
ebench/generalist/<split> | Tâches mixtes toutes catégories |
Splits : val_train, val_unseen, test
Soumettez toutes les tâches en une seule fois avec gmp submit ebench --run_id full_run.
3. Connecter votre modèle
Section intitulée « 3. Connecter votre modèle »Vérification rapide de la connectivité avec le modèle de référence intégré :
gmp eval -a r5a -g lift2 --worker_ids 0Pour intégrer votre propre modèle, consultez Intégrer votre modèle.
4. Consulter les résultats
Section intitulée « 4. Consulter les résultats »gmp statusLes résultats sont enregistrés dans saved/eval_results/<task>/<run_id>/.
Lorsque le serveur et le client s’exécutent sur des machines différentes, ajoutez
--host <ip> --port <port>à toutes les commandesgmp. Consultez la référence GMP CLI pour la liste complète des options.