Aller au contenu
Français

EBench Docs

GMP CLI

Installez le paquet genmanip-client dans votre environnement client :

Fenêtre de terminal
pip install -e standalone_tools/packages/genmanip_client/
gmp --help
CommandeFonction
gmp submitSoumettre ou reconnecter des tâches de benchmark sur le serveur d’évaluation.
gmp statusConsulter la progression et les métriques de l’exécution en cours.
gmp evalLancer des workers client et interagir avec les épisodes du serveur.
gmp plotPost-traiter les sorties d’épisodes en artefacts de visualisation.
gmp cleanSupprimer les caches, logs, résultats d’évaluation et fichiers temporaires.
gmp visualizeParcourir les résultats d’évaluation et rejouer les épisodes dans le visualiseur Rerun.

Famille de benchmark + split :

Fenêtre de terminal
gmp submit ebench/mobile_manip/test --run_id mobile_test
gmp submit ebench/table_top_manip/val_unseen --run_id tabletop_val_unseen
gmp submit ebench/generalist/val_train --run_id generalist_val_train

Alias de benchmark :

Fenêtre de terminal
gmp submit ebench --run_id full_benchmark

Chemins de paramètres de tâche pris en charge :

Paramètres de tâche :

  • mobile_manip
  • table_top_manip
  • generalist

Splits :

  • val_train
  • val_unseen
  • test
Fenêtre de terminal
gmp status --host 127.0.0.1 --port 8087
gmp submit ebench --run_id history_id
gmp status
Fenêtre de terminal
gmp eval -a r5a -g lift2 --worker_ids 0 --frame_save_interval 10
gmp eval --worker_ids 0,1 --chunk_size 8 --host 127.0.0.1 --port 8087

Pour intégrer un modèle personnalisé, consultez Intégrer votre modèle.

Fenêtre de terminal
gmp plot client_results/<benchmark>/<run_id>/<task>/<seed>

Utilisez gmp clean pour supprimer les artefacts générés lors des exécutions locales.

Prévisualiser ce qui sera supprimé :

Fenêtre de terminal
gmp clean --dry-run

Supprimer le cache de maillages, les résultats d’évaluation, les logs et les fichiers temporaires résiduels :

Fenêtre de terminal
gmp clean

Supprimer également le cache des paquets de benchmark téléchargés :

Fenêtre de terminal
gmp clean --all

gmp visualize lance un visualiseur HTTPS local permettant de parcourir les exécutions, les taux de réussite par tâche et les replays épisode par épisode.

Installer l’extension de visualisation :

Fenêtre de terminal
pip install -e "standalone_tools/packages/genmanip_client/[visualize]"

Utilisation de base :

Fenêtre de terminal
gmp visualize
gmp visualize --port 55088

Gestion du cache :

Fenêtre de terminal
gmp visualize --flush-cache --dry-run
gmp visualize --flush-cache

Notes :

  • gmp visualize s’attend à trouver les résultats d’évaluation dans saved/eval_results/.
  • Le visualiseur utilise HTTPS et peut afficher un avertissement de certificat dans le navigateur lors du premier accès.
  • Le chemin rerun-sdk actuel utilisé par visualize nécessite Python 3.11+.
  • --run_id : identifie et permet de reprendre une exécution.
  • --host, --port : cible du serveur d’évaluation (par défaut 127.0.0.1:8087 en local).
  • --worker_ids : allocation des workers dans gmp eval.
  • --frame_save_interval : fréquence d’enregistrement des images côté client.
  • --chunk_size : longueur du chunk d’actions lorsque votre modèle prédit des actions groupées.