EBench Docs
GMP CLI
Installation
Section intitulée « Installation »Installez le paquet genmanip-client dans votre environnement client :
pip install -e standalone_tools/packages/genmanip_client/gmp --helpCommandes principales
Section intitulée « Commandes principales »| Commande | Fonction |
|---|---|
gmp submit | Soumettre ou reconnecter des tâches de benchmark sur le serveur d’évaluation. |
gmp status | Consulter la progression et les métriques de l’exécution en cours. |
gmp eval | Lancer des workers client et interagir avec les épisodes du serveur. |
gmp plot | Post-traiter les sorties d’épisodes en artefacts de visualisation. |
gmp clean | Supprimer les caches, logs, résultats d’évaluation et fichiers temporaires. |
gmp visualize | Parcourir les résultats d’évaluation et rejouer les épisodes dans le visualiseur Rerun. |
Submit, status et eval
Section intitulée « Submit, status et eval »gmp submit
Section intitulée « gmp submit »Famille de benchmark + split :
gmp submit ebench/mobile_manip/test --run_id mobile_testgmp submit ebench/table_top_manip/val_unseen --run_id tabletop_val_unseengmp submit ebench/generalist/val_train --run_id generalist_val_trainAlias de benchmark :
gmp submit ebench --run_id full_benchmarkChemins de paramètres de tâche pris en charge :
Paramètres de tâche :
mobile_maniptable_top_manipgeneralist
Splits :
val_trainval_unseentest
gmp status
Section intitulée « gmp status »gmp status --host 127.0.0.1 --port 8087gmp submit ebench --run_id history_idgmp statusgmp eval
Section intitulée « gmp eval »gmp eval -a r5a -g lift2 --worker_ids 0 --frame_save_interval 10gmp eval --worker_ids 0,1 --chunk_size 8 --host 127.0.0.1 --port 8087Pour intégrer un modèle personnalisé, consultez Intégrer votre modèle.
Clean, plot et visualize
Section intitulée « Clean, plot et visualize »gmp plot
Section intitulée « gmp plot »gmp plot client_results/<benchmark>/<run_id>/<task>/<seed>gmp clean
Section intitulée « gmp clean »Utilisez gmp clean pour supprimer les artefacts générés lors des exécutions locales.
Prévisualiser ce qui sera supprimé :
gmp clean --dry-runSupprimer le cache de maillages, les résultats d’évaluation, les logs et les fichiers temporaires résiduels :
gmp cleanSupprimer également le cache des paquets de benchmark téléchargés :
gmp clean --allgmp visualize
Section intitulée « gmp visualize »gmp visualize lance un visualiseur HTTPS local permettant de parcourir les exécutions, les taux de réussite par tâche et les replays épisode par épisode.
Installer l’extension de visualisation :
pip install -e "standalone_tools/packages/genmanip_client/[visualize]"Utilisation de base :
gmp visualizegmp visualize --port 55088Gestion du cache :
gmp visualize --flush-cache --dry-rungmp visualize --flush-cacheNotes :
gmp visualizes’attend à trouver les résultats d’évaluation danssaved/eval_results/.- Le visualiseur utilise HTTPS et peut afficher un avertissement de certificat dans le navigateur lors du premier accès.
- Le chemin
rerun-sdkactuel utilisé par visualize nécessite Python 3.11+.
Options communes
Section intitulée « Options communes »--run_id: identifie et permet de reprendre une exécution.--host,--port: cible du serveur d’évaluation (par défaut127.0.0.1:8087en local).--worker_ids: allocation des workers dansgmp eval.--frame_save_interval: fréquence d’enregistrement des images côté client.--chunk_size: longueur du chunk d’actions lorsque votre modèle prédit des actions groupées.