跳转到内容
简体中文

EBench Docs

GMP CLI

client 环境中安装 genmanip-client

Terminal window
pip install -e standalone_tools/packages/genmanip_client/
gmp --help
命令作用
gmp submit向评测服务提交任务或重新连接已有任务。
gmp status查看当前 run 的进度和指标。
gmp eval运行 client worker,与 server episode 交互。
gmp plot对 episode 输出做后处理可视化。
gmp clean清理生成的缓存、日志、评测输出和临时残留文件。
gmp visualize浏览评测结果,并在 Rerun viewer 中回放 episode。

按 benchmark family + split 提交:

Terminal window
gmp submit ebench/mobile_manip/test --run_id mobile_test
gmp submit ebench/table_top_manip/val_unseen --run_id tabletop_val_unseen
gmp submit ebench/generalist/val_train --run_id generalist_val_train

benchmark 别名:

Terminal window
gmp submit ebench --run_id full_benchmark

支持的 task-setting 路径:

Task setting:

  • mobile_manip
  • table_top_manip
  • generalist

Split:

  • val_train
  • val_unseen
  • test
Terminal window
gmp status --host 127.0.0.1 --port 8087
gmp submit ebench --run_id history_id
gmp status
Terminal window
gmp eval -a r5a -g lift2 --worker_ids 0 --frame_save_interval 10
gmp eval --worker_ids 0,1 --chunk_size 8 --host 127.0.0.1 --port 8087

接入自定义模型请见接入自定义模型

Terminal window
gmp plot client_results/<benchmark>/<run_id>/<task>/<seed>

使用 gmp clean 清理本地运行产生的各类生成文件。

先预览将要删除的内容:

Terminal window
gmp clean --dry-run

清理生成的 mesh cache、评测结果、日志,以及遗留的 lock/tmp 文件:

Terminal window
gmp clean

如果还要删除下载下来的 benchmark package cache:

Terminal window
gmp clean --all

gmp visualize 会启动一个本地 HTTPS viewer,用来浏览 run、查看 task 成功率,并回放单个 episode。

安装 visualize 额外依赖:

Terminal window
pip install -e "standalone_tools/packages/genmanip_client/[visualize]"

基本用法:

Terminal window
gmp visualize
gmp visualize --port 55088

缓存管理:

Terminal window
gmp visualize --flush-cache --dry-run
gmp visualize --flush-cache

说明:

  • gmp visualize 默认读取 saved/eval_results/ 下的结果。
  • 由于 viewer 使用 HTTPS,浏览器第一次打开时可能会出现一次证书提示。
  • 当前 visualize 依赖的 rerun-sdk 路径要求 Python 3.11+。
  • --run_id:run 的唯一标识,也用于断点恢复。
  • --host--port:评测服务地址(默认本地 127.0.0.1:8087)。
  • --worker_idsgmp eval 要接入的 worker。
  • --frame_save_interval:client 侧存帧频率。
  • --chunk_size:模型按 chunk 输出动作时的 chunk 长度。