EBench Docs
GMP CLI
インストール
Section titled “インストール”クライアント環境に genmanip-client パッケージをインストールします:
pip install -e standalone_tools/packages/genmanip_client/gmp --help主要コマンド
Section titled “主要コマンド”| コマンド | 用途 |
|---|---|
gmp submit | 評価サーバーにベンチマークタスクを送信・再接続します。 |
gmp status | 現在の実行の進捗とメトリクスを確認します。 |
gmp eval | クライアントワーカーを起動し、サーバーエピソードと対話します。 |
gmp plot | エピソード出力を可視化アーティファクトに後処理します。 |
gmp clean | 生成されたキャッシュ、ログ、評価出力、一時ファイルを削除します。 |
gmp visualize | 評価結果の閲覧とエピソードの Rerun ビューアーでの再生を行います。 |
Submit、Status、Eval
Section titled “Submit、Status、Eval”gmp submit
Section titled “gmp submit”ベンチマークファミリー + スプリット:
gmp submit ebench/mobile_manip/test --run_id mobile_testgmp submit ebench/table_top_manip/val_unseen --run_id tabletop_val_unseengmp submit ebench/generalist/val_train --run_id generalist_val_trainベンチマークエイリアス:
gmp submit ebench --run_id full_benchmark対応するタスク設定パス:
タスク設定:
mobile_maniptable_top_manipgeneralist
スプリット:
val_trainval_unseentest
gmp status
Section titled “gmp status”gmp status --host 127.0.0.1 --port 8087gmp submit ebench --run_id history_idgmp statusgmp eval
Section titled “gmp eval”gmp eval -a r5a -g lift2 --worker_ids 0 --frame_save_interval 10gmp eval --worker_ids 0,1 --chunk_size 8 --host 127.0.0.1 --port 8087カスタムモデルの統合については、モデルの統合 を参照してください。
Clean、Plot、Visualize
Section titled “Clean、Plot、Visualize”gmp plot
Section titled “gmp plot”gmp plot client_results/<benchmark>/<run_id>/<task>/<seed>gmp clean
Section titled “gmp clean”gmp clean でローカル実行の生成アーティファクトを削除します。
削除対象のプレビュー:
gmp clean --dry-run生成されたメッシュキャッシュ、評価結果、ログ、残存する一時ファイルを削除:
gmp cleanダウンロード済みのベンチマークパッケージキャッシュも削除:
gmp clean --allgmp visualize
Section titled “gmp visualize”gmp visualize は、実行結果の閲覧、タスク成功率の確認、エピソードごとの再生が可能なローカル HTTPS ビューアーを起動します。
visualize エクストラのインストール:
pip install -e "standalone_tools/packages/genmanip_client/[visualize]"基本的な使い方:
gmp visualizegmp visualize --port 55088キャッシュ管理:
gmp visualize --flush-cache --dry-rungmp visualize --flush-cache注意事項:
gmp visualizeはsaved/eval_results/配下の評価出力を参照します。- ビューアーは HTTPS を使用するため、初回はブラウザの証明書警告が表示される場合があります。
- visualize が使用する現在の
rerun-sdkパスは Python 3.11 以上が必要です。
共通オプション
Section titled “共通オプション”--run_id:実行の識別と再開に使用します。--host、--port:評価サーバーの接続先(デフォルトはローカルの127.0.0.1:8087)。--worker_ids:gmp evalでのワーカー割り当て。--frame_save_interval:クライアント側のフレーム保存頻度。--chunk_size:モデルがチャンクアクションを予測する場合のアクションチャンク長。