Zum Inhalt springen
Deutsch

EBench Docs

GMP CLI

Installieren Sie das Paket genmanip-client in Ihrer Client-Umgebung:

Terminal-Fenster
pip install -e standalone_tools/packages/genmanip_client/
gmp --help
BefehlZweck
gmp submitBenchmark-Aufgaben auf dem Eval-Server einreichen oder wiederaufnehmen.
gmp statusFortschritt und Metriken des aktuellen Laufs anzeigen.
gmp evalClient-Worker starten und mit Server-Episoden interagieren.
gmp plotEpisodenausgaben zu Visualisierungsartefakten nachbearbeiten.
gmp cleanGenerierte Caches, Logs, Eval-Ausgaben und temporaere Reste entfernen.
gmp visualizeEval-Ergebnisse durchsuchen und Episoden im Rerun-Viewer abspielen.

Benchmark-Familie + Split:

Terminal-Fenster
gmp submit ebench/mobile_manip/test --run_id mobile_test
gmp submit ebench/table_top_manip/val_unseen --run_id tabletop_val_unseen
gmp submit ebench/generalist/val_train --run_id generalist_val_train

Benchmark-Alias:

Terminal-Fenster
gmp submit ebench --run_id full_benchmark

Unterstuetzte Aufgabenpfade:

Aufgabeneinstellungen:

  • mobile_manip
  • table_top_manip
  • generalist

Splits:

  • val_train
  • val_unseen
  • test
Terminal-Fenster
gmp status --host 127.0.0.1 --port 8087
gmp submit ebench --run_id history_id
gmp status
Terminal-Fenster
gmp eval -a r5a -g lift2 --worker_ids 0 --frame_save_interval 10
gmp eval --worker_ids 0,1 --chunk_size 8 --host 127.0.0.1 --port 8087

Fuer die Integration eigener Modelle siehe Eigenes Modell einbinden.

Terminal-Fenster
gmp plot client_results/<benchmark>/<run_id>/<task>/<seed>

Verwenden Sie gmp clean, um generierte Artefakte aus lokalen Laeufen zu entfernen.

Vorschau der zu entfernenden Dateien:

Terminal-Fenster
gmp clean --dry-run

Generierten Mesh-Cache, Eval-Ergebnisse, Logs und uebrig gebliebene Lock-/Tmp-Dateien entfernen:

Terminal-Fenster
gmp clean

Zusaetzlich den heruntergeladenen Benchmark-Paket-Cache entfernen:

Terminal-Fenster
gmp clean --all

gmp visualize startet einen lokalen HTTPS-Viewer zum Durchsuchen von Laeufen, Aufgaben-Erfolgsraten und Episoden-Wiederholungen.

Visualize-Erweiterung installieren:

Terminal-Fenster
pip install -e "standalone_tools/packages/genmanip_client/[visualize]"

Grundlegende Verwendung:

Terminal-Fenster
gmp visualize
gmp visualize --port 55088

Cache-Verwaltung:

Terminal-Fenster
gmp visualize --flush-cache --dry-run
gmp visualize --flush-cache

Hinweise:

  • gmp visualize erwartet Evaluationsausgaben unter saved/eval_results/.
  • Der Viewer verwendet HTTPS und zeigt moeglicherweise eine einmalige Browser-Zertifikatswarnung an.
  • Der aktuelle rerun-sdk-Pfad, den Visualize verwendet, erfordert Python 3.11+.
  • --run_id: Identifiziert und setzt einen Lauf fort.
  • --host, --port: Ziel des Eval-Servers (Standard: lokal 127.0.0.1:8087).
  • --worker_ids: Worker-Zuweisung in gmp eval.
  • --frame_save_interval: Clientseitige Frame-Speicherfrequenz.
  • --chunk_size: Action-Chunk-Laenge, wenn Ihr Modell geblockte Aktionen vorhersagt.