EBench Docs
GMP CLI
Installation
Abschnitt betitelt „Installation“Installieren Sie das Paket genmanip-client in Ihrer Client-Umgebung:
pip install -e standalone_tools/packages/genmanip_client/gmp --helpKernbefehle
Abschnitt betitelt „Kernbefehle“| Befehl | Zweck |
|---|---|
gmp submit | Benchmark-Aufgaben auf dem Eval-Server einreichen oder wiederaufnehmen. |
gmp status | Fortschritt und Metriken des aktuellen Laufs anzeigen. |
gmp eval | Client-Worker starten und mit Server-Episoden interagieren. |
gmp plot | Episodenausgaben zu Visualisierungsartefakten nachbearbeiten. |
gmp clean | Generierte Caches, Logs, Eval-Ausgaben und temporaere Reste entfernen. |
gmp visualize | Eval-Ergebnisse durchsuchen und Episoden im Rerun-Viewer abspielen. |
Submit, Status und Eval
Abschnitt betitelt „Submit, Status und Eval“gmp submit
Abschnitt betitelt „gmp submit“Benchmark-Familie + Split:
gmp submit ebench/mobile_manip/test --run_id mobile_testgmp submit ebench/table_top_manip/val_unseen --run_id tabletop_val_unseengmp submit ebench/generalist/val_train --run_id generalist_val_trainBenchmark-Alias:
gmp submit ebench --run_id full_benchmarkUnterstuetzte Aufgabenpfade:
Aufgabeneinstellungen:
mobile_maniptable_top_manipgeneralist
Splits:
val_trainval_unseentest
gmp status
Abschnitt betitelt „gmp status“gmp status --host 127.0.0.1 --port 8087gmp submit ebench --run_id history_idgmp statusgmp eval
Abschnitt betitelt „gmp eval“gmp eval -a r5a -g lift2 --worker_ids 0 --frame_save_interval 10gmp eval --worker_ids 0,1 --chunk_size 8 --host 127.0.0.1 --port 8087Fuer die Integration eigener Modelle siehe Eigenes Modell einbinden.
Clean, Plot und Visualize
Abschnitt betitelt „Clean, Plot und Visualize“gmp plot
Abschnitt betitelt „gmp plot“gmp plot client_results/<benchmark>/<run_id>/<task>/<seed>gmp clean
Abschnitt betitelt „gmp clean“Verwenden Sie gmp clean, um generierte Artefakte aus lokalen Laeufen zu entfernen.
Vorschau der zu entfernenden Dateien:
gmp clean --dry-runGenerierten Mesh-Cache, Eval-Ergebnisse, Logs und uebrig gebliebene Lock-/Tmp-Dateien entfernen:
gmp cleanZusaetzlich den heruntergeladenen Benchmark-Paket-Cache entfernen:
gmp clean --allgmp visualize
Abschnitt betitelt „gmp visualize“gmp visualize startet einen lokalen HTTPS-Viewer zum Durchsuchen von Laeufen, Aufgaben-Erfolgsraten und Episoden-Wiederholungen.
Visualize-Erweiterung installieren:
pip install -e "standalone_tools/packages/genmanip_client/[visualize]"Grundlegende Verwendung:
gmp visualizegmp visualize --port 55088Cache-Verwaltung:
gmp visualize --flush-cache --dry-rungmp visualize --flush-cacheHinweise:
gmp visualizeerwartet Evaluationsausgaben untersaved/eval_results/.- Der Viewer verwendet HTTPS und zeigt moeglicherweise eine einmalige Browser-Zertifikatswarnung an.
- Der aktuelle
rerun-sdk-Pfad, den Visualize verwendet, erfordert Python 3.11+.
Allgemeine Optionen
Abschnitt betitelt „Allgemeine Optionen“--run_id: Identifiziert und setzt einen Lauf fort.--host,--port: Ziel des Eval-Servers (Standard: lokal127.0.0.1:8087).--worker_ids: Worker-Zuweisung ingmp eval.--frame_save_interval: Clientseitige Frame-Speicherfrequenz.--chunk_size: Action-Chunk-Laenge, wenn Ihr Modell geblockte Aktionen vorhersagt.