EBench Docs
GMP CLI
Instalación
Sección titulada «Instalación»Instala el paquete genmanip-client en tu entorno del cliente:
pip install -e standalone_tools/packages/genmanip_client/gmp --helpComandos principales
Sección titulada «Comandos principales»| Comando | Función |
|---|---|
gmp submit | Enviar o reconectar tareas del benchmark en el servidor de evaluación. |
gmp status | Consultar el progreso y las métricas de la ejecución actual. |
gmp eval | Ejecutar workers del cliente e interactuar con los episodios del servidor. |
gmp plot | Postprocesar las salidas de los episodios en artefactos de visualización. |
gmp clean | Eliminar cachés, logs, resultados de evaluación y archivos temporales generados. |
gmp visualize | Explorar resultados de evaluación y reproducir episodios en el visor Rerun. |
Submit, status y eval
Sección titulada «Submit, status y eval»gmp submit
Sección titulada «gmp submit»Familia de benchmark + split:
gmp submit ebench/mobile_manip/test --run_id mobile_testgmp submit ebench/table_top_manip/val_unseen --run_id tabletop_val_unseengmp submit ebench/generalist/val_train --run_id generalist_val_trainAlias de benchmark:
gmp submit ebench --run_id full_benchmarkRutas de configuración de tareas admitidas:
Configuraciones de tareas:
mobile_maniptable_top_manipgeneralist
Splits:
val_trainval_unseentest
gmp status
Sección titulada «gmp status»gmp status --host 127.0.0.1 --port 8087gmp submit ebench --run_id history_idgmp statusgmp eval
Sección titulada «gmp eval»gmp eval -a r5a -g lift2 --worker_ids 0 --frame_save_interval 10gmp eval --worker_ids 0,1 --chunk_size 8 --host 127.0.0.1 --port 8087Para la integración de modelos personalizados, consulta Integrar tu modelo.
Clean, plot y visualize
Sección titulada «Clean, plot y visualize»gmp plot
Sección titulada «gmp plot»gmp plot client_results/<benchmark>/<run_id>/<task>/<seed>gmp clean
Sección titulada «gmp clean»Usa gmp clean para eliminar artefactos generados en ejecuciones locales.
Vista previa de lo que se eliminaría:
gmp clean --dry-runEliminar caché de mallas generada, resultados de evaluación, logs y archivos temporales sobrantes:
gmp cleanEliminar también la caché de paquetes del benchmark descargados:
gmp clean --allgmp visualize
Sección titulada «gmp visualize»gmp visualize inicia un visor HTTPS local para explorar ejecuciones, tasas de éxito por tarea y reproducciones de episodios individuales.
Instalar el extra de visualización:
pip install -e "standalone_tools/packages/genmanip_client/[visualize]"Uso básico:
gmp visualizegmp visualize --port 55088Gestión de caché:
gmp visualize --flush-cache --dry-rungmp visualize --flush-cacheNotas:
gmp visualizeespera encontrar los resultados de evaluación ensaved/eval_results/.- El visor utiliza HTTPS y puede mostrar una advertencia de certificado en el navegador la primera vez.
- La versión actual de
rerun-sdkutilizada por visualize requiere Python 3.11+.
Opciones comunes
Sección titulada «Opciones comunes»--run_id: identifica y reanuda una ejecución.--host,--port: servidor de evaluación destino (por defecto127.0.0.1:8087).--worker_ids: asignación de workers engmp eval.--frame_save_interval: frecuencia de guardado de frames en el cliente.--chunk_size: longitud de chunk de acciones cuando tu modelo predice acciones agrupadas.