EBench Docs

Intégrer votre modèle

L’interface principale est la suivante :

model_client.get_action(obs) -> action

Implémentez un ModelClient, effectuez une passe d’inférence dans get_action(obs) et renvoyez un dictionnaire d’action.

Format des observations

Chaque observation est indexée par worker_id :

obs["0"]["obs"] = {
    "instruction": str,                        # instruction en langage naturel
    "state.joints": np.ndarray,                # (12,) positions articulaires
    "state.gripper": np.ndarray,               # (4,) états de la pince
    "state.base": np.ndarray,                  # (3,) position de la base
    "state.ee_pose": [[pos, quat], [pos, quat]],  # effecteur gauche/droit
    "video.{camera}_view": np.ndarray,         # (480, 640, 3) uint8
    "timestep": int,
    "reset": bool,                             # True au premier pas
}

Format des actions

action = {
    "0": {
        "action": np.ndarray,       # (16,) = 6 articulations gauche + 2 pince gauche + 6 articulations droite + 2 pince droite
        "base_motion": np.ndarray,  # (3,) delta x, y, lacet
        "control_type": "joint_position",
        "is_rel": False,            # True pour des actions bras en delta
        "base_is_rel": True,        # True pour un déplacement de base en delta
    }
}

Vous pouvez également utiliser le contrôle ee_pose en définissant control_type sur "ee_pose" et en fournissant des paires [pos, quat, gripper] au lieu de positions articulaires.

Mode chunk (recommandé)

Approche préférée : Au lieu d’appeler client.step() avec une seule action par pas, soumettez des chunks d’actions pour de meilleures performances :

# Soumettez une liste d'actions sous forme de chunk
actions = [action_dict_1, action_dict_2, action_dict_3]
obs, done = client.step(actions)

Avantages : Le serveur exécute toutes les actions du chunk en interne et ne renvoie que l’observation finale au point de ré-inférence, réduisant la surcharge réseau et permettant un meilleur réglage des performances.

Évaluation multi-worker : Pour plusieurs workers, exécutez simplement des processus distincts avec différents worker_ids :

# Terminal 1 : worker "0"
python model_client.py --worker_id 0

# Terminal 2 : worker "1"
python model_client.py --worker_id 1

Exemple : Mode pas unique

import numpy as np
from genmanip_client.eval_client import EvalClient


class ModelClient:
    def __init__(self):
        pass  # Chargez votre modèle ici

    def get_action_chunk(self, obs):
        worker_id = next(iter(obs))
        worker_obs = obs[worker_id]["obs"]

        instruction = worker_obs["instruction"]
        image = worker_obs["video.front_view"]
        joints = worker_obs["state.joints"]
        gripper = worker_obs["state.gripper"]
        base = worker_obs["state.base"]

        # Votre inférence ici, c'est-à-dire action avec 6 articulations gauche + 2 pince gauche + 6 articulations droite + 2 pince droite, 3 états de mouvement base
        pred_action_chunk = np.zeros(16+3, dtype=np.float32)

        return {
            worker_id: {
                "action": pred_action[:16],
                "base_motion": pred_action[16:],
                "control_type": "joint_position",
                "is_rel": False,
                "base_is_rel": True,
            }
        }

    def reset(self):
        # basé sur votre modèle, nettoyez l'historique et réinitialisez à un nouvel épisode
        pass

client = EvalClient(
    base_url="http://127.0.0.1:8087",
    worker_ids=["0"],
    run_id="my_eval",
)
model = ModelClient()

try:
    obs = client.reset()
    eval_finished = False
    while not eval_finished:
        # Réinitialisez le modèle lorsque obs["reset"] est True, car la tâche en arrière-plan a changé d'épisodes.
        if obs[list(obs.keys())[0]]["obs"]["reset"]:
            model.reset()
        action = model.get_action(obs)
        obs, eval_finished = client.step(action)
finally:
    client.close()

Exemple : Mode chunk (recommandé)

import numpy as np
from genmanip_client.eval_client import EvalClient


class ModelClient:
    def __init__(self, chunk_size: int = 4):
        self.chunk_size = chunk_size
        pass  # Chargez votre modèle ici

    def get_action_chunk(self, obs):
        """Générez un chunk d'actions."""
        worker_id = next(iter(obs))
        worker_obs = obs[worker_id]["obs"]

        instruction = worker_obs["instruction"]
        image = worker_obs["video.front_view"]
        joints = worker_obs["state.joints"]
        gripper = worker_obs["state.gripper"]
        base = worker_obs["state.base"]

        # Votre inférence ici, c'est-à-dire un chunk de longueur chunk_size avec 6 articulations gauche + 2 pince gauche + 6 articulations droite + 2 pince droite, 3 états de mouvement base
        pred_action_chunk = np.zeros((self.chunk_size, 16+3), dtype=np.float32)

        # convertir au format chunk d'action
        action_chunk = []
        for i in range(self.chunk_size):
            action_chunk.append({
                worker_id: {
                    "action": pred_action_chunk[i][:16],
                    "base_motion": pred_action_chunk[i][16:],
                    "control_type": "joint_position",
                    }
                }
            )

        return action_chunk

    def reset(self):
        # basé sur votre modèle, nettoyez l'historique et réinitialisez à un nouvel épisode
        pass

client = EvalClient(
    base_url="http://127.0.0.1:8087",
    worker_ids=["0"],
    run_id="my_eval",
)
model = ModelClient(chunk_size=4)

try:
    obs = client.reset()
    eval_finished = False
    while not eval_finished:
        # Réinitialisez le modèle lorsque obs["reset"] est True, car la tâche en arrière-plan a changé d'épisodes.
        if obs[list(obs.keys())[0]]["obs"]["reset"]:
            model.reset()
        # Générez des actions pour tout le chunk
        action_chunk = model.get_action_chunk(obs)
        # Le serveur exécute le chunk en interne ; retourne obs au prochain point de ré-inférence
        obs, eval_finished = client.step(action_chunk)
finally:
    client.close()

Conseils

Utilisez le mode chunk pour de meilleures performances : Soumettez des listes d’actions via client.step() plutôt que des actions uniques. Le serveur les exécute en interne et ne renvoie que l’observation finale au point de ré-inférence. Fonctionne uniquement pour un serveur avec le flag —no_save_process.
Chargez les poids du modèle dans __init__ et gardez get_action centré sur l’inférence.
Utilisez reset=True dans obs pour détecter le premier pas et, lorsque la tâche en arrière-plan change d’épisode, réinitialiser l’état récurrent ou le buffer de chunk.
Les images sont en uint8 HWC — appliquez la normalisation de votre modèle avant l’inférence.
Pour les chunks d’actions, conservez les actions restantes côté client ou utilisez gmp eval --chunk_size <N>.
Pour l’évaluation multi-worker, renvoyez une action par worker_id.
Le code source de EvalClient se trouve dans standalone_tools/packages/genmanip_client/src/genmanip_client/eval_client.py.