Source code for mani_skill.agents.controllers.pd_joint_pos_vel

from dataclasses import dataclass
from typing import Sequence, Union

import numpy as np
import torch
from gymnasium import spaces

from .pd_joint_pos import PDJointPosController, PDJointPosControllerConfig



[docs]
class PDJointPosVelController(PDJointPosController):

[docs]
    config: "PDJointPosVelControllerConfig"


[docs]
    _target_qvel = None


[docs]
    sets_target_qpos = True


[docs]
    sets_target_qvel = True



[docs]
    def _initialize_action_space(self):
        joint_limits = self._get_joint_limits()
        pos_low, pos_high = joint_limits[:, 0], joint_limits[:, 1]
        vel_low = np.broadcast_to(self.config.vel_lower, pos_low.shape)
        vel_high = np.broadcast_to(self.config.vel_upper, pos_high.shape)
        low = np.float32(np.hstack([pos_low, vel_low]))
        high = np.float32(np.hstack([pos_high, vel_high]))
        self.single_action_space = spaces.Box(low, high, dtype=np.float32)



[docs]
    def reset(self):
        super().reset()
        if self._target_qvel is None:
            self._target_qvel = self.qvel.clone()
        else:
            self._target_qvel[self.scene._reset_mask] = torch.zeros_like(
                self._target_qpos[self.scene._reset_mask], device=self.device
            )



[docs]
    def set_drive_velocity_targets(self, targets):
        self.articulation.set_joint_drive_velocity_targets(
            targets, self.joints, self.active_joint_indices
        )



[docs]
    def set_action(self, action: torch.Tensor):
        action = self._preprocess_action(action)
        nq = len(action[0]) // 2

        self._step = 0
        self._start_qpos = self.qpos

        if self.config.use_delta:
            if self.config.use_target:
                self._target_qpos = self._target_qpos + action[:, :nq]
            else:
                self._target_qpos = self._start_qpos + action[:, :nq]
        else:
            # Compatible with mimic
            self._target_qpos = torch.broadcast_to(
                action[:, :nq], self._start_qpos.shape
            )

        if self.config.interpolate:
            self._step_size = (self._target_qpos - self._start_qpos) / self._sim_steps
        else:
            self.set_drive_targets(self._target_qpos)

        self._target_qvel = action[:, nq:]
        self.set_drive_velocity_targets(self._target_qvel)




@dataclass

[docs]
class PDJointPosVelControllerConfig(PDJointPosControllerConfig):

[docs]
    controller_cls = PDJointPosVelController


[docs]
    vel_lower: Union[float, Sequence[float]] = -1.0


[docs]
    vel_upper: Union[float, Sequence[float]] = 1.0