rlu_rwrl

  • Descripción :

RL Unplugged es un conjunto de puntos de referencia para el aprendizaje por refuerzo fuera de línea. El RL Unplugged está diseñado en torno a las siguientes consideraciones: para facilitar el uso, proporcionamos los conjuntos de datos con una API unificada que facilita al profesional trabajar con todos los datos en la suite una vez que se ha establecido una canalización general.

Los conjuntos de datos siguen el formato RLDS para representar pasos y episodios.

Los ejemplos en el conjunto de datos representan las transiciones de SAR almacenadas cuando se ejecuta un agente capacitado parcialmente en línea como se describe en https://arxiv.org/abs/1904.12901 Seguimos el formato del conjunto de datos RLDS, como se especifica en https://github.com/google-research /rlds#formato-de-conjunto-de-datos

Lanzamos 40 conjuntos de datos en 8 tareas en total, sin desafío combinado y desafío combinado fácil en las tareas de carro, caminante, cuadrúpedo y humanoide. Cada tarea contiene 5 tamaños diferentes de conjuntos de datos, 1%, 5%, 20%, 40% y 100%. Tenga en cuenta que no se garantiza que el conjunto de datos más pequeño sea un subconjunto de los más grandes. Para obtener detalles sobre cómo se generó el conjunto de datos, consulte el documento.

@misc{gulcehre2020rl,
    title={RL Unplugged: Benchmarks for Offline Reinforcement Learning},
    author={Caglar Gulcehre and Ziyu Wang and Alexander Novikov and Tom Le Paine
        and  Sergio Gómez Colmenarejo and Konrad Zolna and Rishabh Agarwal and
        Josh Merel and Daniel Mankowitz and Cosmin Paduraru and Gabriel
        Dulac-Arnold and Jerry Li and Mohammad Norouzi and Matt Hoffman and
        Ofir Nachum and George Tucker and Nicolas Heess and Nando deFreitas},
    year={2020},
    eprint={2006.13888},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

rlu_rwrl/cartpole_swingup_combined_challenge_none_1_percent (configuración predeterminada)

  • Tamaño del conjunto de datos : 172.43 KiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 5
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (1,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/posición Tensor (3,) flotar32
pasos/observación/velocidad Tensor (2,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/cartpole_swingup_combined_challenge_none_5_percent

  • Tamaño del conjunto de datos : 862.13 KiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 25
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (1,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/posición Tensor (3,) flotar32
pasos/observación/velocidad Tensor (2,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/cartpole_swingup_combined_challenge_none_20_percent

  • Tamaño del conjunto de datos : 3.37 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 100
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (1,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/posición Tensor (3,) flotar32
pasos/observación/velocidad Tensor (2,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/cartpole_swingup_combined_challenge_none_40_percent

  • Tamaño del conjunto de datos : 6.74 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 200
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (1,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/posición Tensor (3,) flotar32
pasos/observación/velocidad Tensor (2,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/cartpole_swingup_combined_challenge_none_100_percent

  • Tamaño del conjunto de datos : 16.84 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 500
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (1,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/posición Tensor (3,) flotar32
pasos/observación/velocidad Tensor (2,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/quadruped_walk_combined_challenge_none_1_percent

  • Tamaño del conjunto de datos : 1.77 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 5
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (12,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/estado_egocéntrico Tensor (44,) flotar32
pasos/observación/force_torque Tensor (24,) flotar32
pasos/observación/imu Tensor (6,) flotar32
pasos/observación/torso_vertical Tensor (1,) flotar32
pasos/observación/torso_velocidad Tensor (3,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/quadruped_walk_combined_challenge_none_5_percent

  • Tamaño del conjunto de datos : 8.86 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 25
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (12,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/estado_egocéntrico Tensor (44,) flotar32
pasos/observación/force_torque Tensor (24,) flotar32
pasos/observación/imu Tensor (6,) flotar32
pasos/observación/torso_vertical Tensor (1,) flotar32
pasos/observación/torso_velocidad Tensor (3,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/quadruped_walk_combined_challenge_none_20_percent

  • Tamaño del conjunto de datos : 35.46 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 100
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (12,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/estado_egocéntrico Tensor (44,) flotar32
pasos/observación/force_torque Tensor (24,) flotar32
pasos/observación/imu Tensor (6,) flotar32
pasos/observación/torso_vertical Tensor (1,) flotar32
pasos/observación/torso_velocidad Tensor (3,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/quadruped_walk_combined_challenge_none_40_percent

  • Tamaño del conjunto de datos : 70.92 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 200
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (12,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/estado_egocéntrico Tensor (44,) flotar32
pasos/observación/force_torque Tensor (24,) flotar32
pasos/observación/imu Tensor (6,) flotar32
pasos/observación/torso_vertical Tensor (1,) flotar32
pasos/observación/torso_velocidad Tensor (3,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/quadruped_walk_combined_challenge_none_100_percent

  • Tamaño del conjunto de datos : 177.29 MiB

  • Auto-caché ( documentación ): Solo cuando shuffle_files=False (tren)

  • Divisiones :

Separar Ejemplos
'train' 500
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (12,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/estado_egocéntrico Tensor (44,) flotar32
pasos/observación/force_torque Tensor (24,) flotar32
pasos/observación/imu Tensor (6,) flotar32
pasos/observación/torso_vertical Tensor (1,) flotar32
pasos/observación/torso_velocidad Tensor (3,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/walker_walk_combined_challenge_none_1_percent

  • Tamaño del conjunto de datos : 6.27 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 50
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (6,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/altura Tensor (1,) flotar32
pasos/observación/orientaciones Tensor (14,) flotar32
pasos/observación/velocidad Tensor (9,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/walker_walk_combined_challenge_none_5_percent

  • Tamaño del conjunto de datos : 31.34 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 250
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (6,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/altura Tensor (1,) flotar32
pasos/observación/orientaciones Tensor (14,) flotar32
pasos/observación/velocidad Tensor (9,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/walker_walk_combined_challenge_none_20_percent

  • Tamaño del conjunto de datos : 125.37 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 1,000
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (6,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/altura Tensor (1,) flotar32
pasos/observación/orientaciones Tensor (14,) flotar32
pasos/observación/velocidad Tensor (9,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/walker_walk_combined_challenge_none_40_percent

  • Tamaño del conjunto de datos : 250.75 MiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 2,000
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (6,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/altura Tensor (1,) flotar32
pasos/observación/orientaciones Tensor (14,) flotar32
pasos/observación/velocidad Tensor (9,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/walker_walk_combined_challenge_none_100_percent

  • Tamaño del conjunto de datos : 626.86 MiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 5,000
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (6,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/altura Tensor (1,) flotar32
pasos/observación/orientaciones Tensor (14,) flotar32
pasos/observación/velocidad Tensor (9,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/humanoid_walk_combined_challenge_none_1_percent

  • Tamaño del conjunto de datos : 69.40 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 200
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (21,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/com_velocidad Tensor (3,) flotar32
pasos/observación/extremidades Tensor (12,) flotar32
pasos/observación/cabeza_altura Tensor (1,) flotar32
pasos/observación/joint_angles Tensor (21,) flotar32
pasos/observación/torso_vertical Tensor (3,) flotar32
pasos/observación/velocidad Tensor (27,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/humanoid_walk_combined_challenge_none_5_percent

  • Tamaño del conjunto de datos : 346.98 MiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 1,000
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (21,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/com_velocidad Tensor (3,) flotar32
pasos/observación/extremidades Tensor (12,) flotar32
pasos/observación/cabeza_altura Tensor (1,) flotar32
pasos/observación/joint_angles Tensor (21,) flotar32
pasos/observación/torso_vertical Tensor (3,) flotar32
pasos/observación/velocidad Tensor (27,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/humanoid_walk_combined_challenge_none_20_percent

  • Tamaño del conjunto de datos : 1.36 GiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 4,000
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (21,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/com_velocidad Tensor (3,) flotar32
pasos/observación/extremidades Tensor (12,) flotar32
pasos/observación/cabeza_altura Tensor (1,) flotar32
pasos/observación/joint_angles Tensor (21,) flotar32
pasos/observación/torso_vertical Tensor (3,) flotar32
pasos/observación/velocidad Tensor (27,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/humanoid_walk_combined_challenge_none_40_percent

  • Tamaño del conjunto de datos : 2.71 GiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 8,000
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (21,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/com_velocidad Tensor (3,) flotar32
pasos/observación/extremidades Tensor (12,) flotar32
pasos/observación/cabeza_altura Tensor (1,) flotar32
pasos/observación/joint_angles Tensor (21,) flotar32
pasos/observación/torso_vertical Tensor (3,) flotar32
pasos/observación/velocidad Tensor (27,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/humanoid_walk_combined_challenge_none_100_percent

  • Tamaño del conjunto de datos : 6.78 GiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 20,000
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (21,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/com_velocidad Tensor (3,) flotar32
pasos/observación/extremidades Tensor (12,) flotar32
pasos/observación/cabeza_altura Tensor (1,) flotar32
pasos/observación/joint_angles Tensor (21,) flotar32
pasos/observación/torso_vertical Tensor (3,) flotar32
pasos/observación/velocidad Tensor (27,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_1_percent

  • Tamaño del conjunto de datos : 369.84 KiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 5
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (1,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/dummy-0 Tensor (1,) flotar32
pasos/observación/dummy-1 Tensor (1,) flotar32
pasos/observación/dummy-2 Tensor (1,) flotar32
pasos/observación/dummy-3 Tensor (1,) flotar32
pasos/observación/dummy-4 Tensor (1,) flotar32
pasos/observación/dummy-5 Tensor (1,) flotar32
pasos/observación/dummy-6 Tensor (1,) flotar32
pasos/observación/dummy-7 Tensor (1,) flotar32
pasos/observación/ficticio-8 Tensor (1,) flotar32
pasos/observación/ficticio-9 Tensor (1,) flotar32
pasos/observación/posición Tensor (3,) flotar32
pasos/observación/velocidad Tensor (2,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_5_percent

  • Tamaño del conjunto de datos : 1.81 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 25
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (1,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/dummy-0 Tensor (1,) flotar32
pasos/observación/dummy-1 Tensor (1,) flotar32
pasos/observación/dummy-2 Tensor (1,) flotar32
pasos/observación/dummy-3 Tensor (1,) flotar32
pasos/observación/dummy-4 Tensor (1,) flotar32
pasos/observación/dummy-5 Tensor (1,) flotar32
pasos/observación/dummy-6 Tensor (1,) flotar32
pasos/observación/dummy-7 Tensor (1,) flotar32
pasos/observación/ficticio-8 Tensor (1,) flotar32
pasos/observación/ficticio-9 Tensor (1,) flotar32
pasos/observación/posición Tensor (3,) flotar32
pasos/observación/velocidad Tensor (2,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_20_percent

  • Tamaño del conjunto de datos : 7.22 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 100
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (1,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/dummy-0 Tensor (1,) flotar32
pasos/observación/dummy-1 Tensor (1,) flotar32
pasos/observación/dummy-2 Tensor (1,) flotar32
pasos/observación/dummy-3 Tensor (1,) flotar32
pasos/observación/dummy-4 Tensor (1,) flotar32
pasos/observación/dummy-5 Tensor (1,) flotar32
pasos/observación/dummy-6 Tensor (1,) flotar32
pasos/observación/dummy-7 Tensor (1,) flotar32
pasos/observación/ficticio-8 Tensor (1,) flotar32
pasos/observación/ficticio-9 Tensor (1,) flotar32
pasos/observación/posición Tensor (3,) flotar32
pasos/observación/velocidad Tensor (2,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_40_percent

  • Tamaño del conjunto de datos : 14.45 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 200
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (1,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/dummy-0 Tensor (1,) flotar32
pasos/observación/dummy-1 Tensor (1,) flotar32
pasos/observación/dummy-2 Tensor (1,) flotar32
pasos/observación/dummy-3 Tensor (1,) flotar32
pasos/observación/dummy-4 Tensor (1,) flotar32
pasos/observación/dummy-5 Tensor (1,) flotar32
pasos/observación/dummy-6 Tensor (1,) flotar32
pasos/observación/dummy-7 Tensor (1,) flotar32
pasos/observación/ficticio-8 Tensor (1,) flotar32
pasos/observación/ficticio-9 Tensor (1,) flotar32
pasos/observación/posición Tensor (3,) flotar32
pasos/observación/velocidad Tensor (2,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_100_percent

  • Tamaño del conjunto de datos : 36.12 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 500
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (1,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/dummy-0 Tensor (1,) flotar32
pasos/observación/dummy-1 Tensor (1,) flotar32
pasos/observación/dummy-2 Tensor (1,) flotar32
pasos/observación/dummy-3 Tensor (1,) flotar32
pasos/observación/dummy-4 Tensor (1,) flotar32
pasos/observación/dummy-5 Tensor (1,) flotar32
pasos/observación/dummy-6 Tensor (1,) flotar32
pasos/observación/dummy-7 Tensor (1,) flotar32
pasos/observación/ficticio-8 Tensor (1,) flotar32
pasos/observación/ficticio-9 Tensor (1,) flotar32
pasos/observación/posición Tensor (3,) flotar32
pasos/observación/velocidad Tensor (2,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/quadruped_walk_combined_challenge_easy_1_percent

  • Tamaño del conjunto de datos : 1.97 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 5
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (12,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/dummy-0 Tensor (1,) flotar32
pasos/observación/dummy-1 Tensor (1,) flotar32
pasos/observación/dummy-2 Tensor (1,) flotar32
pasos/observación/dummy-3 Tensor (1,) flotar32
pasos/observación/dummy-4 Tensor (1,) flotar32
pasos/observación/dummy-5 Tensor (1,) flotar32
pasos/observación/dummy-6 Tensor (1,) flotar32
pasos/observación/dummy-7 Tensor (1,) flotar32
pasos/observación/ficticio-8 Tensor (1,) flotar32
pasos/observación/ficticio-9 Tensor (1,) flotar32
pasos/observación/estado_egocéntrico Tensor (44,) flotar32
pasos/observación/force_torque Tensor (24,) flotar32
pasos/observación/imu Tensor (6,) flotar32
pasos/observación/torso_vertical Tensor (1,) flotar32
pasos/observación/torso_velocidad Tensor (3,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/quadruped_walk_combined_challenge_easy_5_percent

  • Tamaño del conjunto de datos : 9.83 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 25
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (12,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/dummy-0 Tensor (1,) flotar32
pasos/observación/dummy-1 Tensor (1,) flotar32
pasos/observación/dummy-2 Tensor (1,) flotar32
pasos/observación/dummy-3 Tensor (1,) flotar32
pasos/observación/dummy-4 Tensor (1,) flotar32
pasos/observación/dummy-5 Tensor (1,) flotar32
pasos/observación/dummy-6 Tensor (1,) flotar32
pasos/observación/dummy-7 Tensor (1,) flotar32
pasos/observación/ficticio-8 Tensor (1,) flotar32
pasos/observación/ficticio-9 Tensor (1,) flotar32
pasos/observación/estado_egocéntrico Tensor (44,) flotar32
pasos/observación/force_torque Tensor (24,) flotar32
pasos/observación/imu Tensor (6,) flotar32
pasos/observación/torso_vertical Tensor (1,) flotar32
pasos/observación/torso_velocidad Tensor (3,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/quadruped_walk_combined_challenge_easy_20_percent

  • Tamaño del conjunto de datos : 39.31 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 100
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (12,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/dummy-0 Tensor (1,) flotar32
pasos/observación/dummy-1 Tensor (1,) flotar32
pasos/observación/dummy-2 Tensor (1,) flotar32
pasos/observación/dummy-3 Tensor (1,) flotar32
pasos/observación/dummy-4 Tensor (1,) flotar32
pasos/observación/dummy-5 Tensor (1,) flotar32
pasos/observación/dummy-6 Tensor (1,) flotar32
pasos/observación/dummy-7 Tensor (1,) flotar32
pasos/observación/ficticio-8 Tensor (1,) flotar32
pasos/observación/ficticio-9 Tensor (1,) flotar32
pasos/observación/estado_egocéntrico Tensor (44,) flotar32
pasos/observación/force_torque Tensor (24,) flotar32
pasos/observación/imu Tensor (6,) flotar32
pasos/observación/torso_vertical Tensor (1,) flotar32
pasos/observación/torso_velocidad Tensor (3,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/quadruped_walk_combined_challenge_easy_40_percent

  • Tamaño del conjunto de datos : 78.63 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 200
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (12,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/dummy-0 Tensor (1,) flotar32
pasos/observación/dummy-1 Tensor (1,) flotar32
pasos/observación/dummy-2 Tensor (1,) flotar32
pasos/observación/dummy-3 Tensor (1,) flotar32
pasos/observación/dummy-4 Tensor (1,) flotar32
pasos/observación/dummy-5 Tensor (1,) flotar32
pasos/observación/dummy-6 Tensor (1,) flotar32
pasos/observación/dummy-7 Tensor (1,) flotar32
pasos/observación/ficticio-8 Tensor (1,) flotar32
pasos/observación/ficticio-9 Tensor (1,) flotar32
pasos/observación/estado_egocéntrico Tensor (44,) flotar32
pasos/observación/force_torque Tensor (24,) flotar32
pasos/observación/imu Tensor (6,) flotar32
pasos/observación/torso_vertical Tensor (1,) flotar32
pasos/observación/torso_velocidad Tensor (3,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/quadruped_walk_combined_challenge_easy_100_percent

  • Tamaño del conjunto de datos : 196.57 MiB

  • Auto-caché ( documentación ): Solo cuando shuffle_files=False (tren)

  • Divisiones :

Separar Ejemplos
'train' 500
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (12,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/dummy-0 Tensor (1,) flotar32
pasos/observación/dummy-1 Tensor (1,) flotar32
pasos/observación/dummy-2 Tensor (1,) flotar32
pasos/observación/dummy-3 Tensor (1,) flotar32
pasos/observación/dummy-4 Tensor (1,) flotar32
pasos/observación/dummy-5 Tensor (1,) flotar32
pasos/observación/dummy-6 Tensor (1,) flotar32
pasos/observación/dummy-7 Tensor (1,) flotar32
pasos/observación/ficticio-8 Tensor (1,) flotar32
pasos/observación/ficticio-9 Tensor (1,) flotar32
pasos/observación/estado_egocéntrico Tensor (44,) flotar32
pasos/observación/force_torque Tensor (24,) flotar32
pasos/observación/imu Tensor (6,) flotar32
pasos/observación/torso_vertical Tensor (1,) flotar32
pasos/observación/torso_velocidad Tensor (3,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/walker_walk_combined_challenge_easy_1_percent

  • Tamaño del conjunto de datos : 8.20 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 50
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (6,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/dummy-0 Tensor (1,) flotar32
pasos/observación/dummy-1 Tensor (1,) flotar32
pasos/observación/dummy-2 Tensor (1,) flotar32
pasos/observación/dummy-3 Tensor (1,) flotar32
pasos/observación/dummy-4 Tensor (1,) flotar32
pasos/observación/dummy-5 Tensor (1,) flotar32
pasos/observación/dummy-6 Tensor (1,) flotar32
pasos/observación/dummy-7 Tensor (1,) flotar32
pasos/observación/ficticio-8 Tensor (1,) flotar32
pasos/observación/ficticio-9 Tensor (1,) flotar32
pasos/observación/altura Tensor (1,) flotar32
pasos/observación/orientaciones Tensor (14,) flotar32
pasos/observación/velocidad Tensor (9,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/walker_walk_combined_challenge_easy_5_percent

  • Tamaño del conjunto de datos : 40.98 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 250
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (6,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/dummy-0 Tensor (1,) flotar32
pasos/observación/dummy-1 Tensor (1,) flotar32
pasos/observación/dummy-2 Tensor (1,) flotar32
pasos/observación/dummy-3 Tensor (1,) flotar32
pasos/observación/dummy-4 Tensor (1,) flotar32
pasos/observación/dummy-5 Tensor (1,) flotar32
pasos/observación/dummy-6 Tensor (1,) flotar32
pasos/observación/dummy-7 Tensor (1,) flotar32
pasos/observación/ficticio-8 Tensor (1,) flotar32
pasos/observación/ficticio-9 Tensor (1,) flotar32
pasos/observación/altura Tensor (1,) flotar32
pasos/observación/orientaciones Tensor (14,) flotar32
pasos/observación/velocidad Tensor (9,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/walker_walk_combined_challenge_easy_20_percent

  • Tamaño del conjunto de datos : 163.93 MiB

  • Auto-caché ( documentación ): Solo cuando shuffle_files=False (tren)

  • Divisiones :

Separar Ejemplos
'train' 1,000
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (6,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/dummy-0 Tensor (1,) flotar32
pasos/observación/dummy-1 Tensor (1,) flotar32
pasos/observación/dummy-2 Tensor (1,) flotar32
pasos/observación/dummy-3 Tensor (1,) flotar32
pasos/observación/dummy-4 Tensor (1,) flotar32
pasos/observación/dummy-5 Tensor (1,) flotar32
pasos/observación/dummy-6 Tensor (1,) flotar32
pasos/observación/dummy-7 Tensor (1,) flotar32
pasos/observación/ficticio-8 Tensor (1,) flotar32
pasos/observación/ficticio-9 Tensor (1,) flotar32
pasos/observación/altura Tensor (1,) flotar32
pasos/observación/orientaciones Tensor (14,) flotar32
pasos/observación/velocidad Tensor (9,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/walker_walk_combined_challenge_easy_40_percent

  • Tamaño del conjunto de datos : 327.86 MiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 2,000
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (6,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/dummy-0 Tensor (1,) flotar32
pasos/observación/dummy-1 Tensor (1,) flotar32
pasos/observación/dummy-2 Tensor (1,) flotar32
pasos/observación/dummy-3 Tensor (1,) flotar32
pasos/observación/dummy-4 Tensor (1,) flotar32
pasos/observación/dummy-5 Tensor (1,) flotar32
pasos/observación/dummy-6 Tensor (1,) flotar32
pasos/observación/dummy-7 Tensor (1,) flotar32
pasos/observación/ficticio-8 Tensor (1,) flotar32
pasos/observación/ficticio-9 Tensor (1,) flotar32
pasos/observación/altura Tensor (1,) flotar32
pasos/observación/orientaciones Tensor (14,) flotar32
pasos/observación/velocidad Tensor (9,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/walker_walk_combined_challenge_easy_100_percent

  • Tamaño del conjunto de datos : 819.65 MiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 5,000
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (6,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/dummy-0 Tensor (1,) flotar32
pasos/observación/dummy-1 Tensor (1,) flotar32
pasos/observación/dummy-2 Tensor (1,) flotar32
pasos/observación/dummy-3 Tensor (1,) flotar32
pasos/observación/dummy-4 Tensor (1,) flotar32
pasos/observación/dummy-5 Tensor (1,) flotar32
pasos/observación/dummy-6 Tensor (1,) flotar32
pasos/observación/dummy-7 Tensor (1,) flotar32
pasos/observación/ficticio-8 Tensor (1,) flotar32
pasos/observación/ficticio-9 Tensor (1,) flotar32
pasos/observación/altura Tensor (1,) flotar32
pasos/observación/orientaciones Tensor (14,) flotar32
pasos/observación/velocidad Tensor (9,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/humanoid_walk_combined_challenge_easy_1_percent

  • Tamaño del conjunto de datos : 77.11 MiB

  • Almacenamiento automático en caché ( documentación ): Sí

  • Divisiones :

Separar Ejemplos
'train' 200
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (21,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/com_velocidad Tensor (3,) flotar32
pasos/observación/dummy-0 Tensor (1,) flotar32
pasos/observación/dummy-1 Tensor (1,) flotar32
pasos/observación/dummy-2 Tensor (1,) flotar32
pasos/observación/dummy-3 Tensor (1,) flotar32
pasos/observación/dummy-4 Tensor (1,) flotar32
pasos/observación/dummy-5 Tensor (1,) flotar32
pasos/observación/dummy-6 Tensor (1,) flotar32
pasos/observación/dummy-7 Tensor (1,) flotar32
pasos/observación/ficticio-8 Tensor (1,) flotar32
pasos/observación/ficticio-9 Tensor (1,) flotar32
pasos/observación/extremidades Tensor (12,) flotar32
pasos/observación/cabeza_altura Tensor (1,) flotar32
pasos/observación/joint_angles Tensor (21,) flotar32
pasos/observación/torso_vertical Tensor (3,) flotar32
pasos/observación/velocidad Tensor (27,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/humanoid_walk_combined_challenge_easy_5_percent

  • Tamaño del conjunto de datos : 385.54 MiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 1,000
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (21,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/com_velocidad Tensor (3,) flotar32
pasos/observación/dummy-0 Tensor (1,) flotar32
pasos/observación/dummy-1 Tensor (1,) flotar32
pasos/observación/dummy-2 Tensor (1,) flotar32
pasos/observación/dummy-3 Tensor (1,) flotar32
pasos/observación/dummy-4 Tensor (1,) flotar32
pasos/observación/dummy-5 Tensor (1,) flotar32
pasos/observación/dummy-6 Tensor (1,) flotar32
pasos/observación/dummy-7 Tensor (1,) flotar32
pasos/observación/ficticio-8 Tensor (1,) flotar32
pasos/observación/ficticio-9 Tensor (1,) flotar32
pasos/observación/extremidades Tensor (12,) flotar32
pasos/observación/cabeza_altura Tensor (1,) flotar32
pasos/observación/joint_angles Tensor (21,) flotar32
pasos/observación/torso_vertical Tensor (3,) flotar32
pasos/observación/velocidad Tensor (27,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/humanoid_walk_combined_challenge_easy_20_percent

  • Tamaño del conjunto de datos : 1.51 GiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 4,000
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (21,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/com_velocidad Tensor (3,) flotar32
pasos/observación/dummy-0 Tensor (1,) flotar32
pasos/observación/dummy-1 Tensor (1,) flotar32
pasos/observación/dummy-2 Tensor (1,) flotar32
pasos/observación/dummy-3 Tensor (1,) flotar32
pasos/observación/dummy-4 Tensor (1,) flotar32
pasos/observación/dummy-5 Tensor (1,) flotar32
pasos/observación/dummy-6 Tensor (1,) flotar32
pasos/observación/dummy-7 Tensor (1,) flotar32
pasos/observación/ficticio-8 Tensor (1,) flotar32
pasos/observación/ficticio-9 Tensor (1,) flotar32
pasos/observación/extremidades Tensor (12,) flotar32
pasos/observación/cabeza_altura Tensor (1,) flotar32
pasos/observación/joint_angles Tensor (21,) flotar32
pasos/observación/torso_vertical Tensor (3,) flotar32
pasos/observación/velocidad Tensor (27,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/humanoid_walk_combined_challenge_easy_40_percent

  • Tamaño del conjunto de datos : 3.01 GiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 8,000
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (21,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/com_velocidad Tensor (3,) flotar32
pasos/observación/dummy-0 Tensor (1,) flotar32
pasos/observación/dummy-1 Tensor (1,) flotar32
pasos/observación/dummy-2 Tensor (1,) flotar32
pasos/observación/dummy-3 Tensor (1,) flotar32
pasos/observación/dummy-4 Tensor (1,) flotar32
pasos/observación/dummy-5 Tensor (1,) flotar32
pasos/observación/dummy-6 Tensor (1,) flotar32
pasos/observación/dummy-7 Tensor (1,) flotar32
pasos/observación/ficticio-8 Tensor (1,) flotar32
pasos/observación/ficticio-9 Tensor (1,) flotar32
pasos/observación/extremidades Tensor (12,) flotar32
pasos/observación/cabeza_altura Tensor (1,) flotar32
pasos/observación/joint_angles Tensor (21,) flotar32
pasos/observación/torso_vertical Tensor (3,) flotar32
pasos/observación/velocidad Tensor (27,) flotar32
pasos/recompensa Tensor (1,) flotar32

rlu_rwrl/humanoid_walk_combined_challenge_easy_100_percent

  • Tamaño del conjunto de datos : 7.53 GiB

  • Almacenamiento automático en caché ( documentación ): No

  • Divisiones :

Separar Ejemplos
'train' 20,000
  • Estructura de características :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
episodio_retorno Tensor flotar32
pasos conjunto de datos
pasos/acción Tensor (21,) flotar32
pasos/descuento Tensor (1,) flotar32
pasos/es_primero Tensor bool
pasos/es_último Tensor bool
pasos/es_terminal Tensor bool
pasos/observación CaracterísticasDict
pasos/observación/com_velocidad Tensor (3,) flotar32
pasos/observación/dummy-0 Tensor (1,) flotar32
pasos/observación/dummy-1 Tensor (1,) flotar32
pasos/observación/dummy-2 Tensor (1,) flotar32
pasos/observación/dummy-3 Tensor (1,) flotar32
pasos/observación/dummy-4 Tensor (1,) flotar32
pasos/observación/dummy-5 Tensor (1,) flotar32
pasos/observación/dummy-6 Tensor (1,) flotar32
pasos/observación/dummy-7 Tensor (1,) flotar32
pasos/observación/ficticio-8 Tensor (1,) flotar32
pasos/observación/ficticio-9 Tensor (1,) flotar32
pasos/observación/extremidades Tensor (12,) flotar32
pasos/observación/cabeza_altura Tensor (1,) flotar32
pasos/observación/joint_angles Tensor (21,) flotar32
pasos/observación/torso_vertical Tensor (3,) flotar32
pasos/observación/velocidad Tensor (27,) flotar32
pasos/recompensa Tensor (1,) flotar32