- Descripción :
RL Unplugged es un conjunto de puntos de referencia para el aprendizaje por refuerzo fuera de línea. El RL Unplugged está diseñado en torno a las siguientes consideraciones: para facilitar el uso, proporcionamos los conjuntos de datos con una API unificada que facilita al profesional trabajar con todos los datos en la suite una vez que se ha establecido una canalización general.
Los conjuntos de datos siguen el formato RLDS para representar pasos y episodios.
Los ejemplos en el conjunto de datos representan las transiciones de SAR almacenadas cuando se ejecuta un agente capacitado parcialmente en línea como se describe en https://arxiv.org/abs/1904.12901 Seguimos el formato del conjunto de datos RLDS, como se especifica en https://github.com/google-research /rlds#formato-de-conjunto-de-datos
Lanzamos 40 conjuntos de datos en 8 tareas en total, sin desafío combinado y desafío combinado fácil en las tareas de carro, caminante, cuadrúpedo y humanoide. Cada tarea contiene 5 tamaños diferentes de conjuntos de datos, 1%, 5%, 20%, 40% y 100%. Tenga en cuenta que no se garantiza que el conjunto de datos más pequeño sea un subconjunto de los más grandes. Para obtener detalles sobre cómo se generó el conjunto de datos, consulte el documento.
Página de inicio: https://github.com/deepmind/deepmind-research/tree/master/rl_unplugged
Código fuente :
tfds.rl_unplugged.rlu_rwrl.RluRwrl
Versiones :
-
1.0.0
: Versión inicial. -
1.0.1
(predeterminado): corrige un error en el conjunto de datos RLU RWRL donde hay identificadores de episodios duplicados en uno de los conjuntos de datos humanoides.
-
Tamaño de descarga :
Unknown size
Claves supervisadas (Ver
as_supervised
doc ):None
Figura ( tfds.show_examples ): no compatible.
Cita :
@misc{gulcehre2020rl,
title={RL Unplugged: Benchmarks for Offline Reinforcement Learning},
author={Caglar Gulcehre and Ziyu Wang and Alexander Novikov and Tom Le Paine
and Sergio Gómez Colmenarejo and Konrad Zolna and Rishabh Agarwal and
Josh Merel and Daniel Mankowitz and Cosmin Paduraru and Gabriel
Dulac-Arnold and Jerry Li and Mohammad Norouzi and Matt Hoffman and
Ofir Nachum and George Tucker and Nicolas Heess and Nando deFreitas},
year={2020},
eprint={2006.13888},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
rlu_rwrl/cartpole_swingup_combined_challenge_none_1_percent (configuración predeterminada)
Tamaño del conjunto de datos :
172.43 KiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 5 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (1,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/posición | Tensor | (3,) | flotar32 | |
pasos/observación/velocidad | Tensor | (2,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_5_percent
Tamaño del conjunto de datos :
862.13 KiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 25 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (1,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/posición | Tensor | (3,) | flotar32 | |
pasos/observación/velocidad | Tensor | (2,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_20_percent
Tamaño del conjunto de datos :
3.37 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 100 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (1,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/posición | Tensor | (3,) | flotar32 | |
pasos/observación/velocidad | Tensor | (2,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_40_percent
Tamaño del conjunto de datos :
6.74 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 200 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (1,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/posición | Tensor | (3,) | flotar32 | |
pasos/observación/velocidad | Tensor | (2,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_100_percent
Tamaño del conjunto de datos :
16.84 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 500 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (1,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/posición | Tensor | (3,) | flotar32 | |
pasos/observación/velocidad | Tensor | (2,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_1_percent
Tamaño del conjunto de datos :
1.77 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 5 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (12,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/estado_egocéntrico | Tensor | (44,) | flotar32 | |
pasos/observación/force_torque | Tensor | (24,) | flotar32 | |
pasos/observación/imu | Tensor | (6,) | flotar32 | |
pasos/observación/torso_vertical | Tensor | (1,) | flotar32 | |
pasos/observación/torso_velocidad | Tensor | (3,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_5_percent
Tamaño del conjunto de datos :
8.86 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 25 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (12,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/estado_egocéntrico | Tensor | (44,) | flotar32 | |
pasos/observación/force_torque | Tensor | (24,) | flotar32 | |
pasos/observación/imu | Tensor | (6,) | flotar32 | |
pasos/observación/torso_vertical | Tensor | (1,) | flotar32 | |
pasos/observación/torso_velocidad | Tensor | (3,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_20_percent
Tamaño del conjunto de datos :
35.46 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 100 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (12,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/estado_egocéntrico | Tensor | (44,) | flotar32 | |
pasos/observación/force_torque | Tensor | (24,) | flotar32 | |
pasos/observación/imu | Tensor | (6,) | flotar32 | |
pasos/observación/torso_vertical | Tensor | (1,) | flotar32 | |
pasos/observación/torso_velocidad | Tensor | (3,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_40_percent
Tamaño del conjunto de datos :
70.92 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 200 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (12,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/estado_egocéntrico | Tensor | (44,) | flotar32 | |
pasos/observación/force_torque | Tensor | (24,) | flotar32 | |
pasos/observación/imu | Tensor | (6,) | flotar32 | |
pasos/observación/torso_vertical | Tensor | (1,) | flotar32 | |
pasos/observación/torso_velocidad | Tensor | (3,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_100_percent
Tamaño del conjunto de datos :
177.29 MiB
Auto-caché ( documentación ): Solo cuando
shuffle_files=False
(tren)Divisiones :
Separar | Ejemplos |
---|---|
'train' | 500 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (12,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/estado_egocéntrico | Tensor | (44,) | flotar32 | |
pasos/observación/force_torque | Tensor | (24,) | flotar32 | |
pasos/observación/imu | Tensor | (6,) | flotar32 | |
pasos/observación/torso_vertical | Tensor | (1,) | flotar32 | |
pasos/observación/torso_velocidad | Tensor | (3,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_1_percent
Tamaño del conjunto de datos :
6.27 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 50 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (6,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/altura | Tensor | (1,) | flotar32 | |
pasos/observación/orientaciones | Tensor | (14,) | flotar32 | |
pasos/observación/velocidad | Tensor | (9,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_5_percent
Tamaño del conjunto de datos :
31.34 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 250 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (6,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/altura | Tensor | (1,) | flotar32 | |
pasos/observación/orientaciones | Tensor | (14,) | flotar32 | |
pasos/observación/velocidad | Tensor | (9,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_20_percent
Tamaño del conjunto de datos :
125.37 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 1,000 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (6,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/altura | Tensor | (1,) | flotar32 | |
pasos/observación/orientaciones | Tensor | (14,) | flotar32 | |
pasos/observación/velocidad | Tensor | (9,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_40_percent
Tamaño del conjunto de datos :
250.75 MiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 2,000 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (6,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/altura | Tensor | (1,) | flotar32 | |
pasos/observación/orientaciones | Tensor | (14,) | flotar32 | |
pasos/observación/velocidad | Tensor | (9,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_100_percent
Tamaño del conjunto de datos :
626.86 MiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 5,000 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (6,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/altura | Tensor | (1,) | flotar32 | |
pasos/observación/orientaciones | Tensor | (14,) | flotar32 | |
pasos/observación/velocidad | Tensor | (9,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_1_percent
Tamaño del conjunto de datos :
69.40 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 200 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (21,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/com_velocidad | Tensor | (3,) | flotar32 | |
pasos/observación/extremidades | Tensor | (12,) | flotar32 | |
pasos/observación/cabeza_altura | Tensor | (1,) | flotar32 | |
pasos/observación/joint_angles | Tensor | (21,) | flotar32 | |
pasos/observación/torso_vertical | Tensor | (3,) | flotar32 | |
pasos/observación/velocidad | Tensor | (27,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_5_percent
Tamaño del conjunto de datos :
346.98 MiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 1,000 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (21,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/com_velocidad | Tensor | (3,) | flotar32 | |
pasos/observación/extremidades | Tensor | (12,) | flotar32 | |
pasos/observación/cabeza_altura | Tensor | (1,) | flotar32 | |
pasos/observación/joint_angles | Tensor | (21,) | flotar32 | |
pasos/observación/torso_vertical | Tensor | (3,) | flotar32 | |
pasos/observación/velocidad | Tensor | (27,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_20_percent
Tamaño del conjunto de datos :
1.36 GiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 4,000 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (21,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/com_velocidad | Tensor | (3,) | flotar32 | |
pasos/observación/extremidades | Tensor | (12,) | flotar32 | |
pasos/observación/cabeza_altura | Tensor | (1,) | flotar32 | |
pasos/observación/joint_angles | Tensor | (21,) | flotar32 | |
pasos/observación/torso_vertical | Tensor | (3,) | flotar32 | |
pasos/observación/velocidad | Tensor | (27,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_40_percent
Tamaño del conjunto de datos :
2.71 GiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 8,000 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (21,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/com_velocidad | Tensor | (3,) | flotar32 | |
pasos/observación/extremidades | Tensor | (12,) | flotar32 | |
pasos/observación/cabeza_altura | Tensor | (1,) | flotar32 | |
pasos/observación/joint_angles | Tensor | (21,) | flotar32 | |
pasos/observación/torso_vertical | Tensor | (3,) | flotar32 | |
pasos/observación/velocidad | Tensor | (27,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_100_percent
Tamaño del conjunto de datos :
6.78 GiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 20,000 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (21,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/com_velocidad | Tensor | (3,) | flotar32 | |
pasos/observación/extremidades | Tensor | (12,) | flotar32 | |
pasos/observación/cabeza_altura | Tensor | (1,) | flotar32 | |
pasos/observación/joint_angles | Tensor | (21,) | flotar32 | |
pasos/observación/torso_vertical | Tensor | (3,) | flotar32 | |
pasos/observación/velocidad | Tensor | (27,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_1_percent
Tamaño del conjunto de datos :
369.84 KiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 5 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (1,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/dummy-0 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-1 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-2 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-3 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-4 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-5 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-6 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-7 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-8 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-9 | Tensor | (1,) | flotar32 | |
pasos/observación/posición | Tensor | (3,) | flotar32 | |
pasos/observación/velocidad | Tensor | (2,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_5_percent
Tamaño del conjunto de datos :
1.81 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 25 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (1,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/dummy-0 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-1 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-2 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-3 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-4 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-5 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-6 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-7 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-8 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-9 | Tensor | (1,) | flotar32 | |
pasos/observación/posición | Tensor | (3,) | flotar32 | |
pasos/observación/velocidad | Tensor | (2,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_20_percent
Tamaño del conjunto de datos :
7.22 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 100 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (1,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/dummy-0 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-1 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-2 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-3 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-4 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-5 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-6 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-7 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-8 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-9 | Tensor | (1,) | flotar32 | |
pasos/observación/posición | Tensor | (3,) | flotar32 | |
pasos/observación/velocidad | Tensor | (2,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_40_percent
Tamaño del conjunto de datos :
14.45 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 200 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (1,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/dummy-0 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-1 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-2 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-3 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-4 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-5 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-6 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-7 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-8 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-9 | Tensor | (1,) | flotar32 | |
pasos/observación/posición | Tensor | (3,) | flotar32 | |
pasos/observación/velocidad | Tensor | (2,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_100_percent
Tamaño del conjunto de datos :
36.12 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 500 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (1,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/dummy-0 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-1 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-2 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-3 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-4 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-5 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-6 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-7 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-8 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-9 | Tensor | (1,) | flotar32 | |
pasos/observación/posición | Tensor | (3,) | flotar32 | |
pasos/observación/velocidad | Tensor | (2,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_1_percent
Tamaño del conjunto de datos :
1.97 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 5 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (12,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/dummy-0 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-1 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-2 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-3 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-4 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-5 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-6 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-7 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-8 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-9 | Tensor | (1,) | flotar32 | |
pasos/observación/estado_egocéntrico | Tensor | (44,) | flotar32 | |
pasos/observación/force_torque | Tensor | (24,) | flotar32 | |
pasos/observación/imu | Tensor | (6,) | flotar32 | |
pasos/observación/torso_vertical | Tensor | (1,) | flotar32 | |
pasos/observación/torso_velocidad | Tensor | (3,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_5_percent
Tamaño del conjunto de datos :
9.83 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 25 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (12,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/dummy-0 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-1 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-2 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-3 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-4 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-5 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-6 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-7 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-8 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-9 | Tensor | (1,) | flotar32 | |
pasos/observación/estado_egocéntrico | Tensor | (44,) | flotar32 | |
pasos/observación/force_torque | Tensor | (24,) | flotar32 | |
pasos/observación/imu | Tensor | (6,) | flotar32 | |
pasos/observación/torso_vertical | Tensor | (1,) | flotar32 | |
pasos/observación/torso_velocidad | Tensor | (3,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_20_percent
Tamaño del conjunto de datos :
39.31 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 100 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (12,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/dummy-0 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-1 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-2 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-3 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-4 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-5 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-6 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-7 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-8 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-9 | Tensor | (1,) | flotar32 | |
pasos/observación/estado_egocéntrico | Tensor | (44,) | flotar32 | |
pasos/observación/force_torque | Tensor | (24,) | flotar32 | |
pasos/observación/imu | Tensor | (6,) | flotar32 | |
pasos/observación/torso_vertical | Tensor | (1,) | flotar32 | |
pasos/observación/torso_velocidad | Tensor | (3,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_40_percent
Tamaño del conjunto de datos :
78.63 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 200 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (12,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/dummy-0 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-1 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-2 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-3 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-4 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-5 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-6 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-7 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-8 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-9 | Tensor | (1,) | flotar32 | |
pasos/observación/estado_egocéntrico | Tensor | (44,) | flotar32 | |
pasos/observación/force_torque | Tensor | (24,) | flotar32 | |
pasos/observación/imu | Tensor | (6,) | flotar32 | |
pasos/observación/torso_vertical | Tensor | (1,) | flotar32 | |
pasos/observación/torso_velocidad | Tensor | (3,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_100_percent
Tamaño del conjunto de datos :
196.57 MiB
Auto-caché ( documentación ): Solo cuando
shuffle_files=False
(tren)Divisiones :
Separar | Ejemplos |
---|---|
'train' | 500 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (12,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/dummy-0 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-1 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-2 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-3 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-4 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-5 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-6 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-7 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-8 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-9 | Tensor | (1,) | flotar32 | |
pasos/observación/estado_egocéntrico | Tensor | (44,) | flotar32 | |
pasos/observación/force_torque | Tensor | (24,) | flotar32 | |
pasos/observación/imu | Tensor | (6,) | flotar32 | |
pasos/observación/torso_vertical | Tensor | (1,) | flotar32 | |
pasos/observación/torso_velocidad | Tensor | (3,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_1_percent
Tamaño del conjunto de datos :
8.20 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 50 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (6,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/dummy-0 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-1 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-2 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-3 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-4 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-5 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-6 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-7 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-8 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-9 | Tensor | (1,) | flotar32 | |
pasos/observación/altura | Tensor | (1,) | flotar32 | |
pasos/observación/orientaciones | Tensor | (14,) | flotar32 | |
pasos/observación/velocidad | Tensor | (9,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_5_percent
Tamaño del conjunto de datos :
40.98 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 250 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (6,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/dummy-0 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-1 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-2 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-3 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-4 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-5 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-6 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-7 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-8 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-9 | Tensor | (1,) | flotar32 | |
pasos/observación/altura | Tensor | (1,) | flotar32 | |
pasos/observación/orientaciones | Tensor | (14,) | flotar32 | |
pasos/observación/velocidad | Tensor | (9,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_20_percent
Tamaño del conjunto de datos :
163.93 MiB
Auto-caché ( documentación ): Solo cuando
shuffle_files=False
(tren)Divisiones :
Separar | Ejemplos |
---|---|
'train' | 1,000 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (6,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/dummy-0 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-1 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-2 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-3 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-4 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-5 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-6 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-7 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-8 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-9 | Tensor | (1,) | flotar32 | |
pasos/observación/altura | Tensor | (1,) | flotar32 | |
pasos/observación/orientaciones | Tensor | (14,) | flotar32 | |
pasos/observación/velocidad | Tensor | (9,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_40_percent
Tamaño del conjunto de datos :
327.86 MiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 2,000 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (6,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/dummy-0 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-1 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-2 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-3 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-4 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-5 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-6 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-7 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-8 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-9 | Tensor | (1,) | flotar32 | |
pasos/observación/altura | Tensor | (1,) | flotar32 | |
pasos/observación/orientaciones | Tensor | (14,) | flotar32 | |
pasos/observación/velocidad | Tensor | (9,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_100_percent
Tamaño del conjunto de datos :
819.65 MiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 5,000 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (6,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/dummy-0 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-1 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-2 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-3 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-4 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-5 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-6 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-7 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-8 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-9 | Tensor | (1,) | flotar32 | |
pasos/observación/altura | Tensor | (1,) | flotar32 | |
pasos/observación/orientaciones | Tensor | (14,) | flotar32 | |
pasos/observación/velocidad | Tensor | (9,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_1_percent
Tamaño del conjunto de datos :
77.11 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 200 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (21,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/com_velocidad | Tensor | (3,) | flotar32 | |
pasos/observación/dummy-0 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-1 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-2 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-3 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-4 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-5 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-6 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-7 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-8 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-9 | Tensor | (1,) | flotar32 | |
pasos/observación/extremidades | Tensor | (12,) | flotar32 | |
pasos/observación/cabeza_altura | Tensor | (1,) | flotar32 | |
pasos/observación/joint_angles | Tensor | (21,) | flotar32 | |
pasos/observación/torso_vertical | Tensor | (3,) | flotar32 | |
pasos/observación/velocidad | Tensor | (27,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_5_percent
Tamaño del conjunto de datos :
385.54 MiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 1,000 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (21,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/com_velocidad | Tensor | (3,) | flotar32 | |
pasos/observación/dummy-0 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-1 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-2 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-3 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-4 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-5 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-6 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-7 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-8 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-9 | Tensor | (1,) | flotar32 | |
pasos/observación/extremidades | Tensor | (12,) | flotar32 | |
pasos/observación/cabeza_altura | Tensor | (1,) | flotar32 | |
pasos/observación/joint_angles | Tensor | (21,) | flotar32 | |
pasos/observación/torso_vertical | Tensor | (3,) | flotar32 | |
pasos/observación/velocidad | Tensor | (27,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_20_percent
Tamaño del conjunto de datos :
1.51 GiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 4,000 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (21,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/com_velocidad | Tensor | (3,) | flotar32 | |
pasos/observación/dummy-0 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-1 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-2 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-3 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-4 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-5 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-6 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-7 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-8 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-9 | Tensor | (1,) | flotar32 | |
pasos/observación/extremidades | Tensor | (12,) | flotar32 | |
pasos/observación/cabeza_altura | Tensor | (1,) | flotar32 | |
pasos/observación/joint_angles | Tensor | (21,) | flotar32 | |
pasos/observación/torso_vertical | Tensor | (3,) | flotar32 | |
pasos/observación/velocidad | Tensor | (27,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_40_percent
Tamaño del conjunto de datos :
3.01 GiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 8,000 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (21,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/com_velocidad | Tensor | (3,) | flotar32 | |
pasos/observación/dummy-0 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-1 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-2 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-3 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-4 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-5 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-6 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-7 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-8 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-9 | Tensor | (1,) | flotar32 | |
pasos/observación/extremidades | Tensor | (12,) | flotar32 | |
pasos/observación/cabeza_altura | Tensor | (1,) | flotar32 | |
pasos/observación/joint_angles | Tensor | (21,) | flotar32 | |
pasos/observación/torso_vertical | Tensor | (3,) | flotar32 | |
pasos/observación/velocidad | Tensor | (27,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_100_percent
Tamaño del conjunto de datos :
7.53 GiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 20,000 |
- Estructura de características :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
episodio_retorno | Tensor | flotar32 | ||
pasos | conjunto de datos | |||
pasos/acción | Tensor | (21,) | flotar32 | |
pasos/descuento | Tensor | (1,) | flotar32 | |
pasos/es_primero | Tensor | bool | ||
pasos/es_último | Tensor | bool | ||
pasos/es_terminal | Tensor | bool | ||
pasos/observación | CaracterísticasDict | |||
pasos/observación/com_velocidad | Tensor | (3,) | flotar32 | |
pasos/observación/dummy-0 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-1 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-2 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-3 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-4 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-5 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-6 | Tensor | (1,) | flotar32 | |
pasos/observación/dummy-7 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-8 | Tensor | (1,) | flotar32 | |
pasos/observación/ficticio-9 | Tensor | (1,) | flotar32 | |
pasos/observación/extremidades | Tensor | (12,) | flotar32 | |
pasos/observación/cabeza_altura | Tensor | (1,) | flotar32 | |
pasos/observación/joint_angles | Tensor | (21,) | flotar32 | |
pasos/observación/torso_vertical | Tensor | (3,) | flotar32 | |
pasos/observación/velocidad | Tensor | (27,) | flotar32 | |
pasos/recompensa | Tensor | (1,) | flotar32 |
- Ejemplos ( tfds.as_dataframe ):