stanford_hydra_dataset_convertido_externalmente_a_rlds

  • Descripción :

Franka resolviendo tareas a largo plazo

Dividir Ejemplos
'train' 570
  • Estructura de características :
FeaturesDict({
    'episode_metadata': FeaturesDict({
        'file_path': Text(shape=(), dtype=string),
    }),
    'steps': Dataset({
        'action': Tensor(shape=(7,), dtype=float32, description=Robot action, consists of [3x EEF positional delta, 3x EEF orientation delta in euler angle, 1x close gripper].),
        'discount': Scalar(shape=(), dtype=float32, description=Discount if provided, default to 1.),
        'is_dense': Scalar(shape=(), dtype=bool, description=True if state is a waypoint(010) or in dense mode(x111).),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'language_embedding': Tensor(shape=(512,), dtype=float32, description=Kona language embedding. See https://tfhub.dev/google/universal-sentence-encoder-large/5),
        'language_instruction': Text(shape=(), dtype=string),
        'observation': FeaturesDict({
            'image': Image(shape=(240, 320, 3), dtype=uint8, description=Main camera RGB observation.),
            'state': Tensor(shape=(27,), dtype=float32, description=Robot state, consists of [3x EEF position,4x EEF orientation in quaternion,3x EEF orientation in euler angle,7x robot joint angles, 7x robot joint velocities,3x gripper state.),
            'wrist_image': Image(shape=(240, 320, 3), dtype=uint8, description=Wrist camera RGB observation.),
        }),
        'reward': Scalar(shape=(), dtype=float32, description=Reward if provided, 1 on final step for demos.),
    }),
})
  • Documentación de funciones :
Característica Clase Forma tipo D Descripción
FuncionesDict
episodio_metadatos FuncionesDict
metadatos_episodio/ruta_archivo Texto cadena Ruta al archivo de datos original.
pasos Conjunto de datos
pasos/acción Tensor (7,) flotador32 La acción del robot consta de [3x delta posicional EEF, 3x delta de orientación EEF en ángulo de Euler, 1x pinza de cierre].
pasos/descuento Escalar flotador32 Descuento si se proporciona, el valor predeterminado es 1.
pasos/es_denso Escalar booleano Verdadero si el estado es un waypoint (010) o en modo denso (x111).
pasos/es_primero Tensor booleano
pasos/es_último Tensor booleano
pasos/es_terminal Tensor booleano
pasos/idioma_incrustación Tensor (512,) flotador32 Incorporación del lenguaje Kona. Consulte https://tfhub.dev/google/universal-sentence-encoder-large/5
pasos/instrucción_idioma Texto cadena Instrucción de idiomas.
pasos/observación FuncionesDict
pasos/observación/imagen Imagen (240, 320, 3) uint8 Observación RGB de la cámara principal.
pasos/observación/estado Tensor (27,) flotador32 El estado del robot consta de [3x posición EEF, 4x orientación EEF en cuaternión, 3x orientación EEF en ángulo de Euler, 7x ángulos de articulación del robot, 7x velocidades de articulación del robot, 3x estado de agarre.
pasos/observación/imagen_muñeca Imagen (240, 320, 3) uint8 Cámara de muñeca de observación RGB.
pasos/recompensa Escalar flotador32 Recompensa si se proporciona, 1 en el paso final para demostraciones.
@article{belkhale2023hydra,
 title={HYDRA: Hybrid Robot Actions for Imitation Learning},
 author={Belkhale, Suneel and Cui, Yuchen and Sadigh, Dorsa},
 journal={arxiv},
 year={2023}
}