stanford_hydra_dataset_converted_externally_to_rlds

  • Descrição :

Franka resolvendo tarefas de longo horizonte

Dividir Exemplos
'train' 570
  • Estrutura de recursos :
FeaturesDict({
    'episode_metadata': FeaturesDict({
        'file_path': Text(shape=(), dtype=string),
    }),
    'steps': Dataset({
        'action': Tensor(shape=(7,), dtype=float32, description=Robot action, consists of [3x EEF positional delta, 3x EEF orientation delta in euler angle, 1x close gripper].),
        'discount': Scalar(shape=(), dtype=float32, description=Discount if provided, default to 1.),
        'is_dense': Scalar(shape=(), dtype=bool, description=True if state is a waypoint(010) or in dense mode(x111).),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'language_embedding': Tensor(shape=(512,), dtype=float32, description=Kona language embedding. See https://tfhub.dev/google/universal-sentence-encoder-large/5),
        'language_instruction': Text(shape=(), dtype=string),
        'observation': FeaturesDict({
            'image': Image(shape=(240, 320, 3), dtype=uint8, description=Main camera RGB observation.),
            'state': Tensor(shape=(27,), dtype=float32, description=Robot state, consists of [3x EEF position,4x EEF orientation in quaternion,3x EEF orientation in euler angle,7x robot joint angles, 7x robot joint velocities,3x gripper state.),
            'wrist_image': Image(shape=(240, 320, 3), dtype=uint8, description=Wrist camera RGB observation.),
        }),
        'reward': Scalar(shape=(), dtype=float32, description=Reward if provided, 1 on final step for demos.),
    }),
})
  • Documentação de recursos :
Recurso Aula Forma Tipo D Descrição
RecursosDict
episódio_metadados RecursosDict
episódio_metadados/caminho_do_arquivo Texto corda Caminho para o arquivo de dados original.
passos Conjunto de dados
etapas/ação Tensor (7,) float32 A ação do robô consiste em [3x delta posicional EEF, 3x delta de orientação EEF no ângulo de Euler, 1x pinça próxima].
passos/desconto Escalar float32 Desconto, se fornecido, o padrão é 1.
passos/é_denso Escalar bool Verdadeiro se o estado for um waypoint(010) ou em modo denso(x111).
passos/é_primeiro Tensor bool
passos/é_último Tensor bool
etapas/is_terminal Tensor bool
etapas/idioma_incorporação Tensor (512,) float32 Incorporação da linguagem Kona. Consulte https://tfhub.dev/google/universal-sentence-encoder-large/5
etapas/instrução_idioma Texto corda Instrução de Idiomas.
etapas/observação RecursosDict
passos/observação/imagem Imagem (240, 320, 3) uint8 Observação RGB da câmera principal.
etapas/observação/estado Tensor (27,) float32 O estado do robô consiste em [3x posição EEF, 4x orientação EEF no quaternion, 3x orientação EEF no ângulo de Euler, 7x ângulos de articulação do robô, 7x velocidades de articulação do robô, 3x estado da garra.
passos/observação/imagem_de_pulso Imagem (240, 320, 3) uint8 Observação RGB da câmera de pulso.
passos/recompensa Escalar float32 Recompensa, se fornecida, 1 na etapa final para demonstrações.
@article{belkhale2023hydra,
 title={HYDRA: Hybrid Robot Actions for Imitation Learning},
 author={Belkhale, Suneel and Cui, Yuchen and Sadigh, Dorsa},
 journal={arxiv},
 year={2023}
}