mt_opt

  • Descriptif :

Ensembles de données pour l' article MT-Opt .

@misc{kalashnikov2021mtopt,
      title={MT-Opt: Continuous Multi-Task Robotic Reinforcement Learning at Scale},
      author={Dmitry Kalashnikov and Jacob Varley and Yevgen Chebotar and Benjamin Swanson and Rico Jonschkowski and Chelsea Finn and Sergey Levine and Karol Hausman},
      year={2021},
      eprint={2104.08212},
      archivePrefix={arXiv},
      primaryClass={cs.RO}
}

mt_opt/rlds (configuration par défaut)

  • Description de la configuration : cet ensemble de données contient des épisodes de tâches collectés sur une flotte de robots réels. Il suit le format RLDS pour représenter les étapes et les épisodes.

  • Taille du jeu de données : 4.38 TiB

  • Fractionnements :

Diviser Exemples
'train' 920 165
  • Structure des fonctionnalités :
FeaturesDict({
    'episode_id': string,
    'skill': uint8,
    'steps': Dataset({
        'action': FeaturesDict({
            'close_gripper': bool,
            'open_gripper': bool,
            'target_pose': Tensor(shape=(7,), dtype=float32),
            'terminate': bool,
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'gripper_closed': bool,
            'height_to_bottom': float32,
            'image': Image(shape=(512, 640, 3), dtype=uint8),
            'state_dense': Tensor(shape=(7,), dtype=float32),
        }),
    }),
    'task_code': string,
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
épisode_id Tenseur chaîne de caractères
compétence Tenseur uint8
pas Base de données
étapes/actions FonctionnalitésDict
étapes/action/fermer_gripper Tenseur bourdonner
étapes/action/open_griper Tenseur bourdonner
étapes/action/target_pose Tenseur (sept,) float32
étapes/action/terminer Tenseur bourdonner
étapes/is_first Tenseur bourdonner
pas/est_dernier Tenseur bourdonner
étapes/is_terminal Tenseur bourdonner
étapes/observation FonctionnalitésDict
étapes/observation/pince_fermée Tenseur bourdonner
marches/observation/hauteur_au_bas Tenseur float32
pas/observation/image Image (512, 640, 3) uint8
étapes/observation/état_dense Tenseur (sept,) float32
code_tâche Tenseur chaîne de caractères

mt_opt/sd

  • Description de la configuration : l'ensemble de données des détecteurs de réussite qui contient des définitions humaines de l'achèvement des tâches.

  • Taille du jeu de données : 548.56 GiB

  • Fractionnements :

Diviser Exemples
'test' 94 636
'train' 380 234
  • Structure des fonctionnalités :
FeaturesDict({
    'image_0': Image(shape=(512, 640, 3), dtype=uint8),
    'image_1': Image(shape=(480, 640, 3), dtype=uint8),
    'image_2': Image(shape=(480, 640, 3), dtype=uint8),
    'success': bool,
    'task_code': string,
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
image_0 Image (512, 640, 3) uint8
image_1 Image (480, 640, 3) uint8
image_2 Image (480, 640, 3) uint8
Succès Tenseur bourdonner
code_tâche Tenseur chaîne de caractères