hareket

  • Tanım :

Veri kümeleri, MuJoCo hareket görevlerinin çevre ödülü konusunda eğitim almış bir SAC aracısı ile oluşturuldu. Bu veri kümeleri , Çekişmeli Taklit Öğrenme İçin Ne Önemlidir? kitabında kullanılmaktadır. Orsini ve ark. 2021 .

Veri kümeleri, adımları ve bölümleri temsil etmek için RLDS formatını takip eder.

@article{orsini2021matters,
  title={What Matters for Adversarial Imitation Learning?},
  author={Orsini, Manu and Raichuk, Anton and Hussenot, L{'e}onard and Vincent, Damien and Dadashi, Robert and Girgin, Sertan and Geist, Matthieu and Bachem, Olivier and Pietquin, Olivier and Andrychowicz, Marcin},
  journal={International Conference in Machine Learning},
  year={2021}
}

locomotion/ant_sac_1M_single_policy_stochastic (varsayılan yapılandırma)

  • Yapılandırma açıklaması : Ant için 1 milyon adım için eğitilmiş bir SAC aracısı tarafından oluşturulan veri kümesi.

  • İndirme boyutu : 6.49 MiB

  • Veri kümesi boyutu : 23.02 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Evet

  • Bölünmeler :

Bölmek Örnekler
'train' 50
  • Özellik yapısı :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(8,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(111,), dtype=float32),
        'reward': float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
adımlar Veri kümesi
adımlar/eylem Tensör (8,) kayan nokta32
adımlar/indirim Tensör kayan nokta32
adımlar/is_first Tensör bool
adımlar/is_last Tensör bool
adımlar/is_terminal Tensör bool
adımlar/gözlem Tensör (111,) kayan nokta32
adımlar/ödül Tensör kayan nokta32

hareket/hopper_sac_1M_single_policy_stochastic

  • Yapılandırma açıklaması : Hopper için 1 milyon adım konusunda eğitilmiş bir SAC aracısı tarafından oluşturulan veri kümesi.

  • İndirme boyutu : 2.26 MiB

  • Veri kümesi boyutu : 2.62 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Evet

  • Bölünmeler :

Bölmek Örnekler
'train' 50
  • Özellik yapısı :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(3,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(11,), dtype=float32),
        'reward': float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
adımlar Veri kümesi
adımlar/eylem Tensör (3,) kayan nokta32
adımlar/indirim Tensör kayan nokta32
adımlar/is_first Tensör bool
adımlar/is_last Tensör bool
adımlar/is_terminal Tensör bool
adımlar/gözlem Tensör (11,) kayan nokta32
adımlar/ödül Tensör kayan nokta32

hareket/halfcheetah_sac_1M_single_policy_stochastic

  • Yapılandırma açıklaması : HalfCheetah için 1 milyon adım eğitimi almış bir SAC aracısı tarafından oluşturulan veri kümesi.

  • İndirme boyutu : 4.49 MiB

  • Veri kümesi boyutu : 4.93 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Evet

  • Bölünmeler :

Bölmek Örnekler
'train' 50
  • Özellik yapısı :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
adımlar Veri kümesi
adımlar/eylem Tensör (6,) kayan nokta32
adımlar/indirim Tensör kayan nokta32
adımlar/is_first Tensör bool
adımlar/is_last Tensör bool
adımlar/is_terminal Tensör bool
adımlar/gözlem Tensör (17,) kayan nokta32
adımlar/ödül Tensör kayan nokta32

hareket/yürüteç2d_sac_1M_single_policy_stochastic

  • Yapılandırma açıklaması : Walker2d için 1 milyon adım için eğitilmiş bir SAC aracısı tarafından oluşturulan veri kümesi.

  • İndirme boyutu : 4.35 MiB

  • Veri kümesi boyutu : 4.91 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Evet

  • Bölünmeler :

Bölmek Örnekler
'train' 50
  • Özellik yapısı :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(17,), dtype=float32),
        'reward': float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
adımlar Veri kümesi
adımlar/eylem Tensör (6,) kayan nokta32
adımlar/indirim Tensör kayan nokta32
adımlar/is_first Tensör bool
adımlar/is_last Tensör bool
adımlar/is_terminal Tensör bool
adımlar/gözlem Tensör (17,) kayan nokta32
adımlar/ödül Tensör kayan nokta32

hareket/humanoid_sac_15M_single_policy_stochastic

  • Yapılandırma açıklaması : İnsansı için 15 milyon adım için eğitilmiş bir SAC aracısı tarafından oluşturulan veri kümesi.

  • İndirme boyutu : 192.78 MiB

  • Veri kümesi boyutu : 300.94 MiB

  • Otomatik önbelleğe alınmış ( belgeler ): Hayır

  • Bölünmeler :

Bölmek Örnekler
'train' 200
  • Özellik yapısı :
FeaturesDict({
    'steps': Dataset({
        'action': Tensor(shape=(17,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': Tensor(shape=(376,), dtype=float32),
        'reward': float32,
    }),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
ÖzelliklerDict
adımlar Veri kümesi
adımlar/eylem Tensör (17,) kayan nokta32
adımlar/indirim Tensör kayan nokta32
adımlar/is_first Tensör bool
adımlar/is_last Tensör bool
adımlar/is_terminal Tensör bool
adımlar/gözlem Tensör (376,) kayan nokta32
adımlar/ödül Tensör kayan nokta32