- Tanım :
Veri kümeleri, MuJoCo hareket görevlerinin çevre ödülü konusunda eğitim almış bir SAC aracısı ile oluşturuldu. Bu veri kümeleri , Çekişmeli Taklit Öğrenme İçin Ne Önemlidir? kitabında kullanılmaktadır. Orsini ve ark. 2021 .
Veri kümeleri, adımları ve bölümleri temsil etmek için RLDS formatını takip eder.
Ana sayfa : https://github.com/google-research/rlds
Kaynak kodu :
tfds.rlds.datasets.locomotion.Locomotion
Sürümler :
-
1.0.0
(varsayılan): İlk sürüm.
-
Denetlenen anahtarlar (
as_supervised
belgesine bakın):None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :
@article{orsini2021matters,
title={What Matters for Adversarial Imitation Learning?},
author={Orsini, Manu and Raichuk, Anton and Hussenot, L{'e}onard and Vincent, Damien and Dadashi, Robert and Girgin, Sertan and Geist, Matthieu and Bachem, Olivier and Pietquin, Olivier and Andrychowicz, Marcin},
journal={International Conference in Machine Learning},
year={2021}
}
locomotion/ant_sac_1M_single_policy_stochastic (varsayılan yapılandırma)
Yapılandırma açıklaması : Ant için 1 milyon adım için eğitilmiş bir SAC aracısı tarafından oluşturulan veri kümesi.
İndirme boyutu :
6.49 MiB
Veri kümesi boyutu :
23.02 MiB
Otomatik önbelleğe alınmış ( belgeler ): Evet
Bölünmeler :
Bölmek | Örnekler |
---|---|
'train' | 50 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(8,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(111,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | Veri kümesi | |||
adımlar/eylem | Tensör | (8,) | kayan nokta32 | |
adımlar/indirim | Tensör | kayan nokta32 | ||
adımlar/is_first | Tensör | bool | ||
adımlar/is_last | Tensör | bool | ||
adımlar/is_terminal | Tensör | bool | ||
adımlar/gözlem | Tensör | (111,) | kayan nokta32 | |
adımlar/ödül | Tensör | kayan nokta32 |
- Örnekler ( tfds.as_dataframe ):
hareket/hopper_sac_1M_single_policy_stochastic
Yapılandırma açıklaması : Hopper için 1 milyon adım konusunda eğitilmiş bir SAC aracısı tarafından oluşturulan veri kümesi.
İndirme boyutu :
2.26 MiB
Veri kümesi boyutu :
2.62 MiB
Otomatik önbelleğe alınmış ( belgeler ): Evet
Bölünmeler :
Bölmek | Örnekler |
---|---|
'train' | 50 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(3,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(11,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | Veri kümesi | |||
adımlar/eylem | Tensör | (3,) | kayan nokta32 | |
adımlar/indirim | Tensör | kayan nokta32 | ||
adımlar/is_first | Tensör | bool | ||
adımlar/is_last | Tensör | bool | ||
adımlar/is_terminal | Tensör | bool | ||
adımlar/gözlem | Tensör | (11,) | kayan nokta32 | |
adımlar/ödül | Tensör | kayan nokta32 |
- Örnekler ( tfds.as_dataframe ):
hareket/halfcheetah_sac_1M_single_policy_stochastic
Yapılandırma açıklaması : HalfCheetah için 1 milyon adım eğitimi almış bir SAC aracısı tarafından oluşturulan veri kümesi.
İndirme boyutu :
4.49 MiB
Veri kümesi boyutu :
4.93 MiB
Otomatik önbelleğe alınmış ( belgeler ): Evet
Bölünmeler :
Bölmek | Örnekler |
---|---|
'train' | 50 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(17,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | Veri kümesi | |||
adımlar/eylem | Tensör | (6,) | kayan nokta32 | |
adımlar/indirim | Tensör | kayan nokta32 | ||
adımlar/is_first | Tensör | bool | ||
adımlar/is_last | Tensör | bool | ||
adımlar/is_terminal | Tensör | bool | ||
adımlar/gözlem | Tensör | (17,) | kayan nokta32 | |
adımlar/ödül | Tensör | kayan nokta32 |
- Örnekler ( tfds.as_dataframe ):
hareket/yürüteç2d_sac_1M_single_policy_stochastic
Yapılandırma açıklaması : Walker2d için 1 milyon adım için eğitilmiş bir SAC aracısı tarafından oluşturulan veri kümesi.
İndirme boyutu :
4.35 MiB
Veri kümesi boyutu :
4.91 MiB
Otomatik önbelleğe alınmış ( belgeler ): Evet
Bölünmeler :
Bölmek | Örnekler |
---|---|
'train' | 50 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(17,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | Veri kümesi | |||
adımlar/eylem | Tensör | (6,) | kayan nokta32 | |
adımlar/indirim | Tensör | kayan nokta32 | ||
adımlar/is_first | Tensör | bool | ||
adımlar/is_last | Tensör | bool | ||
adımlar/is_terminal | Tensör | bool | ||
adımlar/gözlem | Tensör | (17,) | kayan nokta32 | |
adımlar/ödül | Tensör | kayan nokta32 |
- Örnekler ( tfds.as_dataframe ):
hareket/humanoid_sac_15M_single_policy_stochastic
Yapılandırma açıklaması : İnsansı için 15 milyon adım için eğitilmiş bir SAC aracısı tarafından oluşturulan veri kümesi.
İndirme boyutu :
192.78 MiB
Veri kümesi boyutu :
300.94 MiB
Otomatik önbelleğe alınmış ( belgeler ): Hayır
Bölünmeler :
Bölmek | Örnekler |
---|---|
'train' | 200 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(17,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(376,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | Veri kümesi | |||
adımlar/eylem | Tensör | (17,) | kayan nokta32 | |
adımlar/indirim | Tensör | kayan nokta32 | ||
adımlar/is_first | Tensör | bool | ||
adımlar/is_last | Tensör | bool | ||
adımlar/is_terminal | Tensör | bool | ||
adımlar/gözlem | Tensör | (376,) | kayan nokta32 | |
adımlar/ödül | Tensör | kayan nokta32 |
- Örnekler ( tfds.as_dataframe ):