- Tanım :
D4RL, çevrimdışı takviyeli öğrenim için açık kaynaklı bir kıyaslamadır. Eğitim ve kıyaslama algoritmaları için standartlaştırılmış ortamlar ve veri kümeleri sağlar.
Veri kümeleri, adımları ve bölümleri temsil etmek için RLDS formatını takip eder.
Yapılandırma açıklaması : https://github.com/rail-berkeley/d4rl/wiki/Tasks#adroit adresinde görev ve sürümleri hakkında daha fazla ayrıntıya bakın
Ana sayfa : https://sites.google.com/view/d4rl-anonymous
Kaynak kodu :
tfds.d4rl.d4rl_adroit_door.D4rlAdroitDoor
Sürümler :
-
1.0.0
: İlk sürüm. -
1.1.0
(varsayılan): is_last eklendi.
-
Denetlenen anahtarlar (
as_supervised
belgesine bakın):None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :
@misc{fu2020d4rl,
title={D4RL: Datasets for Deep Data-Driven Reinforcement Learning},
author={Justin Fu and Aviral Kumar and Ofir Nachum and George Tucker and Sergey Levine},
year={2020},
eprint={2004.07219},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
d4rl_adroit_door/v0-human (varsayılan yapılandırma)
İndirme boyutu :
2.97 MiB
Veri kümesi boyutu :
3.36 MiB
Otomatik önbelleğe alınmış ( belgeler ): Evet
Bölünmeler :
Bölmek | Örnekler |
---|---|
'train' | 50 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(28,), dtype=float32),
'discount': float32,
'infos': FeaturesDict({
'qpos': Tensor(shape=(30,), dtype=float32),
'qvel': Tensor(shape=(30,), dtype=float32),
}),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(39,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | Veri kümesi | |||
adımlar/eylem | Tensör | (28,) | kayan nokta32 | |
adımlar/indirim | Tensör | kayan nokta32 | ||
adımlar/bilgiler | ÖzelliklerDict | |||
adımlar/bilgiler/qpos | Tensör | (30,) | kayan nokta32 | |
adımlar/bilgiler/qvel | Tensör | (30,) | kayan nokta32 | |
adımlar/is_first | Tensör | bool | ||
adımlar/is_last | Tensör | bool | ||
adımlar/is_terminal | Tensör | bool | ||
adımlar/gözlem | Tensör | (39,) | kayan nokta32 | |
adımlar/ödül | Tensör | kayan nokta32 |
- Örnekler ( tfds.as_dataframe ):
d4rl_adroit_door/v0-klonlandı
İndirme boyutu :
602.42 MiB
Veri kümesi boyutu :
497.47 MiB
Otomatik önbelleğe alınmış ( belgeler ): Hayır
Bölünmeler :
Bölmek | Örnekler |
---|---|
'train' | 6.214 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(28,), dtype=float32),
'discount': float64,
'infos': FeaturesDict({
'qpos': Tensor(shape=(30,), dtype=float64),
'qvel': Tensor(shape=(30,), dtype=float64),
}),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(39,), dtype=float64),
'reward': float64,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | Veri kümesi | |||
adımlar/eylem | Tensör | (28,) | kayan nokta32 | |
adımlar/indirim | Tensör | kayan nokta64 | ||
adımlar/bilgiler | ÖzelliklerDict | |||
adımlar/bilgiler/qpos | Tensör | (30,) | kayan nokta64 | |
adımlar/bilgiler/qvel | Tensör | (30,) | kayan nokta64 | |
adımlar/is_first | Tensör | bool | ||
adımlar/is_last | Tensör | bool | ||
adımlar/is_terminal | Tensör | bool | ||
adımlar/gözlem | Tensör | (39,) | kayan nokta64 | |
adımlar/ödül | Tensör | kayan nokta64 |
- Örnekler ( tfds.as_dataframe ):
d4rl_adroit_door/v0-expert
İndirme boyutu :
511.05 MiB
Veri kümesi boyutu :
710.30 MiB
Otomatik önbelleğe alınmış ( belgeler ): Hayır
Bölünmeler :
Bölmek | Örnekler |
---|---|
'train' | 5.000 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(28,), dtype=float32),
'discount': float32,
'infos': FeaturesDict({
'action_logstd': Tensor(shape=(28,), dtype=float32),
'action_mean': Tensor(shape=(28,), dtype=float32),
'qpos': Tensor(shape=(30,), dtype=float32),
'qvel': Tensor(shape=(30,), dtype=float32),
}),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(39,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | Veri kümesi | |||
adımlar/eylem | Tensör | (28,) | kayan nokta32 | |
adımlar/indirim | Tensör | kayan nokta32 | ||
adımlar/bilgiler | ÖzelliklerDict | |||
adımlar/bilgiler/action_logstd | Tensör | (28,) | kayan nokta32 | |
adımlar/bilgiler/action_mean | Tensör | (28,) | kayan nokta32 | |
adımlar/bilgiler/qpos | Tensör | (30,) | kayan nokta32 | |
adımlar/bilgiler/qvel | Tensör | (30,) | kayan nokta32 | |
adımlar/is_first | Tensör | bool | ||
adımlar/is_last | Tensör | bool | ||
adımlar/is_terminal | Tensör | bool | ||
adımlar/gözlem | Tensör | (39,) | kayan nokta32 | |
adımlar/ödül | Tensör | kayan nokta32 |
- Örnekler ( tfds.as_dataframe ):
d4rl_adroit_door/v1-insan
İndirme boyutu :
2.98 MiB
Veri kümesi boyutu :
3.42 MiB
Otomatik önbelleğe alınmış ( belgeler ): Evet
Bölünmeler :
Bölmek | Örnekler |
---|---|
'train' | 25 |
- Özellik yapısı :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(28,), dtype=float32),
'discount': float32,
'infos': FeaturesDict({
'door_body_pos': Tensor(shape=(3,), dtype=float32),
'qpos': Tensor(shape=(30,), dtype=float32),
'qvel': Tensor(shape=(30,), dtype=float32),
}),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(39,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
adımlar | Veri kümesi | |||
adımlar/eylem | Tensör | (28,) | kayan nokta32 | |
adımlar/indirim | Tensör | kayan nokta32 | ||
adımlar/bilgiler | ÖzelliklerDict | |||
adımlar/bilgiler/door_body_pos | Tensör | (3,) | kayan nokta32 | |
adımlar/bilgiler/qpos | Tensör | (30,) | kayan nokta32 | |
adımlar/bilgiler/qvel | Tensör | (30,) | kayan nokta32 | |
adımlar/is_first | Tensör | bool | ||
adımlar/is_last | Tensör | bool | ||
adımlar/is_terminal | Tensör | bool | ||
adımlar/gözlem | Tensör | (39,) | kayan nokta32 | |
adımlar/ödül | Tensör | kayan nokta32 |
- Örnekler ( tfds.as_dataframe ):
d4rl_adroit_door/v1-klonlandı
İndirme boyutu :
280.72 MiB
Veri kümesi boyutu :
1.85 GiB
Otomatik önbelleğe alınmış ( belgeler ): Hayır
Bölünmeler :
Bölmek | Örnekler |
---|---|
'train' | 4.358 |
- Özellik yapısı :
FeaturesDict({
'algorithm': string,
'policy': FeaturesDict({
'fc0': FeaturesDict({
'bias': Tensor(shape=(256,), dtype=float32),
'weight': Tensor(shape=(39, 256), dtype=float32),
}),
'fc1': FeaturesDict({
'bias': Tensor(shape=(256,), dtype=float32),
'weight': Tensor(shape=(256, 256), dtype=float32),
}),
'last_fc': FeaturesDict({
'bias': Tensor(shape=(28,), dtype=float32),
'weight': Tensor(shape=(256, 28), dtype=float32),
}),
'nonlinearity': string,
'output_distribution': string,
}),
'steps': Dataset({
'action': Tensor(shape=(28,), dtype=float32),
'discount': float32,
'infos': FeaturesDict({
'door_body_pos': Tensor(shape=(3,), dtype=float32),
'qpos': Tensor(shape=(30,), dtype=float32),
'qvel': Tensor(shape=(30,), dtype=float32),
}),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(39,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
algoritma | Tensör | sicim | ||
politika | ÖzelliklerDict | |||
politika/fc0 | ÖzelliklerDict | |||
politika/fc0/önyargı | Tensör | (256,) | kayan nokta32 | |
politika/fc0/ağırlık | Tensör | (39, 256) | kayan nokta32 | |
politika/fc1 | ÖzelliklerDict | |||
politika/fc1/önyargı | Tensör | (256,) | kayan nokta32 | |
politika/fc1/ağırlık | Tensör | (256, 256) | kayan nokta32 | |
politika/last_fc | ÖzelliklerDict | |||
politika/last_fc/bias | Tensör | (28,) | kayan nokta32 | |
politika/last_fc/ağırlık | Tensör | (256, 28) | kayan nokta32 | |
politika/doğrusal olmama | Tensör | sicim | ||
politika/çıkış_dağıtımı | Tensör | sicim | ||
adımlar | Veri kümesi | |||
adımlar/eylem | Tensör | (28,) | kayan nokta32 | |
adımlar/indirim | Tensör | kayan nokta32 | ||
adımlar/bilgiler | ÖzelliklerDict | |||
adımlar/bilgiler/door_body_pos | Tensör | (3,) | kayan nokta32 | |
adımlar/bilgiler/qpos | Tensör | (30,) | kayan nokta32 | |
adımlar/bilgiler/qvel | Tensör | (30,) | kayan nokta32 | |
adımlar/is_first | Tensör | bool | ||
adımlar/is_last | Tensör | bool | ||
adımlar/is_terminal | Tensör | bool | ||
adımlar/gözlem | Tensör | (39,) | kayan nokta32 | |
adımlar/ödül | Tensör | kayan nokta32 |
- Örnekler ( tfds.as_dataframe ):
d4rl_adroit_door/v1-expert
İndirme boyutu :
511.22 MiB
Veri kümesi boyutu :
803.48 MiB
Otomatik önbelleğe alınmış ( belgeler ): Hayır
Bölünmeler :
Bölmek | Örnekler |
---|---|
'train' | 5.000 |
- Özellik yapısı :
FeaturesDict({
'algorithm': string,
'policy': FeaturesDict({
'fc0': FeaturesDict({
'bias': Tensor(shape=(32,), dtype=float32),
'weight': Tensor(shape=(32, 39), dtype=float32),
}),
'fc1': FeaturesDict({
'bias': Tensor(shape=(32,), dtype=float32),
'weight': Tensor(shape=(32, 32), dtype=float32),
}),
'last_fc': FeaturesDict({
'bias': Tensor(shape=(28,), dtype=float32),
'weight': Tensor(shape=(28, 32), dtype=float32),
}),
'last_fc_log_std': FeaturesDict({
'bias': Tensor(shape=(28,), dtype=float32),
'weight': Tensor(shape=(28, 32), dtype=float32),
}),
'nonlinearity': string,
'output_distribution': string,
}),
'steps': Dataset({
'action': Tensor(shape=(28,), dtype=float32),
'discount': float32,
'infos': FeaturesDict({
'action_log_std': Tensor(shape=(28,), dtype=float32),
'action_mean': Tensor(shape=(28,), dtype=float32),
'door_body_pos': Tensor(shape=(3,), dtype=float32),
'qpos': Tensor(shape=(30,), dtype=float32),
'qvel': Tensor(shape=(30,), dtype=float32),
}),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(39,), dtype=float32),
'reward': float32,
}),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
algoritma | Tensör | sicim | ||
politika | ÖzelliklerDict | |||
politika/fc0 | ÖzelliklerDict | |||
politika/fc0/önyargı | Tensör | (32,) | kayan nokta32 | |
politika/fc0/ağırlık | Tensör | (32, 39) | kayan nokta32 | |
politika/fc1 | ÖzelliklerDict | |||
politika/fc1/önyargı | Tensör | (32,) | kayan nokta32 | |
politika/fc1/ağırlık | Tensör | (32, 32) | kayan nokta32 | |
politika/last_fc | ÖzelliklerDict | |||
politika/last_fc/bias | Tensör | (28,) | kayan nokta32 | |
politika/last_fc/ağırlık | Tensör | (28, 32) | kayan nokta32 | |
politika/last_fc_log_std | ÖzelliklerDict | |||
politika/last_fc_log_std/bias | Tensör | (28,) | kayan nokta32 | |
politika/last_fc_log_std/weight | Tensör | (28, 32) | kayan nokta32 | |
politika/doğrusal olmama | Tensör | sicim | ||
politika/çıkış_dağıtımı | Tensör | sicim | ||
adımlar | Veri kümesi | |||
adımlar/eylem | Tensör | (28,) | kayan nokta32 | |
adımlar/indirim | Tensör | kayan nokta32 | ||
adımlar/bilgiler | ÖzelliklerDict | |||
adımlar/bilgiler/action_log_std | Tensör | (28,) | kayan nokta32 | |
adımlar/bilgiler/action_mean | Tensör | (28,) | kayan nokta32 | |
adımlar/bilgiler/door_body_pos | Tensör | (3,) | kayan nokta32 | |
adımlar/bilgiler/qpos | Tensör | (30,) | kayan nokta32 | |
adımlar/bilgiler/qvel | Tensör | (30,) | kayan nokta32 | |
adımlar/is_first | Tensör | bool | ||
adımlar/is_last | Tensör | bool | ||
adımlar/is_terminal | Tensör | bool | ||
adımlar/gözlem | Tensör | (39,) | kayan nokta32 | |
adımlar/ödül | Tensör | kayan nokta32 |
- Örnekler ( tfds.as_dataframe ):