- विवरण :
डेटासेट म्यूजोको लोकोमोशन कार्यों के पर्यावरण पुरस्कार पर प्रशिक्षित एक एसएसी एजेंट के साथ बनाए गए थे। इन डेटासेट का उपयोग प्रतिकूल अनुकरण सीखने के लिए क्या मायने रखता है? में किया जाता है। ओरसिनी एट अल. 2021 .
चरण और एपिसोड का प्रतिनिधित्व करने के लिए डेटासेट आरएलडीएस प्रारूप का पालन करते हैं
मुखपृष्ठ : https://github.com/google-research/rlds
स्रोत कोड :
tfds.rlds.datasets.locomotion.Locomotion
संस्करण :
-
1.0.0
(डिफ़ॉल्ट): प्रारंभिक रिलीज़।
-
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उद्धरण :
@article{orsini2021matters,
title={What Matters for Adversarial Imitation Learning?},
author={Orsini, Manu and Raichuk, Anton and Hussenot, L{'e}onard and Vincent, Damien and Dadashi, Robert and Girgin, Sertan and Geist, Matthieu and Bachem, Olivier and Pietquin, Olivier and Andrychowicz, Marcin},
journal={International Conference in Machine Learning},
year={2021}
}
लोकोमोशन/ant_sac_1M_single_policy_stochastic (डिफ़ॉल्ट कॉन्फ़िगरेशन)
कॉन्फ़िगरेशन विवरण : चींटी के लिए 1M चरणों के लिए प्रशिक्षित SAC एजेंट द्वारा तैयार किया गया डेटासेट।
डाउनलोड आकार :
6.49 MiB
डेटासेट का आकार :
23.02 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 50 |
- फ़ीचर संरचना :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(8,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(111,), dtype=float32),
'reward': float32,
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीप्रकार | विवरण |
---|---|---|---|---|
फीचर्सडिक्ट | ||||
कदम | डेटासेट | |||
कदम/कार्रवाई | टेन्सर | (8,) | फ्लोट32 | |
कदम/छूट | टेन्सर | फ्लोट32 | ||
चरण/पहला है | टेन्सर | बूल | ||
चरण/अंतिम है | टेन्सर | बूल | ||
चरण/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | टेन्सर | (111,) | फ्लोट32 | |
कदम/इनाम | टेन्सर | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
लोकोमोशन/हॉपर_सैक_1एम_सिंगल_पॉलिसी_स्टोकेस्टिक
कॉन्फ़िगरेशन विवरण : हॉपर के लिए 1M चरणों के लिए प्रशिक्षित SAC एजेंट द्वारा तैयार किया गया डेटासेट।
डाउनलोड आकार :
2.26 MiB
डेटासेट का आकार :
2.62 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 50 |
- फ़ीचर संरचना :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(3,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(11,), dtype=float32),
'reward': float32,
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीप्रकार | विवरण |
---|---|---|---|---|
फीचर्सडिक्ट | ||||
कदम | डेटासेट | |||
कदम/कार्रवाई | टेन्सर | (3,) | फ्लोट32 | |
कदम/छूट | टेन्सर | फ्लोट32 | ||
चरण/पहला है | टेन्सर | बूल | ||
चरण/अंतिम है | टेन्सर | बूल | ||
चरण/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | टेन्सर | (11,) | फ्लोट32 | |
कदम/इनाम | टेन्सर | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
लोकोमोशन/हाफचीता_sac_1M_सिंगल_पॉलिसी_स्टोकेस्टिक
कॉन्फ़िगरेशन विवरण : हाफचीता के लिए 1M चरणों के लिए प्रशिक्षित SAC एजेंट द्वारा तैयार किया गया डेटासेट।
डाउनलोड आकार :
4.49 MiB
डेटासेट का आकार :
4.93 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 50 |
- फ़ीचर संरचना :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(17,), dtype=float32),
'reward': float32,
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीप्रकार | विवरण |
---|---|---|---|---|
फीचर्सडिक्ट | ||||
कदम | डेटासेट | |||
कदम/कार्रवाई | टेन्सर | (6,) | फ्लोट32 | |
कदम/छूट | टेन्सर | फ्लोट32 | ||
चरण/पहला है | टेन्सर | बूल | ||
चरण/अंतिम है | टेन्सर | बूल | ||
चरण/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | टेन्सर | (17,) | फ्लोट32 | |
कदम/इनाम | टेन्सर | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
लोकोमोशन/वॉकर2डी_सैक_1एम_सिंगल_पॉलिसी_स्टोकेस्टिक
कॉन्फ़िगरेशन विवरण : वॉकर2डी के लिए 1M चरणों के लिए प्रशिक्षित SAC एजेंट द्वारा तैयार किया गया डेटासेट।
डाउनलोड आकार :
4.35 MiB
डेटासेट का आकार :
4.91 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 50 |
- फ़ीचर संरचना :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(17,), dtype=float32),
'reward': float32,
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीप्रकार | विवरण |
---|---|---|---|---|
फीचर्सडिक्ट | ||||
कदम | डेटासेट | |||
कदम/कार्रवाई | टेन्सर | (6,) | फ्लोट32 | |
कदम/छूट | टेन्सर | फ्लोट32 | ||
चरण/पहला है | टेन्सर | बूल | ||
चरण/अंतिम है | टेन्सर | बूल | ||
चरण/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | टेन्सर | (17,) | फ्लोट32 | |
कदम/इनाम | टेन्सर | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
लोकोमोशन/ह्यूमनॉइड_सैक_15एम_सिंगल_पॉलिसी_स्टोकेस्टिक
कॉन्फ़िगरेशन विवरण : ह्यूमनॉइड के लिए 15M चरणों के लिए प्रशिक्षित SAC एजेंट द्वारा तैयार किया गया डेटासेट।
डाउनलोड आकार :
192.78 MiB
डेटासेट का आकार :
300.94 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 200 |
- फ़ीचर संरचना :
FeaturesDict({
'steps': Dataset({
'action': Tensor(shape=(17,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': Tensor(shape=(376,), dtype=float32),
'reward': float32,
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीप्रकार | विवरण |
---|---|---|---|---|
फीचर्सडिक्ट | ||||
कदम | डेटासेट | |||
कदम/कार्रवाई | टेन्सर | (17,) | फ्लोट32 | |
कदम/छूट | टेन्सर | फ्लोट32 | ||
चरण/पहला है | टेन्सर | बूल | ||
चरण/अंतिम है | टेन्सर | बूल | ||
चरण/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | टेन्सर | (376,) | फ्लोट32 | |
कदम/इनाम | टेन्सर | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):