- विवरण :
आरएल अनप्लग्ड ऑफ़लाइन रीइन्फोर्समेंट लर्निंग के लिए बेंचमार्क का सूट है। आरएल अनप्लग्ड को निम्नलिखित विचारों के आसपास डिज़ाइन किया गया है: उपयोग में आसानी के लिए, हम एक एकीकृत एपीआई के साथ डेटासेट प्रदान करते हैं जो सामान्य पाइपलाइन स्थापित होने के बाद व्यवसायी के लिए सूट में सभी डेटा के साथ काम करना आसान बनाता है।
डेटासेट चरण और एपिसोड का प्रतिनिधित्व करने के लिए आरएलडीएस प्रारूप का पालन करते हैं।
डेटासेट में उदाहरण https://arxiv.org/abs/1904.12901 में बताए अनुसार आंशिक रूप से ऑनलाइन प्रशिक्षित एजेंट चलाते समय संग्रहीत SAR संक्रमणों का प्रतिनिधित्व करते हैं, जैसा कि https://github.com/google-research में निर्दिष्ट किया गया है, हम RLDS डेटासेट प्रारूप का पालन करते हैं /आरएलडी#डेटासेट-प्रारूप
हम कुल 8 कार्यों पर 40 डेटासेट जारी करते हैं - बिना किसी संयुक्त चुनौती और कार्टपोल, वॉकर, क्वाड्रुप्ड और ह्यूमनॉइड कार्यों पर आसान संयुक्त चुनौती के साथ। प्रत्येक कार्य में 5 अलग-अलग आकार के डेटासेट होते हैं, 1%, 5%, 20%, 40% और 100%। ध्यान दें कि छोटे डेटासेट को बड़े डेटासेट का सबसेट होने की गारंटी नहीं है। डेटासेट कैसे उत्पन्न किया गया था, इसके विवरण के लिए, कृपया पेपर देखें।
मुखपृष्ठ : https://github.com/deepmind/deepmind-research/tree/master/rl_unplugged
स्रोत कोड :
tfds.rl_unplugged.rlu_rwrl.RluRwrl
संस्करण :
-
1.0.0
: प्रारंभिक रिलीज। -
1.0.1
(डिफ़ॉल्ट): RLU RWRL डेटासेट में एक बग को ठीक करता है जहां ह्यूमनॉइड डेटासेट में से एक में डुप्लिकेट एपिसोड आईडी हैं।
-
डाउनलोड आकार :
Unknown size
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उद्धरण :
@misc{gulcehre2020rl,
title={RL Unplugged: Benchmarks for Offline Reinforcement Learning},
author={Caglar Gulcehre and Ziyu Wang and Alexander Novikov and Tom Le Paine
and Sergio Gómez Colmenarejo and Konrad Zolna and Rishabh Agarwal and
Josh Merel and Daniel Mankowitz and Cosmin Paduraru and Gabriel
Dulac-Arnold and Jerry Li and Mohammad Norouzi and Matt Hoffman and
Ofir Nachum and George Tucker and Nicolas Heess and Nando deFreitas},
year={2020},
eprint={2006.13888},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
rlu_rwrl/cartpole_swingup_combined_challenge_none_1_percent (डिफ़ॉल्ट कॉन्फ़िगरेशन)
डेटासेट का आकार :
172.43 KiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 5 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (1,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/स्थिति | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (2,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_5_percent
डेटासेट का आकार :
862.13 KiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 25 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (1,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/स्थिति | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (2,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_20_percent
डेटासेट का आकार :
3.37 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 100 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (1,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/स्थिति | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (2,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_40_percent
डेटासेट का आकार :
6.74 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 200 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (1,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/स्थिति | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (2,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_100_percent
डेटासेट का आकार :
16.84 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 500 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (1,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/स्थिति | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (2,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_1_percent
डेटासेट का आकार :
1.77 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 5 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (12,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/egocentric_state | टेन्सर | (44,) | फ्लोट32 | |
चरण/अवलोकन/force_torque | टेन्सर | (24,) | फ्लोट32 | |
चरण/अवलोकन/imu | टेन्सर | (6,) | फ्लोट32 | |
चरण/अवलोकन/torso_upright | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/torso_velocity | टेन्सर | (3,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_5_percent
डेटासेट का आकार :
8.86 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 25 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (12,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/egocentric_state | टेन्सर | (44,) | फ्लोट32 | |
चरण/अवलोकन/force_torque | टेन्सर | (24,) | फ्लोट32 | |
चरण/अवलोकन/imu | टेन्सर | (6,) | फ्लोट32 | |
चरण/अवलोकन/torso_upright | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/torso_velocity | टेन्सर | (3,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_20_percent
डेटासेट का आकार :
35.46 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 100 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (12,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/egocentric_state | टेन्सर | (44,) | फ्लोट32 | |
चरण/अवलोकन/force_torque | टेन्सर | (24,) | फ्लोट32 | |
चरण/अवलोकन/imu | टेन्सर | (6,) | फ्लोट32 | |
चरण/अवलोकन/torso_upright | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/torso_velocity | टेन्सर | (3,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_40_percent
डेटासेट का आकार :
70.92 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 200 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (12,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/egocentric_state | टेन्सर | (44,) | फ्लोट32 | |
चरण/अवलोकन/force_torque | टेन्सर | (24,) | फ्लोट32 | |
चरण/अवलोकन/imu | टेन्सर | (6,) | फ्लोट32 | |
चरण/अवलोकन/torso_upright | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/torso_velocity | टेन्सर | (3,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_100_percent
डेटासेट का आकार :
177.29 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): केवल जब
shuffle_files=False
(ट्रेन)विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 500 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (12,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/egocentric_state | टेन्सर | (44,) | फ्लोट32 | |
चरण/अवलोकन/force_torque | टेन्सर | (24,) | फ्लोट32 | |
चरण/अवलोकन/imu | टेन्सर | (6,) | फ्लोट32 | |
चरण/अवलोकन/torso_upright | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/torso_velocity | टेन्सर | (3,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_1_percent
डेटासेट का आकार :
6.27 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 50 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (6,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
कदम/अवलोकन/ऊंचाई | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/अभिविन्यास | टेन्सर | (14,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (9,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_5_percent
डेटासेट का आकार :
31.34 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 250 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (6,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
कदम/अवलोकन/ऊंचाई | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/अभिविन्यास | टेन्सर | (14,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (9,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_20_percent
डेटासेट का आकार :
125.37 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 1,000 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (6,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
कदम/अवलोकन/ऊंचाई | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/अभिविन्यास | टेन्सर | (14,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (9,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_40_percent
डेटासेट का आकार :
250.75 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 2,000 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (6,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
कदम/अवलोकन/ऊंचाई | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/अभिविन्यास | टेन्सर | (14,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (9,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_100_percent
डेटासेट का आकार :
626.86 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 5,000 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (6,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
कदम/अवलोकन/ऊंचाई | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/अभिविन्यास | टेन्सर | (14,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (9,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_1_percent
डेटासेट का आकार :
69.40 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 200 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (21,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/com_velocity | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/चरम | टेन्सर | (12,) | फ्लोट32 | |
कदम/अवलोकन/head_height | टेन्सर | (1,) | फ्लोट32 | |
कदम/अवलोकन/join_angles | टेन्सर | (21,) | फ्लोट32 | |
चरण/अवलोकन/torso_vertical | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (27,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_5_percent
डेटासेट का आकार :
346.98 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 1,000 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (21,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/com_velocity | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/चरम | टेन्सर | (12,) | फ्लोट32 | |
कदम/अवलोकन/head_height | टेन्सर | (1,) | फ्लोट32 | |
कदम/अवलोकन/join_angles | टेन्सर | (21,) | फ्लोट32 | |
चरण/अवलोकन/torso_vertical | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (27,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_20_percent
डेटासेट का आकार :
1.36 GiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 4,000 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (21,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/com_velocity | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/चरम | टेन्सर | (12,) | फ्लोट32 | |
कदम/अवलोकन/head_height | टेन्सर | (1,) | फ्लोट32 | |
कदम/अवलोकन/join_angles | टेन्सर | (21,) | फ्लोट32 | |
चरण/अवलोकन/torso_vertical | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (27,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_40_percent
डेटासेट का आकार :
2.71 GiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 8,000 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (21,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/com_velocity | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/चरम | टेन्सर | (12,) | फ्लोट32 | |
कदम/अवलोकन/head_height | टेन्सर | (1,) | फ्लोट32 | |
कदम/अवलोकन/join_angles | टेन्सर | (21,) | फ्लोट32 | |
चरण/अवलोकन/torso_vertical | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (27,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_100_percent
डेटासेट का आकार :
6.78 GiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 20,000 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (21,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/com_velocity | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/चरम | टेन्सर | (12,) | फ्लोट32 | |
कदम/अवलोकन/head_height | टेन्सर | (1,) | फ्लोट32 | |
कदम/अवलोकन/join_angles | टेन्सर | (21,) | फ्लोट32 | |
चरण/अवलोकन/torso_vertical | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (27,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_1_percent
डेटासेट का आकार :
369.84 KiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 5 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (1,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/डमी-0 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-1 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-2 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-3 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-4 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-5 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-6 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-7 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-8 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-9 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/स्थिति | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (2,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_5_percent
डेटासेट का आकार :
1.81 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 25 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (1,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/डमी-0 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-1 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-2 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-3 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-4 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-5 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-6 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-7 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-8 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-9 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/स्थिति | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (2,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_20_percent
डेटासेट का आकार :
7.22 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 100 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (1,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/डमी-0 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-1 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-2 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-3 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-4 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-5 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-6 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-7 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-8 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-9 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/स्थिति | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (2,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_40_percent
डेटासेट का आकार :
14.45 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 200 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (1,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/डमी-0 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-1 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-2 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-3 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-4 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-5 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-6 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-7 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-8 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-9 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/स्थिति | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (2,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_100_percent
डेटासेट का आकार :
36.12 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 500 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (1,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/डमी-0 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-1 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-2 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-3 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-4 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-5 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-6 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-7 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-8 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-9 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/स्थिति | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (2,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_1_percent
डेटासेट का आकार :
1.97 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 5 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (12,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/डमी-0 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-1 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-2 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-3 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-4 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-5 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-6 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-7 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-8 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-9 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/egocentric_state | टेन्सर | (44,) | फ्लोट32 | |
चरण/अवलोकन/force_torque | टेन्सर | (24,) | फ्लोट32 | |
चरण/अवलोकन/imu | टेन्सर | (6,) | फ्लोट32 | |
चरण/अवलोकन/torso_upright | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/torso_velocity | टेन्सर | (3,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_5_percent
डेटासेट का आकार :
9.83 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 25 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (12,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/डमी-0 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-1 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-2 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-3 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-4 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-5 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-6 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-7 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-8 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-9 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/egocentric_state | टेन्सर | (44,) | फ्लोट32 | |
चरण/अवलोकन/force_torque | टेन्सर | (24,) | फ्लोट32 | |
चरण/अवलोकन/imu | टेन्सर | (6,) | फ्लोट32 | |
चरण/अवलोकन/torso_upright | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/torso_velocity | टेन्सर | (3,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_20_percent
डेटासेट का आकार :
39.31 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 100 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (12,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/डमी-0 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-1 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-2 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-3 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-4 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-5 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-6 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-7 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-8 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-9 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/egocentric_state | टेन्सर | (44,) | फ्लोट32 | |
चरण/अवलोकन/force_torque | टेन्सर | (24,) | फ्लोट32 | |
चरण/अवलोकन/imu | टेन्सर | (6,) | फ्लोट32 | |
चरण/अवलोकन/torso_upright | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/torso_velocity | टेन्सर | (3,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_40_percent
डेटासेट का आकार :
78.63 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 200 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (12,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/डमी-0 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-1 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-2 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-3 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-4 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-5 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-6 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-7 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-8 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-9 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/egocentric_state | टेन्सर | (44,) | फ्लोट32 | |
चरण/अवलोकन/force_torque | टेन्सर | (24,) | फ्लोट32 | |
चरण/अवलोकन/imu | टेन्सर | (6,) | फ्लोट32 | |
चरण/अवलोकन/torso_upright | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/torso_velocity | टेन्सर | (3,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_100_percent
डेटासेट का आकार :
196.57 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): केवल जब
shuffle_files=False
(ट्रेन)विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 500 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (12,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/डमी-0 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-1 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-2 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-3 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-4 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-5 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-6 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-7 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-8 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-9 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/egocentric_state | टेन्सर | (44,) | फ्लोट32 | |
चरण/अवलोकन/force_torque | टेन्सर | (24,) | फ्लोट32 | |
चरण/अवलोकन/imu | टेन्सर | (6,) | फ्लोट32 | |
चरण/अवलोकन/torso_upright | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/torso_velocity | टेन्सर | (3,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_1_percent
डेटासेट का आकार :
8.20 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 50 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (6,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/डमी-0 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-1 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-2 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-3 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-4 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-5 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-6 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-7 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-8 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-9 | टेन्सर | (1,) | फ्लोट32 | |
कदम/अवलोकन/ऊंचाई | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/अभिविन्यास | टेन्सर | (14,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (9,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_5_percent
डेटासेट का आकार :
40.98 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 250 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (6,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/डमी-0 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-1 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-2 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-3 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-4 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-5 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-6 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-7 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-8 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-9 | टेन्सर | (1,) | फ्लोट32 | |
कदम/अवलोकन/ऊंचाई | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/अभिविन्यास | टेन्सर | (14,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (9,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_20_percent
डेटासेट का आकार :
163.93 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): केवल जब
shuffle_files=False
(ट्रेन)विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 1,000 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (6,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/डमी-0 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-1 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-2 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-3 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-4 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-5 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-6 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-7 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-8 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-9 | टेन्सर | (1,) | फ्लोट32 | |
कदम/अवलोकन/ऊंचाई | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/अभिविन्यास | टेन्सर | (14,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (9,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_40_percent
डेटासेट का आकार :
327.86 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 2,000 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (6,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/डमी-0 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-1 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-2 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-3 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-4 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-5 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-6 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-7 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-8 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-9 | टेन्सर | (1,) | फ्लोट32 | |
कदम/अवलोकन/ऊंचाई | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/अभिविन्यास | टेन्सर | (14,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (9,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_100_percent
डेटासेट का आकार :
819.65 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 5,000 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (6,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/डमी-0 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-1 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-2 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-3 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-4 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-5 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-6 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-7 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-8 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-9 | टेन्सर | (1,) | फ्लोट32 | |
कदम/अवलोकन/ऊंचाई | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/अभिविन्यास | टेन्सर | (14,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (9,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_1_percent
डेटासेट का आकार :
77.11 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 200 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (21,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/com_velocity | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/डमी-0 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-1 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-2 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-3 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-4 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-5 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-6 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-7 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-8 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-9 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/चरम | टेन्सर | (12,) | फ्लोट32 | |
कदम/अवलोकन/head_height | टेन्सर | (1,) | फ्लोट32 | |
कदम/अवलोकन/join_angles | टेन्सर | (21,) | फ्लोट32 | |
चरण/अवलोकन/torso_vertical | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (27,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_5_percent
डेटासेट का आकार :
385.54 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 1,000 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (21,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/com_velocity | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/डमी-0 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-1 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-2 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-3 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-4 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-5 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-6 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-7 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-8 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-9 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/चरम | टेन्सर | (12,) | फ्लोट32 | |
कदम/अवलोकन/head_height | टेन्सर | (1,) | फ्लोट32 | |
कदम/अवलोकन/join_angles | टेन्सर | (21,) | फ्लोट32 | |
चरण/अवलोकन/torso_vertical | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (27,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_20_percent
डेटासेट का आकार :
1.51 GiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 4,000 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (21,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/com_velocity | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/डमी-0 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-1 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-2 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-3 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-4 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-5 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-6 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-7 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-8 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-9 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/चरम | टेन्सर | (12,) | फ्लोट32 | |
कदम/अवलोकन/head_height | टेन्सर | (1,) | फ्लोट32 | |
कदम/अवलोकन/join_angles | टेन्सर | (21,) | फ्लोट32 | |
चरण/अवलोकन/torso_vertical | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (27,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_40_percent
डेटासेट का आकार :
3.01 GiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 8,000 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (21,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/com_velocity | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/डमी-0 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-1 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-2 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-3 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-4 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-5 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-6 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-7 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-8 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-9 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/चरम | टेन्सर | (12,) | फ्लोट32 | |
कदम/अवलोकन/head_height | टेन्सर | (1,) | फ्लोट32 | |
कदम/अवलोकन/join_angles | टेन्सर | (21,) | फ्लोट32 | |
चरण/अवलोकन/torso_vertical | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (27,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_100_percent
डेटासेट का आकार :
7.53 GiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 20,000 |
- फ़ीचर संरचना :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
प्रकरण_वापसी | टेन्सर | फ्लोट32 | ||
कदम | डेटासेट | |||
कदम / कार्रवाई | टेन्सर | (21,) | फ्लोट32 | |
चरण/छूट | टेन्सर | (1,) | फ्लोट32 | |
चरण/is_first | टेन्सर | बूल | ||
चरण/is_last | टेन्सर | बूल | ||
कदम/is_terminal | टेन्सर | बूल | ||
चरण/अवलोकन | विशेषताएं डिक्ट | |||
चरण/अवलोकन/com_velocity | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/डमी-0 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-1 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-2 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-3 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-4 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-5 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-6 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-7 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-8 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/डमी-9 | टेन्सर | (1,) | फ्लोट32 | |
चरण/अवलोकन/चरम | टेन्सर | (12,) | फ्लोट32 | |
कदम/अवलोकन/head_height | टेन्सर | (1,) | फ्लोट32 | |
कदम/अवलोकन/join_angles | टेन्सर | (21,) | फ्लोट32 | |
चरण/अवलोकन/torso_vertical | टेन्सर | (3,) | फ्लोट32 | |
चरण/अवलोकन/वेग | टेन्सर | (27,) | फ्लोट32 | |
कदम / इनाम | टेन्सर | (1,) | फ्लोट32 |
- उदाहरण ( tfds.as_dataframe ):