- বর্ণনা :
RL আনপ্লাগড হল অফলাইন রিইনফোর্সমেন্ট শেখার জন্য বেঞ্চমার্কের স্যুট। RL আনপ্লাগড নিম্নলিখিত বিবেচনার ভিত্তিতে ডিজাইন করা হয়েছে: ব্যবহারের সহজতর করার জন্য, আমরা একটি ইউনিফাইড API সহ ডেটাসেটগুলি সরবরাহ করি যা অনুশীলনকারীর পক্ষে একটি সাধারণ পাইপলাইন প্রতিষ্ঠিত হওয়ার পরে স্যুটের সমস্ত ডেটার সাথে কাজ করা সহজ করে তোলে।
ডেটাসেটগুলি ধাপ এবং পর্বগুলি উপস্থাপন করতে RLDS বিন্যাস অনুসরণ করে।
ডেটাসেটের উদাহরণগুলি https://arxiv.org/abs/1904.12901- এ বর্ণিত আংশিকভাবে অনলাইন প্রশিক্ষিত এজেন্ট চালানোর সময় সংরক্ষিত SAR ট্রানজিশনগুলিকে উপস্থাপন করে, যেমন https://github.com/google-research- এ উল্লেখ করা হয়েছে আমরা RLDS ডেটাসেট বিন্যাস অনুসরণ করি /rlds#dataset-format
আমরা মোট 8টি টাস্কে 40টি ডেটাসেট প্রকাশ করি -- কোন সম্মিলিত চ্যালেঞ্জ ছাড়াই এবং কার্টপোল, ওয়াকার, চতুষ্পদ এবং মানবিক কাজগুলিতে সহজ সম্মিলিত চ্যালেঞ্জ ছাড়াই। প্রতিটি টাস্কে 5টি বিভিন্ন আকারের ডেটাসেট রয়েছে, 1%, 5%, 20%, 40% এবং 100%। মনে রাখবেন যে ছোট ডেটাসেটটি বড়গুলির একটি উপসেট হওয়ার নিশ্চয়তা দেয় না। কীভাবে ডেটাসেট তৈরি করা হয়েছিল তার বিশদ বিবরণের জন্য, অনুগ্রহ করে কাগজটি পড়ুন।
হোমপেজ : https://github.com/deepmind/deepmind-research/tree/master/rl_unplugged
উত্স কোড :
tfds.rl_unplugged.rlu_rwrl.RluRwrl
সংস্করণ :
-
1.0.0
: প্রাথমিক প্রকাশ। -
1.0.1
(ডিফল্ট): RLU RWRL ডেটাসেটের একটি বাগ ফিক্স করে যেখানে হিউম্যানয়েড ডেটাসেটের একটিতে ডুপ্লিকেট করা পর্ব আইডি রয়েছে।
-
ডাউনলোড আকার :
Unknown size
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদ্ধৃতি :
@misc{gulcehre2020rl,
title={RL Unplugged: Benchmarks for Offline Reinforcement Learning},
author={Caglar Gulcehre and Ziyu Wang and Alexander Novikov and Tom Le Paine
and Sergio Gómez Colmenarejo and Konrad Zolna and Rishabh Agarwal and
Josh Merel and Daniel Mankowitz and Cosmin Paduraru and Gabriel
Dulac-Arnold and Jerry Li and Mohammad Norouzi and Matt Hoffman and
Ofir Nachum and George Tucker and Nicolas Heess and Nando deFreitas},
year={2020},
eprint={2006.13888},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
rlu_rwrl/cartpole_swingup_combined_challenge_none_1_percent (ডিফল্ট কনফিগারেশন)
ডেটাসেটের আকার :
172.43 KiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 5 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (1,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/অবস্থান | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (2,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_5_percent
ডেটাসেটের আকার :
862.13 KiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 25 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (1,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/অবস্থান | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (2,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_20_percent
ডেটাসেটের আকার :
3.37 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 100 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (1,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/অবস্থান | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (2,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_40_percent
ডেটাসেটের আকার :
6.74 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 200 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (1,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/অবস্থান | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (2,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_none_100_percent
ডেটাসেটের আকার :
16.84 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 500 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (1,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/অবস্থান | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (2,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_1_percent
ডেটাসেটের আকার :
1.77 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 5 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (12,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র | টেনসর | (44,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক | টেনসর | (24,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ইমু | টেনসর | (6,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_5_percent
ডেটাসেটের আকার :
8.86 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 25 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (12,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র | টেনসর | (44,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক | টেনসর | (24,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ইমু | টেনসর | (6,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_20_percent
ডেটাসেটের আকার :
35.46 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 100 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (12,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র | টেনসর | (44,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক | টেনসর | (24,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ইমু | টেনসর | (6,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_40_percent
ডেটাসেটের আকার :
70.92 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 200 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (12,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র | টেনসর | (44,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক | টেনসর | (24,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ইমু | টেনসর | (6,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_none_100_percent
ডেটাসেটের আকার :
177.29 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): শুধুমাত্র যখন
shuffle_files=False
(ট্রেন)বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 500 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (12,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র | টেনসর | (44,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক | টেনসর | (24,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ইমু | টেনসর | (6,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_1_percent
ডেটাসেটের আকার :
6.27 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 50 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (6,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন | টেনসর | (14,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (9,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_5_percent
ডেটাসেটের আকার :
31.34 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 250 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (6,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন | টেনসর | (14,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (9,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_20_percent
ডেটাসেটের আকার :
125.37 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (6,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন | টেনসর | (14,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (9,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_40_percent
ডেটাসেটের আকার :
250.75 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 2,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (6,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন | টেনসর | (14,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (9,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_none_100_percent
ডেটাসেটের আকার :
626.86 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 5,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (6,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন | টেনসর | (14,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (9,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_1_percent
ডেটাসেটের আকার :
69.40 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 200 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (২১,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/com_velocity | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষন/শেষ | টেনসর | (12,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ | টেনসর | (২১,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (২৭,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_5_percent
ডেটাসেটের আকার :
346.98 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (২১,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/com_velocity | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষন/শেষ | টেনসর | (12,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ | টেনসর | (২১,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (২৭,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_20_percent
ডেটাসেটের আকার :
1.36 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 4,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (২১,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/com_velocity | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষন/শেষ | টেনসর | (12,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ | টেনসর | (২১,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (২৭,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_40_percent
ডেটাসেটের আকার :
2.71 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 8,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (২১,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/com_velocity | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষন/শেষ | টেনসর | (12,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ | টেনসর | (২১,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (২৭,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_none_100_percent
ডেটাসেটের আকার :
6.78 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 20,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (২১,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/com_velocity | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষন/শেষ | টেনসর | (12,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ | টেনসর | (২১,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (২৭,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_1_percent
ডেটাসেটের আকার :
369.84 KiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 5 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (1,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/অবস্থান | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (2,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_5_percent
ডেটাসেটের আকার :
1.81 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 25 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (1,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/অবস্থান | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (2,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_20_percent
ডেটাসেটের আকার :
7.22 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 100 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (1,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/অবস্থান | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (2,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_40_percent
ডেটাসেটের আকার :
14.45 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 200 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (1,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/অবস্থান | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (2,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/cartpole_swingup_combined_challenge_easy_100_percent
ডেটাসেটের আকার :
36.12 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 500 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(1,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'position': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(2,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (1,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/অবস্থান | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (2,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_1_percent
ডেটাসেটের আকার :
1.97 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 5 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (12,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র | টেনসর | (44,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক | টেনসর | (24,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ইমু | টেনসর | (6,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_5_percent
ডেটাসেটের আকার :
9.83 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 25 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (12,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র | টেনসর | (44,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক | টেনসর | (24,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ইমু | টেনসর | (6,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_20_percent
ডেটাসেটের আকার :
39.31 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 100 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (12,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র | টেনসর | (44,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক | টেনসর | (24,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ইমু | টেনসর | (6,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_40_percent
ডেটাসেটের আকার :
78.63 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 200 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (12,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র | টেনসর | (44,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক | টেনসর | (24,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ইমু | টেনসর | (6,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/quadruped_walk_combined_challenge_easy_100_percent
ডেটাসেটের আকার :
196.57 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): শুধুমাত্র যখন
shuffle_files=False
(ট্রেন)বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 500 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'egocentric_state': Tensor(shape=(44,), dtype=float32),
'force_torque': Tensor(shape=(24,), dtype=float32),
'imu': Tensor(shape=(6,), dtype=float32),
'torso_upright': Tensor(shape=(1,), dtype=float32),
'torso_velocity': Tensor(shape=(3,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (12,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র | টেনসর | (44,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক | টেনসর | (24,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ইমু | টেনসর | (6,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_1_percent
ডেটাসেটের আকার :
8.20 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 50 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (6,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন | টেনসর | (14,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (9,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_5_percent
ডেটাসেটের আকার :
40.98 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 250 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (6,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন | টেনসর | (14,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (9,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_20_percent
ডেটাসেটের আকার :
163.93 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): শুধুমাত্র যখন
shuffle_files=False
(ট্রেন)বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (6,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন | টেনসর | (14,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (9,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_40_percent
ডেটাসেটের আকার :
327.86 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 2,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (6,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন | টেনসর | (14,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (9,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/walker_walk_combined_challenge_easy_100_percent
ডেটাসেটের আকার :
819.65 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 5,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(6,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'height': Tensor(shape=(1,), dtype=float32),
'orientations': Tensor(shape=(14,), dtype=float32),
'velocity': Tensor(shape=(9,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (6,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন | টেনসর | (14,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (9,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_1_percent
ডেটাসেটের আকার :
77.11 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 200 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (২১,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/com_velocity | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষন/শেষ | টেনসর | (12,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ | টেনসর | (২১,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (২৭,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_5_percent
ডেটাসেটের আকার :
385.54 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (২১,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/com_velocity | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষন/শেষ | টেনসর | (12,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ | টেনসর | (২১,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (২৭,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_20_percent
ডেটাসেটের আকার :
1.51 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 4,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (২১,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/com_velocity | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষন/শেষ | টেনসর | (12,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ | টেনসর | (২১,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (২৭,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_40_percent
ডেটাসেটের আকার :
3.01 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 8,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (২১,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/com_velocity | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-1 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষন/শেষ | টেনসর | (12,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ | টেনসর | (২১,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (২৭,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_rwrl/humanoid_walk_combined_challenge_easy_100_percent
ডেটাসেটের আকার :
7.53 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 20,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_return': float32,
'steps': Dataset({
'action': Tensor(shape=(21,), dtype=float32),
'discount': Tensor(shape=(1,), dtype=float32),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'com_velocity': Tensor(shape=(3,), dtype=float32),
'dummy-0': Tensor(shape=(1,), dtype=float32),
'dummy-1': Tensor(shape=(1,), dtype=float32),
'dummy-2': Tensor(shape=(1,), dtype=float32),
'dummy-3': Tensor(shape=(1,), dtype=float32),
'dummy-4': Tensor(shape=(1,), dtype=float32),
'dummy-5': Tensor(shape=(1,), dtype=float32),
'dummy-6': Tensor(shape=(1,), dtype=float32),
'dummy-7': Tensor(shape=(1,), dtype=float32),
'dummy-8': Tensor(shape=(1,), dtype=float32),
'dummy-9': Tensor(shape=(1,), dtype=float32),
'extremities': Tensor(shape=(12,), dtype=float32),
'head_height': Tensor(shape=(1,), dtype=float32),
'joint_angles': Tensor(shape=(21,), dtype=float32),
'torso_vertical': Tensor(shape=(3,), dtype=float32),
'velocity': Tensor(shape=(27,), dtype=float32),
}),
'reward': Tensor(shape=(1,), dtype=float32),
}),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
পর্ব_প্রত্যাবর্তন | টেনসর | float32 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (২১,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | (1,) | float32 | |
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/com_velocity | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-১ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-5 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 | টেনসর | (1,) | float32 | |
পদক্ষেপ/অবজারভেশন/ডামি-8 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষন/চূড়া | টেনসর | (12,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ | টেনসর | (২১,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/বেগ | টেনসর | (২৭,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | (1,) | float32 |
- উদাহরণ ( tfds.as_dataframe ):