- বর্ণনা :
RL আনপ্লাগড হল অফলাইন রিইনফোর্সমেন্ট শেখার জন্য বেঞ্চমার্কের স্যুট। RL আনপ্লাগড নিম্নলিখিত বিবেচনার ভিত্তিতে ডিজাইন করা হয়েছে: ব্যবহারের সহজতর করার জন্য, আমরা একটি ইউনিফাইড API সহ ডেটাসেটগুলি সরবরাহ করি যা অনুশীলনকারীর পক্ষে একটি সাধারণ পাইপলাইন প্রতিষ্ঠিত হওয়ার পরে স্যুটের সমস্ত ডেটার সাথে কাজ করা সহজ করে তোলে।
ডেটাসেটগুলি ধাপ এবং পর্বগুলি উপস্থাপন করতে RLDS বিন্যাস অনুসরণ করে।
এই কাজগুলি সিএমইউ হিউম্যানয়েডের সাথে জড়িত করিডোর লোকোমোশন টাস্কগুলির সমন্বয়ে গঠিত, যার জন্য পূর্বের প্রচেষ্টাগুলি হয় মোশন ক্যাপচার ডেটা Merel et al., 2019a , Merel et al., 2019b বা স্ক্র্যাচ থেকে প্রশিক্ষণ Song et al., 2020 ব্যবহার করেছে। এছাড়াও, DM লোকোমোশন রিপোজিটরিতে একটি ভার্চুয়াল রডেন্ট Merel et al., 2020 এর সাথে মানানসই কাজগুলির একটি সেট রয়েছে৷ আমরা জোর দিয়েছি যে DM লোকোমোশন টাস্কে সমৃদ্ধ অহংকেন্দ্রিক পর্যবেক্ষণ থেকে উপলব্ধির সাথে চ্যালেঞ্জিং উচ্চ-DoF ক্রমাগত নিয়ন্ত্রণের সমন্বয় রয়েছে। কীভাবে ডেটাসেট তৈরি করা হয়েছিল তার বিশদ বিবরণের জন্য, অনুগ্রহ করে কাগজটি পড়ুন।
আমরা আপনাকে ডিপমাইন্ড লোকোমোশন ডেটাসেটে অফলাইন RL পদ্ধতিগুলি চেষ্টা করার পরামর্শ দিই, যদি আপনি ক্রমাগত অ্যাকশন স্পেস সহ খুব চ্যালেঞ্জিং অফলাইন RL ডেটাসেটে আগ্রহী হন।
হোমপেজ : https://github.com/deepmind/deepmind-research/tree/master/rl_unplugged
সোর্স কোড :
tfds.rl_unplugged.rlu_locomotion.RluLocomotion
সংস্করণ :
-
1.0.0
(ডিফল্ট): প্রাথমিক প্রকাশ।
-
ডাউনলোড আকার :
Unknown size
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদ্ধৃতি :
@inproceedings{gulcehre2020rl,
title = {RL Unplugged: A Suite of Benchmarks for Offline Reinforcement Learning},
author = {Gulcehre, Caglar and Wang, Ziyu and Novikov, Alexander and Paine, Thomas and G'{o}mez, Sergio and Zolna, Konrad and Agarwal, Rishabh and Merel, Josh S and Mankowitz, Daniel J and Paduraru, Cosmin and Dulac-Arnold, Gabriel and Li, Jerry and Norouzi, Mohammad and Hoffman, Matthew and Heess, Nicolas and de Freitas, Nando},
booktitle = {Advances in Neural Information Processing Systems},
pages = {7248--7259},
volume = {33},
year = {2020}
}
rlu_locomotion/humanoid_corridor (ডিফল্ট কনফিগারেশন)
ডেটাসেটের আকার :
1.88 GiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 4,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_id': int64,
'steps': Dataset({
'action': Tensor(shape=(56,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'walker': FeaturesDict({
'body_height': Tensor(shape=(1,), dtype=float32),
'egocentric_camera': Image(shape=(64, 64, 3), dtype=uint8),
'end_effectors_pos': Tensor(shape=(12,), dtype=float32),
'joints_pos': Tensor(shape=(56,), dtype=float32),
'joints_vel': Tensor(shape=(56,), dtype=float32),
'sensors_accelerometer': Tensor(shape=(3,), dtype=float32),
'sensors_gyro': Tensor(shape=(3,), dtype=float32),
'sensors_velocimeter': Tensor(shape=(3,), dtype=float32),
'world_zaxis': Tensor(shape=(3,), dtype=float32),
}),
}),
'reward': float32,
}),
'timestamp': int64,
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
episode_id | টেনসর | int64 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (56,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | float32 | ||
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষন/ওয়াকার | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষন/ওয়াকার/শরীরের_উচ্চতা | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/অহংকেন্দ্রিক_ক্যামেরা | ছবি | (৬৪, ৬৪, ৩) | uint8 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/এন্ড_ইফেক্টর_পোস | টেনসর | (12,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/জয়েন্টস_পোস | টেনসর | (56,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/জয়েন্টস_ভেল | টেনসর | (56,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_অ্যাক্সিলোমিটার | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_গাইরো | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_বেলোসিমিটার | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/ওয়ার্ল্ড_জ্যাক্সিস | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | float32 | ||
টাইমস্ট্যাম্প | টেনসর | int64 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_locomotion/humanoid_gaps
ডেটাসেটের আকার :
4.57 GiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 8,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_id': int64,
'steps': Dataset({
'action': Tensor(shape=(56,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'walker': FeaturesDict({
'body_height': Tensor(shape=(1,), dtype=float32),
'egocentric_camera': Image(shape=(64, 64, 3), dtype=uint8),
'end_effectors_pos': Tensor(shape=(12,), dtype=float32),
'joints_pos': Tensor(shape=(56,), dtype=float32),
'joints_vel': Tensor(shape=(56,), dtype=float32),
'sensors_accelerometer': Tensor(shape=(3,), dtype=float32),
'sensors_gyro': Tensor(shape=(3,), dtype=float32),
'sensors_velocimeter': Tensor(shape=(3,), dtype=float32),
'world_zaxis': Tensor(shape=(3,), dtype=float32),
}),
}),
'reward': float32,
}),
'timestamp': int64,
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
episode_id | টেনসর | int64 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (56,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | float32 | ||
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষন/ওয়াকার | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষন/ওয়াকার/শরীরের_উচ্চতা | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/অহংকেন্দ্রিক_ক্যামেরা | ছবি | (৬৪, ৬৪, ৩) | uint8 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/এন্ড_ইফেক্টর_পোস | টেনসর | (12,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/জয়েন্টস_পোস | টেনসর | (56,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/জয়েন্টস_ভেল | টেনসর | (56,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_অ্যাক্সিলোমিটার | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_গাইরো | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_বেলোসিমিটার | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/ওয়ার্ল্ড_জ্যাক্সিস | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | float32 | ||
টাইমস্ট্যাম্প | টেনসর | int64 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_locomotion/humanoid_walls
ডেটাসেটের আকার :
2.36 GiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 4,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_id': int64,
'steps': Dataset({
'action': Tensor(shape=(56,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'walker': FeaturesDict({
'body_height': Tensor(shape=(1,), dtype=float32),
'egocentric_camera': Image(shape=(64, 64, 3), dtype=uint8),
'end_effectors_pos': Tensor(shape=(12,), dtype=float32),
'joints_pos': Tensor(shape=(56,), dtype=float32),
'joints_vel': Tensor(shape=(56,), dtype=float32),
'sensors_accelerometer': Tensor(shape=(3,), dtype=float32),
'sensors_gyro': Tensor(shape=(3,), dtype=float32),
'sensors_velocimeter': Tensor(shape=(3,), dtype=float32),
'world_zaxis': Tensor(shape=(3,), dtype=float32),
}),
}),
'reward': float32,
}),
'timestamp': int64,
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
episode_id | টেনসর | int64 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (56,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | float32 | ||
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষন/ওয়াকার | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষন/ওয়াকার/শরীরের_উচ্চতা | টেনসর | (1,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/অহংকেন্দ্রিক_ক্যামেরা | ছবি | (৬৪, ৬৪, ৩) | uint8 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/এন্ড_ইফেক্টর_পোস | টেনসর | (12,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/জয়েন্টস_পোস | টেনসর | (56,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/জয়েন্টস_ভেল | টেনসর | (56,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_অ্যাক্সিলোমিটার | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_গাইরো | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_বেলোসিমিটার | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/ওয়ার্ল্ড_জ্যাক্সিস | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | float32 | ||
টাইমস্ট্যাম্প | টেনসর | int64 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_locomotion/rodent_bowl_escape
ডেটাসেটের আকার :
16.46 GiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 2,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_id': int64,
'steps': Dataset({
'action': Tensor(shape=(38,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'walker': FeaturesDict({
'appendages_pos': Tensor(shape=(15,), dtype=float32),
'egocentric_camera': Image(shape=(64, 64, 3), dtype=uint8),
'joints_pos': Tensor(shape=(30,), dtype=float32),
'joints_vel': Tensor(shape=(30,), dtype=float32),
'sensors_accelerometer': Tensor(shape=(3,), dtype=float32),
'sensors_gyro': Tensor(shape=(3,), dtype=float32),
'sensors_touch': Tensor(shape=(4,), dtype=float32),
'sensors_velocimeter': Tensor(shape=(3,), dtype=float32),
'tendons_pos': Tensor(shape=(8,), dtype=float32),
'tendons_vel': Tensor(shape=(8,), dtype=float32),
'world_zaxis': Tensor(shape=(3,), dtype=float32),
}),
}),
'reward': float32,
}),
'timestamp': int64,
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
episode_id | টেনসর | int64 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (৩৮,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | float32 | ||
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষন/ওয়াকার | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/অ্যাপেন্ডেজ_পোস | টেনসর | (15,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/অহংকেন্দ্রিক_ক্যামেরা | ছবি | (৬৪, ৬৪, ৩) | uint8 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/জয়েন্টস_পোস | টেনসর | (30,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/জয়েন্টস_ভেল | টেনসর | (30,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_অ্যাক্সিলোমিটার | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_গাইরো | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_টাচ | টেনসর | (৪,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_বেলোসিমিটার | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/টেন্ডন_পোস | টেনসর | (8,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/টেন্ডন_ভেল | টেনসর | (8,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/ওয়ার্ল্ড_জ্যাক্সিস | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | float32 | ||
টাইমস্ট্যাম্প | টেনসর | int64 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_locomotion/rodent_gaps
ডেটাসেটের আকার :
8.90 GiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 2,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_id': int64,
'steps': Dataset({
'action': Tensor(shape=(38,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'walker': FeaturesDict({
'appendages_pos': Tensor(shape=(15,), dtype=float32),
'egocentric_camera': Image(shape=(64, 64, 3), dtype=uint8),
'joints_pos': Tensor(shape=(30,), dtype=float32),
'joints_vel': Tensor(shape=(30,), dtype=float32),
'sensors_accelerometer': Tensor(shape=(3,), dtype=float32),
'sensors_gyro': Tensor(shape=(3,), dtype=float32),
'sensors_touch': Tensor(shape=(4,), dtype=float32),
'sensors_velocimeter': Tensor(shape=(3,), dtype=float32),
'tendons_pos': Tensor(shape=(8,), dtype=float32),
'tendons_vel': Tensor(shape=(8,), dtype=float32),
'world_zaxis': Tensor(shape=(3,), dtype=float32),
}),
}),
'reward': float32,
}),
'timestamp': int64,
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
episode_id | টেনসর | int64 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (৩৮,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | float32 | ||
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষন/ওয়াকার | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/অ্যাপেন্ডেজ_পোস | টেনসর | (15,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/অহংকেন্দ্রিক_ক্যামেরা | ছবি | (৬৪, ৬৪, ৩) | uint8 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/জয়েন্টস_পোস | টেনসর | (30,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/জয়েন্টস_ভেল | টেনসর | (30,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_অ্যাক্সিলোমিটার | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_গাইরো | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_টাচ | টেনসর | (৪,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_বেলোসিমিটার | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/টেন্ডন_পোস | টেনসর | (8,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/টেন্ডন_ভেল | টেনসর | (8,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/ওয়ার্ল্ড_জ্যাক্সিস | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | float32 | ||
টাইমস্ট্যাম্প | টেনসর | int64 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_locomotion/rodent_mazes
ডেটাসেটের আকার :
20.71 GiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 2,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_id': int64,
'steps': Dataset({
'action': Tensor(shape=(38,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'walker': FeaturesDict({
'appendages_pos': Tensor(shape=(15,), dtype=float32),
'egocentric_camera': Image(shape=(64, 64, 3), dtype=uint8),
'joints_pos': Tensor(shape=(30,), dtype=float32),
'joints_vel': Tensor(shape=(30,), dtype=float32),
'sensors_accelerometer': Tensor(shape=(3,), dtype=float32),
'sensors_gyro': Tensor(shape=(3,), dtype=float32),
'sensors_touch': Tensor(shape=(4,), dtype=float32),
'sensors_velocimeter': Tensor(shape=(3,), dtype=float32),
'tendons_pos': Tensor(shape=(8,), dtype=float32),
'tendons_vel': Tensor(shape=(8,), dtype=float32),
'world_zaxis': Tensor(shape=(3,), dtype=float32),
}),
}),
'reward': float32,
}),
'timestamp': int64,
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
episode_id | টেনসর | int64 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (৩৮,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | float32 | ||
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষন/ওয়াকার | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/অ্যাপেন্ডেজ_পোস | টেনসর | (15,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/অহংকেন্দ্রিক_ক্যামেরা | ছবি | (৬৪, ৬৪, ৩) | uint8 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/জয়েন্টস_পোস | টেনসর | (30,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/জয়েন্টস_ভেল | টেনসর | (30,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_অ্যাক্সিলোমিটার | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_গাইরো | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_টাচ | টেনসর | (৪,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_বেলোসিমিটার | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/টেন্ডন_পোস | টেনসর | (8,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/টেন্ডন_ভেল | টেনসর | (8,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/ওয়ার্ল্ড_জ্যাক্সিস | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | float32 | ||
টাইমস্ট্যাম্প | টেনসর | int64 |
- উদাহরণ ( tfds.as_dataframe ):
rlu_locomotion/rodent_two_touch
ডেটাসেটের আকার :
23.05 GiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 2,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'episode_id': int64,
'steps': Dataset({
'action': Tensor(shape=(38,), dtype=float32),
'discount': float32,
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'observation': FeaturesDict({
'walker': FeaturesDict({
'appendages_pos': Tensor(shape=(15,), dtype=float32),
'egocentric_camera': Image(shape=(64, 64, 3), dtype=uint8),
'joints_pos': Tensor(shape=(30,), dtype=float32),
'joints_vel': Tensor(shape=(30,), dtype=float32),
'sensors_accelerometer': Tensor(shape=(3,), dtype=float32),
'sensors_gyro': Tensor(shape=(3,), dtype=float32),
'sensors_touch': Tensor(shape=(4,), dtype=float32),
'sensors_velocimeter': Tensor(shape=(3,), dtype=float32),
'tendons_pos': Tensor(shape=(8,), dtype=float32),
'tendons_vel': Tensor(shape=(8,), dtype=float32),
'world_zaxis': Tensor(shape=(3,), dtype=float32),
}),
}),
'reward': float32,
}),
'timestamp': int64,
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
episode_id | টেনসর | int64 | ||
পদক্ষেপ | ডেটাসেট | |||
পদক্ষেপ/ক্রিয়া | টেনসর | (৩৮,) | float32 | |
পদক্ষেপ/ছাড় | টেনসর | float32 | ||
steps/is_first | টেনসর | bool | ||
ধাপ/শেষ_শেষ | টেনসর | bool | ||
steps/is_terminal | টেনসর | bool | ||
পদক্ষেপ/পর্যবেক্ষণ | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষন/ওয়াকার | ফিচারসডিক্ট | |||
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/অ্যাপেন্ডেজ_পোস | টেনসর | (15,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/অহংকেন্দ্রিক_ক্যামেরা | ছবি | (৬৪, ৬৪, ৩) | uint8 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/জয়েন্টস_পোস | টেনসর | (30,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/জয়েন্টস_ভেল | টেনসর | (30,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_অ্যাক্সিলোমিটার | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_গাইরো | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_টাচ | টেনসর | (৪,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_বেলোসিমিটার | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/টেন্ডন_পোস | টেনসর | (8,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/টেন্ডন_ভেল | টেনসর | (8,) | float32 | |
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/ওয়ার্ল্ড_জ্যাক্সিস | টেনসর | (৩,) | float32 | |
পদক্ষেপ/পুরস্কার | টেনসর | float32 | ||
টাইমস্ট্যাম্প | টেনসর | int64 |
- উদাহরণ ( tfds.as_dataframe ):