rlu_locommotion

  • বর্ণনা :

RL আনপ্লাগড হল অফলাইন রিইনফোর্সমেন্ট শেখার জন্য বেঞ্চমার্কের স্যুট। RL আনপ্লাগড নিম্নলিখিত বিবেচনার ভিত্তিতে ডিজাইন করা হয়েছে: ব্যবহারের সহজতর করার জন্য, আমরা একটি ইউনিফাইড API সহ ডেটাসেটগুলি সরবরাহ করি যা অনুশীলনকারীর পক্ষে একটি সাধারণ পাইপলাইন প্রতিষ্ঠিত হওয়ার পরে স্যুটের সমস্ত ডেটার সাথে কাজ করা সহজ করে তোলে।

ডেটাসেটগুলি ধাপ এবং পর্বগুলি উপস্থাপন করতে RLDS বিন্যাস অনুসরণ করে।

এই কাজগুলি সিএমইউ হিউম্যানয়েডের সাথে জড়িত করিডোর লোকোমোশন টাস্কগুলির সমন্বয়ে গঠিত, যার জন্য পূর্বের প্রচেষ্টাগুলি হয় মোশন ক্যাপচার ডেটা Merel et al., 2019a , Merel et al., 2019b বা স্ক্র্যাচ থেকে প্রশিক্ষণ Song et al., 2020 ব্যবহার করেছে। এছাড়াও, DM লোকোমোশন রিপোজিটরিতে একটি ভার্চুয়াল রডেন্ট Merel et al., 2020 এর সাথে মানানসই কাজগুলির একটি সেট রয়েছে৷ আমরা জোর দিয়েছি যে DM লোকোমোশন টাস্কে সমৃদ্ধ অহংকেন্দ্রিক পর্যবেক্ষণ থেকে উপলব্ধির সাথে চ্যালেঞ্জিং উচ্চ-DoF ক্রমাগত নিয়ন্ত্রণের সমন্বয় রয়েছে। কীভাবে ডেটাসেট তৈরি করা হয়েছিল তার বিশদ বিবরণের জন্য, অনুগ্রহ করে কাগজটি পড়ুন।

আমরা আপনাকে ডিপমাইন্ড লোকোমোশন ডেটাসেটে অফলাইন RL পদ্ধতিগুলি চেষ্টা করার পরামর্শ দিই, যদি আপনি ক্রমাগত অ্যাকশন স্পেস সহ খুব চ্যালেঞ্জিং অফলাইন RL ডেটাসেটে আগ্রহী হন।

@inproceedings{gulcehre2020rl,
 title = {RL Unplugged: A Suite of Benchmarks for Offline Reinforcement Learning},
 author = {Gulcehre, Caglar and Wang, Ziyu and Novikov, Alexander and Paine, Thomas and G'{o}mez, Sergio and Zolna, Konrad and Agarwal, Rishabh and Merel, Josh S and Mankowitz, Daniel J and Paduraru, Cosmin and Dulac-Arnold, Gabriel and Li, Jerry and Norouzi, Mohammad and Hoffman, Matthew and Heess, Nicolas and de Freitas, Nando},
 booktitle = {Advances in Neural Information Processing Systems},
 pages = {7248--7259},
 volume = {33},
 year = {2020}
}

rlu_locomotion/humanoid_corridor (ডিফল্ট কনফিগারেশন)

  • ডেটাসেটের আকার : 1.88 GiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 4,000
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_id': int64,
    'steps': Dataset({
        'action': Tensor(shape=(56,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'walker': FeaturesDict({
                'body_height': Tensor(shape=(1,), dtype=float32),
                'egocentric_camera': Image(shape=(64, 64, 3), dtype=uint8),
                'end_effectors_pos': Tensor(shape=(12,), dtype=float32),
                'joints_pos': Tensor(shape=(56,), dtype=float32),
                'joints_vel': Tensor(shape=(56,), dtype=float32),
                'sensors_accelerometer': Tensor(shape=(3,), dtype=float32),
                'sensors_gyro': Tensor(shape=(3,), dtype=float32),
                'sensors_velocimeter': Tensor(shape=(3,), dtype=float32),
                'world_zaxis': Tensor(shape=(3,), dtype=float32),
            }),
        }),
        'reward': float32,
    }),
    'timestamp': int64,
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
episode_id টেনসর int64
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (56,) float32
পদক্ষেপ/ছাড় টেনসর float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষন/ওয়াকার ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষন/ওয়াকার/শরীরের_উচ্চতা টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/অহংকেন্দ্রিক_ক্যামেরা ছবি (৬৪, ৬৪, ৩) uint8
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/এন্ড_ইফেক্টর_পোস টেনসর (12,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/জয়েন্টস_পোস টেনসর (56,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/জয়েন্টস_ভেল টেনসর (56,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_অ্যাক্সিলোমিটার টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_গাইরো টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_বেলোসিমিটার টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/ওয়ার্ল্ড_জ্যাক্সিস টেনসর (৩,) float32
পদক্ষেপ/পুরস্কার টেনসর float32
টাইমস্ট্যাম্প টেনসর int64

rlu_locomotion/humanoid_gaps

  • ডেটাসেটের আকার : 4.57 GiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 8,000
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_id': int64,
    'steps': Dataset({
        'action': Tensor(shape=(56,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'walker': FeaturesDict({
                'body_height': Tensor(shape=(1,), dtype=float32),
                'egocentric_camera': Image(shape=(64, 64, 3), dtype=uint8),
                'end_effectors_pos': Tensor(shape=(12,), dtype=float32),
                'joints_pos': Tensor(shape=(56,), dtype=float32),
                'joints_vel': Tensor(shape=(56,), dtype=float32),
                'sensors_accelerometer': Tensor(shape=(3,), dtype=float32),
                'sensors_gyro': Tensor(shape=(3,), dtype=float32),
                'sensors_velocimeter': Tensor(shape=(3,), dtype=float32),
                'world_zaxis': Tensor(shape=(3,), dtype=float32),
            }),
        }),
        'reward': float32,
    }),
    'timestamp': int64,
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
episode_id টেনসর int64
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (56,) float32
পদক্ষেপ/ছাড় টেনসর float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষন/ওয়াকার ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষন/ওয়াকার/শরীরের_উচ্চতা টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/অহংকেন্দ্রিক_ক্যামেরা ছবি (৬৪, ৬৪, ৩) uint8
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/এন্ড_ইফেক্টর_পোস টেনসর (12,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/জয়েন্টস_পোস টেনসর (56,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/জয়েন্টস_ভেল টেনসর (56,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_অ্যাক্সিলোমিটার টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_গাইরো টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_বেলোসিমিটার টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/ওয়ার্ল্ড_জ্যাক্সিস টেনসর (৩,) float32
পদক্ষেপ/পুরস্কার টেনসর float32
টাইমস্ট্যাম্প টেনসর int64

rlu_locomotion/humanoid_walls

  • ডেটাসেটের আকার : 2.36 GiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 4,000
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_id': int64,
    'steps': Dataset({
        'action': Tensor(shape=(56,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'walker': FeaturesDict({
                'body_height': Tensor(shape=(1,), dtype=float32),
                'egocentric_camera': Image(shape=(64, 64, 3), dtype=uint8),
                'end_effectors_pos': Tensor(shape=(12,), dtype=float32),
                'joints_pos': Tensor(shape=(56,), dtype=float32),
                'joints_vel': Tensor(shape=(56,), dtype=float32),
                'sensors_accelerometer': Tensor(shape=(3,), dtype=float32),
                'sensors_gyro': Tensor(shape=(3,), dtype=float32),
                'sensors_velocimeter': Tensor(shape=(3,), dtype=float32),
                'world_zaxis': Tensor(shape=(3,), dtype=float32),
            }),
        }),
        'reward': float32,
    }),
    'timestamp': int64,
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
episode_id টেনসর int64
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (56,) float32
পদক্ষেপ/ছাড় টেনসর float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষন/ওয়াকার ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষন/ওয়াকার/শরীরের_উচ্চতা টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/অহংকেন্দ্রিক_ক্যামেরা ছবি (৬৪, ৬৪, ৩) uint8
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/এন্ড_ইফেক্টর_পোস টেনসর (12,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/জয়েন্টস_পোস টেনসর (56,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/জয়েন্টস_ভেল টেনসর (56,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_অ্যাক্সিলোমিটার টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_গাইরো টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_বেলোসিমিটার টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/ওয়ার্ল্ড_জ্যাক্সিস টেনসর (৩,) float32
পদক্ষেপ/পুরস্কার টেনসর float32
টাইমস্ট্যাম্প টেনসর int64

rlu_locomotion/rodent_bowl_escape

  • ডেটাসেটের আকার : 16.46 GiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 2,000
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_id': int64,
    'steps': Dataset({
        'action': Tensor(shape=(38,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'walker': FeaturesDict({
                'appendages_pos': Tensor(shape=(15,), dtype=float32),
                'egocentric_camera': Image(shape=(64, 64, 3), dtype=uint8),
                'joints_pos': Tensor(shape=(30,), dtype=float32),
                'joints_vel': Tensor(shape=(30,), dtype=float32),
                'sensors_accelerometer': Tensor(shape=(3,), dtype=float32),
                'sensors_gyro': Tensor(shape=(3,), dtype=float32),
                'sensors_touch': Tensor(shape=(4,), dtype=float32),
                'sensors_velocimeter': Tensor(shape=(3,), dtype=float32),
                'tendons_pos': Tensor(shape=(8,), dtype=float32),
                'tendons_vel': Tensor(shape=(8,), dtype=float32),
                'world_zaxis': Tensor(shape=(3,), dtype=float32),
            }),
        }),
        'reward': float32,
    }),
    'timestamp': int64,
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
episode_id টেনসর int64
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (৩৮,) float32
পদক্ষেপ/ছাড় টেনসর float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষন/ওয়াকার ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/অ্যাপেন্ডেজ_পোস টেনসর (15,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/অহংকেন্দ্রিক_ক্যামেরা ছবি (৬৪, ৬৪, ৩) uint8
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/জয়েন্টস_পোস টেনসর (30,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/জয়েন্টস_ভেল টেনসর (30,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_অ্যাক্সিলোমিটার টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_গাইরো টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_টাচ টেনসর (৪,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_বেলোসিমিটার টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/টেন্ডন_পোস টেনসর (8,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/টেন্ডন_ভেল টেনসর (8,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/ওয়ার্ল্ড_জ্যাক্সিস টেনসর (৩,) float32
পদক্ষেপ/পুরস্কার টেনসর float32
টাইমস্ট্যাম্প টেনসর int64

rlu_locomotion/rodent_gaps

  • ডেটাসেটের আকার : 8.90 GiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 2,000
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_id': int64,
    'steps': Dataset({
        'action': Tensor(shape=(38,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'walker': FeaturesDict({
                'appendages_pos': Tensor(shape=(15,), dtype=float32),
                'egocentric_camera': Image(shape=(64, 64, 3), dtype=uint8),
                'joints_pos': Tensor(shape=(30,), dtype=float32),
                'joints_vel': Tensor(shape=(30,), dtype=float32),
                'sensors_accelerometer': Tensor(shape=(3,), dtype=float32),
                'sensors_gyro': Tensor(shape=(3,), dtype=float32),
                'sensors_touch': Tensor(shape=(4,), dtype=float32),
                'sensors_velocimeter': Tensor(shape=(3,), dtype=float32),
                'tendons_pos': Tensor(shape=(8,), dtype=float32),
                'tendons_vel': Tensor(shape=(8,), dtype=float32),
                'world_zaxis': Tensor(shape=(3,), dtype=float32),
            }),
        }),
        'reward': float32,
    }),
    'timestamp': int64,
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
episode_id টেনসর int64
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (৩৮,) float32
পদক্ষেপ/ছাড় টেনসর float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষন/ওয়াকার ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/অ্যাপেন্ডেজ_পোস টেনসর (15,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/অহংকেন্দ্রিক_ক্যামেরা ছবি (৬৪, ৬৪, ৩) uint8
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/জয়েন্টস_পোস টেনসর (30,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/জয়েন্টস_ভেল টেনসর (30,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_অ্যাক্সিলোমিটার টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_গাইরো টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_টাচ টেনসর (৪,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_বেলোসিমিটার টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/টেন্ডন_পোস টেনসর (8,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/টেন্ডন_ভেল টেনসর (8,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/ওয়ার্ল্ড_জ্যাক্সিস টেনসর (৩,) float32
পদক্ষেপ/পুরস্কার টেনসর float32
টাইমস্ট্যাম্প টেনসর int64

rlu_locomotion/rodent_mazes

  • ডেটাসেটের আকার : 20.71 GiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 2,000
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_id': int64,
    'steps': Dataset({
        'action': Tensor(shape=(38,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'walker': FeaturesDict({
                'appendages_pos': Tensor(shape=(15,), dtype=float32),
                'egocentric_camera': Image(shape=(64, 64, 3), dtype=uint8),
                'joints_pos': Tensor(shape=(30,), dtype=float32),
                'joints_vel': Tensor(shape=(30,), dtype=float32),
                'sensors_accelerometer': Tensor(shape=(3,), dtype=float32),
                'sensors_gyro': Tensor(shape=(3,), dtype=float32),
                'sensors_touch': Tensor(shape=(4,), dtype=float32),
                'sensors_velocimeter': Tensor(shape=(3,), dtype=float32),
                'tendons_pos': Tensor(shape=(8,), dtype=float32),
                'tendons_vel': Tensor(shape=(8,), dtype=float32),
                'world_zaxis': Tensor(shape=(3,), dtype=float32),
            }),
        }),
        'reward': float32,
    }),
    'timestamp': int64,
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
episode_id টেনসর int64
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (৩৮,) float32
পদক্ষেপ/ছাড় টেনসর float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষন/ওয়াকার ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/অ্যাপেন্ডেজ_পোস টেনসর (15,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/অহংকেন্দ্রিক_ক্যামেরা ছবি (৬৪, ৬৪, ৩) uint8
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/জয়েন্টস_পোস টেনসর (30,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/জয়েন্টস_ভেল টেনসর (30,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_অ্যাক্সিলোমিটার টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_গাইরো টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_টাচ টেনসর (৪,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_বেলোসিমিটার টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/টেন্ডন_পোস টেনসর (8,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/টেন্ডন_ভেল টেনসর (8,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/ওয়ার্ল্ড_জ্যাক্সিস টেনসর (৩,) float32
পদক্ষেপ/পুরস্কার টেনসর float32
টাইমস্ট্যাম্প টেনসর int64

rlu_locomotion/rodent_two_touch

  • ডেটাসেটের আকার : 23.05 GiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 2,000
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_id': int64,
    'steps': Dataset({
        'action': Tensor(shape=(38,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'walker': FeaturesDict({
                'appendages_pos': Tensor(shape=(15,), dtype=float32),
                'egocentric_camera': Image(shape=(64, 64, 3), dtype=uint8),
                'joints_pos': Tensor(shape=(30,), dtype=float32),
                'joints_vel': Tensor(shape=(30,), dtype=float32),
                'sensors_accelerometer': Tensor(shape=(3,), dtype=float32),
                'sensors_gyro': Tensor(shape=(3,), dtype=float32),
                'sensors_touch': Tensor(shape=(4,), dtype=float32),
                'sensors_velocimeter': Tensor(shape=(3,), dtype=float32),
                'tendons_pos': Tensor(shape=(8,), dtype=float32),
                'tendons_vel': Tensor(shape=(8,), dtype=float32),
                'world_zaxis': Tensor(shape=(3,), dtype=float32),
            }),
        }),
        'reward': float32,
    }),
    'timestamp': int64,
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
episode_id টেনসর int64
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (৩৮,) float32
পদক্ষেপ/ছাড় টেনসর float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষন/ওয়াকার ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/অ্যাপেন্ডেজ_পোস টেনসর (15,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/অহংকেন্দ্রিক_ক্যামেরা ছবি (৬৪, ৬৪, ৩) uint8
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/জয়েন্টস_পোস টেনসর (30,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/জয়েন্টস_ভেল টেনসর (30,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_অ্যাক্সিলোমিটার টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_গাইরো টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_টাচ টেনসর (৪,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/সেন্সর_বেলোসিমিটার টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/টেন্ডন_পোস টেনসর (8,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/টেন্ডন_ভেল টেনসর (8,) float32
পদক্ষেপ/পর্যবেক্ষণ/ওয়াকার/ওয়ার্ল্ড_জ্যাক্সিস টেনসর (৩,) float32
পদক্ষেপ/পুরস্কার টেনসর float32
টাইমস্ট্যাম্প টেনসর int64