rlu_rwrl

  • বর্ণনা :

RL আনপ্লাগড হল অফলাইন রিইনফোর্সমেন্ট শেখার জন্য বেঞ্চমার্কের স্যুট। RL আনপ্লাগড নিম্নলিখিত বিবেচনার ভিত্তিতে ডিজাইন করা হয়েছে: ব্যবহারের সহজতর করার জন্য, আমরা একটি ইউনিফাইড API সহ ডেটাসেটগুলি সরবরাহ করি যা অনুশীলনকারীর পক্ষে একটি সাধারণ পাইপলাইন প্রতিষ্ঠিত হওয়ার পরে স্যুটের সমস্ত ডেটার সাথে কাজ করা সহজ করে তোলে।

ডেটাসেটগুলি ধাপ এবং পর্বগুলি উপস্থাপন করতে RLDS বিন্যাস অনুসরণ করে।

ডেটাসেটের উদাহরণগুলি https://arxiv.org/abs/1904.12901- এ বর্ণিত আংশিকভাবে অনলাইন প্রশিক্ষিত এজেন্ট চালানোর সময় সংরক্ষিত SAR ট্রানজিশনগুলিকে উপস্থাপন করে, যেমন https://github.com/google-research- এ উল্লেখ করা হয়েছে আমরা RLDS ডেটাসেট বিন্যাস অনুসরণ করি /rlds#dataset-format

আমরা মোট 8টি টাস্কে 40টি ডেটাসেট প্রকাশ করি -- কোন সম্মিলিত চ্যালেঞ্জ ছাড়াই এবং কার্টপোল, ওয়াকার, চতুষ্পদ এবং মানবিক কাজগুলিতে সহজ সম্মিলিত চ্যালেঞ্জ ছাড়াই। প্রতিটি টাস্কে 5টি বিভিন্ন আকারের ডেটাসেট রয়েছে, 1%, 5%, 20%, 40% এবং 100%। মনে রাখবেন যে ছোট ডেটাসেটটি বড়গুলির একটি উপসেট হওয়ার নিশ্চয়তা দেয় না। কীভাবে ডেটাসেট তৈরি করা হয়েছিল তার বিশদ বিবরণের জন্য, অনুগ্রহ করে কাগজটি পড়ুন।

  • হোমপেজ : https://github.com/deepmind/deepmind-research/tree/master/rl_unplugged

  • উত্স কোড : tfds.rl_unplugged.rlu_rwrl.RluRwrl

  • সংস্করণ :

    • 1.0.0 : প্রাথমিক প্রকাশ।
    • 1.0.1 (ডিফল্ট): RLU RWRL ডেটাসেটের একটি বাগ ফিক্স করে যেখানে হিউম্যানয়েড ডেটাসেটের একটিতে ডুপ্লিকেট করা পর্ব আইডি রয়েছে।
  • ডাউনলোড আকার : Unknown size

  • তত্ত্বাবধান করা কী (দেখুন as_supervised doc ): None

  • চিত্র ( tfds.show_examples ): সমর্থিত নয়।

  • উদ্ধৃতি :

@misc{gulcehre2020rl,
    title={RL Unplugged: Benchmarks for Offline Reinforcement Learning},
    author={Caglar Gulcehre and Ziyu Wang and Alexander Novikov and Tom Le Paine
        and  Sergio Gómez Colmenarejo and Konrad Zolna and Rishabh Agarwal and
        Josh Merel and Daniel Mankowitz and Cosmin Paduraru and Gabriel
        Dulac-Arnold and Jerry Li and Mohammad Norouzi and Matt Hoffman and
        Ofir Nachum and George Tucker and Nicolas Heess and Nando deFreitas},
    year={2020},
    eprint={2006.13888},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

rlu_rwrl/cartpole_swingup_combined_challenge_none_1_percent (ডিফল্ট কনফিগারেশন)

  • ডেটাসেটের আকার : 172.43 KiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 5
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (1,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/অবস্থান টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (2,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/cartpole_swingup_combined_challenge_none_5_percent

  • ডেটাসেটের আকার : 862.13 KiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 25
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (1,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/অবস্থান টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (2,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/cartpole_swingup_combined_challenge_none_20_percent

  • ডেটাসেটের আকার : 3.37 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 100
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (1,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/অবস্থান টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (2,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/cartpole_swingup_combined_challenge_none_40_percent

  • ডেটাসেটের আকার : 6.74 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 200
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (1,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/অবস্থান টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (2,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/cartpole_swingup_combined_challenge_none_100_percent

  • ডেটাসেটের আকার : 16.84 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 500
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (1,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/অবস্থান টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (2,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/quadruped_walk_combined_challenge_none_1_percent

  • ডেটাসেটের আকার : 1.77 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 5
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (12,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র টেনসর (44,) float32
পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক টেনসর (24,) float32
পদক্ষেপ/পর্যবেক্ষণ/ইমু টেনসর (6,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ টেনসর (৩,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/quadruped_walk_combined_challenge_none_5_percent

  • ডেটাসেটের আকার : 8.86 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 25
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (12,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র টেনসর (44,) float32
পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক টেনসর (24,) float32
পদক্ষেপ/পর্যবেক্ষণ/ইমু টেনসর (6,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ টেনসর (৩,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/quadruped_walk_combined_challenge_none_20_percent

  • ডেটাসেটের আকার : 35.46 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 100
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (12,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র টেনসর (44,) float32
পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক টেনসর (24,) float32
পদক্ষেপ/পর্যবেক্ষণ/ইমু টেনসর (6,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ টেনসর (৩,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/quadruped_walk_combined_challenge_none_40_percent

  • ডেটাসেটের আকার : 70.92 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 200
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (12,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র টেনসর (44,) float32
পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক টেনসর (24,) float32
পদক্ষেপ/পর্যবেক্ষণ/ইমু টেনসর (6,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ টেনসর (৩,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/quadruped_walk_combined_challenge_none_100_percent

  • ডেটাসেটের আকার : 177.29 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): শুধুমাত্র যখন shuffle_files=False (ট্রেন)

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 500
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (12,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র টেনসর (44,) float32
পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক টেনসর (24,) float32
পদক্ষেপ/পর্যবেক্ষণ/ইমু টেনসর (6,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ টেনসর (৩,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/walker_walk_combined_challenge_none_1_percent

  • ডেটাসেটের আকার : 6.27 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 50
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (6,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন টেনসর (14,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (9,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/walker_walk_combined_challenge_none_5_percent

  • ডেটাসেটের আকার : 31.34 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 250
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (6,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন টেনসর (14,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (9,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/walker_walk_combined_challenge_none_20_percent

  • ডেটাসেটের আকার : 125.37 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (6,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন টেনসর (14,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (9,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/walker_walk_combined_challenge_none_40_percent

  • ডেটাসেটের আকার : 250.75 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 2,000
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (6,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন টেনসর (14,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (9,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/walker_walk_combined_challenge_none_100_percent

  • ডেটাসেটের আকার : 626.86 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 5,000
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (6,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন টেনসর (14,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (9,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/humanoid_walk_combined_challenge_none_1_percent

  • ডেটাসেটের আকার : 69.40 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 200
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (২১,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/com_velocity টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষন/শেষ টেনসর (12,) float32
পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ টেনসর (২১,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (২৭,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/humanoid_walk_combined_challenge_none_5_percent

  • ডেটাসেটের আকার : 346.98 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (২১,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/com_velocity টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষন/শেষ টেনসর (12,) float32
পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ টেনসর (২১,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (২৭,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/humanoid_walk_combined_challenge_none_20_percent

  • ডেটাসেটের আকার : 1.36 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 4,000
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (২১,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/com_velocity টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষন/শেষ টেনসর (12,) float32
পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ টেনসর (২১,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (২৭,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/humanoid_walk_combined_challenge_none_40_percent

  • ডেটাসেটের আকার : 2.71 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 8,000
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (২১,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/com_velocity টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষন/শেষ টেনসর (12,) float32
পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ টেনসর (২১,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (২৭,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/humanoid_walk_combined_challenge_none_100_percent

  • ডেটাসেটের আকার : 6.78 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 20,000
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (২১,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/com_velocity টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষন/শেষ টেনসর (12,) float32
পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ টেনসর (২১,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (২৭,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_1_percent

  • ডেটাসেটের আকার : 369.84 KiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 5
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (1,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-1 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-5 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-8 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/অবস্থান টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (2,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_5_percent

  • ডেটাসেটের আকার : 1.81 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 25
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (1,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-1 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-5 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-8 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/অবস্থান টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (2,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_20_percent

  • ডেটাসেটের আকার : 7.22 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 100
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (1,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-1 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-5 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-8 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/অবস্থান টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (2,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_40_percent

  • ডেটাসেটের আকার : 14.45 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 200
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (1,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-1 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-5 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-8 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/অবস্থান টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (2,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/cartpole_swingup_combined_challenge_easy_100_percent

  • ডেটাসেটের আকার : 36.12 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 500
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(1,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'position': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(2,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (1,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-1 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-5 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-8 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/অবস্থান টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (2,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/quadruped_walk_combined_challenge_easy_1_percent

  • ডেটাসেটের আকার : 1.97 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 5
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (12,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-1 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-5 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-8 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র টেনসর (44,) float32
পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক টেনসর (24,) float32
পদক্ষেপ/পর্যবেক্ষণ/ইমু টেনসর (6,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ টেনসর (৩,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/quadruped_walk_combined_challenge_easy_5_percent

  • ডেটাসেটের আকার : 9.83 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 25
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (12,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-1 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-5 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-8 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র টেনসর (44,) float32
পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক টেনসর (24,) float32
পদক্ষেপ/পর্যবেক্ষণ/ইমু টেনসর (6,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ টেনসর (৩,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/quadruped_walk_combined_challenge_easy_20_percent

  • ডেটাসেটের আকার : 39.31 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 100
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (12,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-1 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-5 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-8 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র টেনসর (44,) float32
পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক টেনসর (24,) float32
পদক্ষেপ/পর্যবেক্ষণ/ইমু টেনসর (6,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ টেনসর (৩,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/quadruped_walk_combined_challenge_easy_40_percent

  • ডেটাসেটের আকার : 78.63 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 200
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (12,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-1 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-5 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-8 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র টেনসর (44,) float32
পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক টেনসর (24,) float32
পদক্ষেপ/পর্যবেক্ষণ/ইমু টেনসর (6,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ টেনসর (৩,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/quadruped_walk_combined_challenge_easy_100_percent

  • ডেটাসেটের আকার : 196.57 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): শুধুমাত্র যখন shuffle_files=False (ট্রেন)

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 500
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(12,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'egocentric_state': Tensor(shape=(44,), dtype=float32),
            'force_torque': Tensor(shape=(24,), dtype=float32),
            'imu': Tensor(shape=(6,), dtype=float32),
            'torso_upright': Tensor(shape=(1,), dtype=float32),
            'torso_velocity': Tensor(shape=(3,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (12,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-1 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-5 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-8 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/অহংকেন্দ্রিক_রাষ্ট্র টেনসর (44,) float32
পদক্ষেপ/পর্যবেক্ষণ/ফোর্স_টর্ক টেনসর (24,) float32
পদক্ষেপ/পর্যবেক্ষণ/ইমু টেনসর (6,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উপর টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_বেগ টেনসর (৩,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/walker_walk_combined_challenge_easy_1_percent

  • ডেটাসেটের আকার : 8.20 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 50
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (6,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-1 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-5 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-8 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন টেনসর (14,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (9,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/walker_walk_combined_challenge_easy_5_percent

  • ডেটাসেটের আকার : 40.98 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 250
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (6,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-1 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-5 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-8 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন টেনসর (14,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (9,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/walker_walk_combined_challenge_easy_20_percent

  • ডেটাসেটের আকার : 163.93 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): শুধুমাত্র যখন shuffle_files=False (ট্রেন)

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (6,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-1 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-5 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-8 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন টেনসর (14,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (9,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/walker_walk_combined_challenge_easy_40_percent

  • ডেটাসেটের আকার : 327.86 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 2,000
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (6,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-1 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-5 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-8 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন টেনসর (14,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (9,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/walker_walk_combined_challenge_easy_100_percent

  • ডেটাসেটের আকার : 819.65 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 5,000
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(6,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'height': Tensor(shape=(1,), dtype=float32),
            'orientations': Tensor(shape=(14,), dtype=float32),
            'velocity': Tensor(shape=(9,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (6,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-1 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-5 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-8 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/উচ্চতা টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/অভিযোজন টেনসর (14,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (9,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_1_percent

  • ডেটাসেটের আকার : 77.11 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 200
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (২১,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/com_velocity টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-1 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-5 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-8 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষন/শেষ টেনসর (12,) float32
পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ টেনসর (২১,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (২৭,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_5_percent

  • ডেটাসেটের আকার : 385.54 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (২১,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/com_velocity টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-1 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-5 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-8 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষন/শেষ টেনসর (12,) float32
পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ টেনসর (২১,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (২৭,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_20_percent

  • ডেটাসেটের আকার : 1.51 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 4,000
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (২১,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/com_velocity টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-1 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-5 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-8 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষন/শেষ টেনসর (12,) float32
পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ টেনসর (২১,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (২৭,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_40_percent

  • ডেটাসেটের আকার : 3.01 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 8,000
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (২১,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/com_velocity টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-1 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-5 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-8 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষন/শেষ টেনসর (12,) float32
পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ টেনসর (২১,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (২৭,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32

rlu_rwrl/humanoid_walk_combined_challenge_easy_100_percent

  • ডেটাসেটের আকার : 7.53 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 20,000
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'episode_return': float32,
    'steps': Dataset({
        'action': Tensor(shape=(21,), dtype=float32),
        'discount': Tensor(shape=(1,), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'com_velocity': Tensor(shape=(3,), dtype=float32),
            'dummy-0': Tensor(shape=(1,), dtype=float32),
            'dummy-1': Tensor(shape=(1,), dtype=float32),
            'dummy-2': Tensor(shape=(1,), dtype=float32),
            'dummy-3': Tensor(shape=(1,), dtype=float32),
            'dummy-4': Tensor(shape=(1,), dtype=float32),
            'dummy-5': Tensor(shape=(1,), dtype=float32),
            'dummy-6': Tensor(shape=(1,), dtype=float32),
            'dummy-7': Tensor(shape=(1,), dtype=float32),
            'dummy-8': Tensor(shape=(1,), dtype=float32),
            'dummy-9': Tensor(shape=(1,), dtype=float32),
            'extremities': Tensor(shape=(12,), dtype=float32),
            'head_height': Tensor(shape=(1,), dtype=float32),
            'joint_angles': Tensor(shape=(21,), dtype=float32),
            'torso_vertical': Tensor(shape=(3,), dtype=float32),
            'velocity': Tensor(shape=(27,), dtype=float32),
        }),
        'reward': Tensor(shape=(1,), dtype=float32),
    }),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পর্ব_প্রত্যাবর্তন টেনসর float32
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া টেনসর (২১,) float32
পদক্ষেপ/ছাড় টেনসর (1,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/পর্যবেক্ষণ/com_velocity টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-0 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-১ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-২ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-৩ টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-4 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-5 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-6 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-7 টেনসর (1,) float32
পদক্ষেপ/অবজারভেশন/ডামি-8 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/ডামি-9 টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষন/চূড়া টেনসর (12,) float32
পদক্ষেপ/পর্যবেক্ষণ/মাথা_উচ্চতা টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/জয়েন্ট_কোণ টেনসর (২১,) float32
পদক্ষেপ/পর্যবেক্ষণ/ধড়_উল্লম্ব টেনসর (৩,) float32
পদক্ষেপ/পর্যবেক্ষণ/বেগ টেনসর (২৭,) float32
পদক্ষেপ/পুরস্কার টেনসর (1,) float32