rlu_locomotion

  • الوصف :

RL Unplugged عبارة عن مجموعة من المعايير للتعلم المعزز في وضع عدم الاتصال. تم تصميم RL Unplugged حول الاعتبارات التالية: لتسهيل الاستخدام ، نوفر مجموعات البيانات بواجهة برمجة تطبيقات موحدة تسهل على الممارس العمل مع جميع البيانات الموجودة في المجموعة بمجرد إنشاء خط أنابيب عام.

تتبع مجموعات البيانات تنسيق RLDS لتمثيل الخطوات والحلقات.

تتكون هذه المهام من مهام التنقل في الممر التي تتضمن CMU Humanoid ، والتي استخدمت فيها الجهود السابقة إما بيانات التقاط الحركة Merel et al. ، 2019a ، Merel et al. ، 2019b أو التدريب من نقطة الصفر Song et al. ، 2020 . بالإضافة إلى ذلك ، يحتوي مستودع DM Locomotion على مجموعة من المهام التي تم تكييفها لتلائم القوارض الافتراضية Merel et al. ، 2020 . نؤكد أن مهام DM Locomotion تتميز بمزيج من التحدي المستمر للتحكم المستمر في DoF جنبًا إلى جنب مع الإدراك من الملاحظات الغنية المتمركزة حول الذات. للحصول على تفاصيل حول كيفية إنشاء مجموعة البيانات ، يرجى الرجوع إلى الورقة.

نوصيك بتجربة أساليب RL في وضع عدم الاتصال على مجموعة بيانات DeepMind Locomotion ، إذا كنت مهتمًا بمجموعة بيانات RL غير المتصلة بالإنترنت الصعبة للغاية مع مساحة عمل مستمرة.

@inproceedings{gulcehre2020rl,
 title = {RL Unplugged: A Suite of Benchmarks for Offline Reinforcement Learning},
 author = {Gulcehre, Caglar and Wang, Ziyu and Novikov, Alexander and Paine, Thomas and G'{o}mez, Sergio and Zolna, Konrad and Agarwal, Rishabh and Merel, Josh S and Mankowitz, Daniel J and Paduraru, Cosmin and Dulac-Arnold, Gabriel and Li, Jerry and Norouzi, Mohammad and Hoffman, Matthew and Heess, Nicolas and de Freitas, Nando},
 booktitle = {Advances in Neural Information Processing Systems},
 pages = {7248--7259},
 volume = {33},
 year = {2020}
}

rlu_locomotion / humanoid_corridor (التكوين الافتراضي)

  • حجم مجموعة البيانات : 1.88 GiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 4000
  • هيكل الميزة :
FeaturesDict({
    'episode_id': int64,
    'steps': Dataset({
        'action': Tensor(shape=(56,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'walker': FeaturesDict({
                'body_height': Tensor(shape=(1,), dtype=float32),
                'egocentric_camera': Image(shape=(64, 64, 3), dtype=uint8),
                'end_effectors_pos': Tensor(shape=(12,), dtype=float32),
                'joints_pos': Tensor(shape=(56,), dtype=float32),
                'joints_vel': Tensor(shape=(56,), dtype=float32),
                'sensors_accelerometer': Tensor(shape=(3,), dtype=float32),
                'sensors_gyro': Tensor(shape=(3,), dtype=float32),
                'sensors_velocimeter': Tensor(shape=(3,), dtype=float32),
                'world_zaxis': Tensor(shape=(3,), dtype=float32),
            }),
        }),
        'reward': float32,
    }),
    'timestamp': int64,
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
معرّف_حلقة موتر int64
خطوات مجموعة البيانات
خطوات / عمل موتر (56 ،) تعويم 32
خطوات / خصم موتر تعويم 32
الخطوات / is_first موتر منطقي
الخطوات / is_last موتر منطقي
الخطوات / is_terminal موتر منطقي
خطوات / ملاحظة الميزات
خطوات / ملاحظة / مشاية الميزات
خطوات / ملاحظة / مشاية / ارتفاع الجسم موتر (1 ،) تعويم 32
خطوات / ملاحظة / ووكر / egocentric_camera صورة (64 ، 64 ، 3) uint8
خطوات / الملاحظة / ووكر / مؤثرات النهاية موتر (12 ،) تعويم 32
خطوات / ملاحظة / ووكر / مفاصل موتر (56 ،) تعويم 32
خطوات / ملاحظة / ووكر / مفاصل_سفر موتر (56 ،) تعويم 32
الخطوات / الملاحظة / المشاية / المستشعرات_ مقياس التسارع موتر (3 ،) تعويم 32
خطوات / ملاحظة / ووكر / سينسورس جيرو موتر (3 ،) تعويم 32
خطوات / ملاحظة / ووكر / sensors_velocimeter موتر (3 ،) تعويم 32
خطوات / ملاحظة / ووكر / world_zaxis موتر (3 ،) تعويم 32
خطوات / مكافأة موتر تعويم 32
الطابع الزمني موتر int64

rlu_locomotion / فجوات بشرية

  • حجم مجموعة البيانات : 4.57 GiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 8000
  • هيكل الميزة :
FeaturesDict({
    'episode_id': int64,
    'steps': Dataset({
        'action': Tensor(shape=(56,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'walker': FeaturesDict({
                'body_height': Tensor(shape=(1,), dtype=float32),
                'egocentric_camera': Image(shape=(64, 64, 3), dtype=uint8),
                'end_effectors_pos': Tensor(shape=(12,), dtype=float32),
                'joints_pos': Tensor(shape=(56,), dtype=float32),
                'joints_vel': Tensor(shape=(56,), dtype=float32),
                'sensors_accelerometer': Tensor(shape=(3,), dtype=float32),
                'sensors_gyro': Tensor(shape=(3,), dtype=float32),
                'sensors_velocimeter': Tensor(shape=(3,), dtype=float32),
                'world_zaxis': Tensor(shape=(3,), dtype=float32),
            }),
        }),
        'reward': float32,
    }),
    'timestamp': int64,
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
معرّف_حلقة موتر int64
خطوات مجموعة البيانات
خطوات / عمل موتر (56 ،) تعويم 32
خطوات / خصم موتر تعويم 32
الخطوات / is_first موتر منطقي
الخطوات / is_last موتر منطقي
الخطوات / is_terminal موتر منطقي
خطوات / ملاحظة الميزات
خطوات / ملاحظة / مشاية الميزات
خطوات / ملاحظة / مشاية / ارتفاع الجسم موتر (1 ،) تعويم 32
خطوات / ملاحظة / ووكر / egocentric_camera صورة (64 ، 64 ، 3) uint8
خطوات / الملاحظة / ووكر / مؤثرات النهاية موتر (12 ،) تعويم 32
خطوات / ملاحظة / ووكر / مفاصل موتر (56 ،) تعويم 32
خطوات / ملاحظة / ووكر / مفاصل_سفر موتر (56 ،) تعويم 32
الخطوات / الملاحظة / المشاية / المستشعرات_ مقياس التسارع موتر (3 ،) تعويم 32
خطوات / ملاحظة / ووكر / سينسورس جيرو موتر (3 ،) تعويم 32
خطوات / ملاحظة / ووكر / sensors_velocimeter موتر (3 ،) تعويم 32
خطوات / ملاحظة / ووكر / world_zaxis موتر (3 ،) تعويم 32
خطوات / مكافأة موتر تعويم 32
الطابع الزمني موتر int64

rlu_locomotion / الجدران_الروبوتية

  • حجم مجموعة البيانات : 2.36 GiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 4000
  • هيكل الميزة :
FeaturesDict({
    'episode_id': int64,
    'steps': Dataset({
        'action': Tensor(shape=(56,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'walker': FeaturesDict({
                'body_height': Tensor(shape=(1,), dtype=float32),
                'egocentric_camera': Image(shape=(64, 64, 3), dtype=uint8),
                'end_effectors_pos': Tensor(shape=(12,), dtype=float32),
                'joints_pos': Tensor(shape=(56,), dtype=float32),
                'joints_vel': Tensor(shape=(56,), dtype=float32),
                'sensors_accelerometer': Tensor(shape=(3,), dtype=float32),
                'sensors_gyro': Tensor(shape=(3,), dtype=float32),
                'sensors_velocimeter': Tensor(shape=(3,), dtype=float32),
                'world_zaxis': Tensor(shape=(3,), dtype=float32),
            }),
        }),
        'reward': float32,
    }),
    'timestamp': int64,
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
معرّف_حلقة موتر int64
خطوات مجموعة البيانات
خطوات / عمل موتر (56 ،) تعويم 32
خطوات / خصم موتر تعويم 32
الخطوات / is_first موتر منطقي
الخطوات / is_last موتر منطقي
الخطوات / is_terminal موتر منطقي
خطوات / ملاحظة الميزات
خطوات / ملاحظة / مشاية الميزات
خطوات / ملاحظة / مشاية / ارتفاع الجسم موتر (1 ،) تعويم 32
خطوات / ملاحظة / ووكر / egocentric_camera صورة (64 ، 64 ، 3) uint8
خطوات / الملاحظة / ووكر / مؤثرات النهاية موتر (12 ،) تعويم 32
خطوات / ملاحظة / ووكر / مفاصل موتر (56 ،) تعويم 32
خطوات / ملاحظة / ووكر / مفاصل_سفر موتر (56 ،) تعويم 32
الخطوات / الملاحظة / المشاية / المستشعرات_ مقياس التسارع موتر (3 ،) تعويم 32
خطوات / ملاحظة / ووكر / سينسورس جيرو موتر (3 ،) تعويم 32
خطوات / ملاحظة / ووكر / sensors_velocimeter موتر (3 ،) تعويم 32
خطوات / ملاحظة / ووكر / world_zaxis موتر (3 ،) تعويم 32
خطوات / مكافأة موتر تعويم 32
الطابع الزمني موتر int64

rlu_locomotion / القوارض_حوض_الهروب

  • حجم مجموعة البيانات : 16.46 GiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 2000
  • هيكل الميزة :
FeaturesDict({
    'episode_id': int64,
    'steps': Dataset({
        'action': Tensor(shape=(38,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'walker': FeaturesDict({
                'appendages_pos': Tensor(shape=(15,), dtype=float32),
                'egocentric_camera': Image(shape=(64, 64, 3), dtype=uint8),
                'joints_pos': Tensor(shape=(30,), dtype=float32),
                'joints_vel': Tensor(shape=(30,), dtype=float32),
                'sensors_accelerometer': Tensor(shape=(3,), dtype=float32),
                'sensors_gyro': Tensor(shape=(3,), dtype=float32),
                'sensors_touch': Tensor(shape=(4,), dtype=float32),
                'sensors_velocimeter': Tensor(shape=(3,), dtype=float32),
                'tendons_pos': Tensor(shape=(8,), dtype=float32),
                'tendons_vel': Tensor(shape=(8,), dtype=float32),
                'world_zaxis': Tensor(shape=(3,), dtype=float32),
            }),
        }),
        'reward': float32,
    }),
    'timestamp': int64,
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
معرّف_حلقة موتر int64
خطوات مجموعة البيانات
خطوات / عمل موتر (38 ،) تعويم 32
خطوات / خصم موتر تعويم 32
الخطوات / is_first موتر منطقي
الخطوات / is_last موتر منطقي
الخطوات / is_terminal موتر منطقي
خطوات / ملاحظة الميزات
خطوات / ملاحظة / مشاية الميزات
الخطوات / الملاحظة / المشاة / appendages_pos موتر (15،) تعويم 32
خطوات / ملاحظة / ووكر / egocentric_camera صورة (64 ، 64 ، 3) uint8
خطوات / ملاحظة / ووكر / مفاصل موتر (30 ،) تعويم 32
خطوات / ملاحظة / ووكر / مفاصل_سفر موتر (30 ،) تعويم 32
الخطوات / الملاحظة / المشاية / المستشعرات_ مقياس التسارع موتر (3 ،) تعويم 32
خطوات / ملاحظة / ووكر / سينسورس جيرو موتر (3 ،) تعويم 32
خطوات / ملاحظة / ووكر / sensors_touch موتر (4 ،) تعويم 32
خطوات / ملاحظة / ووكر / sensors_velocimeter موتر (3 ،) تعويم 32
خطوات / ملاحظة / ووكر / أوتار موتر (8 ،) تعويم 32
خطوات / ملاحظة / ووكر / أوتار موتر (8 ،) تعويم 32
خطوات / ملاحظة / ووكر / world_zaxis موتر (3 ،) تعويم 32
خطوات / مكافأة موتر تعويم 32
الطابع الزمني موتر int64

rlu_locomotion / فجوات القوارض

  • حجم مجموعة البيانات : 8.90 GiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 2000
  • هيكل الميزة :
FeaturesDict({
    'episode_id': int64,
    'steps': Dataset({
        'action': Tensor(shape=(38,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'walker': FeaturesDict({
                'appendages_pos': Tensor(shape=(15,), dtype=float32),
                'egocentric_camera': Image(shape=(64, 64, 3), dtype=uint8),
                'joints_pos': Tensor(shape=(30,), dtype=float32),
                'joints_vel': Tensor(shape=(30,), dtype=float32),
                'sensors_accelerometer': Tensor(shape=(3,), dtype=float32),
                'sensors_gyro': Tensor(shape=(3,), dtype=float32),
                'sensors_touch': Tensor(shape=(4,), dtype=float32),
                'sensors_velocimeter': Tensor(shape=(3,), dtype=float32),
                'tendons_pos': Tensor(shape=(8,), dtype=float32),
                'tendons_vel': Tensor(shape=(8,), dtype=float32),
                'world_zaxis': Tensor(shape=(3,), dtype=float32),
            }),
        }),
        'reward': float32,
    }),
    'timestamp': int64,
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
معرّف_حلقة موتر int64
خطوات مجموعة البيانات
خطوات / عمل موتر (38 ،) تعويم 32
خطوات / خصم موتر تعويم 32
الخطوات / is_first موتر منطقي
الخطوات / is_last موتر منطقي
الخطوات / is_terminal موتر منطقي
خطوات / ملاحظة الميزات
خطوات / ملاحظة / مشاية الميزات
الخطوات / الملاحظة / المشاة / appendages_pos موتر (15،) تعويم 32
خطوات / ملاحظة / ووكر / egocentric_camera صورة (64 ، 64 ، 3) uint8
خطوات / ملاحظة / ووكر / مفاصل موتر (30 ،) تعويم 32
خطوات / ملاحظة / ووكر / مفاصل_سفر موتر (30 ،) تعويم 32
الخطوات / الملاحظة / المشاية / المستشعرات_ مقياس التسارع موتر (3 ،) تعويم 32
خطوات / ملاحظة / ووكر / سينسورس جيرو موتر (3 ،) تعويم 32
خطوات / ملاحظة / ووكر / sensors_touch موتر (4 ،) تعويم 32
خطوات / ملاحظة / ووكر / sensors_velocimeter موتر (3 ،) تعويم 32
خطوات / ملاحظة / ووكر / أوتار موتر (8 ،) تعويم 32
خطوات / ملاحظة / ووكر / أوتار موتر (8 ،) تعويم 32
خطوات / ملاحظة / ووكر / world_zaxis موتر (3 ،) تعويم 32
خطوات / مكافأة موتر تعويم 32
الطابع الزمني موتر int64

rlu_locomotion / متاهات القوارض

  • حجم مجموعة البيانات : 20.71 GiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 2000
  • هيكل الميزة :
FeaturesDict({
    'episode_id': int64,
    'steps': Dataset({
        'action': Tensor(shape=(38,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'walker': FeaturesDict({
                'appendages_pos': Tensor(shape=(15,), dtype=float32),
                'egocentric_camera': Image(shape=(64, 64, 3), dtype=uint8),
                'joints_pos': Tensor(shape=(30,), dtype=float32),
                'joints_vel': Tensor(shape=(30,), dtype=float32),
                'sensors_accelerometer': Tensor(shape=(3,), dtype=float32),
                'sensors_gyro': Tensor(shape=(3,), dtype=float32),
                'sensors_touch': Tensor(shape=(4,), dtype=float32),
                'sensors_velocimeter': Tensor(shape=(3,), dtype=float32),
                'tendons_pos': Tensor(shape=(8,), dtype=float32),
                'tendons_vel': Tensor(shape=(8,), dtype=float32),
                'world_zaxis': Tensor(shape=(3,), dtype=float32),
            }),
        }),
        'reward': float32,
    }),
    'timestamp': int64,
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
معرّف_حلقة موتر int64
خطوات مجموعة البيانات
خطوات / عمل موتر (38 ،) تعويم 32
خطوات / خصم موتر تعويم 32
الخطوات / is_first موتر منطقي
الخطوات / is_last موتر منطقي
الخطوات / is_terminal موتر منطقي
خطوات / ملاحظة الميزات
خطوات / ملاحظة / مشاية الميزات
الخطوات / الملاحظة / المشاة / appendages_pos موتر (15،) تعويم 32
خطوات / ملاحظة / ووكر / egocentric_camera صورة (64 ، 64 ، 3) uint8
خطوات / ملاحظة / ووكر / مفاصل موتر (30 ،) تعويم 32
خطوات / ملاحظة / ووكر / مفاصل_سفر موتر (30 ،) تعويم 32
الخطوات / الملاحظة / المشاية / المستشعرات_ مقياس التسارع موتر (3 ،) تعويم 32
خطوات / ملاحظة / ووكر / سينسورس جيرو موتر (3 ،) تعويم 32
خطوات / ملاحظة / ووكر / sensors_touch موتر (4 ،) تعويم 32
خطوات / ملاحظة / ووكر / sensors_velocimeter موتر (3 ،) تعويم 32
خطوات / ملاحظة / ووكر / أوتار موتر (8 ،) تعويم 32
خطوات / ملاحظة / ووكر / أوتار موتر (8 ،) تعويم 32
خطوات / ملاحظة / ووكر / world_zaxis موتر (3 ،) تعويم 32
خطوات / مكافأة موتر تعويم 32
الطابع الزمني موتر int64

rlu_locomotion / rodent_two_touch

  • حجم مجموعة البيانات : 23.05 GiB

  • الانقسامات :

انشق، مزق أمثلة
'train' 2000
  • هيكل الميزة :
FeaturesDict({
    'episode_id': int64,
    'steps': Dataset({
        'action': Tensor(shape=(38,), dtype=float32),
        'discount': float32,
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'walker': FeaturesDict({
                'appendages_pos': Tensor(shape=(15,), dtype=float32),
                'egocentric_camera': Image(shape=(64, 64, 3), dtype=uint8),
                'joints_pos': Tensor(shape=(30,), dtype=float32),
                'joints_vel': Tensor(shape=(30,), dtype=float32),
                'sensors_accelerometer': Tensor(shape=(3,), dtype=float32),
                'sensors_gyro': Tensor(shape=(3,), dtype=float32),
                'sensors_touch': Tensor(shape=(4,), dtype=float32),
                'sensors_velocimeter': Tensor(shape=(3,), dtype=float32),
                'tendons_pos': Tensor(shape=(8,), dtype=float32),
                'tendons_vel': Tensor(shape=(8,), dtype=float32),
                'world_zaxis': Tensor(shape=(3,), dtype=float32),
            }),
        }),
        'reward': float32,
    }),
    'timestamp': int64,
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
معرّف_حلقة موتر int64
خطوات مجموعة البيانات
خطوات / عمل موتر (38 ،) تعويم 32
خطوات / خصم موتر تعويم 32
الخطوات / is_first موتر منطقي
الخطوات / is_last موتر منطقي
الخطوات / is_terminal موتر منطقي
خطوات / ملاحظة الميزات
خطوات / ملاحظة / مشاية الميزات
الخطوات / الملاحظة / المشاة / appendages_pos موتر (15،) تعويم 32
خطوات / ملاحظة / ووكر / egocentric_camera صورة (64 ، 64 ، 3) uint8
خطوات / ملاحظة / ووكر / مفاصل موتر (30 ،) تعويم 32
خطوات / ملاحظة / ووكر / مفاصل_سفر موتر (30 ،) تعويم 32
الخطوات / الملاحظة / المشاية / المستشعرات_ مقياس التسارع موتر (3 ،) تعويم 32
خطوات / ملاحظة / ووكر / سينسورس جيرو موتر (3 ،) تعويم 32
خطوات / ملاحظة / ووكر / sensors_touch موتر (4 ،) تعويم 32
خطوات / ملاحظة / ووكر / sensors_velocimeter موتر (3 ،) تعويم 32
خطوات / ملاحظة / ووكر / أوتار موتر (8 ،) تعويم 32
خطوات / ملاحظة / ووكر / أوتار موتر (8 ،) تعويم 32
خطوات / ملاحظة / ووكر / world_zaxis موتر (3 ،) تعويم 32
خطوات / مكافأة موتر تعويم 32
الطابع الزمني موتر int64