فيولا

  • وصف :

روبوت فرانكا يتفاعل مع مهام المطبخ المنمقة

ينقسم أمثلة
'test' 15
'train' 135
  • هيكل الميزة :
FeaturesDict({
    'steps': Dataset({
        'action': FeaturesDict({
            'gripper_closedness_action': float32,
            'rotation_delta': Tensor(shape=(3,), dtype=float32),
            'terminate_episode': float32,
            'world_vector': Tensor(shape=(3,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'agentview_rgb': Image(shape=(224, 224, 3), dtype=uint8, description=RGB captured by workspace camera),
            'ee_states': Tensor(shape=(16,), dtype=float32, description=Pose of the end effector specified as a homogenous matrix.),
            'eye_in_hand_rgb': Image(shape=(224, 224, 3), dtype=uint8, description=RGB captured by in hand camera),
            'gripper_states': Tensor(shape=(1,), dtype=float32, description=gripper_states = 0 means the gripper is fully closed. The value represents the gripper width of Franka Panda Gripper.),
            'joint_states': Tensor(shape=(7,), dtype=float32, description=joint values),
            'natural_language_embedding': Tensor(shape=(512,), dtype=float32),
            'natural_language_instruction': string,
        }),
        'reward': Scalar(shape=(), dtype=float32),
    }),
})
  • وثائق الميزة :
ميزة فصل شكل نوع D وصف
المميزاتDict
خطوات مجموعة البيانات
الخطوات/الإجراء المميزاتDict
الخطوات/الإجراء/gripper_closedness_action الموتر float32
الخطوات/الإجراء/rotation_delta الموتر (3،) float32
الخطوات/الإجراء/terminate_episode الموتر float32
الخطوات/الإجراء/world_vector الموتر (3،) float32
الخطوات/is_first الموتر منطقي
الخطوات/is_last الموتر منطقي
الخطوات/is_terminal الموتر منطقي
الخطوات/الملاحظة المميزاتDict
الخطوات/الملاحظة/agentview_rgb صورة (224، 224، 3) uint8 تم التقاط RGB بواسطة كاميرا مساحة العمل
الخطوات/الملاحظة/ee_states الموتر (16،) float32 وضع المستجيب النهائي المحدد كمصفوفة متجانسة.
الخطوات/الملاحظة/eye_in_hand_rgb صورة (224، 224، 3) uint8 تم التقاط RGB بواسطة الكاميرا اليدوية
الخطوات/الملاحظة/gripper_states الموتر (1،) float32 gripper_states = 0 يعني أن القابض مغلق بالكامل. تمثل القيمة عرض القابض لـ Franka Panda Gripper.
الخطوات/الملاحظة/المشتركة الموتر (7،) float32 القيم المشتركة
الخطوات/الملاحظة/natural_language_embedding الموتر (512،) float32
الخطوات/الملاحظة/natural_language_instruction الموتر خيط
خطوات/مكافأة العددية float32
@article{zhu2022viola,
  title={VIOLA: Imitation Learning for Vision-Based Manipulation with Object Proposal Priors},
  author={Zhu, Yifeng and Joshi, Abhishek and Stone, Peter and Zhu, Yuke},
  journal={6th Annual Conference on Robot Learning (CoRL)},
  year={2022}
}