कूका

  • विवरण :

बिन चुनना और पुनर्व्यवस्थित करना कार्य

विभाजित करना उदाहरण
'train' 580,392
  • फ़ीचर संरचना :
FeaturesDict({
    'steps': Dataset({
        'action': FeaturesDict({
            'base_displacement_vector': Tensor(shape=(2,), dtype=float32),
            'base_displacement_vertical_rotation': Tensor(shape=(1,), dtype=float32),
            'gripper_closedness_action': Tensor(shape=(1,), dtype=float32),
            'rotation_delta': Tensor(shape=(3,), dtype=float32),
            'terminate_episode': Tensor(shape=(3,), dtype=int32),
            'world_vector': Tensor(shape=(3,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'clip_function_input/base_pose_tool_reached': Tensor(shape=(7,), dtype=float32),
            'clip_function_input/workspace_bounds': Tensor(shape=(3, 3), dtype=float32),
            'gripper_closed': Tensor(shape=(1,), dtype=float32),
            'height_to_bottom': Tensor(shape=(1,), dtype=float32),
            'image': Image(shape=(512, 640, 3), dtype=uint8),
            'natural_language_embedding': Tensor(shape=(512,), dtype=float32),
            'natural_language_instruction': string,
            'task_id': Tensor(shape=(1,), dtype=float32),
        }),
        'reward': Scalar(shape=(), dtype=float32),
    }),
    'success': bool,
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीप्रकार विवरण
फीचर्सडिक्ट
कदम डेटासेट
कदम/कार्रवाई फीचर्सडिक्ट
चरण/कार्रवाई/आधार_विस्थापन_वेक्टर टेन्सर (2,) फ्लोट32
चरण/कार्रवाई/आधार_विस्थापन_वर्टिकल_रोटेशन टेन्सर (1,) फ्लोट32
चरण/कार्रवाई/ग्रिपर_क्लोज्डनेस_एक्शन टेन्सर (1,) फ्लोट32
चरण/क्रिया/रोटेशन_डेल्टा टेन्सर (3,) फ्लोट32
चरण/कार्रवाई/समाप्त_एपिसोड टेन्सर (3,) int32
चरण/कार्रवाई/विश्व_वेक्टर टेन्सर (3,) फ्लोट32
चरण/पहला है टेन्सर बूल
चरण/अंतिम है टेन्सर बूल
चरण/is_terminal टेन्सर बूल
चरण/अवलोकन फीचर्सडिक्ट
चरण/अवलोकन/clip_function_input/base_pose_tool_reached टेन्सर (7,) फ्लोट32
चरण/अवलोकन/क्लिप_फंक्शन_इनपुट/वर्कस्पेस_बाउंड्स टेन्सर (3,3) फ्लोट32
चरण/अवलोकन/ग्रिपर_बंद टेन्सर (1,) फ्लोट32
चरण/अवलोकन/ऊंचाई_से_नीचे टेन्सर (1,) फ्लोट32
चरण/अवलोकन/छवि छवि (512, 640, 3) uint8
चरण/अवलोकन/प्राकृतिक_भाषा_एम्बेडिंग टेन्सर (512,) फ्लोट32
चरण/अवलोकन/प्राकृतिक_भाषा_निर्देश टेन्सर डोरी
चरण/अवलोकन/कार्य_आईडी टेन्सर (1,) फ्लोट32
कदम/इनाम अदिश फ्लोट32
सफलता टेन्सर बूल
  • उद्धरण :
@article{kalashnikov2018qt,
  title={Qt-opt: Scalable deep reinforcement learning for vision-based robotic manipulation},
  author={Kalashnikov, Dmitry and Irpan, Alex and Pastor, Peter and Ibarz, Julian and Herzog, Alexander and Jang, Eric and Quillen, Deirdre and Holly, Ethan and Kalakrishnan, Mrinal and Vanhoucke, Vincent and others},
  journal={arXiv preprint arXiv:1806.10293},
  year={2018}
}