কুকা

  • বর্ণনা :

বিন বাছাই এবং পুনর্বিন্যাস কাজ

বিভক্ত উদাহরণ
'train' 580,392
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'steps': Dataset({
        'action': FeaturesDict({
            'base_displacement_vector': Tensor(shape=(2,), dtype=float32),
            'base_displacement_vertical_rotation': Tensor(shape=(1,), dtype=float32),
            'gripper_closedness_action': Tensor(shape=(1,), dtype=float32),
            'rotation_delta': Tensor(shape=(3,), dtype=float32),
            'terminate_episode': Tensor(shape=(3,), dtype=int32),
            'world_vector': Tensor(shape=(3,), dtype=float32),
        }),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'observation': FeaturesDict({
            'clip_function_input/base_pose_tool_reached': Tensor(shape=(7,), dtype=float32),
            'clip_function_input/workspace_bounds': Tensor(shape=(3, 3), dtype=float32),
            'gripper_closed': Tensor(shape=(1,), dtype=float32),
            'height_to_bottom': Tensor(shape=(1,), dtype=float32),
            'image': Image(shape=(512, 640, 3), dtype=uint8),
            'natural_language_embedding': Tensor(shape=(512,), dtype=float32),
            'natural_language_instruction': string,
            'task_id': Tensor(shape=(1,), dtype=float32),
        }),
        'reward': Scalar(shape=(), dtype=float32),
    }),
    'success': bool,
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
পদক্ষেপ ডেটাসেট
পদক্ষেপ/ক্রিয়া ফিচারসডিক্ট
steps/action/base_displacement_vector টেনসর (2,) float32
steps/action/base_displacement_vertical_rotation টেনসর (1,) float32
পদক্ষেপ/ক্রিয়া/গ্রিপার_ক্লোজডনেস_অ্যাকশন টেনসর (1,) float32
পদক্ষেপ/ক্রিয়া/ঘূর্ণন_ডেল্টা টেনসর (৩,) float32
steps/action/terminate_episode টেনসর (৩,) int32
পদক্ষেপ/ক্রিয়া/বিশ্ব_ভেক্টর টেনসর (৩,) float32
steps/is_first টেনসর bool
ধাপ/শেষ_শেষ টেনসর bool
steps/is_terminal টেনসর bool
পদক্ষেপ/পর্যবেক্ষণ ফিচারসডিক্ট
পদক্ষেপ/অবজারভেশন/ক্লিপ_ফাংশন_ইনপুট/বেস_পোজ_টুল_রিচড টেনসর (৭,) float32
পদক্ষেপ/অবজারভেশন/ক্লিপ_ফাংশন_ইনপুট/ওয়ার্কস্পেস_বাউন্ড টেনসর (৩, ৩) float32
পদক্ষেপ/অবজারভেশন/গ্রিপার_ক্লোজড টেনসর (1,) float32
ধাপ/পর্যবেক্ষণ/উচ্চতা_থেকে_নীচ পর্যন্ত টেনসর (1,) float32
পদক্ষেপ/পর্যবেক্ষণ/চিত্র ছবি (512, 640, 3) uint8
পদক্ষেপ/পর্যবেক্ষণ/প্রাকৃতিক_ভাষা_এম্বেডিং টেনসর (512,) float32
পদক্ষেপ/পর্যবেক্ষণ/প্রাকৃতিক_ভাষা_নির্দেশ টেনসর স্ট্রিং
পদক্ষেপ/পর্যবেক্ষণ/টাস্ক_আইডি টেনসর (1,) float32
পদক্ষেপ/পুরস্কার স্কেলার float32
সাফল্য টেনসর bool
  • উদ্ধৃতি :
@article{kalashnikov2018qt,
  title={Qt-opt: Scalable deep reinforcement learning for vision-based robotic manipulation},
  author={Kalashnikov, Dmitry and Irpan, Alex and Pastor, Peter and Ibarz, Julian and Herzog, Alexander and Jang, Eric and Quillen, Deirdre and Holly, Ethan and Kalakrishnan, Mrinal and Vanhoucke, Vincent and others},
  journal={arXiv preprint arXiv:1806.10293},
  year={2018}
}