- وصف :
A1 المشي، لا RGB
الصفحة الرئيسية : https://saytap.github.io/
كود المصدر :
tfds.robotics.rtx.UtokyoSaytapConvertedExternallyToRlds
الإصدارات :
-
0.1.0
(افتراضي): الإصدار الأولي.
-
حجم التحميل :
Unknown size
حجم مجموعة البيانات :
55.34 MiB
التخزين المؤقت التلقائي ( الوثائق ): نعم
الإنشقاقات :
ينقسم | أمثلة |
---|---|
'train' | 20 |
- هيكل الميزة :
FeaturesDict({
'episode_metadata': FeaturesDict({
'file_path': Text(shape=(), dtype=string),
}),
'steps': Dataset({
'action': Tensor(shape=(12,), dtype=float32, description=Robot action, consists of [12x joint positios].),
'discount': Scalar(shape=(), dtype=float32, description=Discount if provided, default to 1.),
'is_first': bool,
'is_last': bool,
'is_terminal': bool,
'language_embedding': Tensor(shape=(512,), dtype=float32, description=Kona language embedding. See https://tfhub.dev/google/universal-sentence-encoder-large/5),
'language_instruction': Text(shape=(), dtype=string),
'observation': FeaturesDict({
'desired_pattern': Tensor(shape=(4, 5), dtype=bool, description=Desired foot contact pattern for the 4 legs, the 4 rows are for the front right, front left, rear right and rear left legs, the pattern length is 5 (=0.1s).),
'desired_vel': Tensor(shape=(3,), dtype=float32, description=Desired velocites. The first 2 are linear velocities along and perpendicular to the heading direction, the 3rd is the desired angular velocity about the yaw axis.),
'image': Image(shape=(64, 64, 3), dtype=uint8, description=Dummy camera RGB observation.),
'prev_act': Tensor(shape=(12,), dtype=float32, description=Actions applied in the previous step.),
'proj_grav_vec': Tensor(shape=(3,), dtype=float32, description=The gravity vector [0, 0, -1] in the robot base frame.),
'state': Tensor(shape=(30,), dtype=float32, description=Robot state, consists of [3x robot base linear velocity, 3x base angular vel, 12x joint position, 12x joint velocity].),
'wrist_image': Image(shape=(64, 64, 3), dtype=uint8, description=Dummy wrist camera RGB observation.),
}),
'reward': Scalar(shape=(), dtype=float32, description=Reward if provided, 1 on final step for demos.),
}),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع D | وصف |
---|---|---|---|---|
المميزاتDict | ||||
الحلقة_البيانات الوصفية | المميزاتDict | |||
Episode_metadata/file_path | نص | خيط | المسار إلى ملف البيانات الأصلي. | |
خطوات | مجموعة البيانات | |||
الخطوات/الإجراء | الموتر | (12،) | float32 | عمل الروبوت، يتكون من [12x مواضع مشتركة]. |
الخطوات/الخصم | العددية | float32 | الخصم إذا تم توفيره، الافتراضي هو 1. | |
الخطوات/is_first | الموتر | منطقي | ||
الخطوات/is_last | الموتر | منطقي | ||
الخطوات/is_terminal | الموتر | منطقي | ||
الخطوات/language_embedding | الموتر | (512،) | float32 | تضمين لغة كونا. راجع https://tfhub.dev/google/universal-sentence-encoder-large/5 |
الخطوات/language_instruction | نص | خيط | تعليم اللغة. | |
الخطوات/الملاحظة | المميزاتDict | |||
الخطوات/الملاحظة/desired_pattern | الموتر | (4، 5) | منطقي | نمط ملامسة القدم المرغوب فيه للأرجل الأربعة، الصفوف الأربعة مخصصة للأرجل الأمامية اليمنى، والأمامية اليسرى، والخلفية اليمنى، والخلفية اليسرى، وطول النمط هو 5 (= 0.1 ثانية). |
الخطوات/الملاحظة/desired_vel | الموتر | (3،) | float32 | السرعات المطلوبة. أول سرعتين خطيتين على طول وعمودي على اتجاه الاتجاه، والثالثة هي السرعة الزاوية المطلوبة حول محور الانعراج. |
الخطوات/الملاحظة/الصورة | صورة | (64، 64، 3) | uint8 | مراقبة الكاميرا الوهمية RGB. |
الخطوات/الملاحظة/prev_act | الموتر | (12،) | float32 | الإجراءات المطبقة في الخطوة السابقة. |
الخطوات/الملاحظة/proj_grav_vec | الموتر | (3،) | float32 | ناقل الجاذبية [0، 0، -1] في إطار قاعدة الروبوت. |
الخطوات/الملاحظة/الحالة | الموتر | (30،) | float32 | تتكون حالة الروبوت من [3x السرعة الخطية الأساسية للروبوت، 3x الخط الزاوي الأساسي، 12x موضع المفصل، 12x سرعة المفصل]. |
الخطوات/الملاحظة/wrist_image | صورة | (64، 64، 3) | uint8 | مراقبة كاميرا المعصم الدمية RGB. |
خطوات/مكافأة | العددية | float32 | مكافأة إذا تم توفيرها، 1 في الخطوة النهائية للعروض التوضيحية. |
المفاتيح الخاضعة للإشراف (انظر
as_supervised
doc ):None
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ): مفقود.
الاقتباس :
@article{saytap2023,
author = {Yujin Tang and Wenhao Yu and Jie Tan and Heiga Zen and Aleksandra Faust and
Tatsuya Harada},
title = {SayTap: Language to Quadrupedal Locomotion},
eprint = {arXiv:2306.07580},
url = {https://saytap.github.io},
note = "{https://saytap.github.io}",
year = {2023}
}