کیتی

  • توضیحات :

کیتی شامل مجموعه ای از وظایف بینایی است که با استفاده از یک پلت فرم رانندگی مستقل ساخته شده اند. معیار کامل شامل وظایف بسیاری مانند استریو، جریان نوری، کیلومتر شماری بصری، و غیره است. این مجموعه داده شامل مجموعه داده های تشخیص اشیا، از جمله تصاویر تک چشمی و جعبه های مرزی است. مجموعه داده شامل 7481 تصویر آموزشی است که با جعبه های مرزبندی سه بعدی حاشیه نویسی شده است. شرح کامل حاشیه نویسی ها را می توان در readme کیت توسعه شی readme در صفحه اصلی کیتی یافت.

تقسیم کنید نمونه ها
'test' 711
'train' 6,347
'validation' 423
  • ساختار ویژگی :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/file_name': Text(shape=(), dtype=string),
    'objects': Sequence({
        'alpha': float32,
        'bbox': BBoxFeature(shape=(4,), dtype=float32, description=2D bounding box of object in the image),
        'dimensions': Tensor(shape=(3,), dtype=float32, description=3D object dimensions: height, width, length (in meters)),
        'location': Tensor(shape=(3,), dtype=float32, description=3D object location x,y,z in camera coordinates (in meters)),
        'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
        'rotation_y': float32,
        'truncated': float32,
        'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D توضیحات
FeaturesDict
تصویر تصویر (هیچ، هیچ، 3) uint8
تصویر/نام_فایل متن رشته
اشیاء دنباله
اشیاء/آلفا تانسور float32 زاویه مشاهده جسم، محدوده [-pi..pi]
اشیاء/bbox ویژگی BBox (4،) float32 جعبه محدود کننده دوبعدی شی در تصویر
اشیاء / ابعاد تانسور (3،) float32 ابعاد جسم سه بعدی: ارتفاع، عرض، طول (بر حسب متر)
اشیاء / مکان تانسور (3،) float32 مکان شی سه بعدی x,y,z در مختصات دوربین (بر حسب متر)
اشیاء / مسدود شده ClassLabel int64 عدد صحیح (0،1،2،3) نشان دهنده وضعیت انسداد: 0 = کاملا قابل مشاهده، 1 = تا حدی مسدود شده2 = تا حد زیادی مسدود، 3 = ناشناخته
اشیاء/چرخش_y تانسور float32 چرخش حول محور Y در مختصات دوربین [-pi..pi]
اشیاء / کوتاه شده تانسور float32 شناور از 0 (غیر کوتاه) به 1 (قطع شده)، که در آن کوتاه شده به جسمی که از مرزهای تصویر خارج می شود اشاره دارد.
اشیاء/نوع ClassLabel int64 نوع شی، به عنوان مثال "ماشین" یا "ون"

تجسم

  • نقل قول :
@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}