- توضیحات :
کیتی شامل مجموعه ای از وظایف بینایی است که با استفاده از یک پلت فرم رانندگی مستقل ساخته شده اند. معیار کامل شامل وظایف بسیاری مانند استریو، جریان نوری، کیلومتر شماری بصری، و غیره است. این مجموعه داده شامل مجموعه داده های تشخیص اشیا، از جمله تصاویر تک چشمی و جعبه های مرزی است. مجموعه داده شامل 7481 تصویر آموزشی است که با جعبه های مرزبندی سه بعدی حاشیه نویسی شده است. شرح کامل حاشیه نویسی ها را می توان در readme کیت توسعه شی readme در صفحه اصلی کیتی یافت.
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : http://www.cvlibs.net/datasets/kitti/
کد منبع :
tfds.datasets.kitti.Builder
نسخه ها :
-
3.1.0
: بدون یادداشت انتشار. -
3.2.0
: Devkit به روز شد. -
3.3.0
(پیشفرض): برچسبهایی برای ویژگیoccluded
اضافه شده است.
-
حجم دانلود :
11.71 GiB
حجم مجموعه داده :
5.27 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
تقسیم کنید | نمونه ها |
---|---|
'test' | 711 |
'train' | 6,347 |
'validation' | 423 |
- ساختار ویژگی :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/file_name': Text(shape=(), dtype=string),
'objects': Sequence({
'alpha': float32,
'bbox': BBoxFeature(shape=(4,), dtype=float32, description=2D bounding box of object in the image),
'dimensions': Tensor(shape=(3,), dtype=float32, description=3D object dimensions: height, width, length (in meters)),
'location': Tensor(shape=(3,), dtype=float32, description=3D object location x,y,z in camera coordinates (in meters)),
'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
'rotation_y': float32,
'truncated': float32,
'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
}),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | توضیحات |
---|---|---|---|---|
FeaturesDict | ||||
تصویر | تصویر | (هیچ، هیچ، 3) | uint8 | |
تصویر/نام_فایل | متن | رشته | ||
اشیاء | دنباله | |||
اشیاء/آلفا | تانسور | float32 | زاویه مشاهده جسم، محدوده [-pi..pi] | |
اشیاء/bbox | ویژگی BBox | (4،) | float32 | جعبه محدود کننده دوبعدی شی در تصویر |
اشیاء / ابعاد | تانسور | (3،) | float32 | ابعاد جسم سه بعدی: ارتفاع، عرض، طول (بر حسب متر) |
اشیاء / مکان | تانسور | (3،) | float32 | مکان شی سه بعدی x,y,z در مختصات دوربین (بر حسب متر) |
اشیاء / مسدود شده | ClassLabel | int64 | عدد صحیح (0،1،2،3) نشان دهنده وضعیت انسداد: 0 = کاملا قابل مشاهده، 1 = تا حدی مسدود شده2 = تا حد زیادی مسدود، 3 = ناشناخته | |
اشیاء/چرخش_y | تانسور | float32 | چرخش حول محور Y در مختصات دوربین [-pi..pi] | |
اشیاء / کوتاه شده | تانسور | float32 | شناور از 0 (غیر کوتاه) به 1 (قطع شده)، که در آن کوتاه شده به جسمی که از مرزهای تصویر خارج می شود اشاره دارد. | |
اشیاء/نوع | ClassLabel | int64 | نوع شی، به عنوان مثال "ماشین" یا "ون" |
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
شکل ( tfds.show_examples ):
- مثالها ( tfds.as_dataframe ):
- نقل قول :
@inproceedings{Geiger2012CVPR,
author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
year = {2012}
}