- คำอธิบาย :
Kitti ประกอบด้วยชุดงานด้านการมองเห็นที่สร้างขึ้นโดยใช้แพลตฟอร์มการขับขี่อัตโนมัติ การวัดประสิทธิภาพแบบเต็มประกอบด้วยงานต่างๆ มากมาย เช่น สเตอริโอ การไหลของแสง การวัดระยะทางด้วยภาพ ฯลฯ ชุดข้อมูลนี้ประกอบด้วยชุดข้อมูลการตรวจจับวัตถุ รวมถึงภาพตาข้างเดียวและกล่องขอบเขต ชุดข้อมูลประกอบด้วยรูปภาพการฝึกอบรม 7481 ภาพพร้อมคำอธิบายประกอบด้วยกล่องขอบเขต 3 มิติ คำอธิบายโดยละเอียดของคำอธิบายประกอบสามารถพบได้ใน readme ของ object development kit readme บนหน้าแรกของ Kitti
เอกสารเพิ่มเติม : สำรวจในเอกสารด้วยรหัส
หน้าแรก : http://www.cvlibs.net/datasets/kitti/
ซอร์สโค้ด :
tfds.datasets.kitti.Builder
รุ่น :
-
3.1.0
: ไม่มีบันทึกประจำรุ่น -
3.2.0
: อัปเดต Devkit แล้ว -
3.3.0
(ค่าเริ่มต้น): เพิ่มป้ายกำกับสำหรับคุณลักษณะoccluded
-
ขนาดการดาวน์โหลด :
11.71 GiB
ขนาดชุดข้อมูล :
5.27 GiB
แคชอัตโนมัติ ( เอกสาร ): No
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 711 |
'train' | 6,347 |
'validation' | 423 |
- โครงสร้างคุณสมบัติ :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/file_name': Text(shape=(), dtype=string),
'objects': Sequence({
'alpha': float32,
'bbox': BBoxFeature(shape=(4,), dtype=float32, description=2D bounding box of object in the image),
'dimensions': Tensor(shape=(3,), dtype=float32, description=3D object dimensions: height, width, length (in meters)),
'location': Tensor(shape=(3,), dtype=float32, description=3D object location x,y,z in camera coordinates (in meters)),
'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
'rotation_y': float32,
'truncated': float32,
'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
}),
})
- เอกสารคุณสมบัติ :
คุณสมบัติ | ระดับ | รูปร่าง | ประเภทD | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
ภาพ | ภาพ | (ไม่มี ไม่มี 3) | uint8 | |
รูปภาพ/file_name | ข้อความ | เชือก | ||
วัตถุ | ลำดับ | |||
วัตถุ/อัลฟ่า | เทนเซอร์ | ลอย32 | มุมสังเกตของวัตถุ มีตั้งแต่ [-pi..pi] | |
วัตถุ/bbox | คุณสมบัติ BBox | (4,) | ลอย32 | กรอบขอบเขต 2 มิติของวัตถุในภาพ |
วัตถุ/มิติ | เทนเซอร์ | (3,) | ลอย32 | ขนาดวัตถุ 3 มิติ: ความสูง ความกว้าง ความยาว (เป็นเมตร) |
วัตถุ/สถานที่ | เทนเซอร์ | (3,) | ลอย32 | ตำแหน่งของวัตถุ 3 มิติ x,y,z ในพิกัดของกล้อง (หน่วยเป็นเมตร) |
วัตถุ/ถูกแยกออก | ClassLabel | int64 | จำนวนเต็ม (0,1,2,3) บ่งชี้สถานะการบดเคี้ยว: 0 = มองเห็นได้ทั้งหมด, 1 = บดบังบางส่วน 2 = บดเคี้ยวส่วนใหญ่, 3 = ไม่ทราบ | |
วัตถุ/rotation_y | เทนเซอร์ | ลอย32 | การหมุนรอบแกน Y ในพิกัดกล้อง [-pi..pi] | |
วัตถุ/ถูกตัดทอน | เทนเซอร์ | ลอย32 | ลอยจาก 0 (ไม่ถูกตัดทอน) ถึง 1 (ถูกตัดทอน) โดยที่การตัดทอนหมายถึงวัตถุที่ออกจากขอบเขตรูปภาพ | |
วัตถุ/ประเภท | ClassLabel | int64 | ประเภทของวัตถุ เช่น 'รถยนต์' หรือ 'รถตู้' |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):None
รูป ( tfds.show_examples ):
- ตัวอย่าง ( tfds.as_dataframe ):
- การอ้างอิง :
@inproceedings{Geiger2012CVPR,
author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
year = {2012}
}