กิตติ

  • คำอธิบาย :

Kitti ประกอบด้วยชุดงานด้านการมองเห็นที่สร้างขึ้นโดยใช้แพลตฟอร์มการขับขี่อัตโนมัติ การวัดประสิทธิภาพแบบเต็มประกอบด้วยงานต่างๆ มากมาย เช่น สเตอริโอ การไหลของแสง การวัดระยะทางด้วยภาพ ฯลฯ ชุดข้อมูลนี้ประกอบด้วยชุดข้อมูลการตรวจจับวัตถุ รวมถึงภาพตาข้างเดียวและกล่องขอบเขต ชุดข้อมูลประกอบด้วยรูปภาพการฝึกอบรม 7481 ภาพพร้อมคำอธิบายประกอบด้วยกล่องขอบเขต 3 มิติ คำอธิบายโดยละเอียดของคำอธิบายประกอบสามารถพบได้ใน readme ของ object development kit readme บนหน้าแรกของ Kitti

แยก ตัวอย่าง
'test' 711
'train' 6,347
'validation' 423
  • โครงสร้างคุณสมบัติ :
FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/file_name': Text(shape=(), dtype=string),
    'objects': Sequence({
        'alpha': float32,
        'bbox': BBoxFeature(shape=(4,), dtype=float32, description=2D bounding box of object in the image),
        'dimensions': Tensor(shape=(3,), dtype=float32, description=3D object dimensions: height, width, length (in meters)),
        'location': Tensor(shape=(3,), dtype=float32, description=3D object location x,y,z in camera coordinates (in meters)),
        'occluded': ClassLabel(shape=(), dtype=int64, num_classes=4),
        'rotation_y': float32,
        'truncated': float32,
        'type': ClassLabel(shape=(), dtype=int64, num_classes=8),
    }),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง ประเภทD คำอธิบาย
คุณสมบัติDict
ภาพ ภาพ (ไม่มี ไม่มี 3) uint8
รูปภาพ/file_name ข้อความ เชือก
วัตถุ ลำดับ
วัตถุ/อัลฟ่า เทนเซอร์ ลอย32 มุมสังเกตของวัตถุ มีตั้งแต่ [-pi..pi]
วัตถุ/bbox คุณสมบัติ BBox (4,) ลอย32 กรอบขอบเขต 2 มิติของวัตถุในภาพ
วัตถุ/มิติ เทนเซอร์ (3,) ลอย32 ขนาดวัตถุ 3 มิติ: ความสูง ความกว้าง ความยาว (เป็นเมตร)
วัตถุ/สถานที่ เทนเซอร์ (3,) ลอย32 ตำแหน่งของวัตถุ 3 มิติ x,y,z ในพิกัดของกล้อง (หน่วยเป็นเมตร)
วัตถุ/ถูกแยกออก ClassLabel int64 จำนวนเต็ม (0,1,2,3) บ่งชี้สถานะการบดเคี้ยว: 0 = มองเห็นได้ทั้งหมด, 1 = บดบังบางส่วน 2 = บดเคี้ยวส่วนใหญ่, 3 = ไม่ทราบ
วัตถุ/rotation_y เทนเซอร์ ลอย32 การหมุนรอบแกน Y ในพิกัดกล้อง [-pi..pi]
วัตถุ/ถูกตัดทอน เทนเซอร์ ลอย32 ลอยจาก 0 (ไม่ถูกตัดทอน) ถึง 1 (ถูกตัดทอน) โดยที่การตัดทอนหมายถึงวัตถุที่ออกจากขอบเขตรูปภาพ
วัตถุ/ประเภท ClassLabel int64 ประเภทของวัตถุ เช่น 'รถยนต์' หรือ 'รถตู้'

การแสดงภาพ

  • การอ้างอิง :
@inproceedings{Geiger2012CVPR,
  author = {Andreas Geiger and Philip Lenz and Raquel Urtasun},
  title = {Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite},
  booktitle = {Conference on Computer Vision and Pattern Recognition (CVPR)},
  year = {2012}
}