เต่า

คำอธิบาย :

ชุดข้อมูล TAO เป็นชุดข้อมูลการตรวจจับวัตถุวิดีโอขนาดใหญ่ที่ประกอบด้วยวิดีโอความละเอียดสูง 2,907 รายการ และหมวดหมู่ออบเจ็กต์ 833 รายการ โปรดทราบว่าชุดข้อมูลนี้ต้องการพื้นที่ว่างอย่างน้อย 300 GB ในการจัดเก็บ

เอกสารประกอบเพิ่มเติม : สำรวจในเอกสารด้วยรหัส
หน้าแรก : https://taodataset.org/
ซอร์สโค้ด : tfds.video.tao.Tao
รุ่น :
- 1.1.0 (ค่าเริ่มต้น) : เพิ่มการแยกการทดสอบ
ขนาดการดาวน์โหลด : Unknown size
ขนาดชุดข้อมูล : Unknown size
คำแนะนำในการดาวน์โหลดด้วยตนเอง : ชุดข้อมูลนี้ต้องการให้คุณดาวน์โหลดข้อมูลต้นฉบับด้วยตนเองลงใน download_config.manual_dir (ค่าเริ่มต้นเป็น ~/tensorflow_datasets/downloads/manual/ ):
ไฟล์ TAO บางไฟล์ (วิดีโอ HVACS และ AVA) จะต้องดาวน์โหลดด้วยตนเอง เนื่องจากจำเป็นต้องลงชื่อเข้าใช้ MOT โปรดดาวน์โหลดและข้อมูลเหล่านั้นตามคำแนะนำที่ https://motchallenge.net/tao_download.php

ดาวน์โหลดข้อมูลนี้และย้ายไฟล์ .zip ที่ได้ไปที่ ~/tensorflow_datasets/downloads/manual/

หากไม่มีข้อมูลที่จำเป็นต้องดาวน์โหลดด้วยตนเอง ข้อมูลนั้นจะถูกข้ามไป และจะใช้เฉพาะข้อมูลที่ไม่ต้องดาวน์โหลดด้วยตนเองเท่านั้น

แคชอัตโนมัติ ( เอกสาร ): ไม่ทราบ
แยก :

แยก	ตัวอย่าง

คีย์ภายใต้การดูแล (ดู as_supervised doc ): None
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ): หายไป
การอ้างอิง :

@article{Dave_2020,
   title={TAO: A Large-Scale Benchmark for Tracking Any Object},
   ISBN={9783030585587},
   ISSN={1611-3349},
   url={http://dx.doi.org/10.1007/978-3-030-58558-7_26},
   DOI={10.1007/978-3-030-58558-7_26},
   journal={Lecture Notes in Computer Science},
   publisher={Springer International Publishing},
   author={Dave, Achal and Khurana, Tarasha and Tokmakov, Pavel and Schmid, Cordelia and Ramanan, Deva},
   year={2020},
   pages={436-454}
}

เต่า/480_640 (การกำหนดค่าเริ่มต้น)

คำอธิบายการกำหนดค่า : รูปภาพทั้งหมดจะถูกปรับขนาดแบบสองเส้นเป็น 480 X 640
โครงสร้างคุณสมบัติ :

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': string,
        'height': int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
        'num_frames': int32,
        'video_name': string,
        'width': int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
        'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
        'frames': Sequence(int32),
        'is_crowd': bool,
        'scale_category': string,
        'track_id': int32,
    }),
    'video': Video(Image(shape=(480, 640, 3), dtype=uint8)),
})

เอกสารคุณสมบัติ :

คุณสมบัติ	ระดับ	รูปร่าง	ประเภทD
	คุณสมบัติDict
ข้อมูลเมตา	คุณสมบัติDict
ข้อมูลเมตา/ชุดข้อมูล	เทนเซอร์		เชือก
ข้อมูลเมตา/ความสูง	เทนเซอร์		int32
ข้อมูลเมตา/neg_category_ids	เทนเซอร์	(ไม่มี,)	int32
ข้อมูลเมตา/not_exhaustive_category_ids	เทนเซอร์	(ไม่มี,)	int32
ข้อมูลเมตา/num_frames	เทนเซอร์		int32
ข้อมูลเมตา/video_name	เทนเซอร์		เชือก
ข้อมูลเมตา/ความกว้าง	เทนเซอร์		int32
แทร็ค	ลำดับ
แทร็ก/bbox	ลำดับ (BBoxFeature)	(ไม่มี 4)	ลอย32
แทร็ก/หมวดหมู่	ClassLabel		int64
แทร็ก/เฟรม	ลำดับ(เทนเซอร์)	(ไม่มี,)	int32
แทร็ก/is_crowd	เทนเซอร์		บูล
แทร็ก/scale_category	เทนเซอร์		เชือก
แทร็ก/track_id	เทนเซอร์		int32
วิดีโอ	วิดีโอ (รูปภาพ)	(ไม่มี, 480, 640, 3)	uint8

เต่า/full_solution

คำอธิบายการกำหนดค่า : ชุดข้อมูลเวอร์ชันความละเอียดเต็ม
โครงสร้างคุณสมบัติ :

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': string,
        'height': int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
        'num_frames': int32,
        'video_name': string,
        'width': int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
        'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
        'frames': Sequence(int32),
        'is_crowd': bool,
        'scale_category': string,
        'track_id': int32,
    }),
    'video': Video(Image(shape=(None, None, 3), dtype=uint8)),
})

เอกสารคุณสมบัติ :

คุณสมบัติ	ระดับ	รูปร่าง	ประเภทD
	คุณสมบัติDict
ข้อมูลเมตา	คุณสมบัติDict
ข้อมูลเมตา/ชุดข้อมูล	เทนเซอร์		เชือก
ข้อมูลเมตา/ความสูง	เทนเซอร์		int32
ข้อมูลเมตา/neg_category_ids	เทนเซอร์	(ไม่มี,)	int32
ข้อมูลเมตา/not_exhaustive_category_ids	เทนเซอร์	(ไม่มี,)	int32
ข้อมูลเมตา/num_frames	เทนเซอร์		int32
ข้อมูลเมตา/video_name	เทนเซอร์		เชือก
ข้อมูลเมตา/ความกว้าง	เทนเซอร์		int32
แทร็ค	ลำดับ
แทร็ก/บีบ็อกซ์	ลำดับ (BBoxFeature)	(ไม่มี 4)	ลอย32
แทร็ก/หมวดหมู่	ClassLabel		int64
แทร็ก/เฟรม	ลำดับ (เทนเซอร์)	(ไม่มี,)	int32
แทร็ก/is_crowd	เทนเซอร์		บูล
แทร็ก/scale_category	เทนเซอร์		เชือก
แทร็ก/track_id	เทนเซอร์		int32
วิดีโอ	วิดีโอ (รูปภาพ)	(ไม่มี, ไม่มี, ไม่มี, 3)	uint8

เต่า จัดทุกอย่างให้เป็นระเบียบอยู่เสมอด้วยคอลเล็กชัน บันทึกและจัดหมวดหมู่เนื้อหาตามค่ากำหนดของคุณ

เต่า/480_640 (การกำหนดค่าเริ่มต้น)

เต่า/full_solution

เต่า