- विवरण :
TAO डेटासेट एक बड़ा वीडियो ऑब्जेक्ट डिटेक्शन डेटासेट है जिसमें 2,907 उच्च रिज़ॉल्यूशन वीडियो और 833 ऑब्जेक्ट श्रेणियां शामिल हैं। ध्यान दें कि इस डेटासेट को स्टोर करने के लिए कम से कम 300 जीबी खाली जगह की आवश्यकता है।
मुखपृष्ठ : https://taodataset.org/
स्रोत कोड :
tfds.video.tao.Tao
संस्करण :
-
1.0.0
(डिफ़ॉल्ट): कोई रिलीज़ नोट नहीं। -
1.1.0
: परीक्षण विभाजन जोड़ा गया।
-
डाउनलोड आकार :
113.96 GiB
मैन्युअल डाउनलोड निर्देश : इस डेटासेट के लिए आपको स्रोत डेटा को मैन्युअल रूप से
download_config.manual_dir
(डिफ़ॉल्ट रूप से~/tensorflow_datasets/downloads/manual/
) में डाउनलोड करना होगा:
कुछ TAO फ़ाइलें (HVACS और AVA वीडियो) मैन्युअल रूप से डाउनलोड की जानी चाहिए क्योंकि MOT में लॉगिन आवश्यक है। कृपया https://motchallenge.net/tao_download.php पर दिए गए निर्देशों का पालन करते हुए वह डेटा डाउनलोड करें
इस डेटा को डाउनलोड करें और परिणामी .zip फ़ाइलों को ~/tensorflow_datasets/downloads/manual/ पर ले जाएं
यदि मैन्युअल डाउनलोड की आवश्यकता वाला डेटा मौजूद नहीं है, तो इसे छोड़ दिया जाएगा और केवल उस डेटा का उपयोग किया जाएगा जिसे मैन्युअल डाउनलोड की आवश्यकता नहीं है।
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 500 |
'validation' | 988 |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उद्धरण :
@article{Dave_2020,
title={TAO: A Large-Scale Benchmark for Tracking Any Object},
ISBN={9783030585587},
ISSN={1611-3349},
url={http://dx.doi.org/10.1007/978-3-030-58558-7_26},
DOI={10.1007/978-3-030-58558-7_26},
journal={Lecture Notes in Computer Science},
publisher={Springer International Publishing},
author={Dave, Achal and Khurana, Tarasha and Tokmakov, Pavel and Schmid, Cordelia and Ramanan, Deva},
year={2020},
pages={436-454}
}
ताओ/480_640 (डिफ़ॉल्ट कॉन्फ़िगरेशन)
कॉन्फ़िगरेशन विवरण : सभी छवियों का आकार द्विरेखीय रूप से 480 X 640 कर दिया गया है
डेटासेट का आकार :
482.30 GiB
फ़ीचर संरचना :
FeaturesDict({
'metadata': FeaturesDict({
'dataset': string,
'height': int32,
'neg_category_ids': Tensor(shape=(None,), dtype=int32),
'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
'num_frames': int32,
'video_name': string,
'width': int32,
}),
'tracks': Sequence({
'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
'frames': Sequence(int32),
'is_crowd': bool,
'scale_category': string,
'track_id': int32,
}),
'video': Video(Image(shape=(480, 640, 3), dtype=uint8)),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीप्रकार | विवरण |
---|---|---|---|---|
फीचर्सडिक्ट | ||||
मेटाडाटा | फीचर्सडिक्ट | |||
मेटाडेटा/डेटासेट | टेन्सर | डोरी | ||
मेटाडेटा/ऊंचाई | टेन्सर | int32 | ||
मेटाडेटा/नकारात्मक_श्रेणी_आईडी | टेन्सर | (कोई नहीं,) | int32 | |
मेटाडेटा/not_exhaustive_category_ids | टेन्सर | (कोई नहीं,) | int32 | |
मेटाडेटा/num_frames | टेन्सर | int32 | ||
मेटाडेटा/वीडियो_नाम | टेन्सर | डोरी | ||
मेटाडेटा/चौड़ाई | टेन्सर | int32 | ||
पटरियों | अनुक्रम | |||
ट्रैक/बॉक्स | अनुक्रम(बीबॉक्सफ़ीचर) | (कोई नहीं, 4) | फ्लोट32 | |
ट्रैक/श्रेणी | क्लास लेबल | int64 | ||
ट्रैक/फ़्रेम | अनुक्रम (टेंसर) | (कोई नहीं,) | int32 | |
ट्रैक/भीड़ है | टेन्सर | बूल | ||
ट्रैक/स्केल_श्रेणी | टेन्सर | डोरी | ||
ट्रैक/ट्रैक_आईडी | टेन्सर | int32 | ||
वीडियो | वीडियो(छवि) | (कोई नहीं, 480, 640, 3) | uint8 |
- उदाहरण ( tfds.as_dataframe ):
tao/full_resolution
कॉन्फ़िगरेशन विवरण : डेटासेट का पूर्ण रिज़ॉल्यूशन संस्करण।
डेटासेट का आकार :
171.24 GiB
फ़ीचर संरचना :
FeaturesDict({
'metadata': FeaturesDict({
'dataset': string,
'height': int32,
'neg_category_ids': Tensor(shape=(None,), dtype=int32),
'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
'num_frames': int32,
'video_name': string,
'width': int32,
}),
'tracks': Sequence({
'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
'frames': Sequence(int32),
'is_crowd': bool,
'scale_category': string,
'track_id': int32,
}),
'video': Video(Image(shape=(None, None, 3), dtype=uint8)),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीप्रकार | विवरण |
---|---|---|---|---|
फीचर्सडिक्ट | ||||
मेटाडाटा | फीचर्सडिक्ट | |||
मेटाडेटा/डेटासेट | टेन्सर | डोरी | ||
मेटाडेटा/ऊंचाई | टेन्सर | int32 | ||
मेटाडेटा/नकारात्मक_श्रेणी_आईडी | टेन्सर | (कोई नहीं,) | int32 | |
मेटाडेटा/not_exhaustive_category_ids | टेन्सर | (कोई नहीं,) | int32 | |
मेटाडेटा/num_frames | टेन्सर | int32 | ||
मेटाडेटा/वीडियो_नाम | टेन्सर | डोरी | ||
मेटाडेटा/चौड़ाई | टेन्सर | int32 | ||
पटरियों | अनुक्रम | |||
ट्रैक/बॉक्स | अनुक्रम(बीबॉक्सफ़ीचर) | (कोई नहीं, 4) | फ्लोट32 | |
ट्रैक/श्रेणी | क्लास लेबल | int64 | ||
ट्रैक/फ़्रेम | अनुक्रम (टेंसर) | (कोई नहीं,) | int32 | |
ट्रैक/भीड़ है | टेन्सर | बूल | ||
ट्रैक/स्केल_श्रेणी | टेन्सर | डोरी | ||
ट्रैक/ट्रैक_आईडी | टेन्सर | int32 | ||
वीडियो | वीडियो(छवि) | (कोई नहीं, कोई नहीं, कोई नहीं, 3) | uint8 |
- उदाहरण ( tfds.as_dataframe ):