ताओ

  • विवरण :

TAO डेटासेट एक बड़ा वीडियो ऑब्जेक्ट डिटेक्शन डेटासेट है जिसमें 2,907 उच्च रिज़ॉल्यूशन वीडियो और 833 ऑब्जेक्ट श्रेणियां शामिल हैं। ध्यान दें कि इस डेटासेट को स्टोर करने के लिए कम से कम 300 जीबी खाली जगह की आवश्यकता है।

  • अतिरिक्त दस्तावेज़ीकरण : कोड वाले कागजात पर अन्वेषण करें

  • मुखपृष्ठ : https://taodataset.org/

  • स्रोत कोड : tfds.video.tao.Tao

  • संस्करण :

    • 1.0.0 (डिफ़ॉल्ट): कोई रिलीज़ नोट नहीं।
    • 1.1.0 : परीक्षण विभाजन जोड़ा गया।
  • डाउनलोड आकार : 113.96 GiB

  • मैन्युअल डाउनलोड निर्देश : इस डेटासेट के लिए आपको स्रोत डेटा को मैन्युअल रूप से download_config.manual_dir (डिफ़ॉल्ट रूप से ~/tensorflow_datasets/downloads/manual/ ) में डाउनलोड करना होगा:
    कुछ TAO फ़ाइलें (HVACS और AVA वीडियो) मैन्युअल रूप से डाउनलोड की जानी चाहिए क्योंकि MOT में लॉगिन आवश्यक है। कृपया https://motchallenge.net/tao_download.php पर दिए गए निर्देशों का पालन करते हुए वह डेटा डाउनलोड करें

इस डेटा को डाउनलोड करें और परिणामी .zip फ़ाइलों को ~/tensorflow_datasets/downloads/manual/ पर ले जाएं

यदि मैन्युअल डाउनलोड की आवश्यकता वाला डेटा मौजूद नहीं है, तो इसे छोड़ दिया जाएगा और केवल उस डेटा का उपयोग किया जाएगा जिसे मैन्युअल डाउनलोड की आवश्यकता नहीं है।

विभाजित करना उदाहरण
'train' 500
'validation' 988
  • पर्यवेक्षित कुंजियाँ ( as_supervised doc देखें): None

  • चित्र ( tfds.show_examples ): समर्थित नहीं है।

  • उद्धरण :

@article{Dave_2020,
   title={TAO: A Large-Scale Benchmark for Tracking Any Object},
   ISBN={9783030585587},
   ISSN={1611-3349},
   url={http://dx.doi.org/10.1007/978-3-030-58558-7_26},
   DOI={10.1007/978-3-030-58558-7_26},
   journal={Lecture Notes in Computer Science},
   publisher={Springer International Publishing},
   author={Dave, Achal and Khurana, Tarasha and Tokmakov, Pavel and Schmid, Cordelia and Ramanan, Deva},
   year={2020},
   pages={436-454}
}

ताओ/480_640 (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • कॉन्फ़िगरेशन विवरण : सभी छवियों का आकार द्विरेखीय रूप से 480 X 640 कर दिया गया है

  • डेटासेट का आकार : 482.30 GiB

  • फ़ीचर संरचना :

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': string,
        'height': int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
        'num_frames': int32,
        'video_name': string,
        'width': int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
        'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
        'frames': Sequence(int32),
        'is_crowd': bool,
        'scale_category': string,
        'track_id': int32,
    }),
    'video': Video(Image(shape=(480, 640, 3), dtype=uint8)),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीप्रकार विवरण
फीचर्सडिक्ट
मेटाडाटा फीचर्सडिक्ट
मेटाडेटा/डेटासेट टेन्सर डोरी
मेटाडेटा/ऊंचाई टेन्सर int32
मेटाडेटा/नकारात्मक_श्रेणी_आईडी टेन्सर (कोई नहीं,) int32
मेटाडेटा/not_exhaustive_category_ids टेन्सर (कोई नहीं,) int32
मेटाडेटा/num_frames टेन्सर int32
मेटाडेटा/वीडियो_नाम टेन्सर डोरी
मेटाडेटा/चौड़ाई टेन्सर int32
पटरियों अनुक्रम
ट्रैक/बॉक्स अनुक्रम(बीबॉक्सफ़ीचर) (कोई नहीं, 4) फ्लोट32
ट्रैक/श्रेणी क्लास लेबल int64
ट्रैक/फ़्रेम अनुक्रम (टेंसर) (कोई नहीं,) int32
ट्रैक/भीड़ है टेन्सर बूल
ट्रैक/स्केल_श्रेणी टेन्सर डोरी
ट्रैक/ट्रैक_आईडी टेन्सर int32
वीडियो वीडियो(छवि) (कोई नहीं, 480, 640, 3) uint8

tao/full_resolution

  • कॉन्फ़िगरेशन विवरण : डेटासेट का पूर्ण रिज़ॉल्यूशन संस्करण।

  • डेटासेट का आकार : 171.24 GiB

  • फ़ीचर संरचना :

FeaturesDict({
    'metadata': FeaturesDict({
        'dataset': string,
        'height': int32,
        'neg_category_ids': Tensor(shape=(None,), dtype=int32),
        'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
        'num_frames': int32,
        'video_name': string,
        'width': int32,
    }),
    'tracks': Sequence({
        'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
        'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
        'frames': Sequence(int32),
        'is_crowd': bool,
        'scale_category': string,
        'track_id': int32,
    }),
    'video': Video(Image(shape=(None, None, 3), dtype=uint8)),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीप्रकार विवरण
फीचर्सडिक्ट
मेटाडाटा फीचर्सडिक्ट
मेटाडेटा/डेटासेट टेन्सर डोरी
मेटाडेटा/ऊंचाई टेन्सर int32
मेटाडेटा/नकारात्मक_श्रेणी_आईडी टेन्सर (कोई नहीं,) int32
मेटाडेटा/not_exhaustive_category_ids टेन्सर (कोई नहीं,) int32
मेटाडेटा/num_frames टेन्सर int32
मेटाडेटा/वीडियो_नाम टेन्सर डोरी
मेटाडेटा/चौड़ाई टेन्सर int32
पटरियों अनुक्रम
ट्रैक/बॉक्स अनुक्रम(बीबॉक्सफ़ीचर) (कोई नहीं, 4) फ्लोट32
ट्रैक/श्रेणी क्लास लेबल int64
ट्रैक/फ़्रेम अनुक्रम (टेंसर) (कोई नहीं,) int32
ट्रैक/भीड़ है टेन्सर बूल
ट्रैक/स्केल_श्रेणी टेन्सर डोरी
ट्रैक/ट्रैक_आईडी टेन्सर int32
वीडियो वीडियो(छवि) (कोई नहीं, कोई नहीं, कोई नहीं, 3) uint8