- Deskripsi :
Dataset TAO adalah dataset deteksi objek video berukuran besar yang terdiri dari 2.907 video beresolusi tinggi dan 833 kategori objek. Perhatikan bahwa kumpulan data ini memerlukan setidaknya 300 GB ruang kosong untuk disimpan.
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : https://taodataset.org/
Kode sumber :
tfds.video.tao.Tao
Versi :
-
1.0.0
(default): Rilis awal.
-
Ukuran unduhan :
113.96 GiB
Instruksi pengunduhan manual : Kumpulan data ini mengharuskan Anda mengunduh data sumber secara manual ke
download_config.manual_dir
(default ke~/tensorflow_datasets/downloads/manual/
):
Beberapa file TAO (video HVACS dan AVA) harus diunduh secara manual karena diperlukan login ke MOT. Silakan unduh dan data tersebut mengikuti petunjuk di https://motchallenge.net/tao_download.php
Unduh data ini dan pindahkan file .zip yang dihasilkan ke ~/tensorflow_datasets/downloads/manual/
Jika data yang memerlukan pengunduhan manual tidak ada, maka akan dilewati dan hanya data yang tidak memerlukan pengunduhan manual yang akan digunakan.
Di-cache otomatis ( dokumentasi ): Tidak
Perpecahan :
Membelah | Contoh |
---|---|
'train' | 500 |
'validation' | 988 |
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Gambar ( tfds.show_examples ): Tidak didukung.
Kutipan :
@article{Dave_2020,
title={TAO: A Large-Scale Benchmark for Tracking Any Object},
ISBN={9783030585587},
ISSN={1611-3349},
url={http://dx.doi.org/10.1007/978-3-030-58558-7_26},
DOI={10.1007/978-3-030-58558-7_26},
journal={Lecture Notes in Computer Science},
publisher={Springer International Publishing},
author={Dave, Achal and Khurana, Tarasha and Tokmakov, Pavel and Schmid, Cordelia and Ramanan, Deva},
year={2020},
pages={436-454}
}
tao/480_640 (konfigurasi default)
Deskripsi konfigurasi : Semua gambar diubah ukurannya secara bilinear menjadi 480 X 640
Ukuran dataset :
482.30 GiB
Struktur fitur :
FeaturesDict({
'metadata': FeaturesDict({
'dataset': string,
'height': int32,
'neg_category_ids': Tensor(shape=(None,), dtype=int32),
'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
'num_frames': int32,
'video_name': string,
'width': int32,
}),
'tracks': Sequence({
'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
'frames': Sequence(int32),
'is_crowd': bool,
'scale_category': string,
'track_id': int32,
}),
'video': Video(Image(shape=(480, 640, 3), dtype=uint8)),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
metadata | fiturDict | |||
metadata/kumpulan data | Tensor | rangkaian | ||
metadata/tinggi | Tensor | int32 | ||
metadata/neg_category_ids | Tensor | (Tidak ada,) | int32 | |
metadata/not_exhaustive_category_ids | Tensor | (Tidak ada,) | int32 | |
metadata/num_frames | Tensor | int32 | ||
metadata/nama_video | Tensor | rangkaian | ||
metadata/lebar | Tensor | int32 | ||
trek | Urutan | |||
track/bbox | Urutan (Fitur BBox) | (Tidak ada, 4) | float32 | |
trek/kategori | LabelKelas | int64 | ||
track/frame | Urutan (Tensor) | (Tidak ada,) | int32 | |
track/is_crowd | Tensor | bool | ||
track/scale_category | Tensor | rangkaian | ||
track/track_id | Tensor | int32 | ||
video | Video(Gambar) | (Tidak ada, 480, 640, 3) | uint8 |
- Contoh ( tfds.as_dataframe ):
tao/full_resolution
Deskripsi konfigurasi : Versi resolusi penuh dari kumpulan data.
Ukuran dataset :
171.24 GiB
Struktur fitur :
FeaturesDict({
'metadata': FeaturesDict({
'dataset': string,
'height': int32,
'neg_category_ids': Tensor(shape=(None,), dtype=int32),
'not_exhaustive_category_ids': Tensor(shape=(None,), dtype=int32),
'num_frames': int32,
'video_name': string,
'width': int32,
}),
'tracks': Sequence({
'bboxes': Sequence(BBoxFeature(shape=(4,), dtype=float32)),
'category': ClassLabel(shape=(), dtype=int64, num_classes=363),
'frames': Sequence(int32),
'is_crowd': bool,
'scale_category': string,
'track_id': int32,
}),
'video': Video(Image(shape=(None, None, 3), dtype=uint8)),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
metadata | fiturDict | |||
metadata/kumpulan data | Tensor | rangkaian | ||
metadata/tinggi | Tensor | int32 | ||
metadata/neg_category_ids | Tensor | (Tidak ada,) | int32 | |
metadata/not_exhaustive_category_ids | Tensor | (Tidak ada,) | int32 | |
metadata/num_frames | Tensor | int32 | ||
metadata/nama_video | Tensor | rangkaian | ||
metadata/lebar | Tensor | int32 | ||
trek | Urutan | |||
track/bbox | Urutan (Fitur BBox) | (Tidak ada, 4) | float32 | |
trek/kategori | LabelKelas | int64 | ||
track/frame | Urutan (Tensor) | (Tidak ada,) | int32 | |
track/is_crowd | Tensor | bool | ||
track/scale_category | Tensor | rangkaian | ||
track/track_id | Tensor | int32 | ||
video | Video(Gambar) | (Tidak ada, Tidak ada, Tidak ada, 3) | uint8 |
- Contoh ( tfds.as_dataframe ):