- Açıklama :
WebVid, web'den alınan metin açıklamaları içeren kısa videolardan oluşan büyük ölçekli bir veri kümesidir. Videolar içerik olarak çeşitli ve zengindir.
WebVid-10M şunları içerir:
10,7 milyon video altyazı çifti. 52K toplam video saati.
Ana Sayfa : https://m-bain.github.io/webvid-dataset/
Kaynak kodu :
tfds.datasets.webvid.Builder
sürümler :
-
1.0.0
(varsayılan): İlk sürüm.
-
İndirme boyutu :
Unknown size
Veri kümesi boyutu :
Unknown size
Manuel indirme talimatları : Bu veri kümesi, kaynak verileri manuel olarak
download_config.manual_dir
içine indirmenizi gerektirir (varsayılan olarak~/tensorflow_datasets/downloads/manual/
şeklindedir):
Verileri almak için https://m-bain.github.io/webvid-dataset/ adresindeki indirme talimatlarını izleyin. csv dosyalarını ve video dizinlerinimanual_dir/webvid
içine yerleştirin, böylece mp4 dosyalarımanual_dir/webvid/*/*_*/*.mp4
içine yerleştirilir.
Birinci dizin tipik olarak isteğe bağlı bir parça dizini (parçalı indirme için), ikinci dizin ise içinde bir veya daha fazla mp4 dosyası bulunan sayfa dizinidir (alt çizgi etrafında iki sayı).
Otomatik önbelleğe alınmış ( belgeler ): Bilinmiyor
bölmeler :
Bölmek | örnekler |
---|
- Özellik yapısı :
FeaturesDict({
'caption': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
altyazı | Metin | sicim | ||
İD | Metin | sicim | ||
url | Metin | sicim | ||
video | Video(Resim) | (Yok, 360, 640, 3) | uint8 |
Denetlenen anahtarlar (Bkz.
as_supervised
doc ):None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ): Eksik.
Alıntı :
@misc{bain2021frozen,
title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
year={2021},
eprint={2104.00650},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
, - Açıklama :
WebVid, web'den alınan metin açıklamaları içeren kısa videolardan oluşan büyük ölçekli bir veri kümesidir. Videolar içerik olarak çeşitli ve zengindir.
WebVid-10M şunları içerir:
10,7 milyon video altyazı çifti. 52K toplam video saati.
Ana Sayfa : https://m-bain.github.io/webvid-dataset/
Kaynak kodu :
tfds.datasets.webvid.Builder
sürümler :
-
1.0.0
(varsayılan): İlk sürüm.
-
İndirme boyutu :
Unknown size
Veri kümesi boyutu :
Unknown size
Manuel indirme talimatları : Bu veri kümesi, kaynak verileri manuel olarak
download_config.manual_dir
içine indirmenizi gerektirir (varsayılan olarak~/tensorflow_datasets/downloads/manual/
şeklindedir):
Verileri almak için https://m-bain.github.io/webvid-dataset/ adresindeki indirme talimatlarını izleyin. csv dosyalarını ve video dizinlerinimanual_dir/webvid
içine yerleştirin, böylece mp4 dosyalarımanual_dir/webvid/*/*_*/*.mp4
içine yerleştirilir.
Birinci dizin tipik olarak isteğe bağlı bir parça dizini (parçalı indirme için), ikinci dizin ise içinde bir veya daha fazla mp4 dosyası bulunan sayfa dizinidir (alt çizgi etrafında iki sayı).
Otomatik önbelleğe alınmış ( belgeleme ): Bilinmiyor
bölmeler :
Bölmek | örnekler |
---|
- Özellik yapısı :
FeaturesDict({
'caption': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
altyazı | Metin | sicim | ||
İD | Metin | sicim | ||
url | Metin | sicim | ||
video | Video(Resim) | (Yok, 360, 640, 3) | uint8 |
Denetlenen anahtarlar (Bkz.
as_supervised
doc ):None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ): Eksik.
Alıntı :
@misc{bain2021frozen,
title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
year={2021},
eprint={2104.00650},
archivePrefix={arXiv},
primaryClass={cs.CV}
}