- Descrizione :
WebVid è un set di dati su larga scala di brevi video con descrizioni testuali provenienti dal web. I video sono diversi e ricchi di contenuti.
WebVid-10M contiene:
10,7 milioni di coppie di sottotitoli video. 52.000 ore video totali.
Pagina iniziale : https://m-bain.github.io/webvid-dataset/
Codice sorgente :
tfds.datasets.webvid.Builder
Versioni :
-
1.0.0
(impostazione predefinita): versione iniziale.
-
Dimensioni del download :
Unknown size
Dimensioni del set di dati :
Unknown size
Istruzioni per il download manuale : questo set di dati richiede di scaricare manualmente i dati di origine in
download_config.manual_dir
(il valore predefinito è~/tensorflow_datasets/downloads/manual/
):
Segui le istruzioni per il download in https://m-bain.github.io/webvid-dataset/ per ottenere i dati. Posiziona i file csv e le directory video inmanual_dir/webvid
, in modo tale che i file mp4 vengano inseriti inmanual_dir/webvid/*/*_*/*.mp4
.
La prima directory è tipicamente una directory parziale arbitraria (per il download frammentato), la seconda directory è la directory della pagina (due numeri attorno al trattino basso), all'interno della quale sono presenti uno o più file mp4.
Cache automatica ( documentazione ): Sconosciuto
Divisioni :
Diviso | Esempi |
---|
- Struttura delle caratteristiche :
FeaturesDict({
'caption': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
didascalia | Testo | corda | ||
id | Testo | corda | ||
URL | Testo | corda | ||
video | Video (Immagine) | (Nessuno, 360, 640, 3) | uint8 |
Chiavi supervisionate (Vedi
as_supervised
doc ):None
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ): Mancante.
Citazione :
@misc{bain2021frozen,
title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
year={2021},
eprint={2104.00650},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
, - Descrizione :
WebVid è un set di dati su larga scala di brevi video con descrizioni testuali provenienti dal web. I video sono diversi e ricchi di contenuti.
WebVid-10M contiene:
10,7 milioni di coppie di sottotitoli video. 52.000 ore video totali.
Pagina iniziale : https://m-bain.github.io/webvid-dataset/
Codice sorgente :
tfds.datasets.webvid.Builder
Versioni :
-
1.0.0
(impostazione predefinita): versione iniziale.
-
Dimensioni del download :
Unknown size
Dimensioni del set di dati :
Unknown size
Istruzioni per il download manuale : questo set di dati richiede di scaricare manualmente i dati di origine in
download_config.manual_dir
(il valore predefinito è~/tensorflow_datasets/downloads/manual/
):
Segui le istruzioni per il download in https://m-bain.github.io/webvid-dataset/ per ottenere i dati. Posiziona i file csv e le directory video inmanual_dir/webvid
, in modo tale che i file mp4 vengano inseriti inmanual_dir/webvid/*/*_*/*.mp4
.
La prima directory è tipicamente una directory parziale arbitraria (per il download frammentato), la seconda directory è la directory della pagina (due numeri attorno al trattino basso), all'interno della quale sono presenti uno o più file mp4.
Cache automatica ( documentazione ): Sconosciuto
Divisioni :
Diviso | Esempi |
---|
- Struttura delle caratteristiche :
FeaturesDict({
'caption': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
didascalia | Testo | corda | ||
id | Testo | corda | ||
URL | Testo | corda | ||
video | Video (Immagine) | (Nessuno, 360, 640, 3) | uint8 |
Chiavi supervisionate (Vedi
as_supervised
doc ):None
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ): Mancante.
Citazione :
@misc{bain2021frozen,
title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
year={2021},
eprint={2104.00650},
archivePrefix={arXiv},
primaryClass={cs.CV}
}