- Описание :
WebVid — это крупномасштабный набор коротких видеороликов с текстовыми описаниями, полученными из Интернета. Видео разнообразны и богаты своим содержанием.
WebVid-10M содержит:
10,7 млн пар видео-субтитров. Общее количество часов видео 52 000.
Домашняя страница : https://m-bain.github.io/webvid-dataset/
Исходный код :
tfds.datasets.webvid.Builder
Версии :
-
1.0.0
(по умолчанию): Первоначальный выпуск.
-
Размер загрузки :
Unknown size
Размер набора данных :
Unknown size
Инструкции по ручной загрузке : этот набор данных требует, чтобы вы загружали исходные данные вручную в
download_config.manual_dir
(по умолчанию~/tensorflow_datasets/downloads/manual/
):
Следуйте инструкциям по загрузке в https://m-bain.github.io/webvid-dataset/ , чтобы получить данные. Поместите файлы csv и каталоги видео вmanual_dir/webvid
, чтобы файлы mp4 были помещены вmanual_dir/webvid/*/*_*/*.mp4
.
Первый каталог обычно представляет собой каталог произвольной части (для сегментированной загрузки), второй каталог — это каталог страницы (два числа вокруг подчеркивания), внутри которого находится один или несколько файлов mp4.
Автокэширование ( документация ): неизвестно
Сплиты :
Расколоть | Примеры |
---|
- Структура функции :
FeaturesDict({
'caption': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
- Документация по функциям :
Особенность | Сорт | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
подпись | Текст | нить | ||
идентификатор | Текст | нить | ||
URL | Текст | нить | ||
видео | Видео (изображение) | (Нет, 360, 640, 3) | uint8 |
Ключи под наблюдением (см. документ
as_supervised
):None
Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ): отсутствует.
Цитата :
@misc{bain2021frozen,
title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
year={2021},
eprint={2104.00650},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
, - Описание :
WebVid — это крупномасштабный набор коротких видеороликов с текстовыми описаниями, полученными из Интернета. Видео разнообразны и богаты своим содержанием.
WebVid-10M содержит:
10,7 млн пар видео-субтитров. Общее количество часов видео 52 000.
Домашняя страница : https://m-bain.github.io/webvid-dataset/
Исходный код :
tfds.datasets.webvid.Builder
Версии :
-
1.0.0
(по умолчанию): Первоначальный выпуск.
-
Размер загрузки :
Unknown size
Размер набора данных :
Unknown size
Инструкции по ручной загрузке : этот набор данных требует, чтобы вы загружали исходные данные вручную в
download_config.manual_dir
(по умолчанию~/tensorflow_datasets/downloads/manual/
):
Следуйте инструкциям по загрузке в https://m-bain.github.io/webvid-dataset/ , чтобы получить данные. Поместите файлы csv и каталоги видео вmanual_dir/webvid
, чтобы файлы mp4 были помещены вmanual_dir/webvid/*/*_*/*.mp4
.
Первый каталог обычно представляет собой каталог произвольной части (для сегментированной загрузки), второй каталог — это каталог страницы (два числа вокруг подчеркивания), внутри которого находится один или несколько файлов mp4.
Автокэширование ( документация ): неизвестно
Сплиты :
Расколоть | Примеры |
---|
- Структура функции :
FeaturesDict({
'caption': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
- Документация по функциям :
Особенность | Сорт | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
подпись | Текст | нить | ||
идентификатор | Текст | нить | ||
URL | Текст | нить | ||
видео | Видео (изображение) | (Нет, 360, 640, 3) | uint8 |
Ключи под наблюдением (см. документ
as_supervised
):None
Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ): отсутствует.
Цитата :
@misc{bain2021frozen,
title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
year={2021},
eprint={2104.00650},
archivePrefix={arXiv},
primaryClass={cs.CV}
}