- الوصف :
WebVid عبارة عن مجموعة بيانات واسعة النطاق من مقاطع الفيديو القصيرة ذات الأوصاف النصية التي يتم الحصول عليها من الويب. مقاطع الفيديو متنوعة وغنية بمحتواها.
يحتوي WebVid-10M على:
10.7 مليون زوج من مقاطع الفيديو التوضيحية. إجمالي 52 ألف ساعة فيديو.
الصفحة الرئيسية : https://m-bain.github.io/webvid-dataset/
كود المصدر :
tfds.datasets.webvid.Builder
إصدارات :
-
1.0.0
(افتراضي): الإصدار الأولي.
-
حجم التنزيل :
Unknown size
حجم مجموعة البيانات :
Unknown size
إرشادات التنزيل اليدوي : تتطلب مجموعة البيانات هذه تنزيل بيانات المصدر يدويًا إلى
download_config.manual_dir
(الإعدادات الافتراضية على~/tensorflow_datasets/downloads/manual/
):
اتبع تعليمات التنزيل في https://m-bain.github.io/webvid-dataset/ للحصول على البيانات. ضع ملفات csv وأدلة الفيديو فيmanual_dir/webvid
، بحيث يتم وضع ملفات mp4 فيmanual_dir/webvid/*/*_*/*.mp4
.
يكون الدليل الأول عادةً دليلًا عشوائيًا (للتنزيل المُقسَّم) ، والدليل الثاني هو دليل الصفحة (رقمان حول الشرطة السفلية) ، يوجد بداخله ملف MP4 واحد أو أكثر.
التخزين المؤقت التلقائي ( الوثائق ): غير معروف
الانقسامات :
ينقسم | أمثلة |
---|
- هيكل الميزة :
FeaturesDict({
'caption': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
التسمية التوضيحية | نص | خيط | ||
بطاقة تعريف | نص | خيط | ||
عنوان url | نص | خيط | ||
فيديو | فيديو (صورة) | (لا شيء ، 360 ، 640 ، 3) | uint8 |
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised
):None
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ): مفقود.
الاقتباس :
@misc{bain2021frozen,
title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
year={2021},
eprint={2104.00650},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
، - الوصف :
WebVid عبارة عن مجموعة بيانات واسعة النطاق من مقاطع الفيديو القصيرة ذات الأوصاف النصية التي يتم الحصول عليها من الويب. مقاطع الفيديو متنوعة وغنية بمحتواها.
يحتوي WebVid-10M على:
10.7 مليون زوج من مقاطع الفيديو التوضيحية. إجمالي 52 ألف ساعة فيديو.
الصفحة الرئيسية : https://m-bain.github.io/webvid-dataset/
كود المصدر :
tfds.datasets.webvid.Builder
إصدارات :
-
1.0.0
(افتراضي): الإصدار الأولي.
-
حجم التنزيل :
Unknown size
حجم مجموعة البيانات :
Unknown size
إرشادات التنزيل اليدوي : تتطلب مجموعة البيانات هذه تنزيل بيانات المصدر يدويًا إلى
download_config.manual_dir
(الإعدادات الافتراضية على~/tensorflow_datasets/downloads/manual/
):
اتبع تعليمات التنزيل في https://m-bain.github.io/webvid-dataset/ للحصول على البيانات. ضع ملفات csv وأدلة الفيديو فيmanual_dir/webvid
، بحيث يتم وضع ملفات mp4 فيmanual_dir/webvid/*/*_*/*.mp4
.
يكون الدليل الأول عادةً دليلًا عشوائيًا (للتنزيل المُقسَّم) ، والدليل الثاني هو دليل الصفحة (رقمان حول الشرطة السفلية) ، يوجد بداخله ملف MP4 واحد أو أكثر.
التخزين المؤقت التلقائي ( الوثائق ): غير معروف
الانقسامات :
ينقسم | أمثلة |
---|
- هيكل الميزة :
FeaturesDict({
'caption': Text(shape=(), dtype=string),
'id': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
التسمية التوضيحية | نص | خيط | ||
بطاقة تعريف | نص | خيط | ||
عنوان url | نص | خيط | ||
فيديو | فيديو (صورة) | (لا شيء ، 360 ، 640 ، 3) | uint8 |
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised
):None
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ): مفقود.
الاقتباس :
@misc{bain2021frozen,
title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
year={2021},
eprint={2104.00650},
archivePrefix={arXiv},
primaryClass={cs.CV}
}