เว็บวิด

  • คำอธิบาย :

WebVid เป็นชุดข้อมูลขนาดใหญ่ของวิดีโอขนาดสั้นพร้อมคำอธิบายที่เป็นข้อความซึ่งมาจากเว็บ วิดีโอมีความหลากหลายและเต็มไปด้วยเนื้อหา

WebVid-10M ประกอบด้วย:

คู่คำบรรยายวิดีโอ 10.7 ล้านคู่ 52K ชั่วโมงวิดีโอทั้งหมด

  • หน้าแรก : https://m-bain.github.io/webvid-dataset/

  • รหัสที่มา : tfds.datasets.webvid.Builder

  • รุ่น :

    • 1.0.0 (ค่าเริ่มต้น): การเปิดตัวครั้งแรก
  • ขนาดการดาวน์โหลด : Unknown size

  • ขนาดชุดข้อมูล : Unknown size

  • คำแนะนำในการดาวน์โหลดด้วยตนเอง : ชุดข้อมูลนี้กำหนดให้คุณต้องดาวน์โหลดแหล่งข้อมูลด้วยตนเองลงใน download_config.manual_dir (ค่าเริ่มต้นเป็น ~/tensorflow_datasets/downloads/manual/ ):
    ทำตามคำแนะนำการดาวน์โหลดใน https://m-bain.github.io/webvid-dataset/ เพื่อรับข้อมูล วางไฟล์ csv และไดเรกทอรีวิดีโอใน manual_dir/webvid เพื่อให้ไฟล์ mp4 ถูกวางไว้ใน manual_dir/webvid/*/*_*/*.mp4

โดยทั่วไปไดเร็กทอรีแรกจะเป็นไดเร็กทอรีส่วนใดก็ได้ (สำหรับการดาวน์โหลดแบบชาร์ด) ไดเร็กทอรีที่สองคือไดเร็กทอรีเพจ (ตัวเลขสองตัวรอบๆ ขีดล่าง) ซึ่งภายในมีไฟล์ mp4 หนึ่งไฟล์หรือมากกว่า

  • แคชอัตโนมัติ ( เอกสาร ): ไม่รู้จัก

  • แยก :

แยก ตัวอย่าง
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'caption': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
คำอธิบายภาพ ข้อความ สตริง
รหัส ข้อความ สตริง
URL ข้อความ สตริง
วิดีโอ วิดีโอ (รูปภาพ) (ไม่มี, 360, 640, 3) uint8
@misc{bain2021frozen,
      title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
      author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
      year={2021},
      eprint={2104.00650},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}
,

  • คำอธิบาย :

WebVid เป็นชุดข้อมูลขนาดใหญ่ของวิดีโอขนาดสั้นพร้อมคำอธิบายที่เป็นข้อความซึ่งมาจากเว็บ วิดีโอมีความหลากหลายและเต็มไปด้วยเนื้อหา

WebVid-10M ประกอบด้วย:

คู่คำบรรยายวิดีโอ 10.7 ล้านคู่ 52K ชั่วโมงวิดีโอทั้งหมด

  • หน้าแรก : https://m-bain.github.io/webvid-dataset/

  • รหัสที่มา : tfds.datasets.webvid.Builder

  • รุ่น :

    • 1.0.0 (ค่าเริ่มต้น): การเปิดตัวครั้งแรก
  • ขนาดการดาวน์โหลด : Unknown size

  • ขนาดชุดข้อมูล : Unknown size

  • คำแนะนำในการดาวน์โหลดด้วยตนเอง : ชุดข้อมูลนี้กำหนดให้คุณต้องดาวน์โหลดแหล่งข้อมูลด้วยตนเองลงใน download_config.manual_dir (ค่าเริ่มต้นเป็น ~/tensorflow_datasets/downloads/manual/ ):
    ทำตามคำแนะนำการดาวน์โหลดใน https://m-bain.github.io/webvid-dataset/ เพื่อรับข้อมูล วางไฟล์ csv และไดเรกทอรีวิดีโอใน manual_dir/webvid เพื่อให้ไฟล์ mp4 ถูกวางไว้ใน manual_dir/webvid/*/*_*/*.mp4

โดยทั่วไปไดเร็กทอรีแรกจะเป็นไดเร็กทอรีส่วนใดก็ได้ (สำหรับการดาวน์โหลดแบบชาร์ด) ไดเร็กทอรีที่สองคือไดเร็กทอรีเพจ (ตัวเลขสองตัวรอบๆ ขีดล่าง) ซึ่งภายในมีไฟล์ mp4 หนึ่งไฟล์หรือมากกว่า

  • แคชอัตโนมัติ ( เอกสาร ): ไม่รู้จัก

  • แยก :

แยก ตัวอย่าง
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'caption': Text(shape=(), dtype=string),
    'id': Text(shape=(), dtype=string),
    'url': Text(shape=(), dtype=string),
    'video': Video(Image(shape=(360, 640, 3), dtype=uint8)),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
คำอธิบายภาพ ข้อความ สตริง
รหัส ข้อความ สตริง
URL ข้อความ สตริง
วิดีโอ วิดีโอ (รูปภาพ) (ไม่มี, 360, 640, 3) uint8
@misc{bain2021frozen,
      title={Frozen in Time: A Joint Video and Image Encoder for End-to-End Retrieval},
      author={Max Bain and Arsha Nagrani and Gül Varol and Andrew Zisserman},
      year={2021},
      eprint={2104.00650},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}