voxceleb

  • คำอธิบาย :

ชุดข้อมูลขนาดใหญ่สำหรับการระบุผู้พูด ข้อมูลนี้รวบรวมจากผู้พูดกว่า 1,251 คน โดยมีตัวอย่างทั้งหมดมากกว่า 150,000 ตัวอย่าง รุ่นนี้ประกอบด้วยส่วนเสียงของชุดข้อมูล voxceleb1.1

  • เอกสารประกอบเพิ่มเติม : สำรวจเอกสารด้วยรหัส

  • หน้าแรก : http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html

  • รหัสแหล่งที่มา : tfds.audio.Voxceleb

  • รุ่น :

    • 1.2.1 (ค่าเริ่มต้น): เพิ่มฟิลด์ youtube_id
  • ขนาดการดาวน์โหลด : 4.68 MiB

  • ขนาดชุดข้อมูล : 107.98 GiB

  • คำแนะนำในการดาวน์โหลดด้วยตนเอง : ชุดข้อมูลนี้กำหนดให้คุณต้องดาวน์โหลดแหล่งข้อมูลด้วยตนเองลงใน download_config.manual_dir (ค่าเริ่มต้นเป็น ~/tensorflow_datasets/downloads/manual/ ):
    manual_dir ควรมีไฟล์ vox_dev_wav.zip คำแนะนำสำหรับการดาวน์โหลดไฟล์นี้มีอยู่ใน http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html ชุดข้อมูลนี้ต้องมีการลงทะเบียน

  • แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่

  • แยก :

แยก ตัวอย่าง
'test' 7,972
'train' 134,000
'validation' 6,670
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1252),
    'youtube_id': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
เสียง เครื่องเสียง (ไม่มี,) int64
ฉลาก ป้ายกำกับคลาส int64
youtube_id ข้อความ สตริง
  • การอ้างอิง :
@InProceedings{Nagrani17,
    author       = "Nagrani, A. and Chung, J.~S. and Zisserman, A.",
    title        = "VoxCeleb: a large-scale speaker identification dataset",
    booktitle    = "INTERSPEECH",
    year         = "2017",
}