voxceleb

  • Descrizione :

Un set di dati su larga scala per l'identificazione dei parlanti. Questi dati vengono raccolti da oltre 1.251 relatori, con oltre 150.000 campioni in totale. Questa versione contiene la parte audio del set di dati voxceleb1.1.

Diviso Esempi
'test' 7.972
'train' 134.000
'validation' 6.670
  • Struttura delle caratteristiche :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1252),
    'youtube_id': Text(shape=(), dtype=string),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
Audio Audio (Nessuno,) int64
etichetta ClassLabel int64
youtube_id Testo corda
  • Citazione :
@InProceedings{Nagrani17,
    author       = "Nagrani, A. and Chung, J.~S. and Zisserman, A.",
    title        = "VoxCeleb: a large-scale speaker identification dataset",
    booktitle    = "INTERSPEECH",
    year         = "2017",
}