- Descrizione :
Un set di dati su larga scala per l'identificazione dei parlanti. Questi dati vengono raccolti da oltre 1.251 relatori, con oltre 150.000 campioni in totale. Questa versione contiene la parte audio del set di dati voxceleb1.1.
Documentazione aggiuntiva : Esplora documenti con codice
Pagina iniziale : http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html
Codice sorgente :
tfds.audio.Voxceleb
Versioni :
-
1.2.1
(impostazione predefinita): aggiungi il campo youtube_id
-
Dimensione del download :
4.68 MiB
Dimensione del set di dati:
107.98 GiB
Istruzioni per il download manuale : questo set di dati richiede di scaricare manualmente i dati di origine in
download_config.manual_dir
(il valore predefinito~/tensorflow_datasets/downloads/manual/
):
manual_dir dovrebbe contenere il file vox_dev_wav.zip. Le istruzioni per scaricare questo file si trovano in http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html Questo set di dati richiede la registrazione.Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'test' | 7.972 |
'train' | 134.000 |
'validation' | 6.670 |
- Struttura delle caratteristiche :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'label': ClassLabel(shape=(), dtype=int64, num_classes=1252),
'youtube_id': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
Audio | Audio | (Nessuno,) | int64 | |
etichetta | ClassLabel | int64 | ||
youtube_id | Testo | corda |
Chiavi supervisionate (Vedi
as_supervised
doc ):('audio', 'label')
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ):
- Citazione :
@InProceedings{Nagrani17,
author = "Nagrani, A. and Chung, J.~S. and Zisserman, A.",
title = "VoxCeleb: a large-scale speaker identification dataset",
booktitle = "INTERSPEECH",
year = "2017",
}