voxceleb

Descrizione :

Un set di dati su larga scala per l'identificazione dei parlanti. Questi dati vengono raccolti da oltre 1.251 relatori, con oltre 150.000 campioni in totale. Questa versione contiene la parte audio del set di dati voxceleb1.1.

Documentazione aggiuntiva : Esplora documenti con codice
Pagina iniziale : http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html
Codice sorgente : tfds.audio.Voxceleb
Versioni :
- 1.2.1 (impostazione predefinita): aggiungi il campo youtube_id
Dimensione del download : 4.68 MiB
Dimensione del set di dati: 107.98 GiB
Istruzioni per il download manuale : questo set di dati richiede di scaricare manualmente i dati di origine in download_config.manual_dir (il valore predefinito ~/tensorflow_datasets/downloads/manual/ ):
manual_dir dovrebbe contenere il file vox_dev_wav.zip. Le istruzioni per scaricare questo file si trovano in http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html Questo set di dati richiede la registrazione.
Cache automatica ( documentazione ): No
Divisioni :

Diviso	Esempi
`'test'`	7.972
`'train'`	134.000
`'validation'`	6.670

Struttura delle caratteristiche :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=1252),
    'youtube_id': Text(shape=(), dtype=string),
})

Documentazione delle funzionalità :

Caratteristica	Classe	Forma	Tipo D
	CaratteristicheDict
Audio	Audio	(Nessuno,)	int64
etichetta	ClassLabel		int64
youtube_id	Testo		corda

Chiavi supervisionate (Vedi as_supervised doc ): ('audio', 'label')
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ):

Citazione :

@InProceedings{Nagrani17,
    author       = "Nagrani, A. and Chung, J.~S. and Zisserman, A.",
    title        = "VoxCeleb: a large-scale speaker identification dataset",
    booktitle    = "INTERSPEECH",
    year         = "2017",
}

voxceleb Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

voxceleb