- Açıklama :
Konuşmacı tanımlaması için büyük ölçekli bir veri kümesi. Bu veriler, toplamda 150.000'den fazla örnekle 1.251'den fazla konuşmacıdan toplanır. Bu sürüm, voxceleb1.1 veri kümesinin ses bölümünü içerir.
Ana Sayfa : http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html
Kaynak kodu :
tfds.audio.Voxceleb
sürümler :
-
1.2.1
(varsayılan): youtube_id alanı ekleyin
-
İndirme boyutu :
4.68 MiB
Veri kümesi boyutu :
107.98 GiB
Manuel indirme talimatları : Bu veri kümesi, kaynak verileri manuel olarak download_config.manual_dir içine
download_config.manual_dir
gerektirir (varsayılan olarak~/tensorflow_datasets/downloads/manual/
):
manual_dir, vox_dev_wav.zip dosyasını içermelidir. Bu dosyayı indirme talimatları şu adreste bulunur: http://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1.html Bu veri kümesi kayıt gerektirir.Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 7.972 |
'train' | 134.000 |
'validation' | 6.670 |
- Özellik yapısı :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'label': ClassLabel(shape=(), dtype=int64, num_classes=1252),
'youtube_id': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
ses | Ses | (Hiçbiri,) | int64 | |
etiket | SınıfEtiketi | int64 | ||
youtube_id | Metin | sicim |
Denetlenen tuşlar (Bkz
as_supervised
doc ):('audio', 'label')
Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):
- Alıntı :
@InProceedings{Nagrani17,
author = "Nagrani, A. and Chung, J.~S. and Zisserman, A.",
title = "VoxCeleb: a large-scale speaker identification dataset",
booktitle = "INTERSPEECH",
year = "2017",
}