- Açıklama :
Anahtar kelime bulma sistemlerini eğitmeye ve değerlendirmeye yardımcı olmak için tasarlanmış, konuşulan sözcüklerden oluşan bir ses veri kümesi. Birincil amacı, arka plan gürültüsünden veya ilgisiz konuşmadan mümkün olduğunca az yanlış pozitif ile on hedef kelimeden oluşan bir setten tek bir kelimenin ne zaman söylendiğini tespit eden küçük modeller oluşturmak ve test etmek için bir yol sağlamaktır. Tren ve doğrulama setinde "bilinmeyen" etiketinin, hedef kelimelerin etiketlerinden veya arka plan gürültüsünden çok daha yaygın olduğuna dikkat edin. Yayın sürümünden bir fark, sessiz bölümlerin işlenmesidir. Test setinde sessizlik segmentleri normal 1 saniyelik dosyalar iken, eğitimde "background_noise" klasörü altında uzun segmentler halinde verilmektedir. Burada bu arka plan gürültüsünü 1 saniyelik kliplere bölüyoruz ve ayrıca dosyalardan birini doğrulama seti için saklıyoruz.
Anasayfa : https://arxiv.org/abs/1804.03209
Kaynak kodu :
tfds.datasets.speech_commands.Builder
sürümler :
-
0.0.3
(varsayılan): Ses veri türünü dtype=tf.int16 ile düzeltin.
-
İndirme boyutu :
2.37 GiB
Veri kümesi boyutu :
8.17 GiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 4.890 |
'train' | 85.511 |
'validation' | 10.102 |
- Özellik yapısı :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int16),
'label': ClassLabel(shape=(), dtype=int64, num_classes=12),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Açıklama |
---|---|---|---|---|
ÖzelliklerDict | ||||
ses | Ses | (Hiçbiri,) | int16 | |
etiket | SınıfEtiketi | int64 |
Denetlenen tuşlar (Bkz
as_supervised
doc ):('audio', 'label')
Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):
- Alıntı :
@article{speechcommandsv2,
author = { {Warden}, P.},
title = "{Speech Commands: A Dataset for Limited-Vocabulary Speech Recognition}",
journal = {ArXiv e-prints},
archivePrefix = "arXiv",
eprint = {1804.03209},
primaryClass = "cs.CL",
keywords = {Computer Science - Computation and Language, Computer Science - Human-Computer Interaction},
year = 2018,
month = apr,
url = {https://arxiv.org/abs/1804.03209},
}