हां नहीं

  • विवरण :

एक व्यक्ति के हिब्रू में हां या ना कहने की साठ रिकॉर्डिंग; प्रत्येक रिकॉर्डिंग आठ शब्द लंबी है।

डेटासेट का मुख्य बिंदु कलदी लिपियों का मुफ्त में परीक्षण करने का एक आसान और तेज़ तरीका प्रदान करना है।

संग्रह "waves_yesno.tar.gz" में 60 .wav फ़ाइलें हैं, जिनका नमूना 8 kHz पर लिया गया है। सभी एक ही पुरुष वक्ता द्वारा हिब्रू में रिकॉर्ड किए गए थे। प्रत्येक फ़ाइल में, व्यक्ति 8 शब्द कहता है; प्रत्येक शब्द या तो "हाँ" या "नहीं" के लिए हिब्रू है, इसलिए प्रत्येक फ़ाइल 8 हां-एस या नो का एक यादृच्छिक क्रम है। कोई अलग ट्रांसक्रिप्शन प्रदान नहीं किया गया है; अनुक्रम फ़ाइल नाम में एन्कोड किया गया है, हां के लिए 1 और नहीं के लिए 0 है।

विभाजित करना उदाहरण
'train' 60
  • फ़ीचर संरचना :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=2)),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
ऑडियो ऑडियो (कोई भी नहीं,) int64
ऑडियो/फ़ाइल नाम मूलपाठ डोरी
लेबल अनुक्रम (कक्षा लेबल) (कोई भी नहीं,) int64
  • उद्धरण :
@ONLINE {YesNo,
    author = "Created for the Kaldi Project",
    title  = "YesNo",
    url    = "http://www.openslr.org/1/"
}