- विवरण :
एक व्यक्ति के हिब्रू में हां या ना कहने की साठ रिकॉर्डिंग; प्रत्येक रिकॉर्डिंग आठ शब्द लंबी है।
डेटासेट का मुख्य बिंदु कलदी लिपियों का मुफ्त में परीक्षण करने का एक आसान और तेज़ तरीका प्रदान करना है।
संग्रह "waves_yesno.tar.gz" में 60 .wav फ़ाइलें हैं, जिनका नमूना 8 kHz पर लिया गया है। सभी एक ही पुरुष वक्ता द्वारा हिब्रू में रिकॉर्ड किए गए थे। प्रत्येक फ़ाइल में, व्यक्ति 8 शब्द कहता है; प्रत्येक शब्द या तो "हाँ" या "नहीं" के लिए हिब्रू है, इसलिए प्रत्येक फ़ाइल 8 हां-एस या नो का एक यादृच्छिक क्रम है। कोई अलग ट्रांसक्रिप्शन प्रदान नहीं किया गया है; अनुक्रम फ़ाइल नाम में एन्कोड किया गया है, हां के लिए 1 और नहीं के लिए 0 है।
होमपेज : https://www.openslr.org/1/
स्रोत कोड :
tfds.audio.yesno.YesNo
संस्करण :
-
1.0.0
(डिफ़ॉल्ट): कोई रिलीज़ नोट नहीं।
-
डाउनलोड आकार :
4.49 MiB
डेटासेट का आकार :
16.27 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 60 |
- फ़ीचर संरचना :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'audio/filename': Text(shape=(), dtype=string),
'label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=2)),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
ऑडियो | ऑडियो | (कोई भी नहीं,) | int64 | |
ऑडियो/फ़ाइल नाम | मूलपाठ | डोरी | ||
लेबल | अनुक्रम (कक्षा लेबल) | (कोई भी नहीं,) | int64 |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('audio', 'label')
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
@ONLINE {YesNo,
author = "Created for the Kaldi Project",
title = "YesNo",
url = "http://www.openslr.org/1/"
}