- الوصف :
ستون تسجيلاً لشخص واحد يقول نعم أو لا بالعبرية ؛ كل تسجيل يتكون من ثماني كلمات.
تتمثل النقطة الرئيسية لمجموعة البيانات في توفير طريقة سهلة وسريعة لاختبار نصوص Kaldi مجانًا.
يحتوي أرشيف "wave_yesno.tar.gz" على 60 ملفًا بتنسيق wav ، تم أخذ عينات منها بتردد 8 كيلو هرتز. تم تسجيلها جميعًا بواسطة نفس المتحدث الذكر ، باللغة العبرية. في كل ملف يقول الفرد 8 كلمات ؛ كل كلمة هي إما العبرية لـ "نعم" أو "لا" ، لذا فإن كل ملف عبارة عن تسلسل عشوائي من 8 نعم أو لا. لا يوجد نسخ منفصل مقدم ؛ يتم ترميز التسلسل في اسم الملف ، مع 1 لـ "نعم" و 0 لـ "لا".
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : https://www.openslr.org/1/
كود المصدر :
tfds.audio.yesno.YesNo
إصدارات :
-
1.0.0
(افتراضي): لا توجد ملاحظات حول الإصدار.
-
حجم التحميل :
4.49 MiB
حجم مجموعة البيانات :
16.27 MiB
التخزين المؤقت التلقائي ( الوثائق ): نعم
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'train' | 60 |
- هيكل الميزة :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'audio/filename': Text(shape=(), dtype=string),
'label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=2)),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
صوتي | صوتي | (لا أحد،) | int64 | |
الصوت / اسم الملف | نص | سلسلة | ||
ضع الكلمة المناسبة | تسلسل (ClassLabel) | (لا أحد،) | int64 |
المفاتيح الخاضعة للإشراف (راجع المستند
as_supervised
):('audio', 'label')
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@ONLINE {YesNo,
author = "Created for the Kaldi Project",
title = "YesNo",
url = "http://www.openslr.org/1/"
}