- الوصف :
VoxForge هي مجموعة بيانات تصنيف اللغة. يتكون من مقاطع صوتية مقدمة من المستخدم تم إرسالها إلى الموقع. في هذا الإصدار ، يتم جمع بيانات من 6 لغات - الإنجليزية والإسبانية والفرنسية والألمانية والروسية والإيطالية. نظرًا لأنه يتم تحديث موقع الويب باستمرار ، ولأغراض التكاثر ، فإن هذا الإصدار يحتوي فقط على التسجيلات التي تم إرسالها قبل 2020-01-01. يتم تقسيم العينات بين القطار والتحقق من الصحة والاختبار بحيث تنتمي العينات من كل متحدث إلى تقسيم واحد بالضبط.
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : http://www.voxforge.org/
كود المصدر :
tfds.audio.Voxforge
إصدارات :
-
1.0.0
(افتراضي): لا توجد ملاحظات حول الإصدار.
-
حجم التنزيل :
Unknown size
حجم مجموعة البيانات :
Unknown size
إرشادات التنزيل اليدوي : تتطلب مجموعة البيانات هذه تنزيل بيانات المصدر يدويًا إلى
download_config.manual_dir
(الإعدادات الافتراضية على~/tensorflow_datasets/downloads/manual/
):
يتطلب VoxForge تنزيلًا يدويًا للأرشيفات الصوتية. يمكن العثور على القائمة الكاملة للأرشيفات في https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt ويمكن تنزيلها باستخدام الأمر التالي: wget -i voxforge_urls.txt -x لاحظ أن التنزيل ويتطلب إنشاء مجموعة البيانات محليًا مساحة قرص تبلغ 100 غيغابايت تقريبًا (ولكن سيتم استخدام 60 غيغابايت فقط بشكل دائم).التخزين المؤقت التلقائي ( الوثائق ): غير معروف
الانقسامات :
انشق، مزق | أمثلة |
---|
- هيكل الميزة :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
'speaker_id': string,
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
صوتي | صوتي | (لا أحد،) | int64 | |
ضع الكلمة المناسبة | ClassLabel | int64 | ||
Speaker_id | موتر | سلسلة |
المفاتيح الخاضعة للإشراف (راجع المستند
as_supervised
):('audio', 'label')
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ): مفقود.
الاقتباس :
@article{maclean2018voxforge,
title={Voxforge},
author={MacLean, Ken},
journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
year={2018}
}