فوكسفورج

  • الوصف :

VoxForge هي مجموعة بيانات تصنيف اللغة. يتكون من مقاطع صوتية مقدمة من المستخدم تم إرسالها إلى الموقع. في هذا الإصدار ، يتم جمع بيانات من 6 لغات - الإنجليزية والإسبانية والفرنسية والألمانية والروسية والإيطالية. نظرًا لأنه يتم تحديث موقع الويب باستمرار ، ولأغراض التكاثر ، فإن هذا الإصدار يحتوي فقط على التسجيلات التي تم إرسالها قبل 2020-01-01. يتم تقسيم العينات بين القطار والتحقق من الصحة والاختبار بحيث تنتمي العينات من كل متحدث إلى تقسيم واحد بالضبط.

  • وثائق إضافية : استكشف في الأوراق باستخدام الرمز

  • الصفحة الرئيسية : http://www.voxforge.org/

  • كود المصدر : tfds.audio.Voxforge

  • إصدارات :

    • 1.0.0 (افتراضي): لا توجد ملاحظات حول الإصدار.
  • حجم التنزيل : Unknown size

  • حجم مجموعة البيانات : Unknown size

  • إرشادات التنزيل اليدوي : تتطلب مجموعة البيانات هذه تنزيل بيانات المصدر يدويًا إلى download_config.manual_dir (الإعدادات الافتراضية على ~/tensorflow_datasets/downloads/manual/ ):
    يتطلب VoxForge تنزيلًا يدويًا للأرشيفات الصوتية. يمكن العثور على القائمة الكاملة للأرشيفات في https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt ويمكن تنزيلها باستخدام الأمر التالي: wget -i voxforge_urls.txt -x لاحظ أن التنزيل ويتطلب إنشاء مجموعة البيانات محليًا مساحة قرص تبلغ 100 غيغابايت تقريبًا (ولكن سيتم استخدام 60 غيغابايت فقط بشكل دائم).

  • التخزين المؤقت التلقائي ( الوثائق ): غير معروف

  • الانقسامات :

انشق، مزق أمثلة
  • هيكل الميزة :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
    'speaker_id': string,
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
صوتي صوتي (لا أحد،) int64
ضع الكلمة المناسبة ClassLabel int64
Speaker_id موتر سلسلة
@article{maclean2018voxforge,
  title={Voxforge},
  author={MacLean, Ken},
  journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
  year={2018}
}