- توضیحات :
VoxForge یک مجموعه داده طبقه بندی زبان است. این شامل کلیپ های صوتی ارسال شده توسط کاربر است که به وب سایت ارسال می شود. در این نسخه، داده ها از 6 زبان - انگلیسی، اسپانیایی، فرانسوی، آلمانی، روسی و ایتالیایی جمع آوری شده است. از آنجایی که وبسایت دائماً بهروزرسانی میشود و بهمنظور تکرارپذیری، این نسخه فقط شامل موارد ضبط شده است که قبل از 01-01-2020 ارسال شده است. نمونه ها بین قطار، اعتبارسنجی و آزمایش تقسیم می شوند به طوری که نمونه های هر بلندگو دقیقاً به یک تقسیم تعلق دارد.
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : http://www.voxforge.org/
کد منبع :
tfds.audio.Voxforge
نسخه ها :
-
1.0.0
(پیش فرض): بدون یادداشت انتشار.
-
اندازه دانلود :
Unknown size
اندازه مجموعه داده :
Unknown size
دستورالعملهای دانلود دستی : این مجموعه داده از شما میخواهد که دادههای منبع را به صورت دستی در
download_config.manual_dir
(پیشفرض~/tensorflow_datasets/downloads/manual/
):
VoxForge به دانلود دستی آرشیوهای صوتی نیاز دارد. لیست کامل بایگانی ها را می توانید در https://storage.googleapis.com/tfds-data/downloads/voxforge/voxforge_urls.txt با استفاده از دستور زیر دانلود کنید: wget -i voxforge_urls.txt -x توجه داشته باشید که دانلود و ساخت مجموعه داده به صورت محلی به 100 گیگابایت فضای دیسک نیاز دارد (اما فقط 60 گیگابایت به طور دائم استفاده خواهد شد).ذخیره خودکار ( اسناد ): ناشناخته
تقسیم ها :
شکاف | مثال ها |
---|
- ساختار ویژگی :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'label': ClassLabel(shape=(), dtype=int64, num_classes=6),
'speaker_id': string,
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
سمعی | سمعی | (هیچ یک،) | int64 | |
برچسب | ClassLabel | int64 | ||
speaker_id | تانسور | رشته |
کلیدهای نظارت شده (مشاهده
as_supervised
doc ):('audio', 'label')
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ): وجود ندارد.
نقل قول :
@article{maclean2018voxforge,
title={Voxforge},
author={MacLean, Ken},
journal={Ken MacLean.[Online]. Available: http://www.voxforge.org/home.[Acedido em 2012]},
year={2018}
}