- বর্ণনা :
একজন ব্যক্তির ষাটটি রেকর্ডিং হিব্রুতে হ্যাঁ বা না বলছে; প্রতিটি রেকর্ডিং আট শব্দ দীর্ঘ.
ডেটাসেটের মূল বিষয় হল বিনামূল্যে কালদি স্ক্রিপ্টগুলি পরীক্ষা করার একটি সহজ এবং দ্রুত উপায় প্রদান করা।
আর্কাইভ "waves_yesno.tar.gz"-এ 60 .wav ফাইল রয়েছে, 8 kHz এ নমুনা করা হয়েছে। সমস্ত হিব্রুতে একই পুরুষ স্পিকার দ্বারা রেকর্ড করা হয়েছিল। প্রতিটি ফাইলে, ব্যক্তি 8টি শব্দ বলে; প্রতিটি শব্দ হয় "হ্যাঁ" বা "না" এর জন্য হিব্রু, তাই প্রতিটি ফাইল 8 yes-es বা noes এর একটি এলোমেলো ক্রম। কোন পৃথক প্রতিলিপি প্রদান করা হয় না; ক্রমটি ফাইলের নামে এনকোড করা হয়েছে, হ্যাঁ এর জন্য 1 এবং না এর জন্য 0।
হোমপেজ : https://www.openslr.org/1/
সোর্স কোড :
tfds.audio.yesno.YesNo
সংস্করণ :
-
1.0.0
(ডিফল্ট): কোনো রিলিজ নোট নেই।
-
ডাউনলোড সাইজ :
4.49 MiB
ডেটাসেটের আকার :
16.27 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 60 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'audio/filename': Text(shape=(), dtype=string),
'label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=2)),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
শ্রুতি | শ্রুতি | (কোনটিই নয়,) | int64 | |
অডিও/ফাইলের নাম | পাঠ্য | স্ট্রিং | ||
লেবেল | সিকোয়েন্স (ক্লাসলেবেল) | (কোনটিই নয়,) | int64 |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):('audio', 'label')
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ):
- উদ্ধৃতি :
@ONLINE {YesNo,
author = "Created for the Kaldi Project",
title = "YesNo",
url = "http://www.openslr.org/1/"
}