হ্যাঁ না

  • বর্ণনা :

একজন ব্যক্তির ষাটটি রেকর্ডিং হিব্রুতে হ্যাঁ বা না বলছে; প্রতিটি রেকর্ডিং আট শব্দ দীর্ঘ.

ডেটাসেটের মূল বিষয় হল বিনামূল্যে কালদি স্ক্রিপ্টগুলি পরীক্ষা করার একটি সহজ এবং দ্রুত উপায় প্রদান করা।

আর্কাইভ "waves_yesno.tar.gz"-এ 60 .wav ফাইল রয়েছে, 8 kHz এ নমুনা করা হয়েছে। সমস্ত হিব্রুতে একই পুরুষ স্পিকার দ্বারা রেকর্ড করা হয়েছিল। প্রতিটি ফাইলে, ব্যক্তি 8টি শব্দ বলে; প্রতিটি শব্দ হয় "হ্যাঁ" বা "না" এর জন্য হিব্রু, তাই প্রতিটি ফাইল 8 yes-es বা noes এর একটি এলোমেলো ক্রম। কোন পৃথক প্রতিলিপি প্রদান করা হয় না; ক্রমটি ফাইলের নামে এনকোড করা হয়েছে, হ্যাঁ এর জন্য 1 এবং না এর জন্য 0।

বিভক্ত উদাহরণ
'train' 60
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=2)),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
শ্রুতি শ্রুতি (কোনটিই নয়,) int64
অডিও/ফাইলের নাম পাঠ্য স্ট্রিং
লেবেল সিকোয়েন্স (ক্লাসলেবেল) (কোনটিই নয়,) int64
  • উদ্ধৃতি :
@ONLINE {YesNo,
    author = "Created for the Kaldi Project",
    title  = "YesNo",
    url    = "http://www.openslr.org/1/"
}