- বর্ণনা :
উচ্চারিত শব্দগুলির একটি অডিও ডেটাসেট যা কীওয়ার্ড স্পটিং সিস্টেমগুলিকে প্রশিক্ষণ এবং মূল্যায়নে সহায়তা করার জন্য ডিজাইন করা হয়েছে৷ এর প্রাথমিক লক্ষ্য হল ছোট মডেল তৈরি এবং পরীক্ষা করার একটি উপায় প্রদান করা যা শনাক্ত করে যখন একটি শব্দ উচ্চারিত হয়, দশ টার্গেট শব্দের একটি সেট থেকে, পটভূমির আওয়াজ বা সম্পর্কহীন বক্তৃতা থেকে যতটা সম্ভব কম মিথ্যা ইতিবাচক। লক্ষ্য করুন যে ট্রেন এবং বৈধতা সেটে, "অজানা" লেবেল টার্গেট শব্দ বা ব্যাকগ্রাউন্ড নয়েজের লেবেলের তুলনায় অনেক বেশি প্রচলিত। রিলিজ সংস্করণ থেকে একটি পার্থক্য হল নীরব অংশগুলি পরিচালনা করা। পরীক্ষার সেটে নীরবতার সেগমেন্টগুলি নিয়মিত 1 সেকেন্ডের ফাইল, প্রশিক্ষণে সেগুলি "ব্যাকগ্রাউন্ড_নোইস" ফোল্ডারের অধীনে দীর্ঘ অংশ হিসাবে সরবরাহ করা হয়। এখানে আমরা এই ব্যাকগ্রাউন্ড নয়েজগুলিকে 1 সেকেন্ডের ক্লিপগুলিতে বিভক্ত করি এবং বৈধকরণ সেটের জন্য একটি ফাইলও রাখি।
হোমপেজ : https://arxiv.org/abs/1804.03209
সোর্স কোড :
tfds.datasets.speech_commands.Builder
সংস্করণ :
-
0.0.3
(ডিফল্ট): dtype=tf.int16 দিয়ে অডিও ডেটা টাইপ ঠিক করুন।
-
ডাউনলোড আকার :
2.37 GiB
ডেটাসেটের আকার :
8.17 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 4,890 |
'train' | ৮৫,৫১১ |
'validation' | 10,102 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int16),
'label': ClassLabel(shape=(), dtype=int64, num_classes=12),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
শ্রুতি | শ্রুতি | (কোনটিই নয়,) | int16 | |
লেবেল | ক্লাসলেবেল | int64 |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):('audio', 'label')
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ):
- উদ্ধৃতি :
@article{speechcommandsv2,
author = { {Warden}, P.},
title = "{Speech Commands: A Dataset for Limited-Vocabulary Speech Recognition}",
journal = {ArXiv e-prints},
archivePrefix = "arXiv",
eprint = {1804.03209},
primaryClass = "cs.CL",
keywords = {Computer Science - Computation and Language, Computer Science - Human-Computer Interaction},
year = 2018,
month = apr,
url = {https://arxiv.org/abs/1804.03209},
}