- বর্ণনা :
ডেটাসেটে প্রতি 30 সেকেন্ডের 1000টি অডিও ট্র্যাক থাকে। এটিতে 10টি জেনার রয়েছে, প্রতিটি 100টি ট্র্যাক দ্বারা উপস্থাপিত। ট্র্যাকগুলি হল .wav ফর্ম্যাটে 22050Hz Mono 16-বিট অডিও ফাইল৷
ঘরানাগুলি হল:
- ব্লুজ
- শাস্ত্রীয়
- দেশ
- ডিস্কো
- হিপ - হপ
- জ্যাজ
- ধাতু
- পপ
- রেগে
শিলা
হোমপেজ : http://marsyas.info/index.html
সোর্স কোড :
tfds.audio.gtzan.GTZAN
সংস্করণ :
-
1.0.0
(ডিফল্ট): কোনো রিলিজ নোট নেই।
-
ডাউনলোড সাইজ :
1.14 GiB
ডেটাসেটের আকার :
3.71 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=int64),
'audio/filename': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
শ্রুতি | শ্রুতি | (কোনটিই নয়,) | int64 | |
অডিও/ফাইলের নাম | পাঠ্য | স্ট্রিং | ||
লেবেল | ক্লাসলেবেল | int64 |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):('audio', 'label')
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ):
- উদ্ধৃতি :
@misc{tzanetakis_essl_cook_2001,
author = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title = "Automatic Musical Genre Classification Of Audio Signals",
url = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year = "2001"
}