- বর্ণনা :
মজিলা কমন ভয়েস ডেটাসেট
সোর্স কোড :
tfds.audio.CommonVoice
সংস্করণ :
-
1.0.0
: প্রাথমিক প্রকাশ। -
2.0.0
(ডিফল্ট): 2020-12-11 থেকে কর্পাস 6.1 এ আপডেট করা হয়েছে।
-
বৈশিষ্ট্য গঠন :
FeaturesDict({
'accent': Text(shape=(), dtype=string),
'age': Text(shape=(), dtype=string),
'client_id': Text(shape=(), dtype=string),
'downvotes': Scalar(shape=(), dtype=int32, description=Number of people who said audio does not match text),
'gender': ClassLabel(shape=(), dtype=int64, num_classes=3),
'segment': Text(shape=(), dtype=string),
'sentence': Text(shape=(), dtype=string),
'upvotes': Scalar(shape=(), dtype=int32, description=Number of people who said audio matches the text),
'voice': Audio(shape=(None,), dtype=int64),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
উচ্চারণ | পাঠ্য | স্ট্রিং | স্পিকারের উচ্চারণ, https://github.com/common-voice/common-voice/blob/main/web/src/stores/demographics.ts দেখুন | |
বয়স | পাঠ্য | স্ট্রিং | স্পিকারের বয়স বালতি (যেমন কিশোর বা চল্লিশের দশক), https://github.com/common-voice/common-voice/blob/main/web/src/stores/demographics.ts দেখুন | |
ক্লায়েন্ট_আইডি | পাঠ্য | স্ট্রিং | একটি প্রদত্ত ব্যবহারকারীর UUID হ্যাশ করা হয়েছে | |
ডাউনভোট | স্কেলার | int32 | অডিও টেক্সট মেলে না বলে মানুষ সংখ্যা | |
লিঙ্গ | ক্লাসলেবেল | int64 | বক্তার লিঙ্গ | |
সেগমেন্ট | পাঠ্য | স্ট্রিং | যদি বাক্যটি একটি কাস্টম ডেটাসেট বিভাগের অন্তর্গত হয় তবে এটি এখানে তালিকাভুক্ত করা হবে | |
বাক্য | পাঠ্য | স্ট্রিং | অডিও অনুমিত প্রতিলিপি | |
আপভোট | স্কেলার | int32 | অডিও টেক্সটের সাথে মিলেছে এমন লোকের সংখ্যা | |
ভয়েস | অডিও | (কোনটিই নয়,) | int64 |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদ্ধৃতি :
common_voice/en (ডিফল্ট কনফিগারেশন)
কনফিগার বিবরণ : ভাষা কোড: en
ডাউনলোড আকার :
56.45 GiB
ডেটাসেটের আকার :
2.79 TiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 16,164 |
'test' | 16,164 |
'train' | 564,337 |
'validation' | 1,224,864 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/ab
কনফিগার বিবরণ : ভাষা কোড: ab
ডাউনলোড সাইজ :
39.14 MiB
ডেটাসেটের আকার :
133.24 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 9 |
'train' | 22 |
'validation' | 31 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/ar
কনফিগার বিবরণ : ভাষা কোড: ar
ডাউনলোড আকার :
1.64 GiB
ডেটাসেটের আকার :
67.16 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 7,517 |
'test' | 7,622 |
'train' | 14,227 |
'validation' | 43,291 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/as
কনফিগার বিবরণ : ভাষা কোড: হিসাবে
ডাউনলোড সাইজ :
21.20 MiB
ডেটাসেটের আকার :
1.65 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 124 |
'test' | 110 |
'train' | 270 |
'validation' | 504 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/br
কনফিগার বিবরণ : ভাষা কোড: br
ডাউনলোড সাইজঃ
443.72 MiB
ডেটাসেটের আকার :
13.46 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 1,997 |
'test' | 2,087 |
'train' | 2,780 |
'validation' | ৮,৫৬০ |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/ca
কনফিগার বিবরণ : ভাষা কোড: ca
ডাউনলোড সাইজ :
19.32 GiB
ডেটাসেটের আকার :
1.19 TiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 15,724 |
'test' | 15,724 |
'train' | 285,584 |
'validation' | 416,701 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/cnh
কনফিগারেশনের বিবরণ : ভাষা কোড: cnh
ডাউনলোডের আকার :
153.86 MiB
ডেটাসেটের আকার :
5.12 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 756 |
'test' | 752 |
'train' | 807 |
'validation' | 2,432 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/cs
কনফিগারেশনের বিবরণ : ভাষা কোড: cs
ডাউনলোড সাইজ :
1.18 GiB
ডেটাসেটের আকার :
56.89 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 4,118 |
'test' | 4,144 |
'train' | ৫,৬৫৫ |
'validation' | 30,431 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/cv
কনফিগার বিবরণ : ভাষা কোড: cv
ডাউনলোড সাইজ :
418.98 MiB
ডেটাসেটের আকার :
8.10 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 818 |
'test' | 788 |
'train' | 931 |
'validation' | ৩,৪৯৬ |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/cy
কনফিগারেশনের বিবরণ : ভাষা কোড: cy
ডাউনলোড আকার :
3.20 GiB
ডেটাসেটের আকার :
128.68 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 4,776 |
'test' | 4,820 |
'train' | ৬,৮৩৯ |
'validation' | 72,984 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/de
কনফিগার বিবরণ : ভাষা কোড: de
ডাউনলোড সাইজ :
21.68 GiB
ডেটাসেটের আকার :
1.29 TiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 15,588 |
'test' | 15,588 |
'train' | 246,525 |
'validation' | 565,186 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/dv
কনফিগার বর্ণনা : ভাষা কোড: dv
ডাউনলোড সাইজ :
515.45 MiB
ডেটাসেটের আকার :
31.59 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 2,077 |
'test' | 2,202 |
'train' | 2,680 |
'validation' | 11,866 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/el
কনফিগারেশনের বিবরণ : ভাষা কোড: el
ডাউনলোড আকার :
363.89 MiB
ডেটাসেটের আকার :
14.62 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 1,401 |
'test' | 1,522 |
'train' | ২,৩১৬ |
'validation' | ৫,৯৯৬ |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/eo
কনফিগার বিবরণ : ভাষা কোড: eo
ডাউনলোড সাইজ :
2.69 GiB
ডেটাসেটের আকার :
167.14 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | ৮,৯৮৭ |
'test' | ৮,৯৬৯ |
'train' | 19,587 |
'validation' | 58,094 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/es
কনফিগার বিবরণ : ভাষা কোড: es
ডাউনলোড আকার :
15.08 GiB
ডেটাসেটের আকার :
684.66 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 15,089 |
'test' | 15,089 |
'train' | 161,813 |
'validation' | 236,314 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/et
কনফিগার বিবরণ : ভাষা কোড: et
ডাউনলোড সাইজঃ
731.63 MiB
ডেটাসেটের আকার :
37.95 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 2,507 |
'test' | 2,509 |
'train' | 2,966 |
'validation' | 10,683 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/eu
কনফিগারেশনের বিবরণ : ভাষা কোড: eu
ডাউনলোড সাইজ :
3.41 GiB
ডেটাসেটের আকার :
127.60 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 5,172 |
'test' | 5,172 |
'train' | 7,505 |
'validation' | 63,009 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/fa
কনফিগারেশনের বিবরণ : ভাষা কোড: fa
ডাউনলোড আকার :
8.27 GiB
ডেটাসেটের আকার :
328.61 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 5,213 |
'test' | 5,213 |
'train' | 7,593 |
'validation' | 251,659 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/fi
কনফিগার বিবরণ : ভাষা কোড: fi
ডাউনলোড সাইজ :
47.57 MiB
ডেটাসেটের আকার :
3.41 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 415 |
'test' | 428 |
'train' | 460 |
'validation' | 1,305 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/fr
কনফিগারেশনের বিবরণ : ভাষা কোড: fr
ডাউনলোড সাইজ :
17.82 GiB
ডেটাসেটের আকার :
1.17 TiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 15,763 |
'test' | 15,763 |
'train' | 298,982 |
'validation' | 461,004 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/fy-NL
কনফিগার বিবরণ : ভাষা কোড: fy-NL
ডাউনলোড সাইজ :
1.15 GiB
ডেটাসেটের আকার :
29.93 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 2,790 |
'test' | 3,020 |
'train' | 3,927 |
'validation' | 10,495 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/ga-IE
কনফিগারেশনের বিবরণ : ভাষা কোড: ga-IE
ডাউনলোড সাইজ :
149.30 MiB
ডেটাসেটের আকার :
5.11 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 497 |
'test' | 506 |
'train' | 541 |
'validation' | ৩,৩৫২ |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/hi
কনফিগার বিবরণ : ভাষা কোড: হাই
ডাউনলোড সাইজ :
20.43 MiB
ডেটাসেটের আকার :
1.15 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 135 |
'test' | 127 |
'train' | 157 |
'validation' | 419 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/hsb
কনফিগার বিবরণ : ভাষা কোড: hsb
ডাউনলোড সাইজ :
75.69 MiB
ডেটাসেটের আকার :
5.67 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 172 |
'test' | 387 |
'train' | 808 |
'validation' | 1,367 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/hu
কনফিগার বিবরণ : ভাষা কোড: hu
ডাউনলোড সাইজ :
231.51 MiB
ডেটাসেটের আকার :
17.07 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 1,434 |
'test' | 1,649 |
'train' | ৩,৩৪৮ |
'validation' | 6,457 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/ia
কনফিগার বিবরণ : ভাষা কোড: ia
ডাউনলোড সাইজ :
216.01 MiB
ডেটাসেটের আকার :
14.99 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 1,601 |
'test' | ৮৯৯ |
'train' | ৩,৪৭৭ |
'validation' | 5,978 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/id
কনফিগার বিবরণ : ভাষা কোড: আইডি
ডাউনলোড সাইজ :
453.87 MiB
ডেটাসেটের আকার :
17.20 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 1,835 |
'test' | 1,844 |
'train' | 2,130 |
'validation' | ৮,৬৯৬ |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/it
কনফিগারেশনের বিবরণ : ভাষা কোড: এটি
ডাউনলোড আকার :
5.20 GiB
ডেটাসেটের আকার :
316.38 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 12,928 |
'test' | 12,928 |
'train' | ৫৮,০১৫ |
'validation' | 102,579 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/ja
কনফিগার বিবরণ : ভাষা কোড: ja
ডাউনলোড সাইজ :
145.80 MiB
ডেটাসেটের আকার :
6.83 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 586 |
'test' | 632 |
'train' | 722 |
'validation' | 3,072 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/ka
কনফিগার বিবরণ : ভাষা কোড: ka
ডাউনলোড সাইজ :
99.45 MiB
ডেটাসেটের আকার :
7.51 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 527 |
'test' | 656 |
'train' | 1,058 |
'validation' | 2,275 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/kab
কনফিগারেশনের বিবরণ : ভাষা কোড: kab
ডাউনলোড আকার :
15.99 GiB
ডেটাসেটের আকার :
718.51 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 14,622 |
'test' | 14,622 |
'train' | 120,530 |
'validation' | 573,718 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/ky
কনফিগারেশনের বিবরণ : ভাষা কোড: ky
ডাউনলোড সাইজ :
552.60 MiB
ডেটাসেটের আকার :
18.70 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 1,511 |
'test' | 1,503 |
'train' | 1,955 |
'validation' | 9,236 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/lg
কনফিগারেশনের বিবরণ : ভাষা কোড: lg
ডাউনলোড সাইজ :
198.55 MiB
ডেটাসেটের আকার :
6.65 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 384 |
'test' | 584 |
'train' | 1,250 |
'validation' | 2,220 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/lt
কনফিগারেশনের বিবরণ : ভাষা কোড: lt
ডাউনলোড সাইজ :
129.03 MiB
ডেটাসেটের আকার :
4.79 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 244 |
'test' | 466 |
'train' | 931 |
'validation' | 1,644 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/lv
কনফিগারেশনের বিবরণ : ভাষা কোড: lv
ডাউনলোড সাইজ :
198.66 MiB
ডেটাসেটের আকার :
13.07 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 2,002 |
'test' | 1,882 |
'train' | 2,552 |
'validation' | 6,444 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/mn
কনফিগার বিবরণ : ভাষা কোড: mn
ডাউনলোড সাইজঃ
463.84 MiB
ডেটাসেটের আকার :
22.09 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 1,837 |
'test' | 1,862 |
'train' | 2,183 |
'validation' | 7,487 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/mt
কনফিগার বিবরণ : ভাষা কোড: mt
ডাউনলোড সাইজঃ
405.42 MiB
ডেটাসেটের আকার :
15.09 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 1,516 |
'test' | 1,617 |
'train' | 2,036 |
'validation' | ৫,৭৪৭ |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/nl
কনফিগার বিবরণ : ভাষা কোড: nl
ডাউনলোডের আকার :
1.62 GiB
ডেটাসেটের আকার :
90.20 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 4,938 |
'test' | 5,708 |
'train' | 9,460 |
'validation' | 52,488 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/বা
কনফিগার বিবরণ : ভাষা কোড: বা
ডাউনলোডের আকার :
189.85 MiB
ডেটাসেটের আকার :
1.97 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 129 |
'test' | 98 |
'train' | 388 |
'validation' | 615 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/pa-IN
কনফিগার বিবরণ : ভাষা কোড: pa-IN
ডাউনলোড সাইজ :
66.52 MiB
ডেটাসেটের আকার :
1.03 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 44 |
'test' | 116 |
'train' | 211 |
'validation' | 371 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/pl
কনফিগার বিবরণ : ভাষা কোড: pl
ডাউনলোড আকার :
3.29 GiB
ডেটাসেটের আকার :
141.06 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 5,153 |
'test' | 5,153 |
'train' | 7,468 |
'validation' | 90,791 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/pt
কনফিগারেশনের বিবরণ : ভাষা কোড: pt
ডাউনলোড আকার :
1.59 GiB
ডেটাসেটের আকার :
75.64 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 4,592 |
'test' | 4,641 |
'train' | 6,514 |
'validation' | 41,584 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/rm-sursilv
কনফিগারেশনের বিবরণ : ভাষা কোড: rm-sursilv
ডাউনলোড সাইজ :
263.17 MiB
ডেটাসেটের আকার :
12.31 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 1,205 |
'test' | 1,194 |
'train' | 1,384 |
'validation' | ৩,৭৮৩ |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/rm-vallader
কনফিগারেশনের বিবরণ : ভাষা কোড: rm-vallader
ডাউনলোড সাইজ :
103.11 MiB
ডেটাসেটের আকার :
4.89 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 357 |
'test' | 378 |
'train' | 574 |
'validation' | 1,316 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/ro
কনফিগারেশনের বিবরণ : ভাষা কোড: ro
ডাউনলোড সাইজ :
249.84 MiB
ডেটাসেটের আকার :
14.54 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 858 |
'test' | 1,778 |
'train' | ৩,৩৯৯ |
'validation' | 6,039 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/ru
কনফিগারেশনের বিবরণ : ভাষা কোড: ru
ডাউনলোড সাইজঃ
3.40 GiB
ডেটাসেটের আকার :
175.04 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 7,963 |
'test' | 8,007 |
'train' | 15,481 |
'validation' | 74,256 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/rw
কনফিগারেশনের বিবরণ : ভাষা কোড: rw
ডাউনলোড সাইজ :
39.62 GiB
ডেটাসেটের আকার :
2.18 TiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 15,032 |
'test' | 15,724 |
'train' | 515,197 |
'validation' | ৮৩২,৯২৯ |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/sah
কনফিগারেশনের বিবরণ : ভাষা কোড: sah
ডাউনলোড সাইজ :
172.85 MiB
ডেটাসেটের আকার :
9.42 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 405 |
'test' | 757 |
'train' | 1,442 |
'validation' | 2,606 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/sl
কনফিগার বিবরণ : ভাষা কোড: এসএল
ডাউনলোড সাইজ :
212.43 MiB
ডেটাসেটের আকার :
9.67 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 556 |
'test' | 881 |
'train' | 2,038 |
'validation' | 4,669 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/sv-SE
কনফিগারেশনের বিবরণ : ভাষা কোড: sv-SE
ডাউনলোড সাইজঃ
401.91 MiB
ডেটাসেটের আকার :
18.27 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 2,019 |
'test' | 2,027 |
'train' | ২,৩৩১ |
'validation' | 12,552 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/ta
কনফিগার বিবরণ : ভাষা কোড: ta
ডাউনলোড সাইজ :
648.28 MiB
ডেটাসেটের আকার :
24.06 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 1,779 |
'test' | 1,781 |
'train' | 2,009 |
'validation' | 12,652 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/th
কনফিগার বিবরণ : ভাষা কোড: থ
ডাউনলোড সাইজ :
325.49 MiB
ডেটাসেটের আকার :
18.32 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 1,922 |
'test' | 2,188 |
'train' | 2,917 |
'validation' | 7,028 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/tr
কনফিগার বিবরণ : ভাষা কোড: tr
ডাউনলোড সাইজ :
592.09 MiB
ডেটাসেটের আকার :
28.21 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 1,647 |
'test' | 1,647 |
'train' | 1,831 |
'validation' | 18,685 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/tt
কনফিগার বিবরণ : ভাষা কোড: tt
ডাউনলোড সাইজ :
741.15 MiB
ডেটাসেটের আকার :
46.85 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 2,127 |
'test' | 4,485 |
'train' | 11,211 |
'validation' | 25,781 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/uk
কনফিগার বিবরণ : ভাষা কোড: uk
ডাউনলোড সাইজ :
1.13 GiB
ডেটাসেটের আকার :
49.66 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 3,236 |
'test' | 3,235 |
'train' | 4,035 |
'validation' | 22,337 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/vi
কনফিগার বিবরণ : ভাষা কোড: vi
ডাউনলোড সাইজ :
49.52 MiB
ডেটাসেটের আকার :
1.47 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 200 |
'test' | 198 |
'train' | 221 |
'validation' | 619 |
- উদাহরণ ( tfds.as_dataframe ):
সাধারণ_কণ্ঠ/ভোট
কনফিগারেশনের বিবরণ : ভাষা কোড: ভোট
ডাউনলোড সাইজ :
7.43 MiB
ডেটাসেটের আকার :
11.39 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 3 |
'validation' | 3 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/zh-CN
কনফিগার বিবরণ : ভাষা কোড: zh-CN
ডাউনলোড সাইজ :
2.03 GiB
ডেটাসেটের আকার :
122.54 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | ৮,৭৪৩ |
'test' | ৮,৭৬০ |
'train' | 18,541 |
'validation' | 36,405 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/zh-HK
কনফিগারেশনের বিবরণ : ভাষা কোড: zh-HK
ডাউনলোড সাইজ :
2.58 GiB
ডেটাসেটের আকার :
78.80 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 5,172 |
'test' | 5,172 |
'train' | 7,506 |
'validation' | 41,835 |
- উদাহরণ ( tfds.as_dataframe ):
common_voice/zh-TW
কনফিগার বিবরণ : ভাষা কোড: zh-TW
ডাউনলোড সাইজ :
2.03 GiB
ডেটাসেটের আকার :
69.06 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 2,895 |
'test' | 2,895 |
'train' | 3,507 |
'validation' | 61,232 |
- উদাহরণ ( tfds.as_dataframe ):