সাধারণ_কণ্ঠ

  • বর্ণনা :

মজিলা কমন ভয়েস ডেটাসেট

FeaturesDict({
    'accent': Text(shape=(), dtype=string),
    'age': Text(shape=(), dtype=string),
    'client_id': Text(shape=(), dtype=string),
    'downvotes': Scalar(shape=(), dtype=int32, description=Number of people who said audio does not match text),
    'gender': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'segment': Text(shape=(), dtype=string),
    'sentence': Text(shape=(), dtype=string),
    'upvotes': Scalar(shape=(), dtype=int32, description=Number of people who said audio matches the text),
    'voice': Audio(shape=(None,), dtype=int64),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
উচ্চারণ পাঠ্য স্ট্রিং স্পিকারের উচ্চারণ, https://github.com/common-voice/common-voice/blob/main/web/src/stores/demographics.ts দেখুন
বয়স পাঠ্য স্ট্রিং স্পিকারের বয়স বালতি (যেমন কিশোর বা চল্লিশের দশক), https://github.com/common-voice/common-voice/blob/main/web/src/stores/demographics.ts দেখুন
ক্লায়েন্ট_আইডি পাঠ্য স্ট্রিং একটি প্রদত্ত ব্যবহারকারীর UUID হ্যাশ করা হয়েছে
ডাউনভোট স্কেলার int32 অডিও টেক্সট মেলে না বলে মানুষ সংখ্যা
লিঙ্গ ক্লাসলেবেল int64 বক্তার লিঙ্গ
সেগমেন্ট পাঠ্য স্ট্রিং যদি বাক্যটি একটি কাস্টম ডেটাসেট বিভাগের অন্তর্গত হয় তবে এটি এখানে তালিকাভুক্ত করা হবে
বাক্য পাঠ্য স্ট্রিং অডিও অনুমিত প্রতিলিপি
আপভোট স্কেলার int32 অডিও টেক্সটের সাথে মিলেছে এমন লোকের সংখ্যা
ভয়েস অডিও (কোনটিই নয়,) int64
  • তত্ত্বাবধান করা কী (দেখুন as_supervised doc ): None

  • চিত্র ( tfds.show_examples ): সমর্থিত নয়।

  • উদ্ধৃতি :

common_voice/en (ডিফল্ট কনফিগারেশন)

  • কনফিগার বিবরণ : ভাষা কোড: en

  • ডাউনলোড আকার : 56.45 GiB

  • ডেটাসেটের আকার : 2.79 TiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 16,164
'test' 16,164
'train' 564,337
'validation' 1,224,864

common_voice/ab

  • কনফিগার বিবরণ : ভাষা কোড: ab

  • ডাউনলোড সাইজ : 39.14 MiB

  • ডেটাসেটের আকার : 133.24 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 9
'train' 22
'validation' 31

common_voice/ar

  • কনফিগার বিবরণ : ভাষা কোড: ar

  • ডাউনলোড আকার : 1.64 GiB

  • ডেটাসেটের আকার : 67.16 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 7,517
'test' 7,622
'train' 14,227
'validation' 43,291

common_voice/as

  • কনফিগার বিবরণ : ভাষা কোড: হিসাবে

  • ডাউনলোড সাইজ : 21.20 MiB

  • ডেটাসেটের আকার : 1.65 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 124
'test' 110
'train' 270
'validation' 504

common_voice/br

  • কনফিগার বিবরণ : ভাষা কোড: br

  • ডাউনলোড সাইজঃ 443.72 MiB

  • ডেটাসেটের আকার : 13.46 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 1,997
'test' 2,087
'train' 2,780
'validation' ৮,৫৬০

common_voice/ca

  • কনফিগার বিবরণ : ভাষা কোড: ca

  • ডাউনলোড সাইজ : 19.32 GiB

  • ডেটাসেটের আকার : 1.19 TiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 15,724
'test' 15,724
'train' 285,584
'validation' 416,701

common_voice/cnh

  • কনফিগারেশনের বিবরণ : ভাষা কোড: cnh

  • ডাউনলোডের আকার : 153.86 MiB

  • ডেটাসেটের আকার : 5.12 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 756
'test' 752
'train' 807
'validation' 2,432

common_voice/cs

  • কনফিগারেশনের বিবরণ : ভাষা কোড: cs

  • ডাউনলোড সাইজ : 1.18 GiB

  • ডেটাসেটের আকার : 56.89 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 4,118
'test' 4,144
'train' ৫,৬৫৫
'validation' 30,431

common_voice/cv

  • কনফিগার বিবরণ : ভাষা কোড: cv

  • ডাউনলোড সাইজ : 418.98 MiB

  • ডেটাসেটের আকার : 8.10 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 818
'test' 788
'train' 931
'validation' ৩,৪৯৬

common_voice/cy

  • কনফিগারেশনের বিবরণ : ভাষা কোড: cy

  • ডাউনলোড আকার : 3.20 GiB

  • ডেটাসেটের আকার : 128.68 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 4,776
'test' 4,820
'train' ৬,৮৩৯
'validation' 72,984

common_voice/de

  • কনফিগার বিবরণ : ভাষা কোড: de

  • ডাউনলোড সাইজ : 21.68 GiB

  • ডেটাসেটের আকার : 1.29 TiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 15,588
'test' 15,588
'train' 246,525
'validation' 565,186

common_voice/dv

  • কনফিগার বর্ণনা : ভাষা কোড: dv

  • ডাউনলোড সাইজ : 515.45 MiB

  • ডেটাসেটের আকার : 31.59 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 2,077
'test' 2,202
'train' 2,680
'validation' 11,866

common_voice/el

  • কনফিগারেশনের বিবরণ : ভাষা কোড: el

  • ডাউনলোড আকার : 363.89 MiB

  • ডেটাসেটের আকার : 14.62 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 1,401
'test' 1,522
'train' ২,৩১৬
'validation' ৫,৯৯৬

common_voice/eo

  • কনফিগার বিবরণ : ভাষা কোড: eo

  • ডাউনলোড সাইজ : 2.69 GiB

  • ডেটাসেটের আকার : 167.14 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' ৮,৯৮৭
'test' ৮,৯৬৯
'train' 19,587
'validation' 58,094

common_voice/es

  • কনফিগার বিবরণ : ভাষা কোড: es

  • ডাউনলোড আকার : 15.08 GiB

  • ডেটাসেটের আকার : 684.66 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 15,089
'test' 15,089
'train' 161,813
'validation' 236,314

common_voice/et

  • কনফিগার বিবরণ : ভাষা কোড: et

  • ডাউনলোড সাইজঃ 731.63 MiB

  • ডেটাসেটের আকার : 37.95 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 2,507
'test' 2,509
'train' 2,966
'validation' 10,683

common_voice/eu

  • কনফিগারেশনের বিবরণ : ভাষা কোড: eu

  • ডাউনলোড সাইজ : 3.41 GiB

  • ডেটাসেটের আকার : 127.60 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 5,172
'test' 5,172
'train' 7,505
'validation' 63,009

common_voice/fa

  • কনফিগারেশনের বিবরণ : ভাষা কোড: fa

  • ডাউনলোড আকার : 8.27 GiB

  • ডেটাসেটের আকার : 328.61 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 5,213
'test' 5,213
'train' 7,593
'validation' 251,659

common_voice/fi

  • কনফিগার বিবরণ : ভাষা কোড: fi

  • ডাউনলোড সাইজ : 47.57 MiB

  • ডেটাসেটের আকার : 3.41 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 415
'test' 428
'train' 460
'validation' 1,305

common_voice/fr

  • কনফিগারেশনের বিবরণ : ভাষা কোড: fr

  • ডাউনলোড সাইজ : 17.82 GiB

  • ডেটাসেটের আকার : 1.17 TiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 15,763
'test' 15,763
'train' 298,982
'validation' 461,004

common_voice/fy-NL

  • কনফিগার বিবরণ : ভাষা কোড: fy-NL

  • ডাউনলোড সাইজ : 1.15 GiB

  • ডেটাসেটের আকার : 29.93 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 2,790
'test' 3,020
'train' 3,927
'validation' 10,495

common_voice/ga-IE

  • কনফিগারেশনের বিবরণ : ভাষা কোড: ga-IE

  • ডাউনলোড সাইজ : 149.30 MiB

  • ডেটাসেটের আকার : 5.11 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 497
'test' 506
'train' 541
'validation' ৩,৩৫২

common_voice/hi

  • কনফিগার বিবরণ : ভাষা কোড: হাই

  • ডাউনলোড সাইজ : 20.43 MiB

  • ডেটাসেটের আকার : 1.15 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 135
'test' 127
'train' 157
'validation' 419

common_voice/hsb

  • কনফিগার বিবরণ : ভাষা কোড: hsb

  • ডাউনলোড সাইজ : 75.69 MiB

  • ডেটাসেটের আকার : 5.67 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 172
'test' 387
'train' 808
'validation' 1,367

common_voice/hu

  • কনফিগার বিবরণ : ভাষা কোড: hu

  • ডাউনলোড সাইজ : 231.51 MiB

  • ডেটাসেটের আকার : 17.07 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 1,434
'test' 1,649
'train' ৩,৩৪৮
'validation' 6,457

common_voice/ia

  • কনফিগার বিবরণ : ভাষা কোড: ia

  • ডাউনলোড সাইজ : 216.01 MiB

  • ডেটাসেটের আকার : 14.99 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 1,601
'test' ৮৯৯
'train' ৩,৪৭৭
'validation' 5,978

common_voice/id

  • কনফিগার বিবরণ : ভাষা কোড: আইডি

  • ডাউনলোড সাইজ : 453.87 MiB

  • ডেটাসেটের আকার : 17.20 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 1,835
'test' 1,844
'train' 2,130
'validation' ৮,৬৯৬

common_voice/it

  • কনফিগারেশনের বিবরণ : ভাষা কোড: এটি

  • ডাউনলোড আকার : 5.20 GiB

  • ডেটাসেটের আকার : 316.38 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 12,928
'test' 12,928
'train' ৫৮,০১৫
'validation' 102,579

common_voice/ja

  • কনফিগার বিবরণ : ভাষা কোড: ja

  • ডাউনলোড সাইজ : 145.80 MiB

  • ডেটাসেটের আকার : 6.83 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 586
'test' 632
'train' 722
'validation' 3,072

common_voice/ka

  • কনফিগার বিবরণ : ভাষা কোড: ka

  • ডাউনলোড সাইজ : 99.45 MiB

  • ডেটাসেটের আকার : 7.51 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 527
'test' 656
'train' 1,058
'validation' 2,275

common_voice/kab

  • কনফিগারেশনের বিবরণ : ভাষা কোড: kab

  • ডাউনলোড আকার : 15.99 GiB

  • ডেটাসেটের আকার : 718.51 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 14,622
'test' 14,622
'train' 120,530
'validation' 573,718

common_voice/ky

  • কনফিগারেশনের বিবরণ : ভাষা কোড: ky

  • ডাউনলোড সাইজ : 552.60 MiB

  • ডেটাসেটের আকার : 18.70 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 1,511
'test' 1,503
'train' 1,955
'validation' 9,236

common_voice/lg

  • কনফিগারেশনের বিবরণ : ভাষা কোড: lg

  • ডাউনলোড সাইজ : 198.55 MiB

  • ডেটাসেটের আকার : 6.65 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 384
'test' 584
'train' 1,250
'validation' 2,220

common_voice/lt

  • কনফিগারেশনের বিবরণ : ভাষা কোড: lt

  • ডাউনলোড সাইজ : 129.03 MiB

  • ডেটাসেটের আকার : 4.79 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 244
'test' 466
'train' 931
'validation' 1,644

common_voice/lv

  • কনফিগারেশনের বিবরণ : ভাষা কোড: lv

  • ডাউনলোড সাইজ : 198.66 MiB

  • ডেটাসেটের আকার : 13.07 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 2,002
'test' 1,882
'train' 2,552
'validation' 6,444

common_voice/mn

  • কনফিগার বিবরণ : ভাষা কোড: mn

  • ডাউনলোড সাইজঃ 463.84 MiB

  • ডেটাসেটের আকার : 22.09 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 1,837
'test' 1,862
'train' 2,183
'validation' 7,487

common_voice/mt

  • কনফিগার বিবরণ : ভাষা কোড: mt

  • ডাউনলোড সাইজঃ 405.42 MiB

  • ডেটাসেটের আকার : 15.09 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 1,516
'test' 1,617
'train' 2,036
'validation' ৫,৭৪৭

common_voice/nl

  • কনফিগার বিবরণ : ভাষা কোড: nl

  • ডাউনলোডের আকার : 1.62 GiB

  • ডেটাসেটের আকার : 90.20 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 4,938
'test' 5,708
'train' 9,460
'validation' 52,488

common_voice/বা

  • কনফিগার বিবরণ : ভাষা কোড: বা

  • ডাউনলোডের আকার : 189.85 MiB

  • ডেটাসেটের আকার : 1.97 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 129
'test' 98
'train' 388
'validation' 615

common_voice/pa-IN

  • কনফিগার বিবরণ : ভাষা কোড: pa-IN

  • ডাউনলোড সাইজ : 66.52 MiB

  • ডেটাসেটের আকার : 1.03 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 44
'test' 116
'train' 211
'validation' 371

common_voice/pl

  • কনফিগার বিবরণ : ভাষা কোড: pl

  • ডাউনলোড আকার : 3.29 GiB

  • ডেটাসেটের আকার : 141.06 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 5,153
'test' 5,153
'train' 7,468
'validation' 90,791

common_voice/pt

  • কনফিগারেশনের বিবরণ : ভাষা কোড: pt

  • ডাউনলোড আকার : 1.59 GiB

  • ডেটাসেটের আকার : 75.64 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 4,592
'test' 4,641
'train' 6,514
'validation' 41,584

common_voice/rm-sursilv

  • কনফিগারেশনের বিবরণ : ভাষা কোড: rm-sursilv

  • ডাউনলোড সাইজ : 263.17 MiB

  • ডেটাসেটের আকার : 12.31 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 1,205
'test' 1,194
'train' 1,384
'validation' ৩,৭৮৩

common_voice/rm-vallader

  • কনফিগারেশনের বিবরণ : ভাষা কোড: rm-vallader

  • ডাউনলোড সাইজ : 103.11 MiB

  • ডেটাসেটের আকার : 4.89 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 357
'test' 378
'train' 574
'validation' 1,316

common_voice/ro

  • কনফিগারেশনের বিবরণ : ভাষা কোড: ro

  • ডাউনলোড সাইজ : 249.84 MiB

  • ডেটাসেটের আকার : 14.54 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 858
'test' 1,778
'train' ৩,৩৯৯
'validation' 6,039

common_voice/ru

  • কনফিগারেশনের বিবরণ : ভাষা কোড: ru

  • ডাউনলোড সাইজঃ 3.40 GiB

  • ডেটাসেটের আকার : 175.04 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 7,963
'test' 8,007
'train' 15,481
'validation' 74,256

common_voice/rw

  • কনফিগারেশনের বিবরণ : ভাষা কোড: rw

  • ডাউনলোড সাইজ : 39.62 GiB

  • ডেটাসেটের আকার : 2.18 TiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 15,032
'test' 15,724
'train' 515,197
'validation' ৮৩২,৯২৯

common_voice/sah

  • কনফিগারেশনের বিবরণ : ভাষা কোড: sah

  • ডাউনলোড সাইজ : 172.85 MiB

  • ডেটাসেটের আকার : 9.42 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 405
'test' 757
'train' 1,442
'validation' 2,606

common_voice/sl

  • কনফিগার বিবরণ : ভাষা কোড: এসএল

  • ডাউনলোড সাইজ : 212.43 MiB

  • ডেটাসেটের আকার : 9.67 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 556
'test' 881
'train' 2,038
'validation' 4,669

common_voice/sv-SE

  • কনফিগারেশনের বিবরণ : ভাষা কোড: sv-SE

  • ডাউনলোড সাইজঃ 401.91 MiB

  • ডেটাসেটের আকার : 18.27 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 2,019
'test' 2,027
'train' ২,৩৩১
'validation' 12,552

common_voice/ta

  • কনফিগার বিবরণ : ভাষা কোড: ta

  • ডাউনলোড সাইজ : 648.28 MiB

  • ডেটাসেটের আকার : 24.06 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 1,779
'test' 1,781
'train' 2,009
'validation' 12,652

common_voice/th

  • কনফিগার বিবরণ : ভাষা কোড: থ

  • ডাউনলোড সাইজ : 325.49 MiB

  • ডেটাসেটের আকার : 18.32 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 1,922
'test' 2,188
'train' 2,917
'validation' 7,028

common_voice/tr

  • কনফিগার বিবরণ : ভাষা কোড: tr

  • ডাউনলোড সাইজ : 592.09 MiB

  • ডেটাসেটের আকার : 28.21 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 1,647
'test' 1,647
'train' 1,831
'validation' 18,685

common_voice/tt

  • কনফিগার বিবরণ : ভাষা কোড: tt

  • ডাউনলোড সাইজ : 741.15 MiB

  • ডেটাসেটের আকার : 46.85 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 2,127
'test' 4,485
'train' 11,211
'validation' 25,781

common_voice/uk

  • কনফিগার বিবরণ : ভাষা কোড: uk

  • ডাউনলোড সাইজ : 1.13 GiB

  • ডেটাসেটের আকার : 49.66 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 3,236
'test' 3,235
'train' 4,035
'validation' 22,337

common_voice/vi

  • কনফিগার বিবরণ : ভাষা কোড: vi

  • ডাউনলোড সাইজ : 49.52 MiB

  • ডেটাসেটের আকার : 1.47 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 200
'test' 198
'train' 221
'validation' 619

সাধারণ_কণ্ঠ/ভোট

  • কনফিগারেশনের বিবরণ : ভাষা কোড: ভোট

  • ডাউনলোড সাইজ : 7.43 MiB

  • ডেটাসেটের আকার : 11.39 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 3
'validation' 3

common_voice/zh-CN

  • কনফিগার বিবরণ : ভাষা কোড: zh-CN

  • ডাউনলোড সাইজ : 2.03 GiB

  • ডেটাসেটের আকার : 122.54 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' ৮,৭৪৩
'test' ৮,৭৬০
'train' 18,541
'validation' 36,405

common_voice/zh-HK

  • কনফিগারেশনের বিবরণ : ভাষা কোড: zh-HK

  • ডাউনলোড সাইজ : 2.58 GiB

  • ডেটাসেটের আকার : 78.80 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 5,172
'test' 5,172
'train' 7,506
'validation' 41,835

common_voice/zh-TW

  • কনফিগার বিবরণ : ভাষা কোড: zh-TW

  • ডাউনলোড সাইজ : 2.03 GiB

  • ডেটাসেটের আকার : 69.06 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'dev' 2,895
'test' 2,895
'train' 3,507
'validation' 61,232