ted_hrlr_translate

  • বর্ণনা :

একই ভাষার জোড়া তুলনা করার জন্য TED টক ট্রান্সক্রিপ্ট থেকে প্রাপ্ত ডেটা সেট যেখানে একটি উচ্চ সম্পদ এবং অন্যটি নিম্ন সম্পদ।

@inproceedings{Ye2018WordEmbeddings,
  author  = {Ye, Qi and Devendra, Sachan and Matthieu, Felix and Sarguna, Padmanabhan and Graham, Neubig},
  title   = {When and Why are pre-trained word embeddings useful for Neural Machine Translation},
  booktitle = {HLT-NAACL},
  year    = {2018},
  }

ted_hrlr_translate/az_to_en (ডিফল্ট কনফিগারেশন)

  • কনফিগারেশনের বিবরণ : az থেকে en এ প্লেইন টেক্সটে অনুবাদ ডেটাসেট।

  • ডেটাসেটের আকার : 1.61 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 903
'train' 5,946
'validation' 671
  • বৈশিষ্ট্য গঠন :
Translation({
    'az': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
az পাঠ্য স্ট্রিং
en পাঠ্য স্ট্রিং

ted_hrlr_translate/aztr_to_en

  • কনফিগারেশনের বিবরণ : az_tr থেকে en এ প্লেইন টেক্সটে অনুবাদ ডেটাসেট।

  • ডেটাসেটের আকার : 42.54 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 903
'train' 188,396
'validation' 671
  • বৈশিষ্ট্য গঠন :
Translation({
    'az_tr': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
az_tr পাঠ্য স্ট্রিং
en পাঠ্য স্ট্রিং

ted_hrlr_translate/be_to_en

  • কনফিগারেশনের বিবরণ : প্লেইন টেক্সটে be থেকে en পর্যন্ত অনুবাদ ডেটাসেট।

  • ডেটাসেটের আকার : 1.47 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 664
'train' 4,509
'validation' 248
  • বৈশিষ্ট্য গঠন :
Translation({
    'be': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
থাকা পাঠ্য স্ট্রিং
en পাঠ্য স্ট্রিং

ted_hrlr_translate/beru_to_en

  • কনফিগারেশনের বিবরণ : be_ru থেকে en এ প্লেইন টেক্সটে অনুবাদ ডেটাসেট।

  • ডেটাসেটের আকার : 62.45 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 664
'train' 212,614
'validation' 248
  • বৈশিষ্ট্য গঠন :
Translation({
    'be_ru': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
be_ru পাঠ্য স্ট্রিং
en পাঠ্য স্ট্রিং

ted_hrlr_translate/es_to_pt

  • কনফিগারেশনের বিবরণ : প্লেইন টেক্সটে es থেকে pt পর্যন্ত অনুবাদ ডেটাসেট।

  • ডেটাসেটের আকার : 9.62 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 1,763
'train' 44,938
'validation' 1,016
  • বৈশিষ্ট্য গঠন :
Translation({
    'es': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
es পাঠ্য স্ট্রিং
pt পাঠ্য স্ট্রিং

ted_hrlr_translate/fr_to_pt

  • কনফিগারেশনের বিবরণ : প্লেইন টেক্সটে fr থেকে pt পর্যন্ত অনুবাদ ডেটাসেট।

  • ডেটাসেটের আকার : 9.74 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 1,494
'train' 43,873
'validation' 1,131
  • বৈশিষ্ট্য গঠন :
Translation({
    'fr': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
fr পাঠ্য স্ট্রিং
pt পাঠ্য স্ট্রিং

ted_hrlr_translate/gl_to_en

  • কনফিগারেশনের বিবরণ : সাধারণ পাঠ্যে gl থেকে en পর্যন্ত অনুবাদ ডেটাসেট।

  • ডেটাসেটের আকার : 2.41 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 1,007
'train' 10,017
'validation' 682
  • বৈশিষ্ট্য গঠন :
Translation({
    'en': Text(shape=(), dtype=string),
    'gl': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
en পাঠ্য স্ট্রিং
gl পাঠ্য স্ট্রিং

ted_hrlr_translate/glpt_to_en

  • কনফিগারেশনের বিবরণ : অনুবাদ ডেটাসেট gl_pt থেকে en এ প্লেইন টেক্সটে।

  • ডেটাসেটের আকার : 12.90 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 1,007
'train' 61,802
'validation' 682
  • বৈশিষ্ট্য গঠন :
Translation({
    'en': Text(shape=(), dtype=string),
    'gl_pt': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
en পাঠ্য স্ট্রিং
gl_pt পাঠ্য স্ট্রিং

ted_hrlr_translate/he_to_pt

  • কনফিগারেশনের বিবরণ : প্লেইন টেক্সটে হি থেকে পিটি পর্যন্ত অনুবাদ ডেটাসেট।

  • ডেটাসেটের আকার : 11.71 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 1,623
'train' 48,511
'validation' 1,145
  • বৈশিষ্ট্য গঠন :
Translation({
    'he': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
তিনি পাঠ্য স্ট্রিং
pt পাঠ্য স্ট্রিং

ted_hrlr_translate/it_to_pt

  • কনফিগারেশনের বিবরণ : প্লেইন টেক্সটে pt থেকে অনুবাদ ডেটাসেট।

  • ডেটাসেটের আকার : 9.94 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 1,669
'train' 46,259
'validation' 1,162
  • বৈশিষ্ট্য গঠন :
Translation({
    'it': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
এটা পাঠ্য স্ট্রিং
pt পাঠ্য স্ট্রিং

ted_hrlr_translate/pt_to_en

  • কনফিগারেশনের বিবরণ : প্লেইন টেক্সটে pt থেকে en পর্যন্ত অনুবাদ ডেটাসেট।

  • ডেটাসেটের আকার : 10.89 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 1,803
'train' 51,785
'validation' 1,193
  • বৈশিষ্ট্য গঠন :
Translation({
    'en': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
en পাঠ্য স্ট্রিং
pt পাঠ্য স্ট্রিং

ted_hrlr_translate/ru_to_en

  • কনফিগারেশনের বিবরণ : প্লেইন টেক্সটে ru থেকে en পর্যন্ত অনুবাদ ডেটাসেট।

  • ডেটাসেটের আকার : 63.22 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' ৫,৪৭৬
'train' 208,106
'validation' 4,805
  • বৈশিষ্ট্য গঠন :
Translation({
    'en': Text(shape=(), dtype=string),
    'ru': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
en পাঠ্য স্ট্রিং
ru পাঠ্য স্ট্রিং

ted_hrlr_translate/ru_to_pt

  • কনফিগারেশনের বিবরণ : প্লেইন টেক্সটে ru থেকে pt পর্যন্ত অনুবাদ ডেটাসেট।

  • ডেটাসেটের আকার : 13.00 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 1,588
'train' 47,278
'validation' 1,184
  • বৈশিষ্ট্য গঠন :
Translation({
    'pt': Text(shape=(), dtype=string),
    'ru': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
pt পাঠ্য স্ট্রিং
ru পাঠ্য স্ট্রিং

ted_hrlr_translate/tr_to_en

  • কনফিগারেশনের বিবরণ : tr থেকে en এ প্লেইন টেক্সটে অনুবাদ ডেটাসেট।

  • ডেটাসেটের আকার : 42.33 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' ৫,০২৯
'train' 182,450
'validation' ৪,০৪৫
  • বৈশিষ্ট্য গঠন :
Translation({
    'en': Text(shape=(), dtype=string),
    'tr': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
en পাঠ্য স্ট্রিং
tr পাঠ্য স্ট্রিং