para_crawl

  • বর্ণনা :

অফিসিয়াল ইউরোপীয় ভাষার জন্য ওয়েব-স্কেল সমান্তরাল কর্পোরা।

@misc {paracrawl,
    title  = "ParaCrawl",
    year   = "2018",
    url    = "http://paracrawl.eu/download.html."
}

para_crawl/enbg (ডিফল্ট কনফিগারেশন)

  • কনফিগার বিবরণ : ইংরেজি থেকে বিজিতে অনুবাদ ডেটাসেট।

  • ডাউনলোডের আকার : 98.94 MiB

  • ডেটাসেটের আকার : 362.46 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,039,885
  • বৈশিষ্ট্য গঠন :
Translation({
    'bg': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
bg পাঠ্য স্ট্রিং
en পাঠ্য স্ট্রিং

para_crawl/encs

  • কনফিগারেশনের বিবরণ : ইংরেজি থেকে সিএসে অনুবাদ ডেটাসেট।

  • ডাউনলোড সাইজ : 187.31 MiB

  • ডেটাসেটের আকার : 666.34 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 2,981,949
  • বৈশিষ্ট্য গঠন :
Translation({
    'cs': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
cs পাঠ্য স্ট্রিং
en পাঠ্য স্ট্রিং

para_crawl/enda

  • কনফিগার বিবরণ : ইংরেজি থেকে da তে অনুবাদ ডেটাসেট।

  • ডাউনলোড সাইজ : 174.34 MiB

  • ডেটাসেটের আকার : 619.77 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 2,414,895
  • বৈশিষ্ট্য গঠন :
Translation({
    'da': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
da পাঠ্য স্ট্রিং
en পাঠ্য স্ট্রিং

para_crawl/ende

  • কনফিগার বিবরণ : ইংরেজি থেকে ডি তে অনুবাদ ডেটাসেট।

  • ডাউনলোড সাইজ : 1.22 GiB

  • ডেটাসেটের আকার : 4.04 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 16,264,448
  • বৈশিষ্ট্য গঠন :
Translation({
    'de': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
ডি পাঠ্য স্ট্রিং
en পাঠ্য স্ট্রিং

para_crawl/enel

  • কনফিগারেশনের বিবরণ : ইংরেজি থেকে el-এ অনুবাদ ডেটাসেট।

  • ডাউনলোডের আকার : 184.59 MiB

  • ডেটাসেটের আকার : 698.75 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,985,233
  • বৈশিষ্ট্য গঠন :
Translation({
    'el': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
el পাঠ্য স্ট্রিং
en পাঠ্য স্ট্রিং

para_crawl/enes

  • কনফিগার বিবরণ : ইংরেজি থেকে es-এ অনুবাদ ডেটাসেট।

  • ডাউনলোড আকার : 1.82 GiB

  • ডেটাসেটের আকার : 6.23 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 21,987,267
  • বৈশিষ্ট্য গঠন :
Translation({
    'en': Text(shape=(), dtype=string),
    'es': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
en পাঠ্য স্ট্রিং
es পাঠ্য স্ট্রিং

para_crawl/enet

  • কনফিগার বিবরণ : ইংরেজি থেকে ET-এ অনুবাদ ডেটাসেট।

  • ডাউনলোডের আকার : 66.91 MiB

  • ডেটাসেটের আকার : 209.16 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): শুধুমাত্র যখন shuffle_files=False (ট্রেন)

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 853,422
  • বৈশিষ্ট্য গঠন :
Translation({
    'en': Text(shape=(), dtype=string),
    'et': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
en পাঠ্য স্ট্রিং
ইত্যাদি পাঠ্য স্ট্রিং

para_crawl/enfi

  • কনফিগার বিবরণ : ইংরেজি থেকে ফাইতে অনুবাদ ডেটাসেট।

  • ডাউনলোড সাইজ : 151.83 MiB

  • ডেটাসেটের আকার : 543.85 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 2,156,069
  • বৈশিষ্ট্য গঠন :
Translation({
    'en': Text(shape=(), dtype=string),
    'fi': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
en পাঠ্য স্ট্রিং
fi পাঠ্য স্ট্রিং

para_crawl/enfr

  • কনফিগার বিবরণ : ইংরেজি থেকে fr.

  • ডাউনলোড সাইজ : 2.63 GiB

  • ডেটাসেটের আকার : 9.04 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 31,374,161
  • বৈশিষ্ট্য গঠন :
Translation({
    'en': Text(shape=(), dtype=string),
    'fr': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
en পাঠ্য স্ট্রিং
fr পাঠ্য স্ট্রিং

para_crawl/enga

  • কনফিগারের বিবরণ : ইংরেজি থেকে ga-তে অনুবাদ ডেটাসেট।

  • ডাউনলোড সাইজ : 28.03 MiB

  • ডেটাসেটের আকার : 107.09 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 357,399
  • বৈশিষ্ট্য গঠন :
Translation({
    'en': Text(shape=(), dtype=string),
    'ga': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
en পাঠ্য স্ট্রিং
ga পাঠ্য স্ট্রিং

para_crawl/enhr

  • কনফিগার বিবরণ : ইংরেজি থেকে hr অনুবাদ ডেটাসেট।

  • ডাউনলোড সাইজ : 80.97 MiB

  • ডেটাসেটের আকার : 256.37 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,002,053
  • বৈশিষ্ট্য গঠন :
Translation({
    'en': Text(shape=(), dtype=string),
    'hr': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
en পাঠ্য স্ট্রিং
ঘন্টা পাঠ্য স্ট্রিং

para_crawl/enhu

  • কনফিগারেশনের বিবরণ : ইংরেজি থেকে হুতে অনুবাদ ডেটাসেট।

  • ডাউনলোড সাইজ : 114.24 MiB

  • ডেটাসেটের আকার : 421.40 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,901,342
  • বৈশিষ্ট্য গঠন :
Translation({
    'en': Text(shape=(), dtype=string),
    'hu': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
en পাঠ্য স্ট্রিং
hu পাঠ্য স্ট্রিং

para_crawl/enit

  • কনফিগার বিবরণ : ইংরেজি থেকে এটিতে অনুবাদ ডেটাসেট।

  • ডাউনলোড 1017.30 MiB

  • ডেটাসেটের আকার : 3.36 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 12,162,239
  • বৈশিষ্ট্য গঠন :
Translation({
    'en': Text(shape=(), dtype=string),
    'it': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
en পাঠ্য স্ট্রিং
এটা পাঠ্য স্ট্রিং

para_crawl/enlt

  • কনফিগার বিবরণ : ইংরেজি থেকে lt তে অনুবাদ ডেটাসেট।

  • ডাউনলোড আকার : 63.28 MiB

  • ডেটাসেটের আকার : 204.70 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): শুধুমাত্র যখন shuffle_files=False (ট্রেন)

  • বিভাজন :

বিভক্ত উদাহরণ
'train' ৮৪৪,৬৪৩
  • বৈশিষ্ট্য গঠন :
Translation({
    'en': Text(shape=(), dtype=string),
    'lt': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
en পাঠ্য স্ট্রিং
lt পাঠ্য স্ট্রিং

para_crawl/enlv

  • কনফিগারেশনের বিবরণ : ইংরেজি থেকে lv-তে অনুবাদ ডেটাসেট।

  • ডাউনলোড সাইজ : 45.17 MiB

  • ডেটাসেটের আকার : 147.09 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): শুধুমাত্র যখন shuffle_files=False (ট্রেন)

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 553,060
  • বৈশিষ্ট্য গঠন :
Translation({
    'en': Text(shape=(), dtype=string),
    'lv': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
en পাঠ্য স্ট্রিং
lv পাঠ্য স্ট্রিং

para_crawl/enmt

  • কনফিগ বিবরণ : ইংরেজি থেকে mt অনুবাদ ডেটাসেট।

  • ডাউনলোড আকার : 18.15 MiB

  • ডেটাসেটের আকার : 54.36 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 195,502
  • বৈশিষ্ট্য গঠন :
Translation({
    'en': Text(shape=(), dtype=string),
    'mt': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
en পাঠ্য স্ট্রিং
mt পাঠ্য স্ট্রিং

para_crawl/ennl

  • কনফিগার বিবরণ : ইংরেজি থেকে nl অনুবাদ ডেটাসেট।

  • ডাউনলোড 400.63 MiB

  • ডেটাসেটের আকার : 1.40 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' ৫,৬৫৯,২৬৮
  • বৈশিষ্ট্য গঠন :
Translation({
    'en': Text(shape=(), dtype=string),
    'nl': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
en পাঠ্য স্ট্রিং
nl পাঠ্য স্ট্রিং

para_crawl/enpl

  • কনফিগার বিবরণ : ইংরেজি থেকে pl থেকে অনুবাদ ডেটাসেট।

  • ডাউনলোড সাইজ : 257.90 MiB

  • ডেটাসেটের আকার : 885.63 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 3,503,276
  • বৈশিষ্ট্য গঠন :
Translation({
    'en': Text(shape=(), dtype=string),
    'pl': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
en পাঠ্য স্ট্রিং
pl পাঠ্য স্ট্রিং

para_crawl/enpt

  • কনফিগারেশনের বিবরণ : ইংরেজি থেকে pt তে অনুবাদ ডেটাসেট।

  • ডাউনলোড সাইজ : 608.62 MiB

  • ডেটাসেটের আকার : 2.05 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' ৮,১৪১,৯৪০
  • বৈশিষ্ট্য গঠন :
Translation({
    'en': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
en পাঠ্য স্ট্রিং
pt পাঠ্য স্ট্রিং

para_crawl/enro

  • কনফিগার বিবরণ : ইংরেজি থেকে ro-এ অনুবাদ ডেটাসেট।

  • ডাউনলোড সাইজ : 153.24 MiB

  • ডেটাসেটের আকার : 534.34 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,952,043
  • বৈশিষ্ট্য গঠন :
Translation({
    'en': Text(shape=(), dtype=string),
    'ro': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
en পাঠ্য স্ট্রিং
ro পাঠ্য স্ট্রিং

para_crawl/ensk

  • কনফিগারেশনের বিবরণ : ইংরেজি থেকে sk-এ অনুবাদ ডেটাসেট।

  • ডাউনলোড সাইজ : 96.61 MiB

  • ডেটাসেটের আকার : 352.91 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,591,831
  • বৈশিষ্ট্য গঠন :
Translation({
    'en': Text(shape=(), dtype=string),
    'sk': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
en পাঠ্য স্ট্রিং
sk পাঠ্য স্ট্রিং

para_crawl/ensl

  • কনফিগার বর্ণনা : ইংরেজি থেকে এসএল-এ অনুবাদ ডেটাসেট।

  • ডাউনলোড সাইজ : 62.02 MiB

  • ডেটাসেটের আকার : 187.66 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): শুধুমাত্র যখন shuffle_files=False (ট্রেন)

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 660,161
  • বৈশিষ্ট্য গঠন :
Translation({
    'en': Text(shape=(), dtype=string),
    'sl': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
en পাঠ্য স্ট্রিং
sl পাঠ্য স্ট্রিং

para_crawl/ensv

  • কনফিগার বিবরণ : ইংরেজি থেকে এসভিতে অনুবাদ ডেটাসেট।

  • ডাউনলোড সাইজ : 262.76 MiB

  • ডেটাসেটের আকার : 905.72 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' ৩,৪৭৬,৭২৯
  • বৈশিষ্ট্য গঠন :
Translation({
    'en': Text(shape=(), dtype=string),
    'sv': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
en পাঠ্য স্ট্রিং
sv পাঠ্য স্ট্রিং