para_crawl

  • توضیحات :

مجموعه های موازی مقیاس وب برای زبان های رسمی اروپایی.

@misc {paracrawl,
    title  = "ParaCrawl",
    year   = "2018",
    url    = "http://paracrawl.eu/download.html."
}

para_crawl/enbg (پیکربندی پیش‌فرض)

  • توضیحات پیکربندی : مجموعه داده ترجمه از انگلیسی به bg.

  • حجم دانلود : 98.94 MiB

  • حجم مجموعه داده : 362.46 MiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 1,039,885
  • ساختار ویژگی :
Translation({
    'bg': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
bg متن رشته
en متن رشته

para_crawl/encs

  • توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به cs.

  • حجم دانلود : 187.31 MiB

  • حجم مجموعه داده : 666.34 MiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 2,981,949
  • ساختار ویژگی :
Translation({
    'cs': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
cs متن رشته
en متن رشته

para_crawl/enda

  • توضیحات پیکربندی : مجموعه داده ترجمه از انگلیسی به da.

  • حجم دانلود : 174.34 MiB

  • حجم مجموعه داده : 619.77 MiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 2,414,895
  • ساختار ویژگی :
Translation({
    'da': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
دا متن رشته
en متن رشته

para_crawl/ende

  • توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به de.

  • حجم دانلود : 1.22 GiB

  • حجم مجموعه داده : 4.04 GiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 16,264,448
  • ساختار ویژگی :
Translation({
    'de': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
de متن رشته
en متن رشته

para_crawl/enel

  • توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به el.

  • حجم دانلود : 184.59 MiB

  • حجم مجموعه داده : 698.75 MiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 1,985,233
  • ساختار ویژگی :
Translation({
    'el': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
el متن رشته
en متن رشته

para_crawl/enes

  • توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به es.

  • حجم دانلود : 1.82 GiB

  • حجم مجموعه داده : 6.23 GiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 21,987,267
  • ساختار ویژگی :
Translation({
    'en': Text(shape=(), dtype=string),
    'es': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
en متن رشته
es متن رشته

para_crawl/enet

  • توضیحات پیکربندی : مجموعه داده ترجمه از انگلیسی به et.

  • حجم دانلود : 66.91 MiB

  • حجم مجموعه داده : 209.16 MiB

  • ذخیره خودکار ( مستندات ): فقط زمانی که shuffle_files=False (قطار)

  • تقسیم ها :

شکاف مثال ها
'train' 853,422
  • ساختار ویژگی :
Translation({
    'en': Text(shape=(), dtype=string),
    'et': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
en متن رشته
et متن رشته

para_crawl/enfi

  • توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به fi.

  • حجم دانلود : 151.83 MiB

  • حجم مجموعه داده : 543.85 MiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 2,156,069
  • ساختار ویژگی :
Translation({
    'en': Text(shape=(), dtype=string),
    'fi': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
en متن رشته
فی متن رشته

para_crawl/enfr

  • توضیحات پیکربندی : مجموعه داده ترجمه از انگلیسی به fr.

  • حجم دانلود : 2.63 GiB

  • حجم مجموعه داده : 9.04 GiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 31,374,161
  • ساختار ویژگی :
Translation({
    'en': Text(shape=(), dtype=string),
    'fr': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
en متن رشته
fr متن رشته

para_crawl/enga

  • توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به ga.

  • حجم دانلود : 28.03 MiB

  • حجم مجموعه داده : 107.09 MiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'train' 357,399
  • ساختار ویژگی :
Translation({
    'en': Text(shape=(), dtype=string),
    'ga': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
en متن رشته
GA متن رشته

para_crawl/enhr

  • توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به hr.

  • حجم دانلود : 80.97 MiB

  • حجم مجموعه داده : 256.37 MiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 1,002,053
  • ساختار ویژگی :
Translation({
    'en': Text(shape=(), dtype=string),
    'hr': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
en متن رشته
ساعت متن رشته

para_crawl/enhu

  • توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به hu.

  • حجم دانلود : 114.24 MiB

  • حجم مجموعه داده : 421.40 MiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 1,901,342
  • ساختار ویژگی :
Translation({
    'en': Text(shape=(), dtype=string),
    'hu': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
en متن رشته
هو متن رشته

para_crawl/enit

  • توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به آن.

  • حجم دانلود : 1017.30 MiB

  • حجم مجموعه داده : 3.36 GiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 12,162,239
  • ساختار ویژگی :
Translation({
    'en': Text(shape=(), dtype=string),
    'it': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
en متن رشته
آی تی متن رشته

para_crawl/enlt

  • توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به lt.

  • حجم دانلود : 63.28 MiB

  • حجم مجموعه داده : 204.70 MiB

  • ذخیره خودکار ( مستندات ): فقط زمانی که shuffle_files=False (قطار)

  • تقسیم ها :

شکاف مثال ها
'train' 844,643
  • ساختار ویژگی :
Translation({
    'en': Text(shape=(), dtype=string),
    'lt': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
en متن رشته
آن متن رشته

para_crawl/enlv

  • توضیحات پیکربندی : مجموعه داده ترجمه از انگلیسی به lv.

  • حجم دانلود : 45.17 MiB

  • حجم مجموعه داده : 147.09 MiB

  • ذخیره خودکار ( مستندات ): فقط زمانی که shuffle_files=False (قطار)

  • تقسیم ها :

شکاف مثال ها
'train' 553,060
  • ساختار ویژگی :
Translation({
    'en': Text(shape=(), dtype=string),
    'lv': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
en متن رشته
lv متن رشته

para_crawl/enmt

  • توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به mt.

  • حجم دانلود : 18.15 MiB

  • حجم مجموعه داده : 54.36 MiB

  • ذخیره خودکار ( اسناد ): بله

  • تقسیم ها :

شکاف مثال ها
'train' 195,502
  • ساختار ویژگی :
Translation({
    'en': Text(shape=(), dtype=string),
    'mt': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
en متن رشته
mt متن رشته

para_crawl/ennl

  • توضیحات پیکربندی : مجموعه داده ترجمه از انگلیسی به nl.

  • حجم دانلود : 400.63 MiB

  • حجم مجموعه داده : 1.40 GiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 5,659,268
  • ساختار ویژگی :
Translation({
    'en': Text(shape=(), dtype=string),
    'nl': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
en متن رشته
nl متن رشته

para_crawl/enpl

  • توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به pl.

  • حجم دانلود : 257.90 MiB

  • حجم مجموعه داده : 885.63 MiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 3,503,276
  • ساختار ویژگی :
Translation({
    'en': Text(shape=(), dtype=string),
    'pl': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
en متن رشته
pl متن رشته

para_crawl/enpt

  • توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به pt.

  • حجم دانلود : 608.62 MiB

  • حجم مجموعه داده : 2.05 GiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 8,141,940
  • ساختار ویژگی :
Translation({
    'en': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
en متن رشته
pt متن رشته

para_crawl/enro

  • توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به ro.

  • حجم دانلود : 153.24 MiB

  • حجم مجموعه داده : 534.34 MiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 1,952,043
  • ساختار ویژگی :
Translation({
    'en': Text(shape=(), dtype=string),
    'ro': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
en متن رشته
ro متن رشته

para_crawl/ensk

  • توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به sk.

  • حجم دانلود : 96.61 MiB

  • حجم مجموعه داده : 352.91 MiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 1,591,831
  • ساختار ویژگی :
Translation({
    'en': Text(shape=(), dtype=string),
    'sk': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
en متن رشته
sk متن رشته

para_crawl/ensl

  • توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به sl.

  • حجم دانلود : 62.02 MiB

  • حجم مجموعه داده : 187.66 MiB

  • ذخیره خودکار ( مستندات ): فقط زمانی که shuffle_files=False (قطار)

  • تقسیم ها :

شکاف مثال ها
'train' 660,161
  • ساختار ویژگی :
Translation({
    'en': Text(shape=(), dtype=string),
    'sl': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
en متن رشته
sl متن رشته

para_crawl/ensv

  • توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به sv.

  • حجم دانلود : 262.76 MiB

  • حجم مجموعه داده : 905.72 MiB

  • ذخیره خودکار ( اسناد ): خیر

  • تقسیم ها :

شکاف مثال ها
'train' 3,476,729
  • ساختار ویژگی :
Translation({
    'en': Text(shape=(), dtype=string),
    'sv': Text(shape=(), dtype=string),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
ترجمه
en متن رشته
sv متن رشته