- توضیحات :
مجموعه های موازی مقیاس وب برای زبان های رسمی اروپایی.
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://paracrawl.eu/releases.html
کد منبع :
tfds.datasets.para_crawl.Builder
نسخه ها :
-
1.2.0
(پیش فرض): بدون یادداشت انتشار.
-
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
نقل قول :
@misc {paracrawl,
title = "ParaCrawl",
year = "2018",
url = "http://paracrawl.eu/download.html."
}
para_crawl/enbg (پیکربندی پیشفرض)
توضیحات پیکربندی : مجموعه داده ترجمه از انگلیسی به bg.
حجم دانلود :
98.94 MiB
حجم مجموعه داده :
362.46 MiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1,039,885 |
- ساختار ویژگی :
Translation({
'bg': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
bg | متن | رشته | ||
en | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_supervised
doc ):('en', 'bg')
مثالها ( tfds.as_dataframe ):
para_crawl/encs
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به cs.
حجم دانلود :
187.31 MiB
حجم مجموعه داده :
666.34 MiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 2,981,949 |
- ساختار ویژگی :
Translation({
'cs': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
cs | متن | رشته | ||
en | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_supervised
doc ):('en', 'cs')
مثالها ( tfds.as_dataframe ):
para_crawl/enda
توضیحات پیکربندی : مجموعه داده ترجمه از انگلیسی به da.
حجم دانلود :
174.34 MiB
حجم مجموعه داده :
619.77 MiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 2,414,895 |
- ساختار ویژگی :
Translation({
'da': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
دا | متن | رشته | ||
en | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_supervised
doc ):('en', 'da')
مثالها ( tfds.as_dataframe ):
para_crawl/ende
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به de.
حجم دانلود :
1.22 GiB
حجم مجموعه داده :
4.04 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 16,264,448 |
- ساختار ویژگی :
Translation({
'de': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
de | متن | رشته | ||
en | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_supervised
doc ):('en', 'de')
مثالها ( tfds.as_dataframe ):
para_crawl/enel
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به el.
حجم دانلود :
184.59 MiB
حجم مجموعه داده :
698.75 MiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1,985,233 |
- ساختار ویژگی :
Translation({
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
el | متن | رشته | ||
en | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_supervised
doc ):('en', 'el')
مثالها ( tfds.as_dataframe ):
para_crawl/enes
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به es.
حجم دانلود :
1.82 GiB
حجم مجموعه داده :
6.23 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 21,987,267 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
en | متن | رشته | ||
es | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_supervised
doc ):('en', 'es')
مثالها ( tfds.as_dataframe ):
para_crawl/enet
توضیحات پیکربندی : مجموعه داده ترجمه از انگلیسی به et.
حجم دانلود :
66.91 MiB
حجم مجموعه داده :
209.16 MiB
ذخیره خودکار ( مستندات ): فقط زمانی که
shuffle_files=False
(قطار)تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 853,422 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'et': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
en | متن | رشته | ||
et | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_supervised
doc ):('en', 'et')
مثالها ( tfds.as_dataframe ):
para_crawl/enfi
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به fi.
حجم دانلود :
151.83 MiB
حجم مجموعه داده :
543.85 MiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 2,156,069 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'fi': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
en | متن | رشته | ||
فی | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_supervised
doc ):('en', 'fi')
مثالها ( tfds.as_dataframe ):
para_crawl/enfr
توضیحات پیکربندی : مجموعه داده ترجمه از انگلیسی به fr.
حجم دانلود :
2.63 GiB
حجم مجموعه داده :
9.04 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 31,374,161 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
en | متن | رشته | ||
fr | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_supervised
doc ):('en', 'fr')
مثالها ( tfds.as_dataframe ):
para_crawl/enga
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به ga.
حجم دانلود :
28.03 MiB
حجم مجموعه داده :
107.09 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 357,399 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'ga': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
en | متن | رشته | ||
GA | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_supervised
doc ):('en', 'ga')
مثالها ( tfds.as_dataframe ):
para_crawl/enhr
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به hr.
حجم دانلود :
80.97 MiB
حجم مجموعه داده :
256.37 MiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1,002,053 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'hr': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
en | متن | رشته | ||
ساعت | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_supervised
doc ):('en', 'hr')
مثالها ( tfds.as_dataframe ):
para_crawl/enhu
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به hu.
حجم دانلود :
114.24 MiB
حجم مجموعه داده :
421.40 MiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1,901,342 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'hu': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
en | متن | رشته | ||
هو | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_supervised
doc ):('en', 'hu')
مثالها ( tfds.as_dataframe ):
para_crawl/enit
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به آن.
حجم دانلود :
1017.30 MiB
حجم مجموعه داده :
3.36 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 12,162,239 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'it': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
en | متن | رشته | ||
آی تی | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_supervised
doc ):('en', 'it')
مثالها ( tfds.as_dataframe ):
para_crawl/enlt
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به lt.
حجم دانلود :
63.28 MiB
حجم مجموعه داده :
204.70 MiB
ذخیره خودکار ( مستندات ): فقط زمانی که
shuffle_files=False
(قطار)تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 844,643 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'lt': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
en | متن | رشته | ||
آن | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_supervised
doc ):('en', 'lt')
مثالها ( tfds.as_dataframe ):
para_crawl/enlv
توضیحات پیکربندی : مجموعه داده ترجمه از انگلیسی به lv.
حجم دانلود :
45.17 MiB
حجم مجموعه داده :
147.09 MiB
ذخیره خودکار ( مستندات ): فقط زمانی که
shuffle_files=False
(قطار)تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 553,060 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'lv': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
en | متن | رشته | ||
lv | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_supervised
doc ):('en', 'lv')
مثالها ( tfds.as_dataframe ):
para_crawl/enmt
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به mt.
حجم دانلود :
18.15 MiB
حجم مجموعه داده :
54.36 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 195,502 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'mt': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
en | متن | رشته | ||
mt | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_supervised
doc ):('en', 'mt')
مثالها ( tfds.as_dataframe ):
para_crawl/ennl
توضیحات پیکربندی : مجموعه داده ترجمه از انگلیسی به nl.
حجم دانلود :
400.63 MiB
حجم مجموعه داده :
1.40 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 5,659,268 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'nl': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
en | متن | رشته | ||
nl | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_supervised
doc ):('en', 'nl')
مثالها ( tfds.as_dataframe ):
para_crawl/enpl
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به pl.
حجم دانلود :
257.90 MiB
حجم مجموعه داده :
885.63 MiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 3,503,276 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'pl': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
en | متن | رشته | ||
pl | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_supervised
doc ):('en', 'pl')
مثالها ( tfds.as_dataframe ):
para_crawl/enpt
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به pt.
حجم دانلود :
608.62 MiB
حجم مجموعه داده :
2.05 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 8,141,940 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
en | متن | رشته | ||
pt | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_supervised
doc ):('en', 'pt')
مثالها ( tfds.as_dataframe ):
para_crawl/enro
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به ro.
حجم دانلود :
153.24 MiB
حجم مجموعه داده :
534.34 MiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1,952,043 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'ro': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
en | متن | رشته | ||
ro | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_supervised
doc ):('en', 'ro')
مثالها ( tfds.as_dataframe ):
para_crawl/ensk
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به sk.
حجم دانلود :
96.61 MiB
حجم مجموعه داده :
352.91 MiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1,591,831 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'sk': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
en | متن | رشته | ||
sk | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_supervised
doc ):('en', 'sk')
مثالها ( tfds.as_dataframe ):
para_crawl/ensl
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به sl.
حجم دانلود :
62.02 MiB
حجم مجموعه داده :
187.66 MiB
ذخیره خودکار ( مستندات ): فقط زمانی که
shuffle_files=False
(قطار)تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 660,161 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'sl': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
en | متن | رشته | ||
sl | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_supervised
doc ):('en', 'sl')
مثالها ( tfds.as_dataframe ):
para_crawl/ensv
توضیحات پیکربندی : مجموعه داده های ترجمه از انگلیسی به sv.
حجم دانلود :
262.76 MiB
حجم مجموعه داده :
905.72 MiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 3,476,729 |
- ساختار ویژگی :
Translation({
'en': Text(shape=(), dtype=string),
'sv': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
ترجمه | ||||
en | متن | رشته | ||
sv | متن | رشته |
کلیدهای نظارت شده (نگاه کنید به
as_supervised
doc ):('en', 'sv')
مثالها ( tfds.as_dataframe ):