- विवरण :
आधिकारिक यूरोपीय भाषाओं के लिए वेब-स्केल समानांतर कॉर्पोरा।
होमपेज : https://paracrawl.eu/releases.html
स्रोत कोड :
tfds.datasets.para_crawl.Builder
संस्करण :
-
1.2.0
(डिफ़ॉल्ट): कोई रिलीज़ नोट नहीं।
-
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उद्धरण :
@misc {paracrawl,
title = "ParaCrawl",
year = "2018",
url = "http://paracrawl.eu/download.html."
}
para_crawl/enbg (डिफ़ॉल्ट कॉन्फ़िगरेशन)
विन्यास विवरण : अंग्रेजी से बीजी के लिए अनुवाद डेटासेट।
डाउनलोड आकार :
98.94 MiB
डेटासेट का आकार :
362.46 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 1,039,885 |
- फ़ीचर संरचना :
Translation({
'bg': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
बीजी | मूलपाठ | डोरी | ||
एन | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):('en', 'bg')
उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/encs
विन्यास विवरण : अंग्रेजी से सीएस के लिए अनुवाद डेटासेट।
डाउनलोड आकार :
187.31 MiB
डेटासेट का आकार :
666.34 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 2,981,949 |
- फ़ीचर संरचना :
Translation({
'cs': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
सीएस | मूलपाठ | डोरी | ||
एन | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
दस्तावेज़ देखें):('en', 'cs')
उदाहरण ( tfds.as_dataframe ):
para_crawl/enda
कॉन्फिग विवरण : अंग्रेजी से डीए में अनुवाद डेटासेट।
डाउनलोड आकार :
174.34 MiB
डेटासेट का आकार :
619.77 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 2,414,895 |
- फ़ीचर संरचना :
Translation({
'da': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
दा | मूलपाठ | डोरी | ||
एन | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
दस्तावेज़ देखें):('en', 'da')
उदाहरण ( tfds.as_dataframe ):
para_crawl/ende
कॉन्फ़िग विवरण : अनुवाद डेटासेट अंग्रेज़ी से de.
डाउनलोड आकार :
1.22 GiB
डेटासेट का आकार :
4.04 GiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 16,264,448 |
- फ़ीचर संरचना :
Translation({
'de': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
डे | मूलपाठ | डोरी | ||
एन | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
दस्तावेज़ देखें):('en', 'de')
उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/enel
कॉन्फिग विवरण : अंग्रेजी से el में अनुवाद डेटासेट।
डाउनलोड आकार :
184.59 MiB
डेटासेट का आकार :
698.75 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 1,985,233 |
- फ़ीचर संरचना :
Translation({
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
एल | मूलपाठ | डोरी | ||
एन | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('en', 'el')
उदाहरण ( tfds.as_dataframe ):
para_crawl/enes
कॉन्फ़िग विवरण : अनुवाद डेटासेट अंग्रेज़ी से es.
डाउनलोड आकार :
1.82 GiB
डेटासेट का आकार :
6.23 GiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 21,987,267 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
एन | मूलपाठ | डोरी | ||
तों | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
दस्तावेज़ देखें):('en', 'es')
उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/एनेट
कॉन्फिग विवरण : अंग्रेजी से एट में अनुवाद डेटासेट।
डाउनलोड आकार :
66.91 MiB
डेटासेट का आकार :
209.16 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): केवल जब
shuffle_files=False
(ट्रेन)विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 853,422 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'et': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
एन | मूलपाठ | डोरी | ||
एट | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('en', 'et')
उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/enfi
कॉन्फिग विवरण : अंग्रेजी से फाई में अनुवाद डेटासेट।
डाउनलोड आकार :
151.83 MiB
डेटासेट का आकार :
543.85 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 2,156,069 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'fi': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
एन | मूलपाठ | डोरी | ||
फाई | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
दस्तावेज़ देखें):('en', 'fi')
उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/enfr
कॉन्फ़िग विवरण : अनुवाद डेटासेट अंग्रेज़ी से fr.
डाउनलोड आकार :
2.63 GiB
डेटासेट का आकार :
9.04 GiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 31,374,161 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
एन | मूलपाठ | डोरी | ||
फादर | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('en', 'fr')
उदाहरण ( tfds.as_dataframe ):
para_crawl/enga
कॉन्फिग विवरण : अंग्रेजी से ga में अनुवाद डेटासेट।
डाउनलोड आकार :
28.03 MiB
डेटासेट का आकार :
107.09 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 357,399 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'ga': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
एन | मूलपाठ | डोरी | ||
गा | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('en', 'ga')
उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/enhr
कॉन्फिग विवरण : अनुवाद डेटासेट अंग्रेजी से घंटा।
डाउनलोड आकार :
80.97 MiB
डेटासेट का आकार :
256.37 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 1,002,053 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'hr': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
एन | मूलपाठ | डोरी | ||
मानव संसाधन | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
दस्तावेज़ देखें):('en', 'hr')
उदाहरण ( tfds.as_dataframe ):
para_crawl/enhu
कॉन्फिग विवरण : अंग्रेजी से हू तक अनुवाद डेटासेट।
डाउनलोड का आकार :
114.24 MiB
डेटासेट का आकार :
421.40 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 1,901,342 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'hu': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
एन | मूलपाठ | डोरी | ||
हू | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('en', 'hu')
उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/enit
कॉन्फ़िग विवरण : डेटासेट का अंग्रेजी से अनुवाद।
डाउनलोड आकार :
1017.30 MiB
डेटासेट का आकार :
3.36 GiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 12,162,239 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'it': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
एन | मूलपाठ | डोरी | ||
यह | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):('en', 'it')
उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/enlt
विन्यास विवरण : अंग्रेजी से लेफ्टिनेंट तक अनुवाद डेटासेट।
डाउनलोड आकार :
63.28 MiB
डेटासेट का आकार :
204.70 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): केवल जब
shuffle_files=False
(ट्रेन)विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 844,643 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'lt': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
एन | मूलपाठ | डोरी | ||
लेफ्टिनेंट | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
दस्तावेज़ देखें):('en', 'lt')
उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/enlv
विन्यास विवरण : अंग्रेजी से lv में अनुवाद डेटासेट।
डाउनलोड आकार :
45.17 MiB
डेटासेट का आकार :
147.09 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): केवल जब
shuffle_files=False
(ट्रेन)विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 553,060 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'lv': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
एन | मूलपाठ | डोरी | ||
एल.वी | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('en', 'lv')
उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/enmt
कॉन्फिग विवरण : अंग्रेजी से एमटी में अनुवाद डेटासेट।
डाउनलोड आकार :
18.15 MiB
डेटासेट का आकार :
54.36 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 195,502 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'mt': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
एन | मूलपाठ | डोरी | ||
मीट्रिक टन | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('en', 'mt')
उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/ennl
कॉन्फ़िग विवरण : अंग्रेज़ी से nl में अनुवाद डेटासेट।
डाउनलोड आकार :
400.63 MiB
डेटासेट का आकार :
1.40 GiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 5,659,268 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'nl': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
एन | मूलपाठ | डोरी | ||
nl | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('en', 'nl')
उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/enpl
कॉन्फिग विवरण : अंग्रेजी से पीएल में अनुवाद डेटासेट।
डाउनलोड आकार :
257.90 MiB
डेटासेट का आकार :
885.63 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 3,503,276 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'pl': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
एन | मूलपाठ | डोरी | ||
पी एल | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('en', 'pl')
उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/enpt
विन्यास विवरण : अंग्रेजी से पीटी के लिए अनुवाद डेटासेट।
डाउनलोड आकार :
608.62 MiB
डेटासेट का आकार :
2.05 GiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 8,141,940 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
एन | मूलपाठ | डोरी | ||
पं | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
दस्तावेज़ देखें):('en', 'pt')
उदाहरण ( tfds.as_dataframe ):
para_crawl/enro
कॉन्फिग विवरण : अंग्रेजी से आरओ में अनुवाद डेटासेट।
डाउनलोड आकार :
153.24 MiB
डेटासेट का आकार :
534.34 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 1,952,043 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'ro': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
एन | मूलपाठ | डोरी | ||
आरओ | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
दस्तावेज़ देखें):('en', 'ro')
उदाहरण ( tfds.as_dataframe ):
para_crawl/ensk
कॉन्फ़िग विवरण : अनुवाद डेटासेट अंग्रेज़ी से sk.
डाउनलोड आकार :
96.61 MiB
डेटासेट का आकार :
352.91 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 1,591,831 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'sk': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
एन | मूलपाठ | डोरी | ||
एसके | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
दस्तावेज़ देखें):('en', 'sk')
उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/ensl
विन्यास विवरण : अनुवाद डेटासेट अंग्रेजी से एसएल।
डाउनलोड आकार :
62.02 MiB
डेटासेट का आकार :
187.66 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): केवल जब
shuffle_files=False
(ट्रेन)विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 660,161 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'sl': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
एन | मूलपाठ | डोरी | ||
क्र | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('en', 'sl')
उदाहरण ( tfds.as_dataframe ):
पैरा_क्रॉल/ensv
कॉन्फिग विवरण : अंग्रेजी से sv में अनुवाद डेटासेट।
डाउनलोड आकार :
262.76 MiB
डेटासेट का आकार :
905.72 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'train' | 3,476,729 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'sv': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
एन | मूलपाठ | डोरी | ||
एसवी | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
दस्तावेज़ देखें):('en', 'sv')
उदाहरण ( tfds.as_dataframe ):