पैरा_क्रॉल

  • विवरण :

आधिकारिक यूरोपीय भाषाओं के लिए वेब-स्केल समानांतर कॉर्पोरा।

@misc {paracrawl,
    title  = "ParaCrawl",
    year   = "2018",
    url    = "http://paracrawl.eu/download.html."
}

para_crawl/enbg (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • विन्यास विवरण : अंग्रेजी से बीजी के लिए अनुवाद डेटासेट।

  • डाउनलोड आकार : 98.94 MiB

  • डेटासेट का आकार : 362.46 MiB

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,039,885
  • फ़ीचर संरचना :
Translation({
    'bg': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
बीजी मूलपाठ डोरी
एन मूलपाठ डोरी

पैरा_क्रॉल/encs

  • विन्यास विवरण : अंग्रेजी से सीएस के लिए अनुवाद डेटासेट।

  • डाउनलोड आकार : 187.31 MiB

  • डेटासेट का आकार : 666.34 MiB

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं

  • विभाजन :

विभाजित करना उदाहरण
'train' 2,981,949
  • फ़ीचर संरचना :
Translation({
    'cs': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
सीएस मूलपाठ डोरी
एन मूलपाठ डोरी

para_crawl/enda

  • कॉन्फिग विवरण : अंग्रेजी से डीए में अनुवाद डेटासेट।

  • डाउनलोड आकार : 174.34 MiB

  • डेटासेट का आकार : 619.77 MiB

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं

  • विभाजन :

विभाजित करना उदाहरण
'train' 2,414,895
  • फ़ीचर संरचना :
Translation({
    'da': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
दा मूलपाठ डोरी
एन मूलपाठ डोरी

para_crawl/ende

  • कॉन्फ़िग विवरण : अनुवाद डेटासेट अंग्रेज़ी से de.

  • डाउनलोड आकार : 1.22 GiB

  • डेटासेट का आकार : 4.04 GiB

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं

  • विभाजन :

विभाजित करना उदाहरण
'train' 16,264,448
  • फ़ीचर संरचना :
Translation({
    'de': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
डे मूलपाठ डोरी
एन मूलपाठ डोरी

पैरा_क्रॉल/enel

  • कॉन्फिग विवरण : अंग्रेजी से el में अनुवाद डेटासेट।

  • डाउनलोड आकार : 184.59 MiB

  • डेटासेट का आकार : 698.75 MiB

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,985,233
  • फ़ीचर संरचना :
Translation({
    'el': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
एल मूलपाठ डोरी
एन मूलपाठ डोरी

para_crawl/enes

  • कॉन्फ़िग विवरण : अनुवाद डेटासेट अंग्रेज़ी से es.

  • डाउनलोड आकार : 1.82 GiB

  • डेटासेट का आकार : 6.23 GiB

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं

  • विभाजन :

विभाजित करना उदाहरण
'train' 21,987,267
  • फ़ीचर संरचना :
Translation({
    'en': Text(shape=(), dtype=string),
    'es': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
एन मूलपाठ डोरी
तों मूलपाठ डोरी

पैरा_क्रॉल/एनेट

  • कॉन्फिग विवरण : अंग्रेजी से एट में अनुवाद डेटासेट।

  • डाउनलोड आकार : 66.91 MiB

  • डेटासेट का आकार : 209.16 MiB

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): केवल जब shuffle_files=False (ट्रेन)

  • विभाजन :

विभाजित करना उदाहरण
'train' 853,422
  • फ़ीचर संरचना :
Translation({
    'en': Text(shape=(), dtype=string),
    'et': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
एन मूलपाठ डोरी
एट मूलपाठ डोरी

पैरा_क्रॉल/enfi

  • कॉन्फिग विवरण : अंग्रेजी से फाई में अनुवाद डेटासेट।

  • डाउनलोड आकार : 151.83 MiB

  • डेटासेट का आकार : 543.85 MiB

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं

  • विभाजन :

विभाजित करना उदाहरण
'train' 2,156,069
  • फ़ीचर संरचना :
Translation({
    'en': Text(shape=(), dtype=string),
    'fi': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
एन मूलपाठ डोरी
फाई मूलपाठ डोरी

पैरा_क्रॉल/enfr

  • कॉन्फ़िग विवरण : अनुवाद डेटासेट अंग्रेज़ी से fr.

  • डाउनलोड आकार : 2.63 GiB

  • डेटासेट का आकार : 9.04 GiB

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं

  • विभाजन :

विभाजित करना उदाहरण
'train' 31,374,161
  • फ़ीचर संरचना :
Translation({
    'en': Text(shape=(), dtype=string),
    'fr': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
एन मूलपाठ डोरी
फादर मूलपाठ डोरी

para_crawl/enga

  • कॉन्फिग विवरण : अंग्रेजी से ga में अनुवाद डेटासेट।

  • डाउनलोड आकार : 28.03 MiB

  • डेटासेट का आकार : 107.09 MiB

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ

  • विभाजन :

विभाजित करना उदाहरण
'train' 357,399
  • फ़ीचर संरचना :
Translation({
    'en': Text(shape=(), dtype=string),
    'ga': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
एन मूलपाठ डोरी
गा मूलपाठ डोरी

पैरा_क्रॉल/enhr

  • कॉन्फिग विवरण : अनुवाद डेटासेट अंग्रेजी से घंटा।

  • डाउनलोड आकार : 80.97 MiB

  • डेटासेट का आकार : 256.37 MiB

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,002,053
  • फ़ीचर संरचना :
Translation({
    'en': Text(shape=(), dtype=string),
    'hr': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
एन मूलपाठ डोरी
मानव संसाधन मूलपाठ डोरी

para_crawl/enhu

  • कॉन्फिग विवरण : अंग्रेजी से हू तक अनुवाद डेटासेट।

  • डाउनलोड का आकार : 114.24 MiB

  • डेटासेट का आकार : 421.40 MiB

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,901,342
  • फ़ीचर संरचना :
Translation({
    'en': Text(shape=(), dtype=string),
    'hu': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
एन मूलपाठ डोरी
हू मूलपाठ डोरी

पैरा_क्रॉल/enit

  • कॉन्फ़िग विवरण : डेटासेट का अंग्रेजी से अनुवाद।

  • डाउनलोड आकार : 1017.30 MiB

  • डेटासेट का आकार : 3.36 GiB

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं

  • विभाजन :

विभाजित करना उदाहरण
'train' 12,162,239
  • फ़ीचर संरचना :
Translation({
    'en': Text(shape=(), dtype=string),
    'it': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
एन मूलपाठ डोरी
यह मूलपाठ डोरी

पैरा_क्रॉल/enlt

  • विन्यास विवरण : अंग्रेजी से लेफ्टिनेंट तक अनुवाद डेटासेट।

  • डाउनलोड आकार : 63.28 MiB

  • डेटासेट का आकार : 204.70 MiB

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): केवल जब shuffle_files=False (ट्रेन)

  • विभाजन :

विभाजित करना उदाहरण
'train' 844,643
  • फ़ीचर संरचना :
Translation({
    'en': Text(shape=(), dtype=string),
    'lt': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
एन मूलपाठ डोरी
लेफ्टिनेंट मूलपाठ डोरी

पैरा_क्रॉल/enlv

  • विन्यास विवरण : अंग्रेजी से lv में अनुवाद डेटासेट।

  • डाउनलोड आकार : 45.17 MiB

  • डेटासेट का आकार : 147.09 MiB

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): केवल जब shuffle_files=False (ट्रेन)

  • विभाजन :

विभाजित करना उदाहरण
'train' 553,060
  • फ़ीचर संरचना :
Translation({
    'en': Text(shape=(), dtype=string),
    'lv': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
एन मूलपाठ डोरी
एल.वी मूलपाठ डोरी

पैरा_क्रॉल/enmt

  • कॉन्फिग विवरण : अंग्रेजी से एमटी में अनुवाद डेटासेट।

  • डाउनलोड आकार : 18.15 MiB

  • डेटासेट का आकार : 54.36 MiB

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ

  • विभाजन :

विभाजित करना उदाहरण
'train' 195,502
  • फ़ीचर संरचना :
Translation({
    'en': Text(shape=(), dtype=string),
    'mt': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
एन मूलपाठ डोरी
मीट्रिक टन मूलपाठ डोरी

पैरा_क्रॉल/ennl

  • कॉन्फ़िग विवरण : अंग्रेज़ी से nl में अनुवाद डेटासेट।

  • डाउनलोड आकार : 400.63 MiB

  • डेटासेट का आकार : 1.40 GiB

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं

  • विभाजन :

विभाजित करना उदाहरण
'train' 5,659,268
  • फ़ीचर संरचना :
Translation({
    'en': Text(shape=(), dtype=string),
    'nl': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
एन मूलपाठ डोरी
nl मूलपाठ डोरी

पैरा_क्रॉल/enpl

  • कॉन्फिग विवरण : अंग्रेजी से पीएल में अनुवाद डेटासेट।

  • डाउनलोड आकार : 257.90 MiB

  • डेटासेट का आकार : 885.63 MiB

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं

  • विभाजन :

विभाजित करना उदाहरण
'train' 3,503,276
  • फ़ीचर संरचना :
Translation({
    'en': Text(shape=(), dtype=string),
    'pl': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
एन मूलपाठ डोरी
पी एल मूलपाठ डोरी

पैरा_क्रॉल/enpt

  • विन्यास विवरण : अंग्रेजी से पीटी के लिए अनुवाद डेटासेट।

  • डाउनलोड आकार : 608.62 MiB

  • डेटासेट का आकार : 2.05 GiB

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं

  • विभाजन :

विभाजित करना उदाहरण
'train' 8,141,940
  • फ़ीचर संरचना :
Translation({
    'en': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
एन मूलपाठ डोरी
पं मूलपाठ डोरी

para_crawl/enro

  • कॉन्फिग विवरण : अंग्रेजी से आरओ में अनुवाद डेटासेट।

  • डाउनलोड आकार : 153.24 MiB

  • डेटासेट का आकार : 534.34 MiB

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,952,043
  • फ़ीचर संरचना :
Translation({
    'en': Text(shape=(), dtype=string),
    'ro': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
एन मूलपाठ डोरी
आरओ मूलपाठ डोरी

para_crawl/ensk

  • कॉन्फ़िग विवरण : अनुवाद डेटासेट अंग्रेज़ी से sk.

  • डाउनलोड आकार : 96.61 MiB

  • डेटासेट का आकार : 352.91 MiB

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं

  • विभाजन :

विभाजित करना उदाहरण
'train' 1,591,831
  • फ़ीचर संरचना :
Translation({
    'en': Text(shape=(), dtype=string),
    'sk': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
एन मूलपाठ डोरी
एसके मूलपाठ डोरी

पैरा_क्रॉल/ensl

  • विन्यास विवरण : अनुवाद डेटासेट अंग्रेजी से एसएल।

  • डाउनलोड आकार : 62.02 MiB

  • डेटासेट का आकार : 187.66 MiB

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): केवल जब shuffle_files=False (ट्रेन)

  • विभाजन :

विभाजित करना उदाहरण
'train' 660,161
  • फ़ीचर संरचना :
Translation({
    'en': Text(shape=(), dtype=string),
    'sl': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
एन मूलपाठ डोरी
क्र मूलपाठ डोरी

पैरा_क्रॉल/ensv

  • कॉन्फिग विवरण : अंग्रेजी से sv में अनुवाद डेटासेट।

  • डाउनलोड आकार : 262.76 MiB

  • डेटासेट का आकार : 905.72 MiB

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): नहीं

  • विभाजन :

विभाजित करना उदाहरण
'train' 3,476,729
  • फ़ीचर संरचना :
Translation({
    'en': Text(shape=(), dtype=string),
    'sv': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
अनुवाद
एन मूलपाठ डोरी
एसवी मूलपाठ डोरी