- विवरण :
समान भाषा युग्मों की तुलना करने के लिए टेड टॉक ट्रांस्क्रिप्ट से प्राप्त डेटा सेट जहां एक उच्च संसाधन है और दूसरा कम संसाधन है।
स्रोत कोड :
tfds.datasets.ted_hrlr_translate.Builder
संस्करण :
-
1.0.0
(डिफ़ॉल्ट): नया स्प्लिट एपीआई ( https://tensorflow.org/datasets/splits )
-
डाउनलोड आकार :
124.94 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उद्धरण :
@inproceedings{Ye2018WordEmbeddings,
author = {Ye, Qi and Devendra, Sachan and Matthieu, Felix and Sarguna, Padmanabhan and Graham, Neubig},
title = {When and Why are pre-trained word embeddings useful for Neural Machine Translation},
booktitle = {HLT-NAACL},
year = {2018},
}
ted_hrlr_translate/az_to_en (डिफ़ॉल्ट कॉन्फ़िगरेशन)
कॉन्फिग विवरण : सादा पाठ में एज़ से एन तक अनुवाद डेटासेट।
डेटासेट का आकार :
1.61 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 903 |
'train' | 5,946 |
'validation' | 671 |
- फ़ीचर संरचना :
Translation({
'az': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
अज़ | मूलपाठ | डोरी | ||
एन | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('az', 'en')
उदाहरण ( tfds.as_dataframe ):
ted_hrlr_translate/aztr_to_en
कॉन्फ़िग विवरण : सादे पाठ में डेटासेट का az_tr से en में अनुवाद।
डेटासेट का आकार :
42.54 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 903 |
'train' | 188,396 |
'validation' | 671 |
- फ़ीचर संरचना :
Translation({
'az_tr': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
az_tr | मूलपाठ | डोरी | ||
एन | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('az_tr', 'en')
उदाहरण ( tfds.as_dataframe ):
ted_hrlr_translate/be_to_en
कॉन्फिग विवरण : सादे पाठ में अनुवाद डेटासेट बी से एन तक।
डेटासेट का आकार :
1.47 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 664 |
'train' | 4,509 |
'validation' | 248 |
- फ़ीचर संरचना :
Translation({
'be': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
होना | मूलपाठ | डोरी | ||
एन | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):('be', 'en')
उदाहरण ( tfds.as_dataframe ):
ted_hrlr_translate/beru_to_en
कॉन्फ़िग विवरण : सादे पाठ में be_ru से en तक अनुवाद डेटासेट।
डेटासेट का आकार :
62.45 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 664 |
'train' | 212,614 |
'validation' | 248 |
- फ़ीचर संरचना :
Translation({
'be_ru': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
be_ru | मूलपाठ | डोरी | ||
एन | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('be_ru', 'en')
उदाहरण ( tfds.as_dataframe ):
ted_hrlr_translate/es_to_pt
कॉन्फ़िग विवरण : सादा पाठ में es से pt तक अनुवाद डेटासेट।
डेटासेट का आकार :
9.62 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 1,763 |
'train' | 44,938 |
'validation' | 1,016 |
- फ़ीचर संरचना :
Translation({
'es': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
तों | मूलपाठ | डोरी | ||
पं | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
दस्तावेज़ देखें):('es', 'pt')
उदाहरण ( tfds.as_dataframe ):
ted_hrlr_translate/fr_to_pt
कॉन्फ़िग विवरण : सादा पाठ में fr से pt तक अनुवाद डेटासेट।
डेटासेट का आकार :
9.74 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 1,494 |
'train' | 43,873 |
'validation' | 1,131 |
- फ़ीचर संरचना :
Translation({
'fr': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
फादर | मूलपाठ | डोरी | ||
पं | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
दस्तावेज़ देखें):('fr', 'pt')
उदाहरण ( tfds.as_dataframe ):
ted_hrlr_translate/gl_to_en
कॉन्फिग विवरण : सादा पाठ में जीएल से एन तक अनुवाद डेटासेट।
डेटासेट का आकार :
2.41 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 1,007 |
'train' | 10,017 |
'validation' | 682 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'gl': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
एन | मूलपाठ | डोरी | ||
जीएल | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('gl', 'en')
उदाहरण ( tfds.as_dataframe ):
ted_hrlr_translate/glpt_to_en
Config विवरण : सादा पाठ में अनुवाद डेटासेट gl_pt से en करने के लिए।
डेटासेट का आकार :
12.90 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 1,007 |
'train' | 61,802 |
'validation' | 682 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'gl_pt': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
एन | मूलपाठ | डोरी | ||
gl_pt | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
दस्तावेज़ देखें):('gl_pt', 'en')
उदाहरण ( tfds.as_dataframe ):
ted_hrlr_translate/he_to_pt
कॉन्फिग विवरण : सादे पाठ में अनुवाद डेटासेट से पीटी तक।
डेटासेट का आकार :
11.71 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 1,623 |
'train' | 48,511 |
'validation' | 1,145 |
- फ़ीचर संरचना :
Translation({
'he': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
वह | मूलपाठ | डोरी | ||
पं | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):('he', 'pt')
उदाहरण ( tfds.as_dataframe ):
ted_hrlr_translate/it_to_pt
Config विवरण : सादा पाठ में अनुवाद डेटासेट से pt करने के लिए।
डेटासेट का आकार :
9.94 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 1,669 |
'train' | 46,259 |
'validation' | 1,162 |
- फ़ीचर संरचना :
Translation({
'it': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
यह | मूलपाठ | डोरी | ||
पं | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('it', 'pt')
उदाहरण ( tfds.as_dataframe ):
ted_hrlr_translate/pt_to_en
कॉन्फिग विवरण : डेटासेट का पीटी से एन तक सादे पाठ में अनुवाद।
डेटासेट का आकार :
10.89 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 1,803 |
'train' | 51,785 |
'validation' | 1,193 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
एन | मूलपाठ | डोरी | ||
पं | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('pt', 'en')
उदाहरण ( tfds.as_dataframe ):
ted_hrlr_translate/ru_to_en
विन्यास विवरण : सादे पाठ में आरयू से एन तक अनुवाद डेटासेट।
डेटासेट का आकार :
63.22 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 5,476 |
'train' | 208,106 |
'validation' | 4,805 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
एन | मूलपाठ | डोरी | ||
आरयू | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('ru', 'en')
उदाहरण ( tfds.as_dataframe ):
ted_hrlr_translate/ru_to_pt
विन्यास विवरण : सादे पाठ में आरयू से पीटी तक अनुवाद डेटासेट।
डेटासेट का आकार :
13.00 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 1,588 |
'train' | 47,278 |
'validation' | 1,184 |
- फ़ीचर संरचना :
Translation({
'pt': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
पं | मूलपाठ | डोरी | ||
आरयू | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):('ru', 'pt')
उदाहरण ( tfds.as_dataframe ):
ted_hrlr_translate/tr_to_en
कॉन्फ़िग विवरण : ट्रांसलेशन डेटासेट tr से en में प्लेन टेक्स्ट में।
डेटासेट का आकार :
42.33 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 5,029 |
'train' | 182,450 |
'validation' | 4,045 |
- फ़ीचर संरचना :
Translation({
'en': Text(shape=(), dtype=string),
'tr': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
अनुवाद | ||||
एन | मूलपाठ | डोरी | ||
टी.आर. | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('tr', 'en')
उदाहरण ( tfds.as_dataframe ):