- الوصف :
تم استخراج هذه البيانات من مجموعة تاتويبا ، بتاريخ السبت 2018/11/17.
لكل لغة ، اخترنا 1000 جملة إنجليزية وترجماتها ، إن وجدت. يرجى مراجعة هذه الورقة للحصول على وصف للغات وعائلاتهم ونصوصهم بالإضافة إلى النتائج الأساسية.
يرجى ملاحظة أن الجمل الإنجليزية ليست متطابقة لجميع أزواج اللغات. هذا يعني أن النتائج لا يمكن مقارنتها بشكل مباشر عبر اللغات.
الصفحة الرئيسية : http://opus.nlpl.eu/Tatoeba.php
كود المصدر :
tfds.datasets.tatoeba.Builder
إصدارات :
-
1.0.0
(افتراضي): الإصدار الأولي.
-
التخزين المؤقت التلقائي ( الوثائق ): نعم
هيكل الميزة :
FeaturesDict({
'source_language': Text(shape=(), dtype=string),
'source_sentence': Text(shape=(), dtype=string),
'target_language': Text(shape=(), dtype=string),
'target_sentence': Text(shape=(), dtype=string),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
المصدر_اللغة | نص | خيط | ||
المصدر | نص | خيط | ||
الهدف_اللغة | نص | خيط | ||
target_sentence | نص | خيط |
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised
):None
الشكل ( tfds.show_examples ): غير مدعوم.
الاقتباس :
@article{tatoeba,
title={Massively Multilingual Sentence Embeddings for Zero-Shot
Cross-Lingual Transfer and Beyond},
author={Mikel, Artetxe and Holger, Schwenk,},
journal={arXiv:1812.10464v2},
year={2018}
}
@InProceedings{TIEDEMANN12.463,
author = {J{\"o}rg}rg Tiedemann},
title = {Parallel Data, Tools and Interfaces in OPUS},
booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
year = {2012},
month = {may},
date = {23-25},
address = {Istanbul, Turkey},
editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Ugur Dogan and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis},
publisher = {European Language Resources Association (ELRA)},
isbn = {978-2-9517408-7-7},
language = {english}
}
tatoeba / tatoeba_af (التكوين الافتراضي)
حجم التحميل :
58.24 KiB
حجم مجموعة البيانات :
162.74 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا_ار
حجم التحميل :
70.95 KiB
حجم مجموعة البيانات :
175.46 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا_بج
حجم التحميل :
99.88 KiB
حجم مجموعة البيانات :
204.64 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبة_بن
حجم التحميل :
89.55 KiB
حجم مجموعة البيانات :
194.24 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_de
حجم التحميل :
103.09 KiB
حجم مجموعة البيانات :
207.93 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_el
حجم التحميل :
77.11 KiB
حجم مجموعة البيانات :
181.65 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_es
حجم التحميل :
70.57 KiB
حجم مجموعة البيانات :
175.12 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_et
حجم التحميل :
58.33 KiB
حجم مجموعة البيانات :
162.85 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_eu
حجم التحميل :
64.52 KiB
حجم مجموعة البيانات :
169.02 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا_فا
حجم التحميل :
91.52 KiB
حجم مجموعة البيانات :
196.15 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_fi
حجم التحميل :
73.90 KiB
حجم مجموعة البيانات :
178.47 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا_فر
حجم التحميل :
78.14 KiB
حجم مجموعة البيانات :
182.68 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا
حجم التحميل :
81.54 KiB
حجم مجموعة البيانات :
186.15 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا
حجم التحميل :
119.69 KiB
حجم مجموعة البيانات :
224.89 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا
حجم التحميل :
67.27 KiB
حجم مجموعة البيانات :
171.78 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_id
حجم التحميل :
73.09 KiB
حجم مجموعة البيانات :
177.61 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا_يت
حجم التحميل :
64.29 KiB
حجم مجموعة البيانات :
168.81 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا_جا
حجم التحميل :
90.90 KiB
حجم مجموعة البيانات :
195.53 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_jv
حجم التحميل :
13.59 KiB
حجم مجموعة البيانات :
35.01 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 205 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_ka
حجم التحميل :
70.47 KiB
حجم مجموعة البيانات :
148.67 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 746 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا_كك
حجم التحميل :
46.07 KiB
حجم مجموعة البيانات :
106.25 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 575 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا_كو
حجم التحميل :
77.28 KiB
حجم مجموعة البيانات :
181.88 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا_ مل
حجم التحميل :
92.50 KiB
حجم مجموعة البيانات :
165.14 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 687 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا_مر
حجم التحميل :
98.19 KiB
حجم مجموعة البيانات :
202.96 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_nl
حجم التحميل :
71.55 KiB
حجم مجموعة البيانات :
176.10 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_pt
حجم التحميل :
73.42 KiB
حجم مجموعة البيانات :
177.95 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_ru
حجم التحميل :
90.30 KiB
حجم مجموعة البيانات :
194.92 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_sw
حجم التحميل :
19.99 KiB
حجم مجموعة البيانات :
60.75 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 390 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا_تا
حجم التحميل :
38.52 KiB
حجم مجموعة البيانات :
70.93 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 307 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا
حجم التحميل :
24.55 KiB
حجم مجموعة البيانات :
49.07 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 234 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا
حجم التحميل :
61.72 KiB
حجم مجموعة البيانات :
119.32 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 548 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_tl
حجم التحميل :
66.54 KiB
حجم مجموعة البيانات :
171.04 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا_تر
حجم التحميل :
70.20 KiB
حجم مجموعة البيانات :
174.70 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_ur
حجم التحميل :
86.63 KiB
حجم مجموعة البيانات :
191.20 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_vi
حجم التحميل :
89.26 KiB
حجم مجموعة البيانات :
193.89 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_zh
حجم التحميل :
67.32 KiB
حجم مجموعة البيانات :
171.85 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
- الوصف :
تم استخراج هذه البيانات من مجموعة تاتويبا ، بتاريخ السبت 2018/11/17.
لكل لغة ، اخترنا 1000 جملة إنجليزية وترجماتها ، إن وجدت. يرجى مراجعة هذه الورقة للحصول على وصف للغات وعائلاتهم ونصوصهم بالإضافة إلى النتائج الأساسية.
يرجى ملاحظة أن الجمل الإنجليزية ليست متطابقة لجميع أزواج اللغات. هذا يعني أن النتائج لا يمكن مقارنتها بشكل مباشر عبر اللغات.
الصفحة الرئيسية : http://opus.nlpl.eu/Tatoeba.php
كود المصدر :
tfds.datasets.tatoeba.Builder
إصدارات :
-
1.0.0
(افتراضي): الإصدار الأولي.
-
التخزين المؤقت التلقائي ( الوثائق ): نعم
هيكل الميزة :
FeaturesDict({
'source_language': Text(shape=(), dtype=string),
'source_sentence': Text(shape=(), dtype=string),
'target_language': Text(shape=(), dtype=string),
'target_sentence': Text(shape=(), dtype=string),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
المصدر_اللغة | نص | خيط | ||
المصدر | نص | خيط | ||
الهدف_اللغة | نص | خيط | ||
target_sentence | نص | خيط |
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised
):None
الشكل ( tfds.show_examples ): غير مدعوم.
الاقتباس :
@article{tatoeba,
title={Massively Multilingual Sentence Embeddings for Zero-Shot
Cross-Lingual Transfer and Beyond},
author={Mikel, Artetxe and Holger, Schwenk,},
journal={arXiv:1812.10464v2},
year={2018}
}
@InProceedings{TIEDEMANN12.463,
author = {J{\"o}rg}rg Tiedemann},
title = {Parallel Data, Tools and Interfaces in OPUS},
booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
year = {2012},
month = {may},
date = {23-25},
address = {Istanbul, Turkey},
editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Ugur Dogan and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis},
publisher = {European Language Resources Association (ELRA)},
isbn = {978-2-9517408-7-7},
language = {english}
}
tatoeba / tatoeba_af (التكوين الافتراضي)
حجم التحميل :
58.24 KiB
حجم مجموعة البيانات :
162.74 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا_ار
حجم التحميل :
70.95 KiB
حجم مجموعة البيانات :
175.46 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا_بج
حجم التحميل :
99.88 KiB
حجم مجموعة البيانات :
204.64 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبة_بن
حجم التحميل :
89.55 KiB
حجم مجموعة البيانات :
194.24 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_de
حجم التحميل :
103.09 KiB
حجم مجموعة البيانات :
207.93 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_el
حجم التحميل :
77.11 KiB
حجم مجموعة البيانات :
181.65 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_es
حجم التحميل :
70.57 KiB
حجم مجموعة البيانات :
175.12 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_et
حجم التحميل :
58.33 KiB
حجم مجموعة البيانات :
162.85 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_eu
حجم التحميل :
64.52 KiB
حجم مجموعة البيانات :
169.02 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا_فا
حجم التحميل :
91.52 KiB
حجم مجموعة البيانات :
196.15 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_fi
حجم التحميل :
73.90 KiB
حجم مجموعة البيانات :
178.47 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا_فر
حجم التحميل :
78.14 KiB
حجم مجموعة البيانات :
182.68 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا
حجم التحميل :
81.54 KiB
حجم مجموعة البيانات :
186.15 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا
حجم التحميل :
119.69 KiB
حجم مجموعة البيانات :
224.89 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا
حجم التحميل :
67.27 KiB
حجم مجموعة البيانات :
171.78 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_id
حجم التحميل :
73.09 KiB
حجم مجموعة البيانات :
177.61 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا_يت
حجم التحميل :
64.29 KiB
حجم مجموعة البيانات :
168.81 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا_جا
حجم التحميل :
90.90 KiB
حجم مجموعة البيانات :
195.53 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_jv
حجم التحميل :
13.59 KiB
حجم مجموعة البيانات :
35.01 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 205 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_ka
حجم التحميل :
70.47 KiB
حجم مجموعة البيانات :
148.67 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 746 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا_كك
حجم التحميل :
46.07 KiB
حجم مجموعة البيانات :
106.25 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 575 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا_كو
حجم التحميل :
77.28 KiB
حجم مجموعة البيانات :
181.88 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا_ مل
حجم التحميل :
92.50 KiB
حجم مجموعة البيانات :
165.14 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 687 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا_مر
حجم التحميل :
98.19 KiB
حجم مجموعة البيانات :
202.96 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_nl
حجم التحميل :
71.55 KiB
حجم مجموعة البيانات :
176.10 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_pt
حجم التحميل :
73.42 KiB
حجم مجموعة البيانات :
177.95 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_ru
حجم التحميل :
90.30 KiB
حجم مجموعة البيانات :
194.92 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_sw
حجم التحميل :
19.99 KiB
حجم مجموعة البيانات :
60.75 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 390 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا_تا
حجم التحميل :
38.52 KiB
حجم مجموعة البيانات :
70.93 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 307 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا
حجم التحميل :
24.55 KiB
حجم مجموعة البيانات :
49.07 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 234 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا
حجم التحميل :
61.72 KiB
حجم مجموعة البيانات :
119.32 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 548 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_tl
حجم التحميل :
66.54 KiB
حجم مجموعة البيانات :
171.04 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
تتويبا / تتويبا_تر
حجم التحميل :
70.20 KiB
حجم مجموعة البيانات :
174.70 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_ur
حجم التحميل :
86.63 KiB
حجم مجموعة البيانات :
191.20 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_vi
حجم التحميل :
89.26 KiB
حجم مجموعة البيانات :
193.89 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):
tatoeba / tatoeba_zh
حجم التحميل :
67.32 KiB
حجم مجموعة البيانات :
171.85 KiB
الانقسامات :
ينقسم | أمثلة |
---|---|
'train' | 1،000 |
- أمثلة ( tfds.as_dataframe ):