- বর্ণনা :
শনিবার 2018/11/17 তারিখে, Tatoeba কর্পাস থেকে এই ডেটা নেওয়া হয়েছে৷
প্রতিটি ভাষার জন্য, আমরা 1000টি ইংরেজি বাক্য এবং তাদের অনুবাদ, যদি উপলব্ধ থাকে, নির্বাচন করেছি। ভাষা, তাদের পরিবার এবং স্ক্রিপ্টের পাশাপাশি বেসলাইন ফলাফলের বিবরণের জন্য অনুগ্রহ করে এই কাগজটি দেখুন।
অনুগ্রহ করে মনে রাখবেন যে ইংরেজি বাক্য সব ভাষার জোড়ার জন্য অভিন্ন নয়। এর মানে হল যে ফলাফলগুলি ভাষা জুড়ে সরাসরি তুলনীয় নয়।
হোমপেজ : http://opus.nlpl.eu/Tatoeba.php
সোর্স কোড :
tfds.datasets.tatoeba.Builder
সংস্করণ :
-
1.0.0
(ডিফল্ট): প্রাথমিক প্রকাশ।
-
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বৈশিষ্ট্য গঠন :
FeaturesDict({
'source_language': Text(shape=(), dtype=string),
'source_sentence': Text(shape=(), dtype=string),
'target_language': Text(shape=(), dtype=string),
'target_sentence': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
উৎস ভাষা | পাঠ্য | স্ট্রিং | ||
উৎস_বাক্য | পাঠ্য | স্ট্রিং | ||
সুনির্দিষ্ট ভাষা | পাঠ্য | স্ট্রিং | ||
লক্ষ্য_বাক্য | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদ্ধৃতি :
@article{tatoeba,
title={Massively Multilingual Sentence Embeddings for Zero-Shot
Cross-Lingual Transfer and Beyond},
author={Mikel, Artetxe and Holger, Schwenk,},
journal={arXiv:1812.10464v2},
year={2018}
}
@InProceedings{TIEDEMANN12.463,
author = {J{\"o}rg}rg Tiedemann},
title = {Parallel Data, Tools and Interfaces in OPUS},
booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
year = {2012},
month = {may},
date = {23-25},
address = {Istanbul, Turkey},
editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Ugur Dogan and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis},
publisher = {European Language Resources Association (ELRA)},
isbn = {978-2-9517408-7-7},
language = {english}
}
tatoeba/tatoeba_af (ডিফল্ট কনফিগারেশন)
ডাউনলোডের আকার :
58.24 KiB
ডেটাসেটের আকার :
162.74 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_ar
ডাউনলোড সাইজ :
70.95 KiB
ডেটাসেটের আকার :
175.46 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_bg
ডাউনলোড সাইজ :
99.88 KiB
ডেটাসেটের আকার :
204.64 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_bn
ডাউনলোড সাইজ :
89.55 KiB
ডেটাসেটের আকার :
194.24 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_de
ডাউনলোড সাইজঃ
103.09 KiB
ডেটাসেটের আকার :
207.93 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_el
ডাউনলোড সাইজঃ
77.11 KiB
ডেটাসেটের আকার :
181.65 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_es
ডাউনলোড সাইজ :
70.57 KiB
ডেটাসেটের আকার :
175.12 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_et
ডাউনলোড সাইজ :
58.33 KiB
ডেটাসেটের আকার :
162.85 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_eu
ডাউনলোড সাইজ :
64.52 KiB
ডেটাসেটের আকার :
169.02 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_fa
ডাউনলোড সাইজ :
91.52 KiB
ডেটাসেটের আকার :
196.15 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_fi
ডাউনলোড সাইজ :
73.90 KiB
ডেটাসেটের আকার :
178.47 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_fr
ডাউনলোড সাইজঃ
78.14 KiB
ডেটাসেটের আকার :
182.68 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_he
ডাউনলোড সাইজঃ
81.54 KiB
ডেটাসেটের আকার :
186.15 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_hi
ডাউনলোড সাইজ :
119.69 KiB
ডেটাসেটের আকার :
224.89 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_hu
ডাউনলোড সাইজ :
67.27 KiB
ডেটাসেটের আকার :
171.78 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_id
ডাউনলোড সাইজঃ
73.09 KiB
ডেটাসেটের আকার :
177.61 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_it
ডাউনলোড সাইজ :
64.29 KiB
ডেটাসেটের আকার :
168.81 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_ja
ডাউনলোড সাইজ :
90.90 KiB
ডেটাসেটের আকার :
195.53 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_jv
ডাউনলোড আকার :
13.59 KiB
ডেটাসেটের আকার :
35.01 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 205 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_ka
ডাউনলোড সাইজ :
70.47 KiB
ডেটাসেটের আকার :
148.67 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 746 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_kk
ডাউনলোড সাইজ :
46.07 KiB
ডেটাসেটের আকার :
106.25 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 575 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_ko
ডাউনলোড সাইজঃ
77.28 KiB
ডেটাসেটের আকার :
181.88 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_ml
ডাউনলোড সাইজঃ
92.50 KiB
ডেটাসেটের আকার :
165.14 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 687 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_mr
ডাউনলোড সাইজ :
98.19 KiB
ডেটাসেটের আকার :
202.96 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_nl
ডাউনলোড সাইজ :
71.55 KiB
ডেটাসেটের আকার :
176.10 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_pt
ডাউনলোড সাইজঃ
73.42 KiB
ডেটাসেটের আকার :
177.95 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_ru
ডাউনলোডের আকার :
90.30 KiB
ডেটাসেটের আকার :
194.92 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_sw
ডাউনলোড সাইজ :
19.99 KiB
ডেটাসেটের আকার :
60.75 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 390 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_ta
ডাউনলোড সাইজ :
38.52 KiB
ডেটাসেটের আকার :
70.93 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 307 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_te
ডাউনলোড সাইজ :
24.55 KiB
ডেটাসেটের আকার :
49.07 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 234 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_th
ডাউনলোড সাইজ :
61.72 KiB
ডেটাসেটের আকার :
119.32 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 548 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_tl
ডাউনলোড সাইজ :
66.54 KiB
ডেটাসেটের আকার :
171.04 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_tr
ডাউনলোড সাইজ :
70.20 KiB
ডেটাসেটের আকার :
174.70 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_ur
ডাউনলোড সাইজ :
86.63 KiB
ডেটাসেটের আকার :
191.20 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_vi
ডাউনলোড সাইজঃ
89.26 KiB
ডেটাসেটের আকার :
193.89 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- উদাহরণ ( tfds.as_dataframe ):
tatoeba/tatoeba_zh
ডাউনলোড সাইজ :
67.32 KiB
ডেটাসেটের আকার :
171.85 KiB
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,000 |
- উদাহরণ ( tfds.as_dataframe ):