tatoeba

  • বর্ণনা :

শনিবার 2018/11/17 তারিখে, Tatoeba কর্পাস থেকে এই ডেটা নেওয়া হয়েছে৷

প্রতিটি ভাষার জন্য, আমরা 1000টি ইংরেজি বাক্য এবং তাদের অনুবাদ, যদি উপলব্ধ থাকে, নির্বাচন করেছি। ভাষা, তাদের পরিবার এবং স্ক্রিপ্টের পাশাপাশি বেসলাইন ফলাফলের বিবরণের জন্য অনুগ্রহ করে এই কাগজটি দেখুন।

অনুগ্রহ করে মনে রাখবেন যে ইংরেজি বাক্য সব ভাষার জোড়ার জন্য অভিন্ন নয়। এর মানে হল যে ফলাফলগুলি ভাষা জুড়ে সরাসরি তুলনীয় নয়।

FeaturesDict({
    'source_language': Text(shape=(), dtype=string),
    'source_sentence': Text(shape=(), dtype=string),
    'target_language': Text(shape=(), dtype=string),
    'target_sentence': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
উৎস ভাষা পাঠ্য স্ট্রিং
উৎস_বাক্য পাঠ্য স্ট্রিং
সুনির্দিষ্ট ভাষা পাঠ্য স্ট্রিং
লক্ষ্য_বাক্য পাঠ্য স্ট্রিং
  • তত্ত্বাবধান করা কী (দেখুন as_supervised doc ): None

  • চিত্র ( tfds.show_examples ): সমর্থিত নয়।

  • উদ্ধৃতি :

@article{tatoeba,
          title={Massively Multilingual Sentence Embeddings for Zero-Shot
                   Cross-Lingual Transfer and Beyond},
          author={Mikel, Artetxe and Holger, Schwenk,},
          journal={arXiv:1812.10464v2},
          year={2018}
}

@InProceedings{TIEDEMANN12.463,
  author = {J{\"o}rg}rg Tiedemann},
  title = {Parallel Data, Tools and Interfaces in OPUS},
  booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
  year = {2012},
  month = {may},
  date = {23-25},
  address = {Istanbul, Turkey},
  editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Ugur Dogan and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis},
  publisher = {European Language Resources Association (ELRA)},
  isbn = {978-2-9517408-7-7},
  language = {english}
}

tatoeba/tatoeba_af (ডিফল্ট কনফিগারেশন)

  • ডাউনলোডের আকার : 58.24 KiB

  • ডেটাসেটের আকার : 162.74 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000

tatoeba/tatoeba_ar

  • ডাউনলোড সাইজ : 70.95 KiB

  • ডেটাসেটের আকার : 175.46 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000

tatoeba/tatoeba_bg

  • ডাউনলোড সাইজ : 99.88 KiB

  • ডেটাসেটের আকার : 204.64 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000

tatoeba/tatoeba_bn

  • ডাউনলোড সাইজ : 89.55 KiB

  • ডেটাসেটের আকার : 194.24 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000

tatoeba/tatoeba_de

  • ডাউনলোড সাইজঃ 103.09 KiB

  • ডেটাসেটের আকার : 207.93 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000

tatoeba/tatoeba_el

  • ডাউনলোড সাইজঃ 77.11 KiB

  • ডেটাসেটের আকার : 181.65 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000

tatoeba/tatoeba_es

  • ডাউনলোড সাইজ : 70.57 KiB

  • ডেটাসেটের আকার : 175.12 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000

tatoeba/tatoeba_et

  • ডাউনলোড সাইজ : 58.33 KiB

  • ডেটাসেটের আকার : 162.85 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000

tatoeba/tatoeba_eu

  • ডাউনলোড সাইজ : 64.52 KiB

  • ডেটাসেটের আকার : 169.02 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000

tatoeba/tatoeba_fa

  • ডাউনলোড সাইজ : 91.52 KiB

  • ডেটাসেটের আকার : 196.15 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000

tatoeba/tatoeba_fi

  • ডাউনলোড সাইজ : 73.90 KiB

  • ডেটাসেটের আকার : 178.47 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000

tatoeba/tatoeba_fr

  • ডাউনলোড সাইজঃ 78.14 KiB

  • ডেটাসেটের আকার : 182.68 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000

tatoeba/tatoeba_he

  • ডাউনলোড সাইজঃ 81.54 KiB

  • ডেটাসেটের আকার : 186.15 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000

tatoeba/tatoeba_hi

  • ডাউনলোড সাইজ : 119.69 KiB

  • ডেটাসেটের আকার : 224.89 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000

tatoeba/tatoeba_hu

  • ডাউনলোড সাইজ : 67.27 KiB

  • ডেটাসেটের আকার : 171.78 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000

tatoeba/tatoeba_id

  • ডাউনলোড সাইজঃ 73.09 KiB

  • ডেটাসেটের আকার : 177.61 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000

tatoeba/tatoeba_it

  • ডাউনলোড সাইজ : 64.29 KiB

  • ডেটাসেটের আকার : 168.81 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000

tatoeba/tatoeba_ja

  • ডাউনলোড সাইজ : 90.90 KiB

  • ডেটাসেটের আকার : 195.53 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000

tatoeba/tatoeba_jv

  • ডাউনলোড আকার : 13.59 KiB

  • ডেটাসেটের আকার : 35.01 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 205

tatoeba/tatoeba_ka

  • ডাউনলোড সাইজ : 70.47 KiB

  • ডেটাসেটের আকার : 148.67 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 746

tatoeba/tatoeba_kk

  • ডাউনলোড সাইজ : 46.07 KiB

  • ডেটাসেটের আকার : 106.25 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 575

tatoeba/tatoeba_ko

  • ডাউনলোড সাইজঃ 77.28 KiB

  • ডেটাসেটের আকার : 181.88 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000

tatoeba/tatoeba_ml

  • ডাউনলোড সাইজঃ 92.50 KiB

  • ডেটাসেটের আকার : 165.14 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 687

tatoeba/tatoeba_mr

  • ডাউনলোড সাইজ : 98.19 KiB

  • ডেটাসেটের আকার : 202.96 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000

tatoeba/tatoeba_nl

  • ডাউনলোড সাইজ : 71.55 KiB

  • ডেটাসেটের আকার : 176.10 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000

tatoeba/tatoeba_pt

  • ডাউনলোড সাইজঃ 73.42 KiB

  • ডেটাসেটের আকার : 177.95 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000

tatoeba/tatoeba_ru

  • ডাউনলোডের আকার : 90.30 KiB

  • ডেটাসেটের আকার : 194.92 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000

tatoeba/tatoeba_sw

  • ডাউনলোড সাইজ : 19.99 KiB

  • ডেটাসেটের আকার : 60.75 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 390

tatoeba/tatoeba_ta

  • ডাউনলোড সাইজ : 38.52 KiB

  • ডেটাসেটের আকার : 70.93 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 307

tatoeba/tatoeba_te

  • ডাউনলোড সাইজ : 24.55 KiB

  • ডেটাসেটের আকার : 49.07 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 234

tatoeba/tatoeba_th

  • ডাউনলোড সাইজ : 61.72 KiB

  • ডেটাসেটের আকার : 119.32 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 548

tatoeba/tatoeba_tl

  • ডাউনলোড সাইজ : 66.54 KiB

  • ডেটাসেটের আকার : 171.04 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000

tatoeba/tatoeba_tr

  • ডাউনলোড সাইজ : 70.20 KiB

  • ডেটাসেটের আকার : 174.70 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000

tatoeba/tatoeba_ur

  • ডাউনলোড সাইজ : 86.63 KiB

  • ডেটাসেটের আকার : 191.20 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000

tatoeba/tatoeba_vi

  • ডাউনলোড সাইজঃ 89.26 KiB

  • ডেটাসেটের আকার : 193.89 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000

tatoeba/tatoeba_zh

  • ডাউনলোড সাইজ : 67.32 KiB

  • ডেটাসেটের আকার : 171.85 KiB

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,000