রচনা

  • বর্ণনা :

OPUS হল ওয়েব থেকে অনূদিত পাঠ্যের একটি সংগ্রহ৷

কোন ডেটা/ভাষা জোড়া লোড করতে হবে তা বেছে নিতে আপনার নিজস্ব কনফিগারেশন তৈরি করুন।

config = tfds.translate.opus.OpusConfig(
    version=tfds.core.Version('0.1.0'),
    language_pair=("de", "en"),
    subsets=["GNOME", "EMEA"]
)
builder = tfds.builder("opus", config=config)
Translation({
    'de': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
অনুবাদ
ডি পাঠ্য স্ট্রিং
en পাঠ্য স্ট্রিং
  • তত্ত্বাবধান করা কী (দেখুন as_supervised doc ): ('de', 'en')

  • চিত্র ( tfds.show_examples ): সমর্থিত নয়।

  • উদ্ধৃতি :

@inproceedings{Tiedemann2012ParallelData,
  author = {Tiedemann, J},
  title = {Parallel Data, Tools and Interfaces in OPUS},
  booktitle = {LREC}
  year = {2012} }

ওপাস/মেডিকেল (ডিফল্ট কনফিগারেশন)

  • কনফিগারেশনের বিবরণ : মেডিকেল নথি

  • ডাউনলোড আকার : 34.29 MiB

  • ডেটাসেটের আকার : 188.85 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): শুধুমাত্র যখন shuffle_files=False (ট্রেন)

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 1,108,752

রচনা/আইন

  • কনফিগার বিবরণ : আইন নথি

  • ডাউনলোডের আকার : 46.99 MiB

  • ডেটাসেটের আকার : 214.44 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): শুধুমাত্র যখন shuffle_files=False (ট্রেন)

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 719,372

রচনা/কোরান

  • কনফিগারেশনের বিবরণ : কোরান নথি

  • ডাউনলোড সাইজ : 35.42 MiB

  • ডেটাসেটের আকার : 117.54 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 537,128

রচনা/আইটি

  • কনফিগারেশনের বিবরণ : আইটি নথি

  • ডাউনলোড সাইজ : 10.33 MiB

  • ডেটাসেটের আকার : 42.51 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 347,817

রচনা/সাবটাইটেল

  • কনফিগারেশনের বিবরণ : সাবটাইটেল নথি

  • ডাউনলোড সাইজ : 677.64 MiB

  • ডেটাসেটের আকার : 2.01 GiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না

  • বিভাজন :

বিভক্ত উদাহরণ
'train' 22,512,639