- বর্ণনা :
OPUS হল ওয়েব থেকে অনূদিত পাঠ্যের একটি সংগ্রহ৷
কোন ডেটা/ভাষা জোড়া লোড করতে হবে তা বেছে নিতে আপনার নিজস্ব কনফিগারেশন তৈরি করুন।
config = tfds.translate.opus.OpusConfig(
version=tfds.core.Version('0.1.0'),
language_pair=("de", "en"),
subsets=["GNOME", "EMEA"]
)
builder = tfds.builder("opus", config=config)
হোমপেজ : http://opus.nlpl.eu/
সোর্স কোড :
tfds.datasets.opus.Builder
সংস্করণ :
-
0.1.0
(ডিফল্ট): কোনো রিলিজ নোট নেই।
-
বৈশিষ্ট্য গঠন :
Translation({
'de': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
অনুবাদ | ||||
ডি | পাঠ্য | স্ট্রিং | ||
en | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):('de', 'en')
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদ্ধৃতি :
@inproceedings{Tiedemann2012ParallelData,
author = {Tiedemann, J},
title = {Parallel Data, Tools and Interfaces in OPUS},
booktitle = {LREC}
year = {2012} }
ওপাস/মেডিকেল (ডিফল্ট কনফিগারেশন)
কনফিগারেশনের বিবরণ : মেডিকেল নথি
ডাউনলোড আকার :
34.29 MiB
ডেটাসেটের আকার :
188.85 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): শুধুমাত্র যখন
shuffle_files=False
(ট্রেন)বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 1,108,752 |
- উদাহরণ ( tfds.as_dataframe ):
রচনা/আইন
কনফিগার বিবরণ : আইন নথি
ডাউনলোডের আকার :
46.99 MiB
ডেটাসেটের আকার :
214.44 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): শুধুমাত্র যখন
shuffle_files=False
(ট্রেন)বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 719,372 |
- উদাহরণ ( tfds.as_dataframe ):
রচনা/কোরান
কনফিগারেশনের বিবরণ : কোরান নথি
ডাউনলোড সাইজ :
35.42 MiB
ডেটাসেটের আকার :
117.54 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 537,128 |
- উদাহরণ ( tfds.as_dataframe ):
রচনা/আইটি
কনফিগারেশনের বিবরণ : আইটি নথি
ডাউনলোড সাইজ :
10.33 MiB
ডেটাসেটের আকার :
42.51 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 347,817 |
- উদাহরণ ( tfds.as_dataframe ):
রচনা/সাবটাইটেল
কনফিগারেশনের বিবরণ : সাবটাইটেল নথি
ডাউনলোড সাইজ :
677.64 MiB
ডেটাসেটের আকার :
2.01 GiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'train' | 22,512,639 |
- উদাহরণ ( tfds.as_dataframe ):