TFDS এখন Croissant 🥐 ফরম্যাট সমর্থন করে! আরও জানতে ডকুমেন্টেশন পড়ুন।

এই পৃষ্ঠাটি Cloud Translation API অনুবাদ করেছে।

lm1 খ

তথ্যসূত্র:

প্লেইন_টেক্সট

TFDS এ এই ডেটাসেট লোড করতে নিম্নলিখিত কমান্ডটি ব্যবহার করুন:

ds = tfds.load('huggingface:lm1b/plain_text')

বর্ণনা :

A benchmark corpus to be used for measuring progress in statistical language modeling. This has almost one billion words in the training data.

লাইসেন্স : কোনো পরিচিত লাইসেন্স নেই
সংস্করণ : 1.0.0
বিভাজন :

বিভক্ত	উদাহরণ
`'test'`	306688
`'train'`	30301028

বৈশিষ্ট্য :

{
    "text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}

অন্য কিছু উল্লেখ না করা থাকলে, এই পৃষ্ঠার কন্টেন্ট Creative Commons Attribution 4.0 License-এর অধীনে এবং কোডের নমুনাগুলি Apache 2.0 License-এর অধীনে লাইসেন্স প্রাপ্ত। আরও জানতে, Google Developers সাইট নীতি দেখুন। Java হল Oracle এবং/অথবা তার অ্যাফিলিয়েট সংস্থার রেজিস্টার্ড ট্রেডমার্ক।

2024-11-21 UTC-তে শেষবার আপডেট করা হয়েছে।