- বর্ণনা :
কোয়ালিটি, একটি বহু-পছন্দ, দীর্ঘ-পড়া বোঝার ডেটাসেট।
আমরা শুধুমাত্র কাঁচা সংস্করণ প্রদান.
হোমপেজ : https://github.com/nyu-mll/quality
সোর্স কোড :
tfds.datasets.quality.Builder
সংস্করণ :
-
1.0.0
(ডিফল্ট): প্রাথমিক প্রকাশ।
-
ডাউনলোড সাইজ :
17.26 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'dev' | 230 |
'test' | 232 |
'train' | 300 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'article': Text(shape=(), dtype=string),
'article_id': Text(shape=(), dtype=string),
'difficults': Sequence(bool),
'gold_labels': Sequence(int32),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'question_ids': Sequence(Text(shape=(), dtype=string)),
'questions': Sequence(Text(shape=(), dtype=string)),
'set_unique_id': Text(shape=(), dtype=string),
'source': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'topic': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'writer_id': Text(shape=(), dtype=string),
'writer_labels': Sequence(int32),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
নিবন্ধ | পাঠ্য | স্ট্রিং | ||
নিবন্ধ_আইডি | পাঠ্য | স্ট্রিং | ||
কঠিন | ক্রম (টেনসর) | (কোনটিই নয়,) | bool | |
সোনার_লেবেল | ক্রম (টেনসর) | (কোনটিই নয়,) | int32 | |
বিকল্প | ক্রম(ক্রম(পাঠ্য)) | (কোনটিই নয়) | স্ট্রিং | |
প্রশ্ন_আইডি | ক্রম (পাঠ্য) | (কোনটিই নয়,) | স্ট্রিং | |
প্রশ্ন | ক্রম (পাঠ্য) | (কোনটিই নয়,) | স্ট্রিং | |
set_unique_id | পাঠ্য | স্ট্রিং | ||
সূত্র | পাঠ্য | স্ট্রিং | ||
শিরোনাম | পাঠ্য | স্ট্রিং | ||
বিষয় | পাঠ্য | স্ট্রিং | ||
url | পাঠ্য | স্ট্রিং | ||
writer_id | পাঠ্য | স্ট্রিং | ||
লেখক_লেবেল | ক্রম (টেনসর) | (কোনটিই নয়,) | int32 |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):None
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদ্ধৃতি :
@article{pang2021quality,
title={ {QuALITY}: Question Answering with Long Input Texts, Yes!},
author={Pang, Richard Yuanzhe and Parrish, Alicia and Joshi, Nitish and Nangia, Nikita and Phang, Jason and Chen, Angelica and Padmakumar, Vishakh and Ma, Johnny and Thompson, Jana and He, He and Bowman, Samuel R.},
journal={arXiv preprint arXiv:2112.08608},
year={2021}
}
গুণমান/কাঁচা (ডিফল্ট কনফিগারেশন)
কনফিগার বর্ণনা : এইচটিএমএল সহ কাঁচা।
ডেটাসেটের আকার :
22.18 MiB
উদাহরণ ( tfds.as_dataframe ):
গুণমান/ ছিনতাই করা
কনফিগার বিবরণ : এইচটিএমএল ছিনতাই.
ডেটাসেটের আকার :
20.73 MiB
উদাহরণ ( tfds.as_dataframe ):