- الوصف :
QUALITY ، مجموعة بيانات متعددة الخيارات وقراءة طويلة.
نحن نقدم فقط النسخة الخام.
الصفحة الرئيسية : https://github.com/nyu-mll/quality
كود المصدر :
tfds.datasets.quality.Builder
إصدارات :
-
1.0.0
(افتراضي): الإصدار الأولي.
-
حجم التحميل :
17.26 MiB
التخزين المؤقت التلقائي ( الوثائق ): نعم
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'dev' | 230 |
'test' | 232 |
'train' | 300 |
- هيكل الميزة :
FeaturesDict({
'article': Text(shape=(), dtype=string),
'article_id': Text(shape=(), dtype=string),
'difficults': Sequence(bool),
'gold_labels': Sequence(int32),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'question_ids': Sequence(Text(shape=(), dtype=string)),
'questions': Sequence(Text(shape=(), dtype=string)),
'set_unique_id': Text(shape=(), dtype=string),
'source': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'topic': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'writer_id': Text(shape=(), dtype=string),
'writer_labels': Sequence(int32),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
مقالة - سلعة | نص | سلسلة | ||
article_id | نص | سلسلة | ||
صعب | تسلسل (موتر) | (لا أحد،) | منطقي | |
علامات_ذهب | تسلسل (موتر) | (لا أحد،) | int32 | |
والخيارات | تسلسل (تسلسل (نص)) | (ليس ليس) | سلسلة | |
الأسئلة_العربية | تسلسل (نص) | (لا أحد،) | سلسلة | |
أسئلة | تسلسل (نص) | (لا أحد،) | سلسلة | |
set_unique_id | نص | سلسلة | ||
مصدر | نص | سلسلة | ||
لقب | نص | سلسلة | ||
عنوان | نص | سلسلة | ||
عنوان url | نص | سلسلة | ||
معرّف الكاتب | نص | سلسلة | ||
كاتب_التصنيفات | تسلسل (موتر) | (لا أحد،) | int32 |
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised
):None
الشكل ( tfds.show_examples ): غير مدعوم.
الاقتباس :
@article{pang2021quality,
title={ {QuALITY}: Question Answering with Long Input Texts, Yes!},
author={Pang, Richard Yuanzhe and Parrish, Alicia and Joshi, Nitish and Nangia, Nikita and Phang, Jason and Chen, Angelica and Padmakumar, Vishakh and Ma, Johnny and Thompson, Jana and He, He and Bowman, Samuel R.},
journal={arXiv preprint arXiv:2112.08608},
year={2021}
}
الجودة / الخام (التكوين الافتراضي)
وصف التكوين : خام مع HTML.
حجم مجموعة البيانات :
22.18 MiB
أمثلة ( tfds.as_dataframe ):
جودة / جردت
وصف التكوين : تم تجريده من HTML.
حجم مجموعة البيانات :
20.73 MiB
أمثلة ( tfds.as_dataframe ):