- תיאור :
QUALITY, מערך נתונים רב-ברירה להבנת הנקרא ארוך.
אנו מספקים רק את הגרסה הגולמית.
דף הבית : https://github.com/nyu-mll/quality
קוד מקור :
tfds.datasets.quality.Builder
גרסאות :
-
1.0.0
(ברירת מחדל): שחרור ראשוני.
-
גודל הורדה :
17.26 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'dev' | 230 |
'test' | 232 |
'train' | 300 |
- מבנה תכונה :
FeaturesDict({
'article': Text(shape=(), dtype=string),
'article_id': Text(shape=(), dtype=string),
'difficults': Sequence(bool),
'gold_labels': Sequence(int32),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'question_ids': Sequence(Text(shape=(), dtype=string)),
'questions': Sequence(Text(shape=(), dtype=string)),
'set_unique_id': Text(shape=(), dtype=string),
'source': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'topic': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'writer_id': Text(shape=(), dtype=string),
'writer_labels': Sequence(int32),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
מאמר | טֶקסט | חוּט | ||
מאמר_מזהה | טֶקסט | חוּט | ||
קשיים | רצף (טנזור) | (אף אחד,) | bool | |
תוויות_זהב | רצף (טנזור) | (אף אחד,) | int32 | |
אפשרויות | Sequence(Sequence(Text)) | (אין, אין) | חוּט | |
זיהוי_שאלות | רצף (טקסט) | (אף אחד,) | חוּט | |
שאלות | רצף (טקסט) | (אף אחד,) | חוּט | |
set_unique_id | טֶקסט | חוּט | ||
מָקוֹר | טֶקסט | חוּט | ||
כותרת | טֶקסט | חוּט | ||
נוֹשֵׂא | טֶקסט | חוּט | ||
כתובת אתר | טֶקסט | חוּט | ||
סופר_מזהה | טֶקסט | חוּט | ||
סופר_תוויות | רצף (טנזור) | (אף אחד,) | int32 |
מפתחות בפיקוח (ראה
as_supervised
doc ):None
איור ( tfds.show_examples ): לא נתמך.
ציטוט :
@article{pang2021quality,
title={ {QuALITY}: Question Answering with Long Input Texts, Yes!},
author={Pang, Richard Yuanzhe and Parrish, Alicia and Joshi, Nitish and Nangia, Nikita and Phang, Jason and Chen, Angelica and Padmakumar, Vishakh and Ma, Johnny and Thompson, Jana and He, He and Bowman, Samuel R.},
journal={arXiv preprint arXiv:2112.08608},
year={2021}
}
איכות/גולמי (תצורת ברירת המחדל)
תיאור תצורה : גולמי עם HTML.
גודל ערכת נתונים:
22.18 MiB
דוגמאות ( tfds.as_dataframe ):
איכותי/מופשט
תיאור תצורה : מופשט מ-HTML.
גודל מערך נתונים :
20.73 MiB
דוגמאות ( tfds.as_dataframe ):