- תיאור :
Race הוא מערך נתונים בקנה מידה גדול של הבנת הנקרא עם יותר מ-28,000 קטעים וכמעט 100,000 שאלות. מערך הנתונים נאסף מבחינות אנגלית בסין, המיועדות לתלמידי חטיבת ביניים ותיכון. ניתן להגיש את מערך הנתונים כמערכי ההדרכה והבדיקה להבנת מכונה.
תיעוד נוסף : חקור על ניירות עם קוד
תיאור תצורה : תצורת Builder עבור מערך נתונים של RACE.
דף הבית : https://www.cs.cmu.edu/~glai1/data/race/
קוד מקור :
tfds.datasets.race.Builder
גרסאות :
-
1.0.0
: שחרור ראשוני. -
2.0.0
(ברירת מחדל): הוסף את המזהה לדוגמה.
-
גודל הורדה :
24.26 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
מבנה תכונה :
FeaturesDict({
'answers': Sequence(Text(shape=(), dtype=string)),
'article': Text(shape=(), dtype=string),
'example_id': Text(shape=(), dtype=string),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'questions': Sequence(Text(shape=(), dtype=string)),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
תשובות | רצף (טקסט) | (אף אחד,) | חוּט | |
מאמר | טֶקסט | חוּט | ||
example_id | טֶקסט | חוּט | ||
אפשרויות | Sequence(Sequence(Text)) | (אין, אין) | חוּט | |
שאלות | רצף (טקסט) | (אף אחד,) | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):None
איור ( tfds.show_examples ): לא נתמך.
ציטוט :
@article{lai2017large,
title={RACE: Large-scale ReAding Comprehension Dataset From Examinations},
author={Lai, Guokun and Xie, Qizhe and Liu, Hanxiao and Yang, Yiming and Hovy, Eduard},
journal={arXiv preprint arXiv:1704.04683},
year={2017}
}
גזע/גבוה (תצורת ברירת מחדל)
גודל מערך נתונים :
52.39 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'dev' | 1,021 |
'test' | 1,045 |
'train' | 18,728 |
- דוגמאות ( tfds.as_dataframe ):
גזע/אמצע
גודל ערכת נתונים :
12.51 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'dev' | 368 |
'test' | 362 |
'train' | 6,409 |
- דוגמאות ( tfds.as_dataframe ):