- Описание :
Eraser Multi RC — это набор данных для запросов по многострочным отрывкам вместе с ответами и обоснованием. Каждый пример в этом наборе данных состоит из следующих 5 частей.
- Многострочный пассаж 2. Вопрос о пассаже 3. Ответ на вопрос
- Классификация того, является ли ответ правильным или неправильным 5. Объяснение, обосновывающее классификацию
Дополнительная документация : изучить документы с кодом
Домашняя страница : https://cogcomp.seas.upenn.edu/multirc/
Исходный код :
tfds.text.EraserMultiRc
Версии :
-
0.1.1
(по умолчанию): нет примечаний к выпуску.
-
Размер загрузки :
1.59 MiB
Размер набора данных :
62.59 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'test' | 4848 |
'train' | 24 029 |
'validation' | 3214 |
- Структура функции :
FeaturesDict({
'evidences': Sequence(Text(shape=(), dtype=string)),
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'passage': Text(shape=(), dtype=string),
'query_and_answer': Text(shape=(), dtype=string),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
доказательства | Последовательность (текст) | (Никто,) | нить | |
этикетка | Метка класса | int64 | ||
проход | Текст | нить | ||
запрос_и_ответ | Текст | нить |
Ключи под наблюдением (см . документ
as_supervised
):None
Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :
@unpublished{eraser2019,
title = {ERASER: A Benchmark to Evaluate Rationalized NLP Models},
author = {Jay DeYoung and Sarthak Jain and Nazneen Fatema Rajani and Eric Lehman and Caiming Xiong and Richard Socher and Byron C. Wallace}
}
@inproceedings{MultiRC2018,
author = {Daniel Khashabi and Snigdha Chaturvedi and Michael Roth and Shyam Upadhyay and Dan Roth},
title = {Looking Beyond the Surface:A Challenge Set for Reading Comprehension over Multiple Sentences},
booktitle = {NAACL},
year = {2018}
}