- Описание :
Multi-News состоит из новостных статей и написанных человеком резюме этих статей с сайта newser.com. Каждое резюме профессионально написано редакторами и включает ссылки на цитируемые оригинальные статьи.
Есть две функции: - документ: текст новостных статей, разделенный специальным токеном "|||||". - резюме: сводка новостей.
Дополнительная документация : изучить документы с кодом
Домашняя страница : https://github.com/Alex-Fabbri/Multi-News
Исходный код :
tfds.summarization.MultiNews
Версии :
-
1.0.0
(по умолчанию): нет примечаний к выпуску.
-
Размер загрузки :
245.06 MiB
Размер набора данных :
669.80 MiB
.Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'test' | 5622 |
'train' | 44 972 |
'validation' | 5622 |
- Структура функции :
FeaturesDict({
'document': Text(shape=(), dtype=string),
'summary': Text(shape=(), dtype=string),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
документ | Текст | нить | ||
резюме | Текст | нить |
Контролируемые ключи (см.
as_supervised
doc ):('document', 'summary')
Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :
@misc{alex2019multinews,
title={Multi-News: a Large-Scale Multi-Document Summarization Dataset and Abstractive Hierarchical Model},
author={Alexander R. Fabbri and Irene Li and Tianwei She and Suyi Li and Dragomir R. Radev},
year={2019},
eprint={1906.01749},
archivePrefix={arXiv},
primaryClass={cs.CL}
}