- Описание :
Таблицы Википедии, содержащие как минимум 3 строки и 2 столбца, для дальнейшей аннотации были выбраны 3 случайные строки для каждой таблицы. Каждая строка была аннотирована другим человеком, поэтому набор данных состоит из пар (одна таблица строк, текстовое описание). Аннотации включают как минимум 2 ячейки строки, но не обязательно включать их все. Набор данных соответствует стандартному формату таблицы.
Домашняя страница : https://github.com/msra-nlc/Table2Text
Исходный код :
tfds.structured.wiki_table_text.WikiTableText
Версии :
-
1.0.0
(по умолчанию): Первоначальный выпуск.
-
Размер загрузки :
3.70 MiB
Размер набора данных :
4.64 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'test' | 2000 |
'train' | 10 000 |
'validation' | 1318 |
- Структура функции :
FeaturesDict({
'input_text': FeaturesDict({
'table': Sequence({
'column_header': string,
'content': string,
'row_number': int16,
}),
}),
'target_text': string,
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
input_text | ОсобенностиDict | |||
input_text/таблица | Последовательность | |||
input_text/таблица/column_header | Тензор | нить | ||
input_text/таблица/содержание | Тензор | нить | ||
input_text/таблица/номер_строки | Тензор | int16 | ||
целевой_текст | Тензор | нить |
Контролируемые ключи (см . документ
as_supervised
):('input_text', 'target_text')
Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ):
- Цитата :
@inproceedings{bao2018table,
title={Table-to-Text: Describing Table Region with Natural Language},
author={Junwei Bao and Duyu Tang and Nan Duan and Zhao Yan and Yuanhua Lv and Ming Zhou and Tiejun Zhao},
booktitle={AAAI},
url={https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/download/16138/16782},
year={2018}
}