wiki_table_text

  • Описание :

Таблицы Википедии, содержащие как минимум 3 строки и 2 столбца, для дальнейшей аннотации были выбраны 3 случайные строки для каждой таблицы. Каждая строка была аннотирована другим человеком, поэтому набор данных состоит из пар (одна таблица строк, текстовое описание). Аннотации включают как минимум 2 ячейки строки, но не обязательно включать их все. Набор данных соответствует стандартному формату таблицы.

Расколоть Примеры
'test' 2000
'train' 10 000
'validation' 1318
  • Структура функции :
FeaturesDict({
    'input_text': FeaturesDict({
        'table': Sequence({
            'column_header': string,
            'content': string,
            'row_number': int16,
        }),
    }),
    'target_text': string,
})
  • Документация по функциям :
Особенность Учебный класс Форма Dтип Описание
ОсобенностиDict
input_text ОсобенностиDict
input_text/таблица Последовательность
input_text/таблица/column_header Тензор нить
input_text/таблица/содержание Тензор нить
input_text/таблица/номер_строки Тензор int16
целевой_текст Тензор нить
  • Цитата :
@inproceedings{bao2018table,
  title={Table-to-Text: Describing Table Region with Natural Language},
  author={Junwei Bao and Duyu Tang and Nan Duan and Zhao Yan and Yuanhua Lv and Ming Zhou and Tiejun Zhao},
  booktitle={AAAI},
  url={https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/download/16138/16782},
  year={2018}
}