wiki_table_text

  • الوصف :

تم تحديد جداول Wikipedia التي تحتوي على 3 صفوف على الأقل وعمودين ، و 3 صفوف عشوائية لكل جدول لمزيد من التعليقات التوضيحية. تم تعليق كل صف بواسطة شخص مختلف ، لذلك تتكون مجموعة البيانات من أزواج (جدول صف واحد ، وصف نصي). تتضمن التعليقات التوضيحية خليتين على الأقل من الصف ، ولكن لا تتطلب تضمينها جميعًا. تتبع مجموعة البيانات تنسيق جدول قياسي.

انشق، مزق أمثلة
'test' 2000
'train' 10000
'validation' 1،318
  • هيكل الميزة :
FeaturesDict({
    'input_text': FeaturesDict({
        'table': Sequence({
            'column_header': string,
            'content': string,
            'row_number': int16,
        }),
    }),
    'target_text': string,
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
أدخل نصآ الميزات
input_text / الجدول تسلسل
input_text / table / column_header. إدخال / نص / جدول / عمود موتر سلسلة
input_text / جدول / محتوى موتر سلسلة
input_text / table / row_number موتر int16
target_text موتر سلسلة
  • الاقتباس :
@inproceedings{bao2018table,
  title={Table-to-Text: Describing Table Region with Natural Language},
  author={Junwei Bao and Duyu Tang and Nan Duan and Zhao Yan and Yuanhua Lv and Ming Zhou and Tiejun Zhao},
  booktitle={AAAI},
  url={https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/download/16138/16782},
  year={2018}
}