wiki_table_text

  • Deskripsi :

Tabel Wikipedia dengan setidaknya 3 baris dan 2 kolom, 3 baris acak untuk setiap tabel dipilih untuk anotasi lebih lanjut. Setiap baris dianotasi oleh orang yang berbeda, sehingga kumpulan data disusun oleh pasangan (satu tabel baris, deskripsi teks). Anotasi mencakup setidaknya 2 sel baris, tetapi tidak perlu menyertakan semuanya. Dataset mengikuti format tabel standar.

Membelah Contoh
'test' 2.000
'train' 10.000
'validation' 1.318
  • Struktur fitur :
FeaturesDict({
    'input_text': FeaturesDict({
        'table': Sequence({
            'column_header': string,
            'content': string,
            'row_number': int16,
        }),
    }),
    'target_text': string,
})
  • Dokumentasi fitur :
Fitur Kelas Membentuk Dtype Keterangan
fiturDict
Masukkan teks fiturDict
masukan_teks/tabel Urutan
input_text/table/column_header Tensor rangkaian
input_teks/tabel/konten Tensor rangkaian
input_teks/tabel/nomor_baris Tensor int16
target_text Tensor rangkaian
  • Kutipan :
@inproceedings{bao2018table,
  title={Table-to-Text: Describing Table Region with Natural Language},
  author={Junwei Bao and Duyu Tang and Nan Duan and Zhao Yan and Yuanhua Lv and Ming Zhou and Tiejun Zhao},
  booktitle={AAAI},
  url={https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/download/16138/16782},
  year={2018}
}