- Deskripsi :
Tabel Wikipedia dengan setidaknya 3 baris dan 2 kolom, 3 baris acak untuk setiap tabel dipilih untuk anotasi lebih lanjut. Setiap baris dianotasi oleh orang yang berbeda, sehingga kumpulan data disusun oleh pasangan (satu tabel baris, deskripsi teks). Anotasi mencakup setidaknya 2 sel baris, tetapi tidak perlu menyertakan semuanya. Dataset mengikuti format tabel standar.
Beranda : https://github.com/msra-nlc/Table2Text
Kode sumber :
tfds.structured.wiki_table_text.WikiTableText
Versi :
-
1.0.0
(default): Rilis awal.
-
Ukuran unduhan :
3.70 MiB
Ukuran dataset :
4.64 MiB
Di-cache otomatis ( dokumentasi ): Ya
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 2.000 |
'train' | 10.000 |
'validation' | 1.318 |
- Struktur fitur :
FeaturesDict({
'input_text': FeaturesDict({
'table': Sequence({
'column_header': string,
'content': string,
'row_number': int16,
}),
}),
'target_text': string,
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
Masukkan teks | fiturDict | |||
masukan_teks/tabel | Urutan | |||
input_text/table/column_header | Tensor | rangkaian | ||
input_teks/tabel/konten | Tensor | rangkaian | ||
input_teks/tabel/nomor_baris | Tensor | int16 | ||
target_text | Tensor | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):('input_text', 'target_text')
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@inproceedings{bao2018table,
title={Table-to-Text: Describing Table Region with Natural Language},
author={Junwei Bao and Duyu Tang and Nan Duan and Zhao Yan and Yuanhua Lv and Ming Zhou and Tiejun Zhao},
booktitle={AAAI},
url={https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/download/16138/16782},
year={2018}
}