- คำอธิบาย :
ข้อมูลประกอบด้วยชุดของ 1 ถึง 7 ของรูปแบบ subject-predicate-object ที่ดึงมาจาก (DBpedia)[ https://wiki.dbpedia.org/ ] และข้อความภาษาธรรมชาติที่เป็นคำพูดของ triple เหล่านี้ ข้อมูลการทดสอบครอบคลุม 15 โดเมนที่แตกต่างกัน โดยมีเพียง 10 โดเมนเท่านั้นที่ปรากฏในข้อมูลการฝึกอบรม ชุดข้อมูลเป็นไปตามรูปแบบตารางมาตรฐาน
เอกสารประกอบเพิ่มเติม : สำรวจเอกสารด้วยรหัส
รหัสแหล่งที่มา :
tfds.structured.web_nlg.WebNlg
รุ่น :
-
0.1.0
(ค่าเริ่มต้น): ไม่มีบันทึกประจำรุ่น
-
ขนาดการดาวน์โหลด :
19.76 MiB
ขนาดชุดข้อมูล :
13.78 MiB
แคชอัตโนมัติ ( เอกสาร ): ใช่
แยก :
แยก | ตัวอย่าง |
---|---|
'test_all' | 4,928 |
'test_unseen' | 2,433 |
'train' | 18,102 |
'validation' | 2,268 |
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'input_text': FeaturesDict({
'context': string,
'table': Sequence({
'column_header': string,
'content': string,
'row_number': int16,
}),
}),
'target_text': string,
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
อินพุต_ข้อความ | คุณสมบัติDict | |||
input_text/บริบท | เทนเซอร์ | สตริง | ||
input_text/ตาราง | ลำดับ | |||
input_text/table/column_header | เทนเซอร์ | สตริง | ||
input_text/table/content | เทนเซอร์ | สตริง | ||
input_text/table/row_number | เทนเซอร์ | int16 | ||
target_text | เทนเซอร์ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('input_text', 'target_text')
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ):
- การอ้างอิง :
@inproceedings{gardent2017creating,
title = ""Creating Training Corpora for {NLG} Micro-Planners"",
author = ""Gardent, Claire and
Shimorina, Anastasia and
Narayan, Shashi and
Perez-Beltrachini, Laura"",
booktitle = ""Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)"",
month = jul,
year = ""2017"",
address = ""Vancouver, Canada"",
publisher = ""Association for Computational Linguistics"",
doi = ""10.18653/v1/P17-1017"",
pages = ""179--188"",
url = ""https://www.aclweb.org/anthology/P17-1017.pdf""
}