- คำอธิบาย :
BoolQ เป็นชุดข้อมูลตอบคำถามสำหรับคำถามใช่/ไม่ใช่ที่มีตัวอย่าง 15,942 ตัวอย่าง คำถามเหล่านี้เกิดขึ้นตามธรรมชาติ โดยสร้างขึ้นในการตั้งค่าที่ไม่ได้รับการแจ้งเตือนและไม่ถูกจำกัด
แต่ละตัวอย่างเป็นสามส่วนของ (คำถาม ข้อความ คำตอบ) โดยมีชื่อเรื่องของหน้าเป็นบริบทเพิ่มเติมหรือไม่ก็ได้ การตั้งค่าการจัดประเภทคู่ข้อความคล้ายกับงานการอนุมานภาษาธรรมชาติที่มีอยู่
เอกสารประกอบเพิ่มเติม : สำรวจเอกสารด้วยรหัส
หน้าแรก : https://github.com/google-research-datasets/boolean-questions
รหัสที่มา :
tfds.datasets.bool_q.Builder
รุ่น :
-
1.0.0
(ค่าเริ่มต้น): ไม่มีบันทึกประจำรุ่น
-
ขนาดการดาวน์โหลด :
8.36 MiB
ขนาดชุดข้อมูล :
8.51 MiB
แคชอัตโนมัติ ( เอกสาร ): ใช่
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 9,427 |
'validation' | 3,270 |
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'answer': bool,
'passage': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
คำตอบ | เทนเซอร์ | บูล | ||
ทางเดิน | ข้อความ | สตริง | ||
คำถาม | ข้อความ | สตริง | ||
ชื่อ | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):None
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ):
- การอ้างอิง :
@inproceedings{clark2019boolq,
title = {BoolQ: Exploring the Surprising Difficulty of Natural Yes/No Questions},
author = {Clark, Christopher and Lee, Kenton and Chang, Ming-Wei, and Kwiatkowski, Tom and Collins, Michael, and Toutanova, Kristina},
booktitle = {NAACL},
year = {2019},
}