eraser_multi_rc

Mô tả :

Eraser Multi RC là một bộ dữ liệu cho các truy vấn về các đoạn nhiều dòng, cùng với câu trả lời và lý do hợp lý. Mỗi ví dụ trong tập dữ liệu này có 5 phần sau

Đoạn văn có nhiều dòng 2. Truy vấn về đoạn văn 3. Câu trả lời cho truy vấn
A Phân loại xem câu trả lời đúng hay sai 5. Giải thích biện minh cho sự phân loại

Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : https://cogcomp.seas.upenn.edu/multirc/
Mã nguồn : tfds.text.EraserMultiRc
Phiên bản :
- 0.1.1 (mặc định): Không có ghi chú phát hành.
Kích thước tải xuống : 1.59 MiB
Kích thước tập dữ liệu : 62.59 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :

Tách ra	ví dụ
`'test'`	4.848
`'train'`	24.029
`'validation'`	3,214

Cấu trúc tính năng :

FeaturesDict({
    'evidences': Sequence(Text(shape=(), dtype=string)),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'passage': Text(shape=(), dtype=string),
    'query_and_answer': Text(shape=(), dtype=string),
})

Tài liệu tính năng :

Tính năng	Lớp	Hình dạng	Dtype
	Tính năngDict
bằng chứng	Trình tự (Văn bản)	(Không có,)	sợi dây
nhãn mác	LớpNhãn		int64
đoạn văn	Chữ		sợi dây
query_and_answer	Chữ		sợi dây

Các khóa được giám sát (Xem as_supervised doc ): None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):

trích dẫn :

@unpublished{eraser2019,
    title = {ERASER: A Benchmark to Evaluate Rationalized NLP Models},
    author = {Jay DeYoung and Sarthak Jain and Nazneen Fatema Rajani and Eric Lehman and Caiming Xiong and Richard Socher and Byron C. Wallace}
}
@inproceedings{MultiRC2018,
    author = {Daniel Khashabi and Snigdha Chaturvedi and Michael Roth and Shyam Upadhyay and Dan Roth},
    title = {Looking Beyond the Surface:A Challenge Set for Reading Comprehension over Multiple Sentences},
    booktitle = {NAACL},
    year = {2018}
}

eraser_multi_rc Sử dụng bộ sưu tập để sắp xếp ngăn nắp các trang Lưu và phân loại nội dung dựa trên lựa chọn ưu tiên của bạn.

eraser_multi_rc