- Mô tả :
Bộ dữ liệu này chứa các bản dịch máy của dữ liệu đào tạo PAWS tiếng Anh. Các bản dịch được cung cấp bởi điểm chuẩn XTREME và bao gồm các ngôn ngữ sau:
- người Pháp
- người Tây Ban Nha
- tiếng Đức
- người Trung Quốc
- tiếng Nhật
- Hàn Quốc
Để biết thêm chi tiết về PAWS, hãy xem các bài báo: PAWS: Đối thủ diễn giải từ Word Scrambling tại https://arxiv.org/abs/1904.01130 và PAWS-X: Bộ dữ liệu đối thủ diễn giải đa ngôn ngữ để nhận dạng cụm từ diễn giải tại https://arxiv. org/abs/1908.11828
Để biết chi tiết liên quan đến XTREME, vui lòng tham khảo: XTREME: Điểm chuẩn đa tác vụ đa ngôn ngữ để đánh giá quá trình tổng quát hóa đa ngôn ngữ tại https://arxiv.org/abs/2003.11080
Trang chủ : https://github.com/google-research/xtreme
Mã nguồn :
tfds.text.xtreme_pawsx.XtremePawsx
Phiên bản :
-
1.0.0
(mặc định): Không có ghi chú phát hành.
-
Tự động lưu vào bộ đệm ( tài liệu ): Có
Cấu trúc tính năng :
FeaturesDict({
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'sentence1': Text(shape=(), dtype=string),
'sentence2': Text(shape=(), dtype=string),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
nhãn mác | LớpNhãn | int64 | ||
câu1 | Chữ | sợi dây | ||
câu2 | Chữ | sợi dây |
Các khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
trích dẫn :
@article{hu2020xtreme,
author = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
title = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
journal = {CoRR},
volume = {abs/2003.11080},
year = {2020},
archivePrefix = {arXiv},
eprint = {2003.11080}
}
xtreme_pawsx/de (cấu hình mặc định)
Mô tả cấu hình : Được dịch sang de
Kích thước tải xuống :
22.34 MiB
Kích thước tập dữ liệu :
14.19 MiB
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 49.340 |
- Ví dụ ( tfds.as_dataframe ):
xtreme_pawsx/es
Mô tả cấu hình : Được dịch sang es
Kích thước tải xuống :
22.27 MiB
Kích thước tập dữ liệu :
14.09 MiB
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 49,244 |
- Ví dụ ( tfds.as_dataframe ):
xtreme_pawsx/fr
Mô tả cấu hình : Được dịch sang fr
Kích thước tải xuống :
22.70 MiB
Kích thước tập dữ liệu :
14.53 MiB
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 49,208 |
- Ví dụ ( tfds.as_dataframe ):
xtreme_pawsx/ja
Mô tả cấu hình : Đã dịch sang ja
Kích thước tải xuống :
25.12 MiB
Kích thước tập dữ liệu :
16.98 MiB
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 49,086 |
- Ví dụ ( tfds.as_dataframe ):
xtreme_pawsx/ko
Mô tả cấu hình : Đã dịch sang ko
Kích thước tải xuống :
22.99 MiB
Kích thước tập dữ liệu :
14.86 MiB
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 49,298 |
- Ví dụ ( tfds.as_dataframe ):
xtreme_pawsx/zh
Mô tả cấu hình : Đã dịch sang zh
Kích thước tải xuống :
21.45 MiB
Kích thước tập dữ liệu :
13.21 MiB
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 49,149 |
- Ví dụ ( tfds.as_dataframe ):