- 설명 :
이 데이터 세트에는 영어 PAWS 교육 데이터의 기계 번역이 포함되어 있습니다. 번역은 XTREME 벤치마크에서 제공되며 다음 언어를 다룹니다.
- 프랑스 국민
- 스페인의
- 독일 사람
- 중국인
- 일본어
- 한국인
PAWS에 대한 자세한 내용은 다음 문서를 참조하십시오. PAWS: Paraphrase Adversaries from Word Scrambling( https://arxiv.org/abs/1904.01130 ) 및 PAWS-X: A Cross-lingual Adversarial Dataset for Paraphrase Identification( https://arxiv). org/abs/1908.11828
XTREME에 대한 자세한 내용은 XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization( https://arxiv.org/abs/2003.11080 )을 참조하십시오.
버전 :
-
1.0.0
(기본값): 릴리스 정보가 없습니다.
-
자동 캐시 ( 문서 ): 예
기능 구조 :
FeaturesDict({
'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
'sentence1': Text(shape=(), dtype=string),
'sentence2': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
상표 | 클래스 레이블 | int64 | ||
문장1 | 텍스트 | 끈 | ||
문장2 | 텍스트 | 끈 |
감독된 키 (
as_supervised
문서 참조):None
그림 ( tfds.show_examples ): 지원되지 않습니다.
인용 :
@article{hu2020xtreme,
author = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
title = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
journal = {CoRR},
volume = {abs/2003.11080},
year = {2020},
archivePrefix = {arXiv},
eprint = {2003.11080}
}
xtreme_pawsx/de(기본 구성)
구성 설명 : de로 번역됨
다운로드 크기 :
22.34 MiB
데이터 세트 크기 :
14.19 MiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 49,340 |
- 예 ( tfds.as_dataframe ):
xtreme_pawsx/es
구성 설명 : es로 번역됨
다운로드 크기 :
22.27 MiB
데이터 세트 크기 :
14.09 MiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 49,244 |
- 예 ( tfds.as_dataframe ):
xtreme_pawsx/fr
구성 설명 : fr로 번역됨
다운로드 크기 :
22.70 MiB
데이터 세트 크기 :
14.53 MiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 49,208 |
- 예 ( tfds.as_dataframe ):
xtreme_pawsx/ja
구성 설명 : ja로 번역됨
다운로드 크기 :
25.12 MiB
데이터 세트 크기 :
16.98 MiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 49,086 |
- 예 ( tfds.as_dataframe ):
xtreme_pawsx/ko
구성 설명 : ko로 번역됨
다운로드 크기 :
22.99 MiB
데이터 세트 크기 :
14.86 MiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 49,298 |
- 예 ( tfds.as_dataframe ):
xtreme_pawsx/zh
구성 설명 : zh로 번역됨
다운로드 크기 :
21.45 MiB
데이터 세트 크기 :
13.21 MiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 49,149 |
- 예 ( tfds.as_dataframe ):