- Descrizione :
Questo set di dati contiene traduzioni automatiche di MNLI in ciascuna delle lingue XNLI. I dati di traduzione sono forniti da XTREME. Si noti che questo è diverso dai dati tradotti automaticamente forniti dal documento XNLI originale.
Pagina iniziale : https://www.nyu.edu/projects/bowman/xnli/
Codice sorgente :
tfds.text.xtreme_xnli.XtremeXnli
Versioni :
-
1.1.0
(impostazione predefinita): nessuna nota di rilascio.
-
Dimensione del download :
2.31 GiB
Dimensione del set di dati:
1.59 GiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'train' | 392.570 |
- Struttura delle caratteristiche :
FeaturesDict({
'hypothesis': TranslationVariableLanguages({
'language': Text(shape=(), dtype=string),
'translation': Text(shape=(), dtype=string),
}),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'premise': Translation({
'ar': Text(shape=(), dtype=string),
'bg': Text(shape=(), dtype=string),
'de': Text(shape=(), dtype=string),
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
'hi': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
'sw': Text(shape=(), dtype=string),
'th': Text(shape=(), dtype=string),
'tr': Text(shape=(), dtype=string),
'ur': Text(shape=(), dtype=string),
'vi': Text(shape=(), dtype=string),
'zh': Text(shape=(), dtype=string),
}),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
ipotesi | TranslationVariableLanguages | |||
ipotesi/linguaggio | Testo | corda | ||
ipotesi/traduzione | Testo | corda | ||
etichetta | ClassLabel | int64 | ||
premessa | Traduzione | |||
premessa/ar | Testo | corda | ||
premessa/bg | Testo | corda | ||
premessa/de | Testo | corda | ||
premessa/el | Testo | corda | ||
premessa/it | Testo | corda | ||
premessa/es | Testo | corda | ||
premessa/fr | Testo | corda | ||
premessa/ciao | Testo | corda | ||
premessa/ru | Testo | corda | ||
premessa/sw | Testo | corda | ||
premessa/th | Testo | corda | ||
premessa/tr | Testo | corda | ||
premessa/ur | Testo | corda | ||
premessa/vi | Testo | corda | ||
premessa/zh | Testo | corda |
Chiavi supervisionate (Vedi
as_supervised
doc ):None
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ):
- Citazione :
@article{hu2020xtreme,
author = {Junjie Hu and Sebastian Ruder and Aditya Siddhant and Graham Neubig and Orhan Firat and Melvin Johnson},
title = {XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating Cross-lingual Generalization},
journal = {CoRR},
volume = {abs/2003.11080},
year = {2020},
archivePrefix = {arXiv},
eprint = {2003.11080}
}