- Descripción :
MLQA (conjunto de datos de respuesta a preguntas multilingües) es un conjunto de datos de referencia para evaluar el rendimiento de respuesta a preguntas multilingües. El conjunto de datos consta de 7 idiomas: árabe, alemán, español, inglés, hindi, vietnamita, chino.
Documentación adicional : Explore en Papers With Code
Página de inicio: https://github.com/facebookresearch/MLQA
Código fuente :
tfds.datasets.mlqa.Builder
Versiones :
-
1.0.0
(predeterminado): Sin notas de la versión.
-
Tamaño de la descarga :
72.21 MiB
Almacenamiento automático en caché ( documentación ): Sí
Estructura de características :
FeaturesDict({
'answers': Sequence({
'answer_start': int32,
'text': Text(shape=(), dtype=string),
}),
'context': Text(shape=(), dtype=string),
'id': string,
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Documentación de características :
Característica | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
respuestas | Secuencia | |||
respuestas/answer_start | Tensor | int32 | ||
respuestas/texto | Texto | cadena | ||
contexto | Texto | cadena | ||
identificación | Tensor | cadena | ||
pregunta | Texto | cadena | ||
título | Texto | cadena |
Claves supervisadas (Ver
as_supervised
doc ):None
Figura ( tfds.show_examples ): no compatible.
Cita :
@article{lewis2019mlqa,
title={MLQA: Evaluating Cross-lingual Extractive Question Answering},
author={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel, Sebastian and Schwenk, Holger},
journal={arXiv preprint arXiv:1910.07475},
year={2019}
}
mlqa/ar (configuración predeterminada)
Descripción de la configuración : divisiones de desarrollo y prueba de MLQA 'ar'.
Tamaño del conjunto de datos :
9.28 MiB
Divisiones :
Dividir | Ejemplos |
---|---|
'test' | 5,335 |
'validation' | 517 |
- Ejemplos ( tfds.as_dataframe ):
mlqa/de
Descripción de la configuración : divisiones de desarrollo y prueba de MLQA 'de'.
Tamaño del conjunto de datos :
5.06 MiB
Divisiones :
Dividir | Ejemplos |
---|---|
'test' | 4,517 |
'validation' | 512 |
- Ejemplos ( tfds.as_dataframe ):
mlqa/es
Descripción de la configuración : divisiones de desarrollo y prueba de MLQA 'en'.
Tamaño del conjunto de datos :
15.72 MiB
Divisiones :
Dividir | Ejemplos |
---|---|
'test' | 11,590 |
'validation' | 1,148 |
- Ejemplos ( tfds.as_dataframe ):
mlqa/es
Descripción de la configuración : divisiones de desarrollo y prueba de MLQA 'es'.
Tamaño del conjunto de datos :
5.09 MiB
Divisiones :
Dividir | Ejemplos |
---|---|
'test' | 5,253 |
'validation' | 500 |
- Ejemplos ( tfds.as_dataframe ):
mlqa/hola
Descripción de la configuración : MLQA 'hi' dev y divisiones de prueba.
Tamaño del conjunto de datos :
12.83 MiB
Divisiones :
Dividir | Ejemplos |
---|---|
'test' | 4,918 |
'validation' | 507 |
- Ejemplos ( tfds.as_dataframe ):
mlqa/vi
Descripción de la configuración : divisiones de desarrollo y prueba de MLQA 'vi'.
Tamaño del conjunto de datos :
8.77 MiB
Divisiones :
Dividir | Ejemplos |
---|---|
'test' | 5,495 |
'validation' | 511 |
- Ejemplos ( tfds.as_dataframe ):
mlqa/zh
Descripción de la configuración : divisiones de desarrollo y prueba de MLQA 'zh'.
Tamaño del conjunto de datos :
5.13 MiB
Divisiones :
Dividir | Ejemplos |
---|---|
'test' | 5,137 |
'validation' | 504 |
- Ejemplos ( tfds.as_dataframe ):