- Descrição :
MLQA (Multilingual Question Answering Dataset) é um conjunto de dados de referência para avaliar o desempenho de resposta a perguntas multilíngues. O conjunto de dados consiste em 7 idiomas: árabe, alemão, espanhol, inglês, hindi, vietnamita e chinês.
Documentação Adicional : Explore em Papers With Code
Página inicial : https://github.com/facebookresearch/MLQA
Código -fonte:
tfds.datasets.mlqa.Builder
Versões :
-
1.0.0
(padrão): sem notas de versão.
-
Tamanho do download :
72.21 MiB
Cache automático ( documentação ): Sim
Estrutura de recursos :
FeaturesDict({
'answers': Sequence({
'answer_start': int32,
'text': Text(shape=(), dtype=string),
}),
'context': Text(shape=(), dtype=string),
'id': string,
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Recurso | Aula | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
respostas | Seqüência | |||
respostas/resposta_início | tensor | int32 | ||
respostas/texto | Texto | corda | ||
contexto | Texto | corda | ||
eu ia | tensor | corda | ||
pergunta | Texto | corda | ||
título | Texto | corda |
Chaves supervisionadas (Consulte
as_supervised
doc ):None
Figura ( tfds.show_examples ): Não compatível.
Citação :
@article{lewis2019mlqa,
title={MLQA: Evaluating Cross-lingual Extractive Question Answering},
author={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel, Sebastian and Schwenk, Holger},
journal={arXiv preprint arXiv:1910.07475},
year={2019}
}
mlqa/ar (configuração padrão)
Descrição da configuração : MLQA 'ar' dev e divisões de teste.
Tamanho do conjunto de dados :
9.28 MiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 5.335 |
'validation' | 517 |
- Exemplos ( tfds.as_dataframe ):
mlqa/de
Descrição da configuração : MLQA 'de' dev e divisões de teste.
Tamanho do conjunto de dados :
5.06 MiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 4.517 |
'validation' | 512 |
- Exemplos ( tfds.as_dataframe ):
mlqa/en
Descrição da configuração : MLQA 'en' dev e divisões de teste.
Tamanho do conjunto de dados :
15.72 MiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 11.590 |
'validation' | 1.148 |
- Exemplos ( tfds.as_dataframe ):
mlqa/es
Descrição da configuração : MLQA 'es' dev e test splits.
Tamanho do conjunto de dados :
5.09 MiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 5.253 |
'validation' | 500 |
- Exemplos ( tfds.as_dataframe ):
mlqa/oi
Descrição da configuração : MLQA 'hi' dev e divisões de teste.
Tamanho do conjunto de dados :
12.83 MiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 4.918 |
'validation' | 507 |
- Exemplos ( tfds.as_dataframe ):
mlqa/vi
Descrição da configuração : MLQA 'vi' dev e divisões de teste.
Tamanho do conjunto de dados :
8.77 MiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 5.495 |
'validation' | 511 |
- Exemplos ( tfds.as_dataframe ):
mlqa/zh
Descrição da configuração : MLQA 'zh' dev e divisões de teste.
Tamanho do conjunto de dados :
5.13 MiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 5.137 |
'validation' | 504 |
- Exemplos ( tfds.as_dataframe ):