- Açıklama :
MLQA (Multilingual Question Answering Dataset), çok dilli soru yanıtlama performansını değerlendirmek için bir kıyaslama veri kümesidir. Veri seti 7 dilden oluşmaktadır: Arapça, Almanca, İspanyolca, İngilizce, Hintçe, Vietnamca, Çince.
Ana Sayfa : https://github.com/facebookresearch/MLQA
Kaynak kodu :
tfds.datasets.mlqa.Builder
sürümler :
-
1.0.0
(varsayılan): Sürüm notu yok.
-
İndirme boyutu :
72.21 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
Özellik yapısı :
FeaturesDict({
'answers': Sequence({
'answer_start': int32,
'text': Text(shape=(), dtype=string),
}),
'context': Text(shape=(), dtype=string),
'id': string,
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
Yanıtlar | Sekans | |||
cevaplar/cevap_başlangıç | tensör | int32 | ||
cevaplar/metin | Metin | sicim | ||
bağlam | Metin | sicim | ||
İD | tensör | sicim | ||
soru | Metin | sicim | ||
başlık | Metin | sicim |
Denetlenen anahtarlar (Bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :
@article{lewis2019mlqa,
title={MLQA: Evaluating Cross-lingual Extractive Question Answering},
author={Lewis, Patrick and Ouguz, Barlas and Rinott, Ruty and Riedel, Sebastian and Schwenk, Holger},
journal={arXiv preprint arXiv:1910.07475},
year={2019}
}
mlqa/ar (varsayılan yapılandırma)
Yapılandırma açıklaması : MLQA 'ar' geliştirme ve test bölmeleri.
Veri kümesi boyutu :
9.28 MiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 5.335 |
'validation' | 517 |
- Örnekler ( tfds.as_dataframe ):
mlqa/de
Yapılandırma açıklaması : MLQA 'de' geliştirme ve test bölmeleri.
Veri kümesi boyutu :
5.06 MiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 4.517 |
'validation' | 512 |
- Örnekler ( tfds.as_dataframe ):
mlqa/tr
Yapılandırma açıklaması : MLQA 'en' geliştirme ve test bölmeleri.
Veri kümesi boyutu :
15.72 MiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 11.590 |
'validation' | 1.148 |
- Örnekler ( tfds.as_dataframe ):
mlqa/es
Yapılandırma açıklaması : MLQA 'es' geliştirme ve test bölmeleri.
Veri kümesi boyutu :
5.09 MiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 5.253 |
'validation' | 500 |
- Örnekler ( tfds.as_dataframe ):
merhaba
Yapılandırma açıklaması : MLQA "hi" geliştirme ve test bölmeleri.
Veri kümesi boyutu :
12.83 MiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 4.918 |
'validation' | 507 |
- Örnekler ( tfds.as_dataframe ):
mlqa/vi
Yapılandırma açıklaması : MLQA 'vi' geliştirme ve test bölmeleri.
Veri kümesi boyutu :
8.77 MiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 5.495 |
'validation' | 511 |
- Örnekler ( tfds.as_dataframe ):
mlqa/zh
Yapılandırma açıklaması : MLQA 'zh' geliştirme ve test bölmeleri.
Veri kümesi boyutu :
5.13 MiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 5.137 |
'validation' | 504 |
- Örnekler ( tfds.as_dataframe ):