- Açıklama :
XQuAD (Diller Arası Soru Cevaplama Veri Kümesi), diller arası soru yanıtlama performansını değerlendirmek için bir kıyaslama veri kümesidir. Veri seti, SQuAD v1.1 geliştirme setinden (Rajpurkar ve diğerleri, 2016) 240 paragraflık bir alt küme ve 1190 soru-cevap çiftinden ve bunların on dile profesyonel çevirilerinden oluşur: İspanyolca, Almanca, Yunanca, Rusça, Türkçe , Arapça, Vietnamca, Tayca, Çince ve Hintçe. Sonuç olarak, veri kümesi 11 dilde tamamen paraleldir. XQuAD'i varsayılan sıfır atış ayarında çalıştırmak için SQuAD v1.1 eğitim ve doğrulama verilerini burada kullanın: https://www.tensorflow.org/datasets/catalog/squad
Ayrıca XTREME'den İngilizce olmayan her dil için "translate-train", "translate-dev" ve "translate-test" bölümlerini de dahil ediyoruz (Hu ve diğerleri, 2020). Bunlar, XQuAD'i "translate-train" veya "translate-test" ayarlarında çalıştırmak için kullanılabilir.
Ana Sayfa : https://github.com/deepmind/xquad
Kaynak kodu :
tfds.question_answering.Xquad
sürümler :
-
3.0.0
(varsayılan): Bağlamdaki boşlukların kaldırılması nedeniyle yanıt aralıklarının yanlış hizalandığı bir dizi örnekle ilgili sorunu düzeltir. Bu değişiklik, test örneklerinin kabaca %14'ünü etkiler.
-
Özellik yapısı :
FeaturesDict({
'answers': Sequence({
'answer_start': int32,
'text': Text(shape=(), dtype=string),
}),
'context': Text(shape=(), dtype=string),
'id': string,
'question': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
Yanıtlar | Sekans | |||
cevaplar/cevap_başlangıç | tensör | int32 | ||
cevaplar/metin | Metin | sicim | ||
bağlam | Metin | sicim | ||
İD | tensör | sicim | ||
soru | Metin | sicim | ||
Başlık | Metin | sicim |
Denetlenen anahtarlar (Bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :
@article{Artetxe:etal:2019,
author = {Mikel Artetxe and Sebastian Ruder and Dani Yogatama},
title = {On the cross-lingual transferability of monolingual representations},
journal = {CoRR},
volume = {abs/1910.11856},
year = {2019},
archivePrefix = {arXiv},
eprint = {1910.11856}
}
xquad/ar (varsayılan yapılandırma)
Yapılandırma açıklaması : XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle XQuAD 'ar' test bölümü (Hu ve diğerleri, 2020).
İndirme boyutu :
420.97 MiB
Veri kümesi boyutu :
134.83 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 1.190 |
'translate-dev' | 10.541 |
'translate-test' | 1.151 |
'translate-train' | 86.787 |
- Örnekler ( tfds.as_dataframe ):
xquad/de
Yapılandırma açıklaması : XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle XQuAD 'de' test bölümü (Hu ve diğerleri, 2020).
İndirme boyutu :
127.04 MiB
Veri kümesi boyutu :
98.80 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 1.190 |
'translate-dev' | 10.371 |
'translate-test' | 1.168 |
'translate-train' | 82.603 |
- Örnekler ( tfds.as_dataframe ):
xquad/el
Yapılandırma açıklaması : XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle XQuAD 'el' test bölümü (Hu ve diğerleri, 2020).
İndirme boyutu :
499.40 MiB
Veri kümesi boyutu :
157.90 MiB
Otomatik önbelleğe alınmış ( belgeler ): Evet (test, translate-dev, translate-test), Yalnızca
shuffle_files=False
(translate-train) olduğundabölmeler :
Bölmek | örnekler |
---|---|
'test' | 1.190 |
'translate-dev' | 10.100 |
'translate-test' | 1.182 |
'translate-train' | 79.946 |
- Örnekler ( tfds.as_dataframe ):
xquad/es
Yapılandırma açıklaması : XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle XQuAD 'es' test bölümü (Hu ve diğerleri, 2020).
İndirme boyutu :
138.41 MiB
Veri kümesi boyutu :
104.96 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 1.190 |
'translate-dev' | 10.566 |
'translate-test' | 1.188 |
'translate-train' | 87.488 |
- Örnekler ( tfds.as_dataframe ):
xquad/merhaba
Yapılandırma açıklaması : XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle XQuAD 'hi' test bölümü (Hu ve diğerleri, 2020).
İndirme boyutu :
472.23 MiB
Veri kümesi boyutu :
207.85 MiB
Otomatik önbelleğe alınmış ( belgeler ): Evet (test, translate-dev, translate-test), Yalnızca
shuffle_files=False
(translate-train) olduğundabölmeler :
Bölmek | örnekler |
---|---|
'test' | 1.190 |
'translate-dev' | 10.536 |
'translate-test' | 1.184 |
'translate-train' | 85.804 |
- Örnekler ( tfds.as_dataframe ):
xquad/ru
Yapılandırma açıklaması : XQuAD 'ru' test bölümü, XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle (Hu ve diğerleri, 2020).
İndirme boyutu :
513.80 MiB
Veri kümesi boyutu :
159.38 MiB
Otomatik önbelleğe alınmış ( belgeler ): Evet (test, translate-dev, translate-test), Yalnızca
shuffle_files=False
(translate-train) olduğundabölmeler :
Bölmek | örnekler |
---|---|
'test' | 1.190 |
'translate-dev' | 10.469 |
'translate-test' | 1.190 |
'translate-train' | 84.869 |
- Örnekler ( tfds.as_dataframe ):
xdört/th
Yapılandırma açıklaması : XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle XQuAD "th" test bölümü (Hu ve diğerleri, 2020).
İndirme boyutu :
461.54 MiB
Veri kümesi boyutu :
199.57 MiB
Otomatik önbelleğe alınmış ( belgeler ): Evet (test, translate-dev, translate-test), Yalnızca
shuffle_files=False
(translate-train) olduğundabölmeler :
Bölmek | örnekler |
---|---|
'test' | 1.190 |
'translate-dev' | 10.516 |
'translate-test' | 1.157 |
'translate-train' | 85.846 |
- Örnekler ( tfds.as_dataframe ):
xquad/tr
Yapılandırma açıklaması : XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle XQuAD "tr" test bölümü (Hu ve diğerleri, 2020).
İndirme boyutu :
151.08 MiB
Veri kümesi boyutu :
97.56 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 1.190 |
'translate-dev' | 10.535 |
'translate-test' | 1.112 |
'translate-train' | 86.511 |
- Örnekler ( tfds.as_dataframe ):
xquad/vi
Yapılandırma açıklaması : XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle XQuAD 'vi' test bölümü (Hu ve diğerleri, 2020).
İndirme boyutu :
218.09 MiB
Veri kümesi boyutu :
120.03 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 1.190 |
'translate-dev' | 10.555 |
'translate-test' | 1.178 |
'translate-train' | 87.187 |
- Örnekler ( tfds.as_dataframe ):
xquad/zh
Yapılandırma açıklaması : XTREME'den makine tarafından çevrilmiş translate-train/translate-dev/translate-test bölümleriyle XQuAD "zh" test bölümü (Hu ve diğerleri, 2020).
İndirme boyutu :
174.57 MiB
Veri kümesi boyutu :
80.79 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 1.190 |
'translate-dev' | 10.475 |
'translate-test' | 1.186 |
'translate-train' | 85.700 |
- Örnekler ( tfds.as_dataframe ):
xquad/tr
Yapılandırma açıklaması : XQuAD 'en' test bölümü.
İndirme boyutu :
595.10 KiB
Veri kümesi boyutu :
1.19 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 1.190 |
- Örnekler ( tfds.as_dataframe ):