- Açıklama :
QuALITY, çoktan seçmeli, uzun okuma anlama veri seti.
Yalnızca ham sürümü sağlıyoruz.
Ana Sayfa : https://github.com/nyu-mll/quality
Kaynak kodu :
tfds.datasets.quality.Builder
sürümler :
-
1.0.0
(varsayılan): İlk sürüm.
-
İndirme boyutu :
17.26 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'dev' | 230 |
'test' | 232 |
'train' | 300 |
- Özellik yapısı :
FeaturesDict({
'article': Text(shape=(), dtype=string),
'article_id': Text(shape=(), dtype=string),
'difficults': Sequence(bool),
'gold_labels': Sequence(int32),
'options': Sequence(Sequence(Text(shape=(), dtype=string))),
'question_ids': Sequence(Text(shape=(), dtype=string)),
'questions': Sequence(Text(shape=(), dtype=string)),
'set_unique_id': Text(shape=(), dtype=string),
'source': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
'topic': Text(shape=(), dtype=string),
'url': Text(shape=(), dtype=string),
'writer_id': Text(shape=(), dtype=string),
'writer_labels': Sequence(int32),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Açıklama |
---|---|---|---|---|
ÖzelliklerDict | ||||
makale | Metin | sicim | ||
makale_kimliği | Metin | sicim | ||
zorluklar | Sıra(Tensor) | (Hiçbiri,) | bool | |
gold_labels | Sıra(Tensor) | (Hiçbiri,) | int32 | |
seçenekler | Sıra(Sıra(Metin)) | (Yok, Yok) | sicim | |
soru_kimlikleri | Sıra(Metin) | (Hiçbiri,) | sicim | |
sorular | Sıra(Metin) | (Hiçbiri,) | sicim | |
set_unique_id | Metin | sicim | ||
kaynak | Metin | sicim | ||
Başlık | Metin | sicim | ||
başlık | Metin | sicim | ||
url | Metin | sicim | ||
yazar_kimliği | Metin | sicim | ||
yazar_etiketleri | Sıra(Tensor) | (Hiçbiri,) | int32 |
Denetlenen anahtarlar (Bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :
@article{pang2021quality,
title={ {QuALITY}: Question Answering with Long Input Texts, Yes!},
author={Pang, Richard Yuanzhe and Parrish, Alicia and Joshi, Nitish and Nangia, Nikita and Phang, Jason and Chen, Angelica and Padmakumar, Vishakh and Ma, Johnny and Thompson, Jana and He, He and Bowman, Samuel R.},
journal={arXiv preprint arXiv:2112.08608},
year={2021}
}
kalite/ham (varsayılan yapılandırma)
Yapılandırma açıklaması : HTML ile ham.
Veri kümesi boyutu :
22.18 MiB
Örnekler ( tfds.as_dataframe ):
kaliteli/soyulmuş
Yapılandırma açıklaması : HTML'den çıkarıldı.
Veri kümesi boyutu :
20.73 MiB
Örnekler ( tfds.as_dataframe ):