- Tanım :
81 bin soru-cevap çifti ile 14 bin görüşme içeren bir veri kümesi. QReCC, TREC CAsT, QuAC ve Google Natural Questions'ın soruları üzerine kurulmuştur.
Ana sayfa : https://github.com/apple/ml-qrecc
Kaynak kodu :
tfds.text.qrecc.QReCC
Sürümler :
-
1.0.0
(varsayılan): İlk sürüm.
-
İndirme boyutu :
7.60 MiB
Veri kümesi boyutu :
69.29 MiB
Otomatik önbelleğe alınmış ( belgeler ): Evet
Bölünmeler :
Bölmek | Örnekler |
---|---|
'test' | 16.451 |
'train' | 63.501 |
- Özellik yapısı :
FeaturesDict({
'answer': Text(shape=(), dtype=string),
'answer_url': Text(shape=(), dtype=string),
'context': Sequence(Text(shape=(), dtype=string)),
'conversation_id': Scalar(shape=(), dtype=int32, description=The id of the conversation.),
'question': Text(shape=(), dtype=string),
'question_rewrite': Text(shape=(), dtype=string),
'source': Text(shape=(), dtype=string),
'turn_id': Scalar(shape=(), dtype=int32, description=The id of the conversation turn, within a conversation.),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
ÖzelliklerDict | ||||
cevap | Metin | sicim | ||
answer_url | Metin | sicim | ||
bağlam | Sıra(Metin) | (Hiçbiri,) | sicim | |
konuşma_kimliği | Skaler | int32 | Konuşmanın kimliği. | |
soru | Metin | sicim | ||
soru_yeniden yazma | Metin | sicim | ||
kaynak | Metin | sicim | Verilerin orijinal kaynağı - QuAC, CAsT veya Natural Questions | |
dönüş_id | Skaler | int32 | Konuşmanın kimliği bir konuşma içinde değişir. |
Denetlenen anahtarlar (
as_supervised
belgesine bakın):None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):
- Alıntı :
@article{qrecc,
title={Open-Domain Question Answering Goes Conversational via Question Rewriting},
author={Anantha, Raviteja and Vakulenko, Svitlana and Tu, Zhucheng and Longpre, Shayne and Pulman, Stephen and Chappidi, Srinivas},
journal={Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies},
year={2021}
}