- Description :
Un ensemble de données contenant 14 000 conversations avec 81 000 paires de questions-réponses. QReCC est construit sur les questions de TREC CAST, QuAC et Google Natural Questions.
Page d'accueil : https://github.com/apple/ml-qrecc
Code source :
tfds.text.qrecc.QReCC
Versions :
-
1.0.0
(par défaut) : version initiale.
-
Taille du téléchargement :
7.60 MiB
Taille de l'ensemble de données :
69.29 MiB
Mise en cache automatique ( documentation ) : Oui
Divisions :
Diviser | Exemples |
---|---|
'test' | 16 451 |
'train' | 63 501 |
- Structure des fonctionnalités :
FeaturesDict({
'answer': Text(shape=(), dtype=string),
'answer_url': Text(shape=(), dtype=string),
'context': Sequence(Text(shape=(), dtype=string)),
'conversation_id': Scalar(shape=(), dtype=int32, description=The id of the conversation.),
'question': Text(shape=(), dtype=string),
'question_rewrite': Text(shape=(), dtype=string),
'source': Text(shape=(), dtype=string),
'turn_id': Scalar(shape=(), dtype=int32, description=The id of the conversation turn, within a conversation.),
})
- Documentation des fonctionnalités :
Fonctionnalité | Classe | Forme | Type D | Description |
---|---|---|---|---|
FonctionnalitésDict | ||||
répondre | Texte | chaîne | ||
réponse_url | Texte | chaîne | ||
contexte | Séquence (Texte) | (Aucun,) | chaîne | |
conversation_id | Scalaire | int32 | L'identifiant de la conversation. | |
question | Texte | chaîne | ||
question_rewrite | Texte | chaîne | ||
source | Texte | chaîne | La source originale des données – soit QuAC, CAST ou Natural Questions | |
turn_id | Scalaire | int32 | L'identifiant de la conversation tourne, au sein d'une conversation. |
Clés supervisées (Voir doc
as_supervised
) :None
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ) :
- Citation :
@article{qrecc,
title={Open-Domain Question Answering Goes Conversational via Question Rewriting},
author={Anantha, Raviteja and Vakulenko, Svitlana and Tu, Zhucheng and Longpre, Shayne and Pulman, Stephen and Chappidi, Srinivas},
journal={Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies},
year={2021}
}