- Descrizione :
Un set di dati contenente 14.000 conversazioni con 81.000 coppie domanda-risposta. QReCC si basa su domande di TREC CAsT, QuAC e Google Natural Questions.
Home page : https://github.com/apple/ml-qrecc
Codice sorgente :
tfds.text.qrecc.QReCC
Versioni :
-
1.0.0
(impostazione predefinita): versione iniziale.
-
Dimensione download :
7.60 MiB
Dimensione del set di dati :
69.29 MiB
Memorizzazione nella cache automatica ( documentazione ): sì
Divide :
Diviso | Esempi |
---|---|
'test' | 16.451 |
'train' | 63.501 |
- Struttura delle caratteristiche :
FeaturesDict({
'answer': Text(shape=(), dtype=string),
'answer_url': Text(shape=(), dtype=string),
'context': Sequence(Text(shape=(), dtype=string)),
'conversation_id': Scalar(shape=(), dtype=int32, description=The id of the conversation.),
'question': Text(shape=(), dtype=string),
'question_rewrite': Text(shape=(), dtype=string),
'source': Text(shape=(), dtype=string),
'turn_id': Scalar(shape=(), dtype=int32, description=The id of the conversation turn, within a conversation.),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
risposta | Testo | corda | ||
risposta_url | Testo | corda | ||
contesto | Sequenza(Testo) | (Nessuno,) | corda | |
conversazione_id | Scalare | int32 | L'ID della conversazione. | |
domanda | Testo | corda | ||
domanda_riscrivi | Testo | corda | ||
fonte | Testo | corda | La fonte originale dei dati: QuAC, CAsT o Natural Questions | |
turn_id | Scalare | int32 | L'id della conversazione si trasforma, all'interno di una conversazione. |
Chiavi supervisionate (vedi il documento
as_supervised
):None
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ):
- Citazione :
@article{qrecc,
title={Open-Domain Question Answering Goes Conversational via Question Rewriting},
author={Anantha, Raviteja and Vakulenko, Svitlana and Tu, Zhucheng and Longpre, Shayne and Pulman, Stephen and Chappidi, Srinivas},
journal={Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies},
year={2021}
}