- Descripción :
El conjunto de datos de equivalencia de respuesta contiene calificaciones humanas sobre predicciones de modelos de varios modelos en el conjunto de datos SQuAD. Las calificaciones establecen si la respuesta pronosticada es 'equivalente' a la respuesta dorada (teniendo en cuenta tanto la pregunta como el contexto).
Más específicamente, por 'equivalente' queremos decir que la respuesta predicha contiene al menos la misma información que la respuesta dorada y no agrega información superflua. El conjunto de datos contiene anotaciones para: * predicciones de BiDAF en SQuAD dev * predicciones de XLNet en SQuAD dev * predicciones de Luke en SQuAD dev * predicciones de Albert en SQuAD ejemplos de entrenamiento, desarrollo y prueba
Página de inicio: https://github.com/google-research-datasets/answer-equivalence-dataset
Código fuente :
tfds.datasets.answer_equivalence.Builder
Versiones :
-
1.0.0
(predeterminado): versión inicial.
-
Tamaño de la descarga :
45.86 MiB
Tamaño del conjunto de datos :
47.24 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'ae_dev' | 4,446 |
'ae_test' | 9,724 |
'dev_bidaf' | 7,522 |
'dev_luke' | 4,590 |
'dev_xlnet' | 7,932 |
'train' | 9,090 |
- Estructura de características :
FeaturesDict({
'candidate': Text(shape=(), dtype=string),
'context': Text(shape=(), dtype=string),
'gold_index': int32,
'qid': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
'question_1': ClassLabel(shape=(), dtype=int64, num_classes=3),
'question_2': ClassLabel(shape=(), dtype=int64, num_classes=3),
'question_3': ClassLabel(shape=(), dtype=int64, num_classes=3),
'question_4': ClassLabel(shape=(), dtype=int64, num_classes=3),
'reference': Text(shape=(), dtype=string),
'score': float32,
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
candidato | Texto | cuerda | ||
contexto | Texto | cuerda | ||
índice_oro | Tensor | int32 | ||
qid | Texto | cuerda | ||
pregunta | Texto | cuerda | ||
Pregunta 1 | Etiqueta de clase | int64 | ||
Pregunta 2 | Etiqueta de clase | int64 | ||
Pregunta 3 | Etiqueta de clase | int64 | ||
pregunta_4 | Etiqueta de clase | int64 | ||
referencia | Texto | cuerda | ||
puntaje | Tensor | flotar32 |
Claves supervisadas (Ver
as_supervised
doc ):None
Figura ( tfds.show_examples ): no compatible.
Ejemplos ( tfds.as_dataframe ):
- Cita :
@article{bulian-etal-2022-tomayto,
title={Tomayto, Tomahto. Beyond Token-level Answer Equivalence for Question Answering Evaluation},
author={Jannis Bulian and Christian Buck and Wojciech Gajewski and Benjamin Boerschinger and Tal Schuster},
year={2022},
eprint={2202.07654},
archivePrefix={arXiv},
primaryClass={cs.CL}
}