- Descripción :
Este es un conjunto de datos para clasificar las intenciones de citación en trabajos académicos. La etiqueta de intención de cita principal para cada objeto Json se especifica con la clave de etiqueta, mientras que el contexto de la cita se especifica con una clave de contexto. Ejemplo:
{
'string': 'In chacma baboons, male-infant relationships can be linked to both
formation of friendships and paternity success [30,31].'
'sectionName': 'Introduction',
'label': 'background',
'citingPaperId': '7a6b2d4b405439',
'citedPaperId': '9d1abadc55b5e0',
...
}
Puede obtener la información completa sobre el trabajo utilizando las identificaciones de trabajo provistas con la API de Semantic Scholar ( https://api.semanticscholar.org/ ).
Las etiquetas son: Método, Fondo, Resultado
Documentación adicional : Explore en Papers With Code
Página de inicio: https://github.com/allenai/scicite
Código fuente :
tfds.datasets.scicite.Builder
Versiones :
-
1.0.0
(predeterminado): Sin notas de la versión.
-
Tamaño de la descarga :
22.12 MiB
Tamaño del conjunto de datos :
7.26 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 1,859 |
'train' | 8,194 |
'validation' | 916 |
- Estructura de características :
FeaturesDict({
'citeEnd': int64,
'citeStart': int64,
'citedPaperId': Text(shape=(), dtype=string),
'citingPaperId': Text(shape=(), dtype=string),
'excerpt_index': int32,
'id': Text(shape=(), dtype=string),
'isKeyCitation': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label2': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label2_confidence': float32,
'label_confidence': float32,
'sectionName': Text(shape=(), dtype=string),
'source': ClassLabel(shape=(), dtype=int64, num_classes=7),
'string': Text(shape=(), dtype=string),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
citeEnd | Tensor | int64 | ||
citarIniciar | Tensor | int64 | ||
ID de papel citado | Texto | cadena | ||
citandoPaperId | Texto | cadena | ||
extracto_índice | Tensor | int32 | ||
identificación | Texto | cadena | ||
esKeyCitation | Tensor | bool | ||
etiqueta | Etiqueta de clase | int64 | ||
etiqueta2 | Etiqueta de clase | int64 | ||
etiqueta2_confianza | Tensor | flotar32 | ||
etiqueta_confianza | Tensor | flotar32 | ||
Nombre de la sección | Texto | cadena | ||
fuente | Etiqueta de clase | int64 | ||
cadena | Texto | cadena |
Claves supervisadas (ver
as_supervised
doc ):('string', 'label')
Figura ( tfds.show_examples ): no compatible.
Ejemplos ( tfds.as_dataframe ):
- Cita :
@InProceedings{Cohan2019Structural,
author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
booktitle="NAACL",
year="2019"
}