scicite

  • Descripción :

Este es un conjunto de datos para clasificar las intenciones de citación en trabajos académicos. La etiqueta de intención de cita principal para cada objeto Json se especifica con la clave de etiqueta, mientras que el contexto de la cita se especifica con una clave de contexto. Ejemplo:

{
 'string': 'In chacma baboons, male-infant relationships can be linked to both
    formation of friendships and paternity success [30,31].'
 'sectionName': 'Introduction',
 'label': 'background',
 'citingPaperId': '7a6b2d4b405439',
 'citedPaperId': '9d1abadc55b5e0',
 ...
 }

Puede obtener la información completa sobre el trabajo utilizando las identificaciones de trabajo provistas con la API de Semantic Scholar ( https://api.semanticscholar.org/ ).

Las etiquetas son: Método, Fondo, Resultado

Separar Ejemplos
'test' 1,859
'train' 8,194
'validation' 916
  • Estructura de características :
FeaturesDict({
    'citeEnd': int64,
    'citeStart': int64,
    'citedPaperId': Text(shape=(), dtype=string),
    'citingPaperId': Text(shape=(), dtype=string),
    'excerpt_index': int32,
    'id': Text(shape=(), dtype=string),
    'isKeyCitation': bool,
    'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'label2': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'label2_confidence': float32,
    'label_confidence': float32,
    'sectionName': Text(shape=(), dtype=string),
    'source': ClassLabel(shape=(), dtype=int64, num_classes=7),
    'string': Text(shape=(), dtype=string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
citeEnd Tensor int64
citarIniciar Tensor int64
ID de papel citado Texto cadena
citandoPaperId Texto cadena
extracto_índice Tensor int32
identificación Texto cadena
esKeyCitation Tensor bool
etiqueta Etiqueta de clase int64
etiqueta2 Etiqueta de clase int64
etiqueta2_confianza Tensor flotar32
etiqueta_confianza Tensor flotar32
Nombre de la sección Texto cadena
fuente Etiqueta de clase int64
cadena Texto cadena
  • Cita :
@InProceedings{Cohan2019Structural,
  author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
  title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
  booktitle="NAACL",
  year="2019"
}