scicite

  • Descriptif :

Il s'agit d'un ensemble de données permettant de classer les intentions de citation dans les articles universitaires. L'étiquette d'intention de citation principale pour chaque objet Json est spécifiée avec la clé d'étiquette tandis que le contexte de citation est spécifié avec une clé de contexte. Exemple:

{
 'string': 'In chacma baboons, male-infant relationships can be linked to both
    formation of friendships and paternity success [30,31].'
 'sectionName': 'Introduction',
 'label': 'background',
 'citingPaperId': '7a6b2d4b405439',
 'citedPaperId': '9d1abadc55b5e0',
 ...
 }

Vous pouvez obtenir toutes les informations sur l'article en utilisant les identifiants d'article fournis avec l'API Semantic Scholar ( https://api.semanticscholar.org/ ).

Les étiquettes sont : Méthode, Contexte, Résultat

Diviser Exemples
'test' 1 859
'train' 8 194
'validation' 916
  • Structure des fonctionnalités :
FeaturesDict({
    'citeEnd': int64,
    'citeStart': int64,
    'citedPaperId': Text(shape=(), dtype=string),
    'citingPaperId': Text(shape=(), dtype=string),
    'excerpt_index': int32,
    'id': Text(shape=(), dtype=string),
    'isKeyCitation': bool,
    'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'label2': ClassLabel(shape=(), dtype=int64, num_classes=4),
    'label2_confidence': float32,
    'label_confidence': float32,
    'sectionName': Text(shape=(), dtype=string),
    'source': ClassLabel(shape=(), dtype=int64, num_classes=7),
    'string': Text(shape=(), dtype=string),
})
  • Documentation des fonctionnalités :
Caractéristique Classe Façonner Dtype Description
FonctionnalitésDict
citerFin Tenseur int64
citerStart Tenseur int64
quotePaperId Texte chaîne de caractères
citingPaperId Texte chaîne de caractères
extrait_index Tenseur int32
identifiant Texte chaîne de caractères
isKeyCitation Tenseur bourdonner
étiquette Étiquette de classe int64
étiquette2 Étiquette de classe int64
label2_confiance Tenseur float32
label_confidence Tenseur float32
Nom de la section Texte chaîne de caractères
la source Étiquette de classe int64
chaîne de caractères Texte chaîne de caractères
  • Citation :
@InProceedings{Cohan2019Structural,
  author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
  title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
  booktitle="NAACL",
  year="2019"
}