- Descriptif :
Il s'agit d'un ensemble de données permettant de classer les intentions de citation dans les articles universitaires. L'étiquette d'intention de citation principale pour chaque objet Json est spécifiée avec la clé d'étiquette tandis que le contexte de citation est spécifié avec une clé de contexte. Exemple:
{
'string': 'In chacma baboons, male-infant relationships can be linked to both
formation of friendships and paternity success [30,31].'
'sectionName': 'Introduction',
'label': 'background',
'citingPaperId': '7a6b2d4b405439',
'citedPaperId': '9d1abadc55b5e0',
...
}
Vous pouvez obtenir toutes les informations sur l'article en utilisant les identifiants d'article fournis avec l'API Semantic Scholar ( https://api.semanticscholar.org/ ).
Les étiquettes sont : Méthode, Contexte, Résultat
Documentation complémentaire : Explorer sur Papers With Code
Page d' accueil : https://github.com/allenai/scicite
Code source :
tfds.datasets.scicite.Builder
Versions :
-
1.0.0
(par défaut) : aucune note de version.
-
Taille du téléchargement :
22.12 MiB
Taille du jeu de données :
7.26 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'test' | 1 859 |
'train' | 8 194 |
'validation' | 916 |
- Structure des fonctionnalités :
FeaturesDict({
'citeEnd': int64,
'citeStart': int64,
'citedPaperId': Text(shape=(), dtype=string),
'citingPaperId': Text(shape=(), dtype=string),
'excerpt_index': int32,
'id': Text(shape=(), dtype=string),
'isKeyCitation': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label2': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label2_confidence': float32,
'label_confidence': float32,
'sectionName': Text(shape=(), dtype=string),
'source': ClassLabel(shape=(), dtype=int64, num_classes=7),
'string': Text(shape=(), dtype=string),
})
- Documentation des fonctionnalités :
Caractéristique | Classe | Façonner | Dtype | Description |
---|---|---|---|---|
FonctionnalitésDict | ||||
citerFin | Tenseur | int64 | ||
citerStart | Tenseur | int64 | ||
quotePaperId | Texte | chaîne de caractères | ||
citingPaperId | Texte | chaîne de caractères | ||
extrait_index | Tenseur | int32 | ||
identifiant | Texte | chaîne de caractères | ||
isKeyCitation | Tenseur | bourdonner | ||
étiquette | Étiquette de classe | int64 | ||
étiquette2 | Étiquette de classe | int64 | ||
label2_confiance | Tenseur | float32 | ||
label_confidence | Tenseur | float32 | ||
Nom de la section | Texte | chaîne de caractères | ||
la source | Étiquette de classe | int64 | ||
chaîne de caractères | Texte | chaîne de caractères |
Clés supervisées (Voir
as_supervised
doc ):('string', 'label')
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@InProceedings{Cohan2019Structural,
author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
booktitle="NAACL",
year="2019"
}