- Descrizione :
Questo è un set di dati per classificare gli intenti di citazione negli articoli accademici. L'etichetta dell'intento di citazione principale per ogni oggetto Json viene specificata con la chiave dell'etichetta mentre il contesto della citazione viene specificato con una chiave di contesto. Esempio:
{
'string': 'In chacma baboons, male-infant relationships can be linked to both
formation of friendships and paternity success [30,31].'
'sectionName': 'Introduction',
'label': 'background',
'citingPaperId': '7a6b2d4b405439',
'citedPaperId': '9d1abadc55b5e0',
...
}
È possibile ottenere le informazioni complete sull'articolo utilizzando gli ID carta forniti con l'API Semantic Scholar ( https://api.semanticscholar.org/ ).
Le etichette sono: Metodo, Sfondo, Risultato
Documentazione aggiuntiva : Esplora documenti con codice
Homepage : https://github.com/allenai/scicite
Codice sorgente :
tfds.datasets.scicite.Builder
Versioni :
-
1.0.0
(impostazione predefinita): nessuna nota di rilascio.
-
Dimensione del download :
22.12 MiB
Dimensione del set di dati:
7.26 MiB
Auto-cache ( documentazione ): Sì
Divisioni :
Diviso | Esempi |
---|---|
'test' | 1.859 |
'train' | 8.194 |
'validation' | 916 |
- Struttura delle caratteristiche :
FeaturesDict({
'citeEnd': int64,
'citeStart': int64,
'citedPaperId': Text(shape=(), dtype=string),
'citingPaperId': Text(shape=(), dtype=string),
'excerpt_index': int32,
'id': Text(shape=(), dtype=string),
'isKeyCitation': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label2': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label2_confidence': float32,
'label_confidence': float32,
'sectionName': Text(shape=(), dtype=string),
'source': ClassLabel(shape=(), dtype=int64, num_classes=7),
'string': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
citeFine | Tensore | int64 | ||
citeStart | Tensore | int64 | ||
citatoPaperId | Testo | corda | ||
citando PaperId | Testo | corda | ||
estratto_indice | Tensore | int32 | ||
id | Testo | corda | ||
isKeyCitation | Tensore | bool | ||
etichetta | ClassLabel | int64 | ||
etichetta2 | ClassLabel | int64 | ||
label2_confidence | Tensore | galleggiante32 | ||
etichetta_confidenza | Tensore | galleggiante32 | ||
sectionName | Testo | corda | ||
fonte | ClassLabel | int64 | ||
corda | Testo | corda |
Chiavi supervisionate (vedi
as_supervised
doc ):('string', 'label')
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ):
- Citazione :
@InProceedings{Cohan2019Structural,
author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
booktitle="NAACL",
year="2019"
}