- विवरण :
यह अकादमिक पत्रों में उद्धरण के उद्देश्यों को वर्गीकृत करने के लिए एक डेटासेट है। प्रत्येक Json ऑब्जेक्ट के लिए मुख्य उद्धरण आशय लेबल लेबल कुंजी के साथ निर्दिष्ट किया गया है जबकि उद्धरण संदर्भ संदर्भ कुंजी के साथ निर्दिष्ट किया गया है। उदाहरण:
{
'string': 'In chacma baboons, male-infant relationships can be linked to both
formation of friendships and paternity success [30,31].'
'sectionName': 'Introduction',
'label': 'background',
'citingPaperId': '7a6b2d4b405439',
'citedPaperId': '9d1abadc55b5e0',
...
}
आप सिमेंटिक स्कॉलर एपीआई ( https://api.semanticscholar.org/ ) के साथ प्रदान की गई पेपर आईडी का उपयोग करके पेपर के बारे में पूरी जानकारी प्राप्त कर सकते हैं।
लेबल हैं: विधि, पृष्ठभूमि, परिणाम
होमपेज : https://github.com/allenai/scicite
स्रोत कोड :
tfds.datasets.scicite.Builder
संस्करण :
-
1.0.0
(डिफ़ॉल्ट): कोई रिलीज़ नोट नहीं।
-
डाउनलोड आकार :
22.12 MiB
डेटासेट का आकार :
7.26 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 1,859 |
'train' | 8,194 |
'validation' | 916 |
- फ़ीचर संरचना :
FeaturesDict({
'citeEnd': int64,
'citeStart': int64,
'citedPaperId': Text(shape=(), dtype=string),
'citingPaperId': Text(shape=(), dtype=string),
'excerpt_index': int32,
'id': Text(shape=(), dtype=string),
'isKeyCitation': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label2': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label2_confidence': float32,
'label_confidence': float32,
'sectionName': Text(shape=(), dtype=string),
'source': ClassLabel(shape=(), dtype=int64, num_classes=7),
'string': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीटाइप | विवरण |
---|---|---|---|---|
विशेषताएं डिक्ट | ||||
उद्धृत अंत | टेन्सर | int64 | ||
citeStart | टेन्सर | int64 | ||
उद्धृत पेपरआईडी | मूलपाठ | डोरी | ||
पेपरआईडी का हवाला देते हुए | मूलपाठ | डोरी | ||
अंश_सूचकांक | टेन्सर | int32 | ||
पहचान | मूलपाठ | डोरी | ||
isKeyCation | टेन्सर | बूल | ||
लेबल | क्लासलेबल | int64 | ||
लेबल2 | क्लासलेबल | int64 | ||
लेबल2_आत्मविश्वास | टेन्सर | फ्लोट32 | ||
लेबल_आत्मविश्वास | टेन्सर | फ्लोट32 | ||
अनुभाग का नाम | मूलपाठ | डोरी | ||
स्रोत | क्लासलेबल | int64 | ||
डोरी | मूलपाठ | डोरी |
पर्यवेक्षित कुंजी (
as_supervised
दस्तावेज़ देखें):('string', 'label')
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
@InProceedings{Cohan2019Structural,
author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
booktitle="NAACL",
year="2019"
}