- توضیحات :
این مجموعه داده ای برای طبقه بندی اهداف استنادی در مقالات دانشگاهی است. برچسب اصلی استناد برای هر شی Json با کلید برچسب مشخص می شود در حالی که زمینه استناد با یک کلید زمینه مشخص می شود. مثال:
{
'string': 'In chacma baboons, male-infant relationships can be linked to both
formation of friendships and paternity success [30,31].'
'sectionName': 'Introduction',
'label': 'background',
'citingPaperId': '7a6b2d4b405439',
'citedPaperId': '9d1abadc55b5e0',
...
}
می توانید اطلاعات کامل مقاله را با استفاده از شناسه های مقاله ارائه شده با Semantic Scholar API ( https://api.semanticscholar.org/ ) به دست آورید.
برچسب ها عبارتند از: روش، پس زمینه، نتیجه
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://github.com/allenai/scicite
کد منبع :
tfds.datasets.scicite.Builder
نسخه ها :
-
1.0.0
(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
22.12 MiB
حجم مجموعه داده :
7.26 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 1,859 |
'train' | 8,194 |
'validation' | 916 |
- ساختار ویژگی :
FeaturesDict({
'citeEnd': int64,
'citeStart': int64,
'citedPaperId': Text(shape=(), dtype=string),
'citingPaperId': Text(shape=(), dtype=string),
'excerpt_index': int32,
'id': Text(shape=(), dtype=string),
'isKeyCitation': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label2': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label2_confidence': float32,
'label_confidence': float32,
'sectionName': Text(shape=(), dtype=string),
'source': ClassLabel(shape=(), dtype=int64, num_classes=7),
'string': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
citeEnd | تانسور | int64 | ||
citeStart | تانسور | int64 | ||
به نقل از PaperId | متن | رشته | ||
با استناد به PaperId | متن | رشته | ||
excerpt_index | تانسور | int32 | ||
شناسه | متن | رشته | ||
isKeyCitation | تانسور | بوول | ||
برچسب | ClassLabel | int64 | ||
label2 | ClassLabel | int64 | ||
label2_اعتماد | تانسور | float32 | ||
برچسب_اعتماد | تانسور | float32 | ||
نام بخش | متن | رشته | ||
منبع | ClassLabel | int64 | ||
رشته | متن | رشته |
کلیدهای نظارت شده (مشاهده
as_supervised
doc ):('string', 'label')
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@InProceedings{Cohan2019Structural,
author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
booktitle="NAACL",
year="2019"
}