- বর্ণনা :
এটি একাডেমিক কাগজপত্রে উদ্ধৃতি উদ্দেশ্য শ্রেণীবদ্ধ করার জন্য একটি ডেটাসেট। প্রতিটি Json অবজেক্টের জন্য প্রধান উদ্ধৃতি উদ্দেশ্য লেবেল লেবেল কী দিয়ে নির্দিষ্ট করা হয় যখন উদ্ধৃতি প্রসঙ্গে একটি প্রসঙ্গ কী দিয়ে নির্দিষ্ট করা হয়। উদাহরণ:
{
'string': 'In chacma baboons, male-infant relationships can be linked to both
formation of friendships and paternity success [30,31].'
'sectionName': 'Introduction',
'label': 'background',
'citingPaperId': '7a6b2d4b405439',
'citedPaperId': '9d1abadc55b5e0',
...
}
আপনি সেম্যান্টিক স্কলার API ( https://api.semanticscholar.org/ ) দিয়ে প্রদত্ত পেপার আইডি ব্যবহার করে কাগজ সম্পর্কে সম্পূর্ণ তথ্য পেতে পারেন।
লেবেলগুলি হল: পদ্ধতি, পটভূমি, ফলাফল
হোমপেজ : https://github.com/allenai/scicite
সোর্স কোড :
tfds.datasets.scicite.Builder
সংস্করণ :
-
1.0.0
(ডিফল্ট): কোনো রিলিজ নোট নেই।
-
ডাউনলোড সাইজ :
22.12 MiB
ডেটাসেটের আকার :
7.26 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 1,859 |
'train' | 8,194 |
'validation' | 916 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'citeEnd': int64,
'citeStart': int64,
'citedPaperId': Text(shape=(), dtype=string),
'citingPaperId': Text(shape=(), dtype=string),
'excerpt_index': int32,
'id': Text(shape=(), dtype=string),
'isKeyCitation': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label2': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label2_confidence': float32,
'label_confidence': float32,
'sectionName': Text(shape=(), dtype=string),
'source': ClassLabel(shape=(), dtype=int64, num_classes=7),
'string': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
citeEnd | টেনসর | int64 | ||
সূচনা | টেনসর | int64 | ||
উদ্ধৃত পেপারআইডি | পাঠ্য | স্ট্রিং | ||
উদ্ধৃতি পেপারআইডি | পাঠ্য | স্ট্রিং | ||
excerpt_index | টেনসর | int32 | ||
আইডি | পাঠ্য | স্ট্রিং | ||
isKeyCitation | টেনসর | bool | ||
লেবেল | ক্লাসলেবেল | int64 | ||
লেবেল2 | ক্লাসলেবেল | int64 | ||
লেবেল2_আত্মবিশ্বাস | টেনসর | float32 | ||
লেবেল_বিশ্বাস | টেনসর | float32 | ||
বিভাগের নাম | পাঠ্য | স্ট্রিং | ||
সূত্র | ক্লাসলেবেল | int64 | ||
স্ট্রিং | পাঠ্য | স্ট্রিং |
তত্ত্বাবধান করা কী (দেখুন
as_supervised
doc ):('string', 'label')
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ):
- উদ্ধৃতি :
@InProceedings{Cohan2019Structural,
author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
booktitle="NAACL",
year="2019"
}