- คำอธิบาย :
นี่คือชุดข้อมูลสำหรับจำแนกเจตนาของการอ้างอิงในเอกสารวิชาการ ป้ายกำกับการอ้างอิงหลักสำหรับออบเจ็กต์ Json แต่ละรายการระบุด้วยคีย์ป้ายกำกับในขณะที่ระบุบริบทการอ้างอิงด้วยคีย์บริบท ตัวอย่าง:
{
'string': 'In chacma baboons, male-infant relationships can be linked to both
formation of friendships and paternity success [30,31].'
'sectionName': 'Introduction',
'label': 'background',
'citingPaperId': '7a6b2d4b405439',
'citedPaperId': '9d1abadc55b5e0',
...
}
คุณอาจได้รับข้อมูลทั้งหมดเกี่ยวกับเอกสารโดยใช้รหัสเอกสารที่ให้ไว้กับ Semantic Scholar API ( https://api.semanticscholar.org/ )
ป้ายกำกับคือ: วิธีการ พื้นหลัง ผลลัพธ์
เอกสารประกอบเพิ่มเติม : สำรวจเอกสารด้วยรหัส
หน้าแรก : https://github.com/allenai/scicite
รหัสแหล่งที่มา :
tfds.datasets.scicite.Builder
รุ่น :
-
1.0.0
(ค่าเริ่มต้น): ไม่มีบันทึกประจำรุ่น
-
ขนาดการดาวน์โหลด :
22.12 MiB
ขนาดชุดข้อมูล :
7.26 MiB
แคชอัตโนมัติ ( เอกสาร ): ใช่
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 1,859 |
'train' | 8,194 |
'validation' | 916 |
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'citeEnd': int64,
'citeStart': int64,
'citedPaperId': Text(shape=(), dtype=string),
'citingPaperId': Text(shape=(), dtype=string),
'excerpt_index': int32,
'id': Text(shape=(), dtype=string),
'isKeyCitation': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label2': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label2_confidence': float32,
'label_confidence': float32,
'sectionName': Text(shape=(), dtype=string),
'source': ClassLabel(shape=(), dtype=int64, num_classes=7),
'string': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
คุณสมบัติ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
อ้างอิงEnd | เทนเซอร์ | int64 | ||
อ้างเริ่มต้น | เทนเซอร์ | int64 | ||
อ้างถึง PaperId | ข้อความ | สตริง | ||
อ้างถึง PaperId | ข้อความ | สตริง | ||
excerpt_index | เทนเซอร์ | int32 | ||
รหัส | ข้อความ | สตริง | ||
isKeyCitation | เทนเซอร์ | บูล | ||
ฉลาก | ป้ายกำกับคลาส | int64 | ||
ป้ายกำกับ2 | ป้ายกำกับคลาส | int64 | ||
label2_confidence | เทนเซอร์ | ลอย32 | ||
label_confidence | เทนเซอร์ | ลอย32 | ||
ชื่อส่วน | ข้อความ | สตริง | ||
แหล่งที่มา | ป้ายกำกับคลาส | int64 | ||
สตริง | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('string', 'label')
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ):
- การอ้างอิง :
@InProceedings{Cohan2019Structural,
author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
booktitle="NAACL",
year="2019"
}