- คำอธิบาย :
CORD-19 เป็นแหล่งข้อมูลที่มีบทความวิชาการมากกว่า 45,000 บทความ รวมถึงบทความฉบับสมบูรณ์กว่า 33,000 บทความเกี่ยวกับ COVID-19, SARS-CoV-2 และไวรัสโคโรนาที่เกี่ยวข้อง
เพื่อช่วยจัดระเบียบข้อมูลในวรรณกรรมทางวิทยาศาสตร์ของ COVID-19 ผ่านการสรุปที่เป็นนามธรรม ชุดข้อมูลนี้จะวิเคราะห์บทความเหล่านั้นเป็นคู่ของเอกสารและบทสรุปของ full_text-abstract หรือ Introduction-abstract
คุณลักษณะรวมถึงสตริงของ: บทคัดย่อ, full_text, sha (แฮชของ pdf), source_x (แหล่งที่มาของสิ่งพิมพ์), ชื่อเรื่อง, doi (ตัวระบุวัตถุดิจิทัล), ใบอนุญาต, ผู้แต่ง, publish_time, วารสาร, url
เอกสารประกอบเพิ่มเติม : สำรวจเอกสารด้วยรหัส
หน้าแรก : https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge
รหัสที่มา :
tfds.summarization.Covid19sum
รุ่น :
-
1.0.0
(ค่าเริ่มต้น): ไม่มีบันทึกประจำรุ่น
-
ขนาดการดาวน์โหลด :
Unknown size
ขนาดชุดข้อมูล :
Unknown size
คำแนะนำในการดาวน์โหลดด้วยตนเอง : ชุดข้อมูลนี้กำหนดให้คุณต้องดาวน์โหลดแหล่งข้อมูลด้วยตนเองลงใน
download_config.manual_dir
(ค่าเริ่มต้นเป็น~/tensorflow_datasets/downloads/manual/
):
ชุดข้อมูลนี้จำเป็นต้องดาวน์โหลดด้วยตนเองผ่าน kaggle api:kaggle datasets download allen-institute-for-ai/CORD-19-research-challenge
วางไฟล์ zip ที่ดาวน์โหลดไว้ในโฟลเดอร์คู่มือแคชอัตโนมัติ ( เอกสาร ): ไม่รู้จัก
แยก :
แยก | ตัวอย่าง |
---|
- โครงสร้างคุณลักษณะ :
FeaturesDict({
'abstract': string,
'authors': string,
'body_text': Sequence({
'section': string,
'text': string,
}),
'doi': string,
'journal': string,
'license': string,
'publish_time': string,
'sha': string,
'source_x': string,
'title': string,
'url': string,
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
บทคัดย่อ | เทนเซอร์ | สตริง | ||
ผู้เขียน | เทนเซอร์ | สตริง | ||
body_text | ลำดับ | |||
body_text/section | เทนเซอร์ | สตริง | ||
body_text/ข้อความ | เทนเซอร์ | สตริง | ||
ดอย | เทนเซอร์ | สตริง | ||
วารสาร | เทนเซอร์ | สตริง | ||
ใบอนุญาต | เทนเซอร์ | สตริง | ||
เผยแพร่_เวลา | เทนเซอร์ | สตริง | ||
ชา | เทนเซอร์ | สตริง | ||
แหล่งที่มา_x | เทนเซอร์ | สตริง | ||
ชื่อ | เทนเซอร์ | สตริง | ||
URL | เทนเซอร์ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('body_text', 'abstract')
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
ตัวอย่าง ( tfds.as_dataframe ): ไม่มี
การอ้างอิง :
@ONLINE {CORD-19-research-challenge,
author = "An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House",
title = "COVID-19 Open Research Dataset Challenge (CORD-19)",
month = "april",
year = "2020",
url = "https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge"
}