covid19sum

  • คำอธิบาย :

CORD-19 เป็นแหล่งข้อมูลที่มีบทความวิชาการมากกว่า 45,000 บทความ รวมถึงบทความฉบับสมบูรณ์กว่า 33,000 บทความเกี่ยวกับ COVID-19, SARS-CoV-2 และไวรัสโคโรนาที่เกี่ยวข้อง

เพื่อช่วยจัดระเบียบข้อมูลในวรรณกรรมทางวิทยาศาสตร์ของ COVID-19 ผ่านการสรุปที่เป็นนามธรรม ชุดข้อมูลนี้จะวิเคราะห์บทความเหล่านั้นเป็นคู่ของเอกสารและบทสรุปของ full_text-abstract หรือ Introduction-abstract

คุณลักษณะรวมถึงสตริงของ: บทคัดย่อ, full_text, sha (แฮชของ pdf), source_x (แหล่งที่มาของสิ่งพิมพ์), ชื่อเรื่อง, doi (ตัวระบุวัตถุดิจิทัล), ใบอนุญาต, ผู้แต่ง, publish_time, วารสาร, url

  • เอกสารประกอบเพิ่มเติม : สำรวจเอกสารด้วยรหัส

  • หน้าแรก : https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge

  • รหัสที่มา : tfds.summarization.Covid19sum

  • รุ่น :

    • 1.0.0 (ค่าเริ่มต้น): ไม่มีบันทึกประจำรุ่น
  • ขนาดการดาวน์โหลด : Unknown size

  • ขนาดชุดข้อมูล : Unknown size

  • คำแนะนำในการดาวน์โหลดด้วยตนเอง : ชุดข้อมูลนี้กำหนดให้คุณต้องดาวน์โหลดแหล่งข้อมูลด้วยตนเองลงใน download_config.manual_dir (ค่าเริ่มต้นเป็น ~/tensorflow_datasets/downloads/manual/ ):
    ชุดข้อมูลนี้จำเป็นต้องดาวน์โหลดด้วยตนเองผ่าน kaggle api: kaggle datasets download allen-institute-for-ai/CORD-19-research-challenge วางไฟล์ zip ที่ดาวน์โหลดไว้ในโฟลเดอร์คู่มือ

  • แคชอัตโนมัติ ( เอกสาร ): ไม่รู้จัก

  • แยก :

แยก ตัวอย่าง
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'abstract': string,
    'authors': string,
    'body_text': Sequence({
        'section': string,
        'text': string,
    }),
    'doi': string,
    'journal': string,
    'license': string,
    'publish_time': string,
    'sha': string,
    'source_x': string,
    'title': string,
    'url': string,
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
บทคัดย่อ เทนเซอร์ สตริง
ผู้เขียน เทนเซอร์ สตริง
body_text ลำดับ
body_text/section เทนเซอร์ สตริง
body_text/ข้อความ เทนเซอร์ สตริง
ดอย เทนเซอร์ สตริง
วารสาร เทนเซอร์ สตริง
ใบอนุญาต เทนเซอร์ สตริง
เผยแพร่_เวลา เทนเซอร์ สตริง
ชา เทนเซอร์ สตริง
แหล่งที่มา_x เทนเซอร์ สตริง
ชื่อ เทนเซอร์ สตริง
URL เทนเซอร์ สตริง
  • คีย์ภายใต้การดูแล (ดู as_supervised doc ): ('body_text', 'abstract')

  • รูปภาพ ( tfds.show_examples ): ไม่รองรับ

  • ตัวอย่าง ( tfds.as_dataframe ): ไม่มี

  • การอ้างอิง :

@ONLINE {CORD-19-research-challenge,
    author = "An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House",
    title  = "COVID-19 Open Research Dataset Challenge (CORD-19)",
    month  = "april",
    year   = "2020",
    url    = "https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge"
}