covid19sum

  • विवरण :

CORD-19 45,000 से अधिक विद्वानों के लेखों का एक संसाधन है, जिसमें पूर्ण पाठ के साथ 33,000 से अधिक, COVID-19, SARS-CoV-2 और संबंधित कोरोनविर्यूज़ के बारे में है।

सार संक्षेपण के माध्यम से COVID-19 के वैज्ञानिक साहित्य में सूचना को व्यवस्थित करने में मदद करना। यह डेटासेट उन लेखों को दस्तावेज़ के जोड़े और पूर्ण_पाठ-सार या परिचय-सार के सारांश के लिए पार्स करता है।

विशेषताओं में शामिल हैं: सार, पूर्ण_पाठ, शा (पीडीएफ का हैश), स्रोत_एक्स (प्रकाशन का स्रोत), शीर्षक, डीओआई (डिजिटल वस्तु पहचानकर्ता), लाइसेंस, लेखक, प्रकाशन_समय, पत्रिका, यूआरएल।

  • अतिरिक्त दस्तावेज़ीकरण : कोड वाले पेपर्स पर एक्सप्लोर करें

  • होमपेज : https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge

  • स्रोत कोड : tfds.summarization.Covid19sum

  • संस्करण :

    • 1.0.0 (डिफ़ॉल्ट): कोई रिलीज़ नोट नहीं।
  • डाउनलोड आकार : Unknown size

  • डेटासेट का आकार : Unknown size

  • मैन्युअल डाउनलोड निर्देश : इस डेटासेट के लिए आपको स्रोत डेटा को मैन्युअल रूप से download_config.manual_dir (डिफ़ॉल्ट रूप से ~/tensorflow_datasets/downloads/manual/ ) में डाउनलोड करना होगा:
    इस डेटासेट को kaggle api के माध्यम से मैन्युअल रूप से डाउनलोड करने की आवश्यकता है: kaggle datasets download allen-institute-for-ai/CORD-19-research-challenge डाउनलोड की गई ज़िप फ़ाइल को मैन्युअल फ़ोल्डर में रखें।

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): अज्ञात

  • विभाजन :

विभाजित करना उदाहरण
  • फ़ीचर संरचना :
FeaturesDict({
    'abstract': string,
    'authors': string,
    'body_text': Sequence({
        'section': string,
        'text': string,
    }),
    'doi': string,
    'journal': string,
    'license': string,
    'publish_time': string,
    'sha': string,
    'source_x': string,
    'title': string,
    'url': string,
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
सार टेन्सर डोरी
लेखकों टेन्सर डोरी
मुख्य भाग क्रम
बॉडी_टेक्स्ट/सेक्शन टेन्सर डोरी
बॉडी_टेक्स्ट/टेक्स्ट टेन्सर डोरी
दोई टेन्सर डोरी
पत्रिका टेन्सर डोरी
लाइसेंस टेन्सर डोरी
publish_time टेन्सर डोरी
शा टेन्सर डोरी
स्रोत_x टेन्सर डोरी
शीर्षक टेन्सर डोरी
यूआरएल टेन्सर डोरी
@ONLINE {CORD-19-research-challenge,
    author = "An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House",
    title  = "COVID-19 Open Research Dataset Challenge (CORD-19)",
    month  = "april",
    year   = "2020",
    url    = "https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge"
}