- الوصف :
CORD-19 هو مورد لأكثر من 45000 مقالة علمية ، بما في ذلك أكثر من 33000 مقالة بنص كامل ، حول COVID-19 و SARS-CoV-2 وفيروسات كورونا ذات الصلة.
للمساعدة في تنظيم المعلومات في الآداب العلمية لـ COVID-19 من خلال التلخيص التجريدي. تقوم مجموعة البيانات هذه بتحليل تلك المقالات إلى أزواج من المستندات وملخصات من full_text-abstract أو مقدمة-abstract.
تتضمن الميزات سلاسل: abstract ، full_text ، sha (تجزئة pdf) ، source_x (مصدر النشر) ، العنوان ، doi (معرف الكائن الرقمي) ، الترخيص ، المؤلفون ، وقت النشر ، المجلة ، url.
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge
كود المصدر :
tfds.summarization.Covid19sum
إصدارات :
-
1.0.0
(افتراضي): لا توجد ملاحظات حول الإصدار.
-
حجم التنزيل :
Unknown size
حجم مجموعة البيانات :
Unknown size
إرشادات التنزيل اليدوي : تتطلب مجموعة البيانات هذه تنزيل بيانات المصدر يدويًا إلى
download_config.manual_dir
(الإعدادات الافتراضية على~/tensorflow_datasets/downloads/manual/
):
يجب تنزيل مجموعة البيانات هذه يدويًا من خلال kaggle api:kaggle datasets download allen-institute-for-ai/CORD-19-research-challenge
ضع الملف المضغوط الذي تم تنزيله في المجلد اليدوي.التخزين المؤقت التلقائي ( الوثائق ): غير معروف
الانقسامات :
انشق، مزق | أمثلة |
---|
- هيكل الميزة :
FeaturesDict({
'abstract': string,
'authors': string,
'body_text': Sequence({
'section': string,
'text': string,
}),
'doi': string,
'journal': string,
'license': string,
'publish_time': string,
'sha': string,
'source_x': string,
'title': string,
'url': string,
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
نبذة مختصرة | موتر | سلسلة | ||
المؤلفون | موتر | سلسلة | ||
body_text | تسلسل | |||
body_text / قسم | موتر | سلسلة | ||
body_text / text | موتر | سلسلة | ||
دوى | موتر | سلسلة | ||
مجلة | موتر | سلسلة | ||
رخصة | موتر | سلسلة | ||
وقت النشر | موتر | سلسلة | ||
شا | موتر | سلسلة | ||
المصدر_x | موتر | سلسلة | ||
لقب | موتر | سلسلة | ||
عنوان url | موتر | سلسلة |
المفاتيح الخاضعة للإشراف (انظر
as_supervised
doc ):('body_text', 'abstract')
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ): مفقود.
الاقتباس :
@ONLINE {CORD-19-research-challenge,
author = "An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House",
title = "COVID-19 Open Research Dataset Challenge (CORD-19)",
month = "april",
year = "2020",
url = "https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge"
}