- الوصف :
جمل ويكيبيديا مع امتدادات بارزة.
الصفحة الرئيسية : https://www.tensorflow.org/datasets/catalog/salient_span_wikipedia
كود المصدر :
tfds.datasets.salient_span_wikipedia.Builder
إصدارات :
-
1.0.0
(افتراضي): لا توجد ملاحظات حول الإصدار.
-
حجم التنزيل :
Unknown size
التخزين المؤقت التلقائي ( التوثيق ): لا
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised
):None
الشكل ( tfds.show_examples ): غير مدعوم.
الاقتباس :
@article{guu2020realm,
title={REALM: Retrieval-Augmented Language Model Pre-Training},
author={Kelvin Guu and Kenton Lee and Zora Tung and Panupong Pasupat and Ming-Wei Chang},
year={2020},
journal = {arXiv e-prints},
archivePrefix = {arXiv},
eprint={2002.08909},
}
salient_span_wikipedia / الجمل (التكوين الافتراضي)
وصف التكوين : الأمثلة عبارة عن جمل فردية تحتوي على كيانات.
حجم مجموعة البيانات :
20.57 GiB
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'train' | 82291706 |
- هيكل الميزة :
FeaturesDict({
'spans': Sequence({
'limit': int32,
'start': int32,
'type': string,
}),
'text': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
يمتد | تسلسل | |||
يمتد / الحد | موتر | int32 | ||
يمتد / البداية | موتر | int32 | ||
يمتد / النوع | موتر | سلسلة | ||
نص | نص | سلسلة | ||
لقب | نص | سلسلة |
- أمثلة ( tfds.as_dataframe ):
salient_span_wikipedia / documents
وصف التكوين : أمثلة على الوثائق الكاملة.
حجم مجموعة البيانات :
16.52 GiB
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'train' | 13353.718 |
- هيكل الميزة :
FeaturesDict({
'sentences': Sequence({
'limit': int32,
'start': int32,
}),
'spans': Sequence({
'limit': int32,
'start': int32,
'type': string,
}),
'text': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
جمل | تسلسل | |||
جمل / حد | موتر | int32 | ||
جمل / ابدأ | موتر | int32 | ||
يمتد | تسلسل | |||
يمتد / الحد | موتر | int32 | ||
يمتد / البداية | موتر | int32 | ||
يمتد / النوع | موتر | سلسلة | ||
نص | نص | سلسلة | ||
لقب | نص | سلسلة |
- أمثلة ( tfds.as_dataframe ):