- الوصف :
MSLR-WEB هما مجموعتان من بيانات التعلم للترتيب واسع النطاق تم إصدارهما بواسطة Microsoft Research. تحتوي مجموعة البيانات الأولى (المسماة "30 كيلو") على 30000 استعلام ومجموعة البيانات الثانية (تسمى "10 كيلو") تحتوي على 10000 استعلام. تتكون كل مجموعة بيانات من أزواج من مستندات الاستعلام ممثلة كمتجهات ميزات وما يقابلها من تسميات حكم ذات صلة.
يمكنك تحديد ما إذا كنت تريد استخدام الإصدار "10 كيلو بايت" أو "30 كيلو بايت" من مجموعة البيانات ، والطي المقابل ، على النحو التالي:
ds = tfds.load("mslr_web/30k_fold1")
إذا تم تحديد mslr_web
فقط ، فسيتم تحديد الخيار mslr_web/10k_fold1
افتراضيًا:
# This is the same as `tfds.load("mslr_web/10k_fold1")`
ds = tfds.load("mslr_web")
الصفحة الرئيسية : https://www.microsoft.com/en-us/research/project/mslr/
كود المصدر :
tfds.ranking.mslr_web.MslrWeb
إصدارات :
-
1.0.0
: الإصدار الأولي. -
1.1.0
: تجميع الميزات في ميزة "float_features" واحدة. -
1.2.0
(افتراضي): إضافة معرفات الاستعلام والمستند.
-
التخزين المؤقت التلقائي ( التوثيق ): لا
هيكل الميزة :
FeaturesDict({
'doc_id': Tensor(shape=(None,), dtype=int64),
'float_features': Tensor(shape=(None, 136), dtype=float64),
'label': Tensor(shape=(None,), dtype=float64),
'query_id': Text(shape=(), dtype=string),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
doc_id | موتر | (لا أحد،) | int64 | |
تعويم_ميزات | موتر | (لا شيء ، 136) | تعويم 64 | |
ضع الكلمة المناسبة | موتر | (لا أحد،) | تعويم 64 | |
معرّف_ الاستعلام | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised
):None
الشكل ( tfds.show_examples ): غير مدعوم.
الاقتباس :
@article{DBLP:journals/corr/QinL13,
author = {Tao Qin and Tie{-}Yan Liu},
title = {Introducing {LETOR} 4.0 Datasets},
journal = {CoRR},
volume = {abs/1306.2597},
year = {2013},
url = {http://arxiv.org/abs/1306.2597},
timestamp = {Mon, 01 Jul 2013 20:31:25 +0200},
biburl = {http://dblp.uni-trier.de/rec/bib/journals/corr/QinL13},
bibsource = {dblp computer science bibliography, http://dblp.org}
}
mslr_web / 10k_fold1 (التكوين الافتراضي)
حجم التحميل :
1.15 GiB
حجم مجموعة البيانات :
310.08 MiB
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'test' | 2000 |
'train' | 6000 |
'vali' | 2000 |
- أمثلة ( tfds.as_dataframe ):
mslr_web / 10k_fold2
حجم التحميل :
1.15 GiB
حجم مجموعة البيانات :
310.08 MiB
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'test' | 2000 |
'train' | 6000 |
'vali' | 2000 |
- أمثلة ( tfds.as_dataframe ):
mslr_web / 10k_fold3
حجم التحميل :
1.15 GiB
حجم مجموعة البيانات :
310.08 MiB
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'test' | 2000 |
'train' | 6000 |
'vali' | 2000 |
- أمثلة ( tfds.as_dataframe ):
mslr_web / 10k_fold4
حجم التحميل :
1.15 GiB
حجم مجموعة البيانات :
310.08 MiB
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'test' | 2000 |
'train' | 6000 |
'vali' | 2000 |
- أمثلة ( tfds.as_dataframe ):
mslr_web / 10k_fold5
حجم التحميل :
1.15 GiB
حجم مجموعة البيانات :
310.08 MiB
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'test' | 2000 |
'train' | 6000 |
'vali' | 2000 |
- أمثلة ( tfds.as_dataframe ):
mslr_web / 30k_fold1
حجم التحميل :
3.59 GiB
حجم مجموعة البيانات :
964.09 MiB
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'test' | 6306 |
'train' | 18،919 |
'vali' | 6306 |
- أمثلة ( tfds.as_dataframe ):
mslr_web / 30k_fold2
حجم التحميل :
3.59 GiB
حجم مجموعة البيانات :
964.09 MiB
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'test' | 6307 |
'train' | 18،918 |
'vali' | 6306 |
- أمثلة ( tfds.as_dataframe ):
mslr_web / 30k_fold3
حجم التحميل :
3.59 GiB
حجم مجموعة البيانات :
964.09 MiB
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'test' | 6306 |
'train' | 18،918 |
'vali' | 6307 |
- أمثلة ( tfds.as_dataframe ):
mslr_web / 30k_fold4
حجم التحميل :
3.59 GiB
حجم مجموعة البيانات :
964.09 MiB
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'test' | 6306 |
'train' | 18،919 |
'vali' | 6306 |
- أمثلة ( tfds.as_dataframe ):
mslr_web / 30k_fold5
حجم التحميل :
3.59 GiB
حجم مجموعة البيانات :
964.09 MiB
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'test' | 6306 |
'train' | 18،919 |
'vali' | 6306 |
- أمثلة ( tfds.as_dataframe ):