- คำอธิบาย :
MSLR-WEB เป็นชุดข้อมูล Learning-to-Rank ขนาดใหญ่สองชุดที่เผยแพร่โดย Microsoft Research ชุดข้อมูลแรก (เรียกว่า "30k") มีข้อความค้นหา 30,000 รายการ และชุดข้อมูลที่สอง (เรียกว่า "10k") มีข้อความค้นหา 10,000 รายการ ชุดข้อมูลแต่ละชุดประกอบด้วยคู่ของคิวรี-เอกสารที่แสดงเป็นเวกเตอร์คุณลักษณะและป้ายกำกับการตัดสินความเกี่ยวข้องที่สอดคล้องกัน
คุณสามารถระบุว่าจะใช้ชุดข้อมูลเวอร์ชัน "10k" หรือ "30k" และพับที่เกี่ยวข้องได้ดังต่อไปนี้:
ds = tfds.load("mslr_web/30k_fold1")
หากระบุเฉพาะ mslr_web
ตัวเลือก mslr_web/10k_fold1
จะถูกเลือกตามค่าเริ่มต้น:
# This is the same as `tfds.load("mslr_web/10k_fold1")`
ds = tfds.load("mslr_web")
โฮมเพจ : https://www.microsoft.com/en-us/research/project/mslr/
รหัสที่มา :
tfds.ranking.mslr_web.MslrWeb
รุ่น :
-
1.0.0
: การเปิดตัวครั้งแรก -
1.1.0
: รวมคุณสมบัติเป็นคุณสมบัติ 'float_features' เดียว -
1.2.0
(ค่าเริ่มต้น): เพิ่มตัวระบุการค้นหาและเอกสาร
-
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
โครงสร้างคุณลักษณะ :
FeaturesDict({
'doc_id': Tensor(shape=(None,), dtype=int64),
'float_features': Tensor(shape=(None, 136), dtype=float64),
'label': Tensor(shape=(None,), dtype=float64),
'query_id': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
คุณสมบัติDict | ||||
doc_id | เทนเซอร์ | (ไม่มี,) | int64 | |
float_features | เทนเซอร์ | (ไม่มี, 136) | float64 | |
ฉลาก | เทนเซอร์ | (ไม่มี,) | float64 | |
แบบสอบถาม_id | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):None
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
การอ้างอิง :
@article{DBLP:journals/corr/QinL13,
author = {Tao Qin and Tie{-}Yan Liu},
title = {Introducing {LETOR} 4.0 Datasets},
journal = {CoRR},
volume = {abs/1306.2597},
year = {2013},
url = {http://arxiv.org/abs/1306.2597},
timestamp = {Mon, 01 Jul 2013 20:31:25 +0200},
biburl = {http://dblp.uni-trier.de/rec/bib/journals/corr/QinL13},
bibsource = {dblp computer science bibliography, http://dblp.org}
}
mslr_web/10k_fold1 (ค่าเริ่มต้น)
ขนาดการดาวน์โหลด :
1.15 GiB
ขนาดชุดข้อมูล :
310.08 MiB
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
mslr_web/10k_fold2
ขนาดการดาวน์โหลด :
1.15 GiB
ขนาดชุดข้อมูล :
310.08 MiB
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
mslr_web/10k_fold3
ขนาดการดาวน์โหลด :
1.15 GiB
ขนาดชุดข้อมูล :
310.08 MiB
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
mslr_web/10k_fold4
ขนาดการดาวน์โหลด :
1.15 GiB
ขนาดชุดข้อมูล :
310.08 MiB
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
mslr_web/10k_fold5
ขนาดการดาวน์โหลด :
1.15 GiB
ขนาดชุดข้อมูล :
310.08 MiB
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2,000 |
'train' | 6,000 |
'vali' | 2,000 |
- ตัวอย่าง ( tfds.as_dataframe ):
mslr_web/30k_fold1
ขนาดการดาวน์โหลด :
3.59 GiB
ขนาดชุดข้อมูล :
964.09 MiB
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 6,306 |
'train' | 18,919 |
'vali' | 6,306 |
- ตัวอย่าง ( tfds.as_dataframe ):
mslr_web/30k_fold2
ขนาดการดาวน์โหลด :
3.59 GiB
ขนาดชุดข้อมูล :
964.09 MiB
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 6,307 |
'train' | 18,918 |
'vali' | 6,306 |
- ตัวอย่าง ( tfds.as_dataframe ):
mslr_web/30k_fold3
ขนาดการดาวน์โหลด :
3.59 GiB
ขนาดชุดข้อมูล :
964.09 MiB
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 6,306 |
'train' | 18,918 |
'vali' | 6,307 |
- ตัวอย่าง ( tfds.as_dataframe ):
mslr_web/30k_fold4
ขนาดการดาวน์โหลด :
3.59 GiB
ขนาดชุดข้อมูล :
964.09 MiB
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 6,306 |
'train' | 18,919 |
'vali' | 6,306 |
- ตัวอย่าง ( tfds.as_dataframe ):
mslr_web/30k_fold5
ขนาดการดาวน์โหลด :
3.59 GiB
ขนาดชุดข้อมูล :
964.09 MiB
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 6,306 |
'train' | 18,919 |
'vali' | 6,306 |
- ตัวอย่าง ( tfds.as_dataframe ):