mslr_web

  • คำอธิบาย :

MSLR-WEB เป็นชุดข้อมูล Learning-to-Rank ขนาดใหญ่สองชุดที่เผยแพร่โดย Microsoft Research ชุดข้อมูลแรก (เรียกว่า "30k") มีข้อความค้นหา 30,000 รายการ และชุดข้อมูลที่สอง (เรียกว่า "10k") มีข้อความค้นหา 10,000 รายการ ชุดข้อมูลแต่ละชุดประกอบด้วยคู่ของคิวรี-เอกสารที่แสดงเป็นเวกเตอร์คุณลักษณะและป้ายกำกับการตัดสินความเกี่ยวข้องที่สอดคล้องกัน

คุณสามารถระบุว่าจะใช้ชุดข้อมูลเวอร์ชัน "10k" หรือ "30k" และพับที่เกี่ยวข้องได้ดังต่อไปนี้:

ds = tfds.load("mslr_web/30k_fold1")

หากระบุเฉพาะ mslr_web ตัวเลือก mslr_web/10k_fold1 จะถูกเลือกตามค่าเริ่มต้น:

# This is the same as `tfds.load("mslr_web/10k_fold1")`
ds = tfds.load("mslr_web")
  • โฮมเพจ : https://www.microsoft.com/en-us/research/project/mslr/

  • รหัสที่มา : tfds.ranking.mslr_web.MslrWeb

  • รุ่น :

    • 1.0.0 : การเปิดตัวครั้งแรก
    • 1.1.0 : รวมคุณสมบัติเป็นคุณสมบัติ 'float_features' เดียว
    • 1.2.0 (ค่าเริ่มต้น): เพิ่มตัวระบุการค้นหาและเอกสาร
  • แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่

  • โครงสร้างคุณลักษณะ :

FeaturesDict({
    'doc_id': Tensor(shape=(None,), dtype=int64),
    'float_features': Tensor(shape=(None, 136), dtype=float64),
    'label': Tensor(shape=(None,), dtype=float64),
    'query_id': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
doc_id เทนเซอร์ (ไม่มี,) int64
float_features เทนเซอร์ (ไม่มี, 136) float64
ฉลาก เทนเซอร์ (ไม่มี,) float64
แบบสอบถาม_id ข้อความ สตริง
  • คีย์ภายใต้การดูแล (ดู as_supervised doc ): None

  • รูปภาพ ( tfds.show_examples ): ไม่รองรับ

  • การอ้างอิง :

@article{DBLP:journals/corr/QinL13,
  author    = {Tao Qin and Tie{-}Yan Liu},
  title     = {Introducing {LETOR} 4.0 Datasets},
  journal   = {CoRR},
  volume    = {abs/1306.2597},
  year      = {2013},
  url       = {http://arxiv.org/abs/1306.2597},
  timestamp = {Mon, 01 Jul 2013 20:31:25 +0200},
  biburl    = {http://dblp.uni-trier.de/rec/bib/journals/corr/QinL13},
  bibsource = {dblp computer science bibliography, http://dblp.org}
}

mslr_web/10k_fold1 (ค่าเริ่มต้น)

  • ขนาดการดาวน์โหลด : 1.15 GiB

  • ขนาดชุดข้อมูล : 310.08 MiB

  • แยก :

แยก ตัวอย่าง
'test' 2,000
'train' 6,000
'vali' 2,000

mslr_web/10k_fold2

  • ขนาดการดาวน์โหลด : 1.15 GiB

  • ขนาดชุดข้อมูล : 310.08 MiB

  • แยก :

แยก ตัวอย่าง
'test' 2,000
'train' 6,000
'vali' 2,000

mslr_web/10k_fold3

  • ขนาดการดาวน์โหลด : 1.15 GiB

  • ขนาดชุดข้อมูล : 310.08 MiB

  • แยก :

แยก ตัวอย่าง
'test' 2,000
'train' 6,000
'vali' 2,000

mslr_web/10k_fold4

  • ขนาดการดาวน์โหลด : 1.15 GiB

  • ขนาดชุดข้อมูล : 310.08 MiB

  • แยก :

แยก ตัวอย่าง
'test' 2,000
'train' 6,000
'vali' 2,000

mslr_web/10k_fold5

  • ขนาดการดาวน์โหลด : 1.15 GiB

  • ขนาดชุดข้อมูล : 310.08 MiB

  • แยก :

แยก ตัวอย่าง
'test' 2,000
'train' 6,000
'vali' 2,000

mslr_web/30k_fold1

  • ขนาดการดาวน์โหลด : 3.59 GiB

  • ขนาดชุดข้อมูล : 964.09 MiB

  • แยก :

แยก ตัวอย่าง
'test' 6,306
'train' 18,919
'vali' 6,306

mslr_web/30k_fold2

  • ขนาดการดาวน์โหลด : 3.59 GiB

  • ขนาดชุดข้อมูล : 964.09 MiB

  • แยก :

แยก ตัวอย่าง
'test' 6,307
'train' 18,918
'vali' 6,306

mslr_web/30k_fold3

  • ขนาดการดาวน์โหลด : 3.59 GiB

  • ขนาดชุดข้อมูล : 964.09 MiB

  • แยก :

แยก ตัวอย่าง
'test' 6,306
'train' 18,918
'vali' 6,307

mslr_web/30k_fold4

  • ขนาดการดาวน์โหลด : 3.59 GiB

  • ขนาดชุดข้อมูล : 964.09 MiB

  • แยก :

แยก ตัวอย่าง
'test' 6,306
'train' 18,919
'vali' 6,306

mslr_web/30k_fold5

  • ขนาดการดาวน์โหลด : 3.59 GiB

  • ขนาดชุดข้อมูล : 964.09 MiB

  • แยก :

แยก ตัวอย่าง
'test' 6,306
'train' 18,919
'vali' 6,306