yahoo_ltrc

  • Açıklama :

Yahoo Learning to Rank Challenge veri kümesi ("C14" olarak da adlandırılır), Yahoo tarafından yayınlanan bir Learning-to-Rank veri kümesidir. Veri seti, özellik vektörleri ve karşılık gelen alaka değerlendirme etiketleri olarak temsil edilen sorgu-belge çiftlerinden oluşur.

Veri kümesi iki sürüm içerir:

  • set1 : 709.877 sorgu-belge çifti içerir.
  • set2 : 172.870 sorgu-belge çifti içerir.

Veri kümesinin set1 sürümünün mü yoksa set2 sürümünün mü kullanılacağını aşağıdaki gibi belirleyebilirsiniz:

ds = tfds.load("yahoo_ltrc/set1")
ds = tfds.load("yahoo_ltrc/set2")

Yalnızca yahoo_ltrc belirtilirse, varsayılan olarak yahoo_ltrc/set1 seçeneği seçilir:

# This is the same as `tfds.load("yahoo_ltrc/set1")`
ds = tfds.load("yahoo_ltrc")
  • Anasayfa : https://research.yahoo.com/datasets

  • Kaynak kodu : tfds.ranking.yahoo_ltrc.YahooLTRC

  • sürümler :

    • 1.0.0 : İlk sürüm.
    • 1.1.0 (varsayılan): Sorgu ve belge tanımlayıcıları ekleyin.
  • İndirme boyutu : Unknown size

  • Manuel indirme talimatları : Bu veri kümesi, kaynak verileri manuel olarak download_config.manual_dir içine download_config.manual_dir gerektirir (varsayılan olarak ~/tensorflow_datasets/downloads/manual/ ):
    https://research.yahoo.com/datasets adresinden C14 Yahoo Learning To Rank Challenge veri kümesi için erişim talep edin İndirilen dataset.tgz dosyasını çıkarın ve ltrc_yahoo.tar.bz2 dosyasını manual_dir/ içine yerleştirin.

  • Denetlenen anahtarlar (Bkz as_supervised doc ): None

  • Şekil ( tfds.show_examples ): Desteklenmiyor.

  • Alıntı :

@inproceedings{chapelle2011yahoo,
  title={Yahoo! learning to rank challenge overview},
  author={Chapelle, Olivier and Chang, Yi},
  booktitle={Proceedings of the learning to rank challenge},
  pages={1--24},
  year={2011},
  organization={PMLR}
}

yahoo_ltrc/set1 (varsayılan yapılandırma)

  • Veri kümesi boyutu : 795.39 MiB

  • Otomatik önbelleğe alınmış ( belgeleme ): Hayır

  • bölmeler :

Bölmek örnekler
'test' 6.983
'train' 19.944
'vali' 2.994
  • Özellik yapısı :
FeaturesDict({
    'doc_id': Tensor(shape=(None,), dtype=int64),
    'float_features': Tensor(shape=(None, 699), dtype=float64),
    'label': Tensor(shape=(None,), dtype=float64),
    'query_id': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Açıklama
ÖzelliklerDict
doc_id tensör (Hiçbiri,) int64
float_features tensör (Yok, 699) şamandıra64
etiket tensör (Hiçbiri,) şamandıra64
sorgu_kimliği Metin sicim

yahoo_ltrc/set2

  • Veri kümesi boyutu : 194.92 MiB

  • Otomatik önbelleğe alınmış ( belgeleme ): Evet

  • bölmeler :

Bölmek örnekler
'test' 3.798
'train' 1.266
'vali' 1.266
  • Özellik yapısı :
FeaturesDict({
    'doc_id': Tensor(shape=(None,), dtype=int64),
    'float_features': Tensor(shape=(None, 700), dtype=float64),
    'label': Tensor(shape=(None,), dtype=float64),
    'query_id': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Açıklama
ÖzelliklerDict
doc_id tensör (Hiçbiri,) int64
float_features tensör (Yok, 700) şamandıra64
etiket tensör (Hiçbiri,) şamandıra64
sorgu_kimliği Metin sicim