- Açıklama :
Yahoo Learning to Rank Challenge veri kümesi ("C14" olarak da adlandırılır), Yahoo tarafından yayınlanan bir Learning-to-Rank veri kümesidir. Veri seti, özellik vektörleri ve karşılık gelen alaka değerlendirme etiketleri olarak temsil edilen sorgu-belge çiftlerinden oluşur.
Veri kümesi iki sürüm içerir:
-
set1
: 709.877 sorgu-belge çifti içerir. -
set2
: 172.870 sorgu-belge çifti içerir.
Veri kümesinin set1
sürümünün mü yoksa set2
sürümünün mü kullanılacağını aşağıdaki gibi belirleyebilirsiniz:
ds = tfds.load("yahoo_ltrc/set1")
ds = tfds.load("yahoo_ltrc/set2")
Yalnızca yahoo_ltrc
belirtilirse, varsayılan olarak yahoo_ltrc/set1
seçeneği seçilir:
# This is the same as `tfds.load("yahoo_ltrc/set1")`
ds = tfds.load("yahoo_ltrc")
Anasayfa : https://research.yahoo.com/datasets
Kaynak kodu :
tfds.ranking.yahoo_ltrc.YahooLTRC
sürümler :
-
1.0.0
: İlk sürüm. -
1.1.0
(varsayılan): Sorgu ve belge tanımlayıcıları ekleyin.
-
İndirme boyutu :
Unknown size
Manuel indirme talimatları : Bu veri kümesi, kaynak verileri manuel olarak download_config.manual_dir içine
download_config.manual_dir
gerektirir (varsayılan olarak~/tensorflow_datasets/downloads/manual/
):
https://research.yahoo.com/datasets adresinden C14 Yahoo Learning To Rank Challenge veri kümesi için erişim talep edin İndirilendataset.tgz
dosyasını çıkarın veltrc_yahoo.tar.bz2
dosyasınımanual_dir/
içine yerleştirin.Denetlenen anahtarlar (Bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :
@inproceedings{chapelle2011yahoo,
title={Yahoo! learning to rank challenge overview},
author={Chapelle, Olivier and Chang, Yi},
booktitle={Proceedings of the learning to rank challenge},
pages={1--24},
year={2011},
organization={PMLR}
}
yahoo_ltrc/set1 (varsayılan yapılandırma)
Veri kümesi boyutu :
795.39 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 6.983 |
'train' | 19.944 |
'vali' | 2.994 |
- Özellik yapısı :
FeaturesDict({
'doc_id': Tensor(shape=(None,), dtype=int64),
'float_features': Tensor(shape=(None, 699), dtype=float64),
'label': Tensor(shape=(None,), dtype=float64),
'query_id': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Açıklama |
---|---|---|---|---|
ÖzelliklerDict | ||||
doc_id | tensör | (Hiçbiri,) | int64 | |
float_features | tensör | (Yok, 699) | şamandıra64 | |
etiket | tensör | (Hiçbiri,) | şamandıra64 | |
sorgu_kimliği | Metin | sicim |
- Örnekler ( tfds.as_dataframe ):
yahoo_ltrc/set2
Veri kümesi boyutu :
194.92 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 3.798 |
'train' | 1.266 |
'vali' | 1.266 |
- Özellik yapısı :
FeaturesDict({
'doc_id': Tensor(shape=(None,), dtype=int64),
'float_features': Tensor(shape=(None, 700), dtype=float64),
'label': Tensor(shape=(None,), dtype=float64),
'query_id': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Açıklama |
---|---|---|---|---|
ÖzelliklerDict | ||||
doc_id | tensör | (Hiçbiri,) | int64 | |
float_features | tensör | (Yok, 700) | şamandıra64 | |
etiket | tensör | (Hiçbiri,) | şamandıra64 | |
sorgu_kimliği | Metin | sicim |
- Örnekler ( tfds.as_dataframe ):