- Açıklama :
Istella veri kümeleri, Istella tarafından yayınlanan üç büyük ölçekli Sıralamaya Göre Öğrenme veri kümesidir. Her veri kümesi, özellik vektörleri ve karşılık gelen alaka değerlendirme etiketleri olarak temsil edilen sorgu-belge çiftlerinden oluşur.
Veri kümesi üç sürüm içerir:
-
main
("Istella LETOR"): 10.454.629 sorgu-belge çifti içerir. -
s
("Istella-S LETOR"): 3.408.630 sorgu-belge çifti içerir. -
x
("Istella-X LETOR"): 26.791.447 sorgu-belge çifti içerir.
Veri kümesinin main
, s
veya x
sürümünün kullanılıp kullanılmayacağını aşağıdaki gibi belirtebilirsiniz:
ds = tfds.load("istella/main")
ds = tfds.load("istella/s")
ds = tfds.load("istella/x")
Yalnızca istella
belirtilirse, istella/main
seçenek varsayılan olarak seçilir:
# This is the same as `tfds.load("istella/main")`
ds = tfds.load("istella")
Kaynak kodu :
tfds.ranking.istella.Istella
sürümler :
-
1.0.0
: İlk sürüm. -
1.0.1
: Float64'ü desteklemek için serileştirmeyi düzeltin. -
1.1.0
: Özellikleri tek bir 'float_features' özelliğinde toplayın. -
1.2.0
(varsayılan): Sorgu ve belge tanımlayıcıları ekleyin.
-
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
Özellik yapısı :
FeaturesDict({
'doc_id': Tensor(shape=(None,), dtype=int64),
'float_features': Tensor(shape=(None, 220), dtype=float64),
'label': Tensor(shape=(None,), dtype=float64),
'query_id': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Açıklama |
---|---|---|---|---|
ÖzelliklerDict | ||||
doc_id | tensör | (Hiçbiri,) | int64 | |
float_features | tensör | (Yok, 220) | şamandıra64 | |
etiket | tensör | (Hiçbiri,) | şamandıra64 | |
sorgu_kimliği | Metin | sicim |
Denetlenen anahtarlar (Bkz
as_supervised
doc ):None
Şekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :
@article{10.1145/2987380,
author = {Dato, Domenico and Lucchese, Claudio and Nardini, Franco Maria and Orlando, Salvatore and Perego, Raffaele and Tonellotto, Nicola and Venturini, Rossano},
title = {Fast Ranking with Additive Ensembles of Oblivious and Non-Oblivious Regression Trees},
year = {2016},
publisher = {ACM},
address = {New York, NY, USA},
volume = {35},
number = {2},
issn = {1046-8188},
url = {https://doi.org/10.1145/2987380},
doi = {10.1145/2987380},
journal = {ACM Transactions on Information Systems},
articleno = {15},
numpages = {31},
}
istella/main (varsayılan yapılandırma)
İndirme boyutu :
1.20 GiB
Veri kümesi boyutu :
1.12 GiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 9.799 |
'train' | 23.219 |
- Örnekler ( tfds.as_dataframe ):
istella/lar
İndirme boyutu :
450.26 MiB
Veri kümesi boyutu :
421.88 MiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 6.562 |
'train' | 19.245 |
'vali' | 7.211 |
- Örnekler ( tfds.as_dataframe ):
istella/x
İndirme boyutu :
4.42 GiB
Veri kümesi boyutu :
2.46 GiB
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 2.000 |
'train' | 6.000 |
'vali' | 2.000 |
- Örnekler ( tfds.as_dataframe ):