- Descrição :
MSLR-WEB são dois conjuntos de dados Learning-to-Rank em larga escala lançados pela Microsoft Research. O primeiro conjunto de dados (chamado "30k") contém 30.000 consultas e o segundo conjunto de dados (chamado "10k") contém 10.000 consultas. Cada conjunto de dados consiste em pares consulta-documento representados como vetores de recursos e rótulos de julgamento de relevância correspondentes.
Você pode especificar se deseja usar a versão "10k" ou "30k" do conjunto de dados e uma dobra correspondente, da seguinte maneira:
ds = tfds.load("mslr_web/30k_fold1")
Se apenas mslr_web
for especificado, a opção mslr_web/10k_fold1
será selecionada por padrão:
# This is the same as `tfds.load("mslr_web/10k_fold1")`
ds = tfds.load("mslr_web")
Página inicial : https://www.microsoft.com/en-us/research/project/mslr/
Código -fonte:
tfds.ranking.mslr_web.MslrWeb
Versões :
-
1.0.0
: versão inicial. -
1.1.0
: Agrupe recursos em um único recurso 'float_features'. -
1.2.0
(padrão): Adicionar identificadores de consulta e documento.
-
Armazenado em cache automaticamente ( documentação ): Não
Estrutura de recursos :
FeaturesDict({
'doc_id': Tensor(shape=(None,), dtype=int64),
'float_features': Tensor(shape=(None, 136), dtype=float64),
'label': Tensor(shape=(None,), dtype=float64),
'query_id': Text(shape=(), dtype=string),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
doc_id | tensor | (Nenhum,) | int64 | |
float_features | tensor | (Nenhuma, 136) | float64 | |
rótulo | tensor | (Nenhum,) | float64 | |
query_id | Texto | corda |
Chaves supervisionadas (Consulte
as_supervised
doc ):None
Figura ( tfds.show_examples ): Não compatível.
Citação :
@article{DBLP:journals/corr/QinL13,
author = {Tao Qin and Tie{-}Yan Liu},
title = {Introducing {LETOR} 4.0 Datasets},
journal = {CoRR},
volume = {abs/1306.2597},
year = {2013},
url = {http://arxiv.org/abs/1306.2597},
timestamp = {Mon, 01 Jul 2013 20:31:25 +0200},
biburl = {http://dblp.uni-trier.de/rec/bib/journals/corr/QinL13},
bibsource = {dblp computer science bibliography, http://dblp.org}
}
mslr_web/10k_fold1 (configuração padrão)
Tamanho do download :
1.15 GiB
Tamanho do conjunto de dados :
310.08 MiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 2.000 |
'train' | 6.000 |
'vali' | 2.000 |
- Exemplos ( tfds.as_dataframe ):
mslr_web/10k_fold2
Tamanho do download :
1.15 GiB
Tamanho do conjunto de dados :
310.08 MiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 2.000 |
'train' | 6.000 |
'vali' | 2.000 |
- Exemplos ( tfds.as_dataframe ):
mslr_web/10k_fold3
Tamanho do download :
1.15 GiB
Tamanho do conjunto de dados :
310.08 MiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 2.000 |
'train' | 6.000 |
'vali' | 2.000 |
- Exemplos ( tfds.as_dataframe ):
mslr_web/10k_fold4
Tamanho do download :
1.15 GiB
Tamanho do conjunto de dados :
310.08 MiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 2.000 |
'train' | 6.000 |
'vali' | 2.000 |
- Exemplos ( tfds.as_dataframe ):
mslr_web/10k_fold5
Tamanho do download :
1.15 GiB
Tamanho do conjunto de dados :
310.08 MiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 2.000 |
'train' | 6.000 |
'vali' | 2.000 |
- Exemplos ( tfds.as_dataframe ):
mslr_web/30k_fold1
Tamanho do download :
3.59 GiB
Tamanho do conjunto de dados :
964.09 MiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 6.306 |
'train' | 18.919 |
'vali' | 6.306 |
- Exemplos ( tfds.as_dataframe ):
mslr_web/30k_fold2
Tamanho do download :
3.59 GiB
Tamanho do conjunto de dados :
964.09 MiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 6.307 |
'train' | 18.918 |
'vali' | 6.306 |
- Exemplos ( tfds.as_dataframe ):
mslr_web/30k_fold3
Tamanho do download :
3.59 GiB
Tamanho do conjunto de dados :
964.09 MiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 6.306 |
'train' | 18.918 |
'vali' | 6.307 |
- Exemplos ( tfds.as_dataframe ):
mslr_web/30k_fold4
Tamanho do download :
3.59 GiB
Tamanho do conjunto de dados :
964.09 MiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 6.306 |
'train' | 18.919 |
'vali' | 6.306 |
- Exemplos ( tfds.as_dataframe ):
mslr_web/30k_fold5
Tamanho do download :
3.59 GiB
Tamanho do conjunto de dados :
964.09 MiB
Divisões :
Dividir | Exemplos |
---|---|
'test' | 6.306 |
'train' | 18.919 |
'vali' | 6.306 |
- Exemplos ( tfds.as_dataframe ):