- Descrizione :
Set di dati di modellazione Criteo Uplift
Questo set di dati viene rilasciato insieme al documento: "A Large Scale Benchmark for Uplift Modeling" Eustache Diemert, Artem Betlei, Christophe Renaudin; (Criteo AI Lab), Massih-Reza Amini (LIG, Grenoble INP)
Questo lavoro è stato pubblicato in: AdKDD 2018 Workshop, in concomitanza con KDD 2018.
Descrizione dei dati
Questo set di dati è costruito assemblando i dati risultanti da diversi test di incrementalità, una particolare procedura di sperimentazione randomizzata in cui si impedisce a una parte casuale della popolazione di essere presa di mira dalla pubblicità. è composto da 25 milioni di righe, ognuna delle quali rappresenta un utente con 11 caratteristiche, un indicatore di trattamento e 2 etichette (visite e conversioni).
Campi
Ecco una descrizione dettagliata dei campi (sono separati da virgole nel file):
- f0, f1, f2, f3, f4, f5, f6, f7, f8, f9, f10, f11: valori delle caratteristiche (dense, float)
- trattamento: gruppo di trattamento (1 = trattato, 0 = controllo)
- conversione: se si è verificata una conversione per questo utente (binario, etichetta)
- visit: se si è verificata una visita per questo utente (binario, etichetta)
- esposizione: effetto del trattamento, se l'utente è stato effettivamente esposto (binario)
Figure chiave
- Formato: CSV
- Dimensione: 459 MB (compresso)
- Righe: 25.309.483
- Tasso medio di visite: 0,04132
- Tasso di conversione medio: 0,00229
- Rapporto di trattamento: .846
Compiti
Il set di dati è stato raccolto e preparato tenendo presente la previsione dell'aumento come compito principale. Inoltre possiamo prevedere usi correlati come, a titolo esemplificativo ma non esaustivo:
- punto di riferimento per l'inferenza causale
- modellazione del sollevamento
- interazioni tra caratteristiche e trattamento
- eterogeneità del trattamento
punto di riferimento per i metodi di causalità osservativa
Documentazione aggiuntiva : Esplora documenti con codice
Pagina iniziale : https://ailab.criteo.com/criteo-uplift-prediction-dataset/
Codice sorgente :
tfds.recommendation.criteo.Criteo
Versioni :
-
1.0.0
: Versione iniziale. -
1.0.1
(predefinito): Corretta l'analisi dei campiconversion
,visit
edexposure
.
-
Dimensione del download :
297.00 MiB
Dimensione del set di dati:
3.55 GiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'train' | 13.979.592 |
- Struttura delle caratteristiche :
FeaturesDict({
'conversion': bool,
'exposure': bool,
'f0': float32,
'f1': float32,
'f10': float32,
'f11': float32,
'f2': float32,
'f3': float32,
'f4': float32,
'f5': float32,
'f6': float32,
'f7': float32,
'f8': float32,
'f9': float32,
'treatment': int64,
'visit': bool,
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
conversione | Tensore | bool | ||
esposizione | Tensore | bool | ||
f0 | Tensore | galleggiante32 | ||
f1 | Tensore | galleggiante32 | ||
f10 | Tensore | galleggiante32 | ||
f11 | Tensore | galleggiante32 | ||
f2 | Tensore | galleggiante32 | ||
f3 | Tensore | galleggiante32 | ||
f4 | Tensore | galleggiante32 | ||
f5 | Tensore | galleggiante32 | ||
f6 | Tensore | galleggiante32 | ||
f7 | Tensore | galleggiante32 | ||
f8 | Tensore | galleggiante32 | ||
f9 | Tensore | galleggiante32 | ||
trattamento | Tensore | int64 | ||
visitare | Tensore | bool |
Chiavi supervisionate (vedi
as_supervised
doc ):({'exposure': 'exposure', 'f0': 'f0', 'f1': 'f1', 'f10': 'f10', 'f11': 'f11', 'f2': 'f2', 'f3': 'f3', 'f4': 'f4', 'f5': 'f5', 'f6': 'f6', 'f7': 'f7', 'f8': 'f8', 'f9': 'f9', 'treatment': 'treatment'}, 'visit')
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ):
- Citazione :
@inproceedings{Diemert2018,
author = { {Diemert Eustache, Betlei Artem} and Renaudin, Christophe and Massih-Reza, Amini},
title={A Large Scale Benchmark for Uplift Modeling},
publisher = {ACM},
booktitle = {Proceedings of the AdKDD and TargetAd Workshop, KDD, London,United Kingdom, August, 20, 2018},
year = {2018}
}
, - Descrizione :
Set di dati di modellazione Criteo Uplift
Questo set di dati viene rilasciato insieme al documento: "A Large Scale Benchmark for Uplift Modeling" Eustache Diemert, Artem Betlei, Christophe Renaudin; (Criteo AI Lab), Massih-Reza Amini (LIG, Grenoble INP)
Questo lavoro è stato pubblicato in: AdKDD 2018 Workshop, in concomitanza con KDD 2018.
Descrizione dei dati
Questo set di dati è costruito assemblando i dati risultanti da diversi test di incrementalità, una particolare procedura di sperimentazione randomizzata in cui si impedisce a una parte casuale della popolazione di essere presa di mira dalla pubblicità. è composto da 25 milioni di righe, ognuna delle quali rappresenta un utente con 11 caratteristiche, un indicatore di trattamento e 2 etichette (visite e conversioni).
Campi
Ecco una descrizione dettagliata dei campi (sono separati da virgole nel file):
- f0, f1, f2, f3, f4, f5, f6, f7, f8, f9, f10, f11: valori delle caratteristiche (dense, float)
- trattamento: gruppo di trattamento (1 = trattato, 0 = controllo)
- conversione: se si è verificata una conversione per questo utente (binario, etichetta)
- visit: se si è verificata una visita per questo utente (binario, etichetta)
- esposizione: effetto del trattamento, se l'utente è stato effettivamente esposto (binario)
Figure chiave
- Formato: CSV
- Dimensione: 459 MB (compresso)
- Righe: 25.309.483
- Tasso medio di visite: 0,04132
- Tasso di conversione medio: 0,00229
- Rapporto di trattamento: .846
Compiti
Il set di dati è stato raccolto e preparato tenendo presente la previsione dell'aumento come attività principale. Inoltre possiamo prevedere usi correlati come, a titolo esemplificativo ma non esaustivo:
- punto di riferimento per l'inferenza causale
- modellazione del sollevamento
- interazioni tra caratteristiche e trattamento
- eterogeneità del trattamento
punto di riferimento per i metodi di causalità osservativa
Documentazione aggiuntiva : Esplora documenti con codice
Pagina iniziale : https://ailab.criteo.com/criteo-uplift-prediction-dataset/
Codice sorgente :
tfds.recommendation.criteo.Criteo
Versioni :
-
1.0.0
: Versione iniziale. -
1.0.1
(predefinito): Corretta l'analisi dei campiconversion
,visit
edexposure
.
-
Dimensione del download :
297.00 MiB
Dimensione del set di dati:
3.55 GiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'train' | 13.979.592 |
- Struttura delle caratteristiche :
FeaturesDict({
'conversion': bool,
'exposure': bool,
'f0': float32,
'f1': float32,
'f10': float32,
'f11': float32,
'f2': float32,
'f3': float32,
'f4': float32,
'f5': float32,
'f6': float32,
'f7': float32,
'f8': float32,
'f9': float32,
'treatment': int64,
'visit': bool,
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
conversione | Tensore | bool | ||
esposizione | Tensore | bool | ||
f0 | Tensore | galleggiante32 | ||
f1 | Tensore | galleggiante32 | ||
f10 | Tensore | galleggiante32 | ||
f11 | Tensore | galleggiante32 | ||
f2 | Tensore | galleggiante32 | ||
f3 | Tensore | galleggiante32 | ||
f4 | Tensore | galleggiante32 | ||
f5 | Tensore | galleggiante32 | ||
f6 | Tensore | galleggiante32 | ||
f7 | Tensore | galleggiante32 | ||
f8 | Tensore | galleggiante32 | ||
f9 | Tensore | galleggiante32 | ||
trattamento | Tensore | int64 | ||
visitare | Tensore | bool |
Chiavi supervisionate (vedi
as_supervised
doc ):({'exposure': 'exposure', 'f0': 'f0', 'f1': 'f1', 'f10': 'f10', 'f11': 'f11', 'f2': 'f2', 'f3': 'f3', 'f4': 'f4', 'f5': 'f5', 'f6': 'f6', 'f7': 'f7', 'f8': 'f8', 'f9': 'f9', 'treatment': 'treatment'}, 'visit')
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ):
- Citazione :
@inproceedings{Diemert2018,
author = { {Diemert Eustache, Betlei Artem} and Renaudin, Christophe and Massih-Reza, Amini},
title={A Large Scale Benchmark for Uplift Modeling},
publisher = {ACM},
booktitle = {Proceedings of the AdKDD and TargetAd Workshop, KDD, London,United Kingdom, August, 20, 2018},
year = {2018}
}