criteo

  • Descrizione :

Set di dati di modellazione Criteo Uplift

Questo set di dati viene rilasciato insieme al documento: "A Large Scale Benchmark for Uplift Modeling" Eustache Diemert, Artem Betlei, Christophe Renaudin; (Criteo AI Lab), Massih-Reza Amini (LIG, Grenoble INP)

Questo lavoro è stato pubblicato in: AdKDD 2018 Workshop, in concomitanza con KDD 2018.

Descrizione dei dati

Questo set di dati è costruito assemblando i dati risultanti da diversi test di incrementalità, una particolare procedura di sperimentazione randomizzata in cui si impedisce a una parte casuale della popolazione di essere presa di mira dalla pubblicità. è composto da 25 milioni di righe, ognuna delle quali rappresenta un utente con 11 caratteristiche, un indicatore di trattamento e 2 etichette (visite e conversioni).

Campi

Ecco una descrizione dettagliata dei campi (sono separati da virgole nel file):

  • f0, f1, f2, f3, f4, f5, f6, f7, f8, f9, f10, f11: valori delle caratteristiche (dense, float)
  • trattamento: gruppo di trattamento (1 = trattato, 0 = controllo)
  • conversione: se si è verificata una conversione per questo utente (binario, etichetta)
  • visit: se si è verificata una visita per questo utente (binario, etichetta)
  • esposizione: effetto del trattamento, se l'utente è stato effettivamente esposto (binario)

Figure chiave

  • Formato: CSV
  • Dimensione: 459 MB (compresso)
  • Righe: 25.309.483
  • Tasso medio di visite: 0,04132
  • Tasso di conversione medio: 0,00229
  • Rapporto di trattamento: .846

Compiti

Il set di dati è stato raccolto e preparato tenendo presente la previsione dell'aumento come compito principale. Inoltre possiamo prevedere usi correlati come, a titolo esemplificativo ma non esaustivo:

Diviso Esempi
'train' 13.979.592
  • Struttura delle caratteristiche :
FeaturesDict({
    'conversion': bool,
    'exposure': bool,
    'f0': float32,
    'f1': float32,
    'f10': float32,
    'f11': float32,
    'f2': float32,
    'f3': float32,
    'f4': float32,
    'f5': float32,
    'f6': float32,
    'f7': float32,
    'f8': float32,
    'f9': float32,
    'treatment': int64,
    'visit': bool,
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
conversione Tensore bool
esposizione Tensore bool
f0 Tensore galleggiante32
f1 Tensore galleggiante32
f10 Tensore galleggiante32
f11 Tensore galleggiante32
f2 Tensore galleggiante32
f3 Tensore galleggiante32
f4 Tensore galleggiante32
f5 Tensore galleggiante32
f6 Tensore galleggiante32
f7 Tensore galleggiante32
f8 Tensore galleggiante32
f9 Tensore galleggiante32
trattamento Tensore int64
visitare Tensore bool
  • Chiavi supervisionate (vedi as_supervised doc ): ({'exposure': 'exposure', 'f0': 'f0', 'f1': 'f1', 'f10': 'f10', 'f11': 'f11', 'f2': 'f2', 'f3': 'f3', 'f4': 'f4', 'f5': 'f5', 'f6': 'f6', 'f7': 'f7', 'f8': 'f8', 'f9': 'f9', 'treatment': 'treatment'}, 'visit')

  • Figura ( tfds.show_examples ): non supportato.

  • Esempi ( tfds.as_dataframe ):

  • Citazione :
@inproceedings{Diemert2018,
author = { {Diemert Eustache, Betlei Artem} and Renaudin, Christophe and Massih-Reza, Amini},
title={A Large Scale Benchmark for Uplift Modeling},
publisher = {ACM},
booktitle = {Proceedings of the AdKDD and TargetAd Workshop, KDD, London,United Kingdom, August, 20, 2018},
year = {2018}
}
,

  • Descrizione :

Set di dati di modellazione Criteo Uplift

Questo set di dati viene rilasciato insieme al documento: "A Large Scale Benchmark for Uplift Modeling" Eustache Diemert, Artem Betlei, Christophe Renaudin; (Criteo AI Lab), Massih-Reza Amini (LIG, Grenoble INP)

Questo lavoro è stato pubblicato in: AdKDD 2018 Workshop, in concomitanza con KDD 2018.

Descrizione dei dati

Questo set di dati è costruito assemblando i dati risultanti da diversi test di incrementalità, una particolare procedura di sperimentazione randomizzata in cui si impedisce a una parte casuale della popolazione di essere presa di mira dalla pubblicità. è composto da 25 milioni di righe, ognuna delle quali rappresenta un utente con 11 caratteristiche, un indicatore di trattamento e 2 etichette (visite e conversioni).

Campi

Ecco una descrizione dettagliata dei campi (sono separati da virgole nel file):

  • f0, f1, f2, f3, f4, f5, f6, f7, f8, f9, f10, f11: valori delle caratteristiche (dense, float)
  • trattamento: gruppo di trattamento (1 = trattato, 0 = controllo)
  • conversione: se si è verificata una conversione per questo utente (binario, etichetta)
  • visit: se si è verificata una visita per questo utente (binario, etichetta)
  • esposizione: effetto del trattamento, se l'utente è stato effettivamente esposto (binario)

Figure chiave

  • Formato: CSV
  • Dimensione: 459 MB (compresso)
  • Righe: 25.309.483
  • Tasso medio di visite: 0,04132
  • Tasso di conversione medio: 0,00229
  • Rapporto di trattamento: .846

Compiti

Il set di dati è stato raccolto e preparato tenendo presente la previsione dell'aumento come attività principale. Inoltre possiamo prevedere usi correlati come, a titolo esemplificativo ma non esaustivo:

Diviso Esempi
'train' 13.979.592
  • Struttura delle caratteristiche :
FeaturesDict({
    'conversion': bool,
    'exposure': bool,
    'f0': float32,
    'f1': float32,
    'f10': float32,
    'f11': float32,
    'f2': float32,
    'f3': float32,
    'f4': float32,
    'f5': float32,
    'f6': float32,
    'f7': float32,
    'f8': float32,
    'f9': float32,
    'treatment': int64,
    'visit': bool,
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
conversione Tensore bool
esposizione Tensore bool
f0 Tensore galleggiante32
f1 Tensore galleggiante32
f10 Tensore galleggiante32
f11 Tensore galleggiante32
f2 Tensore galleggiante32
f3 Tensore galleggiante32
f4 Tensore galleggiante32
f5 Tensore galleggiante32
f6 Tensore galleggiante32
f7 Tensore galleggiante32
f8 Tensore galleggiante32
f9 Tensore galleggiante32
trattamento Tensore int64
visitare Tensore bool
  • Chiavi supervisionate (vedi as_supervised doc ): ({'exposure': 'exposure', 'f0': 'f0', 'f1': 'f1', 'f10': 'f10', 'f11': 'f11', 'f2': 'f2', 'f3': 'f3', 'f4': 'f4', 'f5': 'f5', 'f6': 'f6', 'f7': 'f7', 'f8': 'f8', 'f9': 'f9', 'treatment': 'treatment'}, 'visit')

  • Figura ( tfds.show_examples ): non supportato.

  • Esempi ( tfds.as_dataframe ):

  • Citazione :
@inproceedings{Diemert2018,
author = { {Diemert Eustache, Betlei Artem} and Renaudin, Christophe and Massih-Reza, Amini},
title={A Large Scale Benchmark for Uplift Modeling},
publisher = {ACM},
booktitle = {Proceedings of the AdKDD and TargetAd Workshop, KDD, London,United Kingdom, August, 20, 2018},
year = {2018}
}