- Descriptif :
Nom complet : Simulations pour des effets de traitement personnalisés
Généré avec le package R's Uplift : https://rdrr.io/cran/uplift/man/sim_pte.html
Le package peut être téléchargé ici : https://cran.r-project.org/src/contrib/Archive/uplift/
Jeu de données généré dans R version 4.1.2 avec le code suivant :
library(uplift)
set.seed(123)
train <- sim_pte(n = 1000, p = 20, rho = 0, sigma = sqrt(2), beta.den = 4)
test <- sim_pte(n = 2000, p = 20, rho = 0, sigma = sqrt(2), beta.den = 4)
train$treat <- ifelse(train$treat == 1, 2, 1)
test$treat <- ifelse(test$treat == 1, 2, 1)
train$y <- ifelse(train$y == 1, 2, 1)
test$y <- ifelse(test$y == 1, 2, 1)
train$ts = NULL
test$ts = NULL
Paramètres:
-
n
= nombre d'échantillons -
p
= nombre de prédicteurs -
ro
= covariance entre les prédicteurs -
sigma
= multiplicateur du terme d'erreur -
beta.den
= beta est multiplié par 1/beta.den
Créateur : Léo Guelman leo.guelman@gmail.com
Page d' accueil : https://rdrr.io/cran/uplift/man/sim_pte.html
Code source :
tfds.datasets.simpte.Builder
Versions :
-
1.0.0
(par défaut) : version initiale.
-
Taille du téléchargement :
Unknown size
Taille du jeu de données :
1.04 MiB
Instructions de téléchargement manuel : cet ensemble de données nécessite que vous téléchargiez manuellement les données sources dans
download_config.manual_dir
(par défaut~/tensorflow_datasets/downloads/manual/
) :
Veuillez télécharger les données d'entraînement : sim_pte_train.csv et les données de test : sim_pte_test.csv vers ~/tensorflow_datasets/downloads/manual/.Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'test' | 2 000 |
'train' | 1 000 |
- Structure des fonctionnalités :
FeaturesDict({
'X1': float32,
'X10': float32,
'X11': float32,
'X12': float32,
'X13': float32,
'X14': float32,
'X15': float32,
'X16': float32,
'X17': float32,
'X18': float32,
'X19': float32,
'X2': float32,
'X20': float32,
'X3': float32,
'X4': float32,
'X5': float32,
'X6': float32,
'X7': float32,
'X8': float32,
'X9': float32,
'treat': int32,
'y': int32,
})
- Documentation des fonctionnalités :
Caractéristique | Classe | Façonner | Dtype | Description |
---|---|---|---|---|
FonctionnalitésDict | ||||
X1 | Tenseur | float32 | ||
X10 | Tenseur | float32 | ||
X11 | Tenseur | float32 | ||
X12 | Tenseur | float32 | ||
X13 | Tenseur | float32 | ||
X14 | Tenseur | float32 | ||
X15 | Tenseur | float32 | ||
X16 | Tenseur | float32 | ||
X17 | Tenseur | float32 | ||
X18 | Tenseur | float32 | ||
X19 | Tenseur | float32 | ||
X2 | Tenseur | float32 | ||
X20 | Tenseur | float32 | ||
X3 | Tenseur | float32 | ||
X4 | Tenseur | float32 | ||
X5 | Tenseur | float32 | ||
X6 | Tenseur | float32 | ||
X7 | Tenseur | float32 | ||
X8 | Tenseur | float32 | ||
X9 | Tenseur | float32 | ||
traiter | Tenseur | int32 | ||
y | Tenseur | int32 |
Clés supervisées (Voir
as_supervised
doc ):({'X1': 'X1', 'X10': 'X10', 'X11': 'X11', 'X12': 'X12', 'X13': 'X13', 'X14': 'X14', 'X15': 'X15', 'X16': 'X16', 'X17': 'X17', 'X18': 'X18', 'X19': 'X19', 'X2': 'X2', 'X20': 'X20', 'X3': 'X3', 'X4': 'X4', 'X5': 'X5', 'X6': 'X6', 'X7': 'X7', 'X8': 'X8', 'X9': 'X9', 'treat': 'treat'}, 'y')
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@misc{https://doi.org/10.48550/arxiv.1212.2995,
doi = {10.48550/ARXIV.1212.2995},
url = {https://arxiv.org/abs/1212.2995},
author = {Tian, Lu and Alizadeh, Ash and Gentles, Andrew and Tibshirani, Robert},
keywords = {Methodology (stat.ME), FOS: Computer and information sciences, FOS: Computer and information sciences},
title = {A Simple Method for Detecting Interactions between a Treatment and a Large Number of Covariates},
publisher = {arXiv},
year = {2012},
copyright = {arXiv.org perpetual, non-exclusive license}
}