- Descripción :
Nombre completo: Simulaciones para Efectos de Tratamiento Personalizado
Generado con el paquete Uplift de R: https://rdrr.io/cran/uplift/man/sim_pte.html
El paquete se puede descargar aquí: https://cran.r-project.org/src/contrib/Archive/uplift/
Conjunto de datos generado en R versión 4.1.2 con el siguiente código:
library(uplift)
set.seed(123)
train <- sim_pte(n = 1000, p = 20, rho = 0, sigma = sqrt(2), beta.den = 4)
test <- sim_pte(n = 2000, p = 20, rho = 0, sigma = sqrt(2), beta.den = 4)
train$treat <- ifelse(train$treat == 1, 2, 1)
test$treat <- ifelse(test$treat == 1, 2, 1)
train$y <- ifelse(train$y == 1, 2, 1)
test$y <- ifelse(test$y == 1, 2, 1)
train$ts = NULL
test$ts = NULL
Parámetros:
-
n
= número de muestras -
p
= número de predictores -
ro
= covarianza entre predictores -
sigma
= multiplicador del término de error -
beta.den
= beta se multiplica por 1/beta.den
Creador: Leo Guelman leo.guelman@gmail.com
Página de inicio: https://rdrr.io/cran/uplift/man/sim_pte.html
Código fuente :
tfds.datasets.simpte.Builder
Versiones :
-
1.0.0
(predeterminado): versión inicial.
-
Tamaño de descarga :
Unknown size
Tamaño del conjunto de datos :
1.04 MiB
Instrucciones de descarga manual : este conjunto de datos requiere que descargue los datos de origen manualmente en
download_config.manual_dir
(el valor predeterminado es~/tensorflow_datasets/downloads/manual/
):
Descargue los datos de capacitación: sim_pte_train.csv y los datos de prueba: sim_pte_test.csv a ~/tensorflow_datasets/downloads/manual/.Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 2,000 |
'train' | 1,000 |
- Estructura de características :
FeaturesDict({
'X1': float32,
'X10': float32,
'X11': float32,
'X12': float32,
'X13': float32,
'X14': float32,
'X15': float32,
'X16': float32,
'X17': float32,
'X18': float32,
'X19': float32,
'X2': float32,
'X20': float32,
'X3': float32,
'X4': float32,
'X5': float32,
'X6': float32,
'X7': float32,
'X8': float32,
'X9': float32,
'treat': int32,
'y': int32,
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
X1 | Tensor | flotar32 | ||
X10 | Tensor | flotar32 | ||
X11 | Tensor | flotar32 | ||
X12 | Tensor | flotar32 | ||
X13 | Tensor | flotar32 | ||
X14 | Tensor | flotar32 | ||
X15 | Tensor | flotar32 | ||
X16 | Tensor | flotar32 | ||
X17 | Tensor | flotar32 | ||
X18 | Tensor | flotar32 | ||
X19 | Tensor | flotar32 | ||
X2 | Tensor | flotar32 | ||
X20 | Tensor | flotar32 | ||
X3 | Tensor | flotar32 | ||
X4 | Tensor | flotar32 | ||
X5 | Tensor | flotar32 | ||
X6 | Tensor | flotar32 | ||
X7 | Tensor | flotar32 | ||
X8 | Tensor | flotar32 | ||
X9 | Tensor | flotar32 | ||
tratar | Tensor | int32 | ||
y | Tensor | int32 |
Teclas supervisadas (Ver
as_supervised
):({'X1': 'X1', 'X10': 'X10', 'X11': 'X11', 'X12': 'X12', 'X13': 'X13', 'X14': 'X14', 'X15': 'X15', 'X16': 'X16', 'X17': 'X17', 'X18': 'X18', 'X19': 'X19', 'X2': 'X2', 'X20': 'X20', 'X3': 'X3', 'X4': 'X4', 'X5': 'X5', 'X6': 'X6', 'X7': 'X7', 'X8': 'X8', 'X9': 'X9', 'treat': 'treat'}, 'y')
Figura ( tfds.show_examples ): no compatible.
Ejemplos ( tfds.as_dataframe ):
- Cita :
@misc{https://doi.org/10.48550/arxiv.1212.2995,
doi = {10.48550/ARXIV.1212.2995},
url = {https://arxiv.org/abs/1212.2995},
author = {Tian, Lu and Alizadeh, Ash and Gentles, Andrew and Tibshirani, Robert},
keywords = {Methodology (stat.ME), FOS: Computer and information sciences, FOS: Computer and information sciences},
title = {A Simple Method for Detecting Interactions between a Treatment and a Large Number of Covariates},
publisher = {arXiv},
year = {2012},
copyright = {arXiv.org perpetual, non-exclusive license}
}