- Descriptif :
Le radon est un gaz radioactif qui pénètre dans les maisons par des points de contact avec le sol. C'est un cancérogène qui est la principale cause de cancer du poumon chez les non-fumeurs. Les niveaux de radon varient considérablement d'un ménage à l'autre. Cet ensemble de données contient les niveaux de radon mesurés dans les foyers américains par comté et par État. L'étiquette « activité » est la concentration de radon mesurée en pCi/L. Les prédicteurs importants sont le « plancher » (le sol de la maison dans laquelle la mesure a été prise), le « comté » (le comté américain dans lequel la maison est située) et « Uppm » (une mesure du niveau d'uranium du sol par comté ).
Page d'accueil : http://www.stat.columbia.edu/~gelman/arm/examples/radon/
Code source :
tfds.datasets.radon.Builder
Versions :
-
1.0.0
(par défaut) : aucune note de version.
-
Taille du téléchargement :
1.71 MiB
Taille du jeu de données :
9.15 MiB
Mise en cache automatique ( documentation ): Oui
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 12 573 |
- Structure des fonctionnalités :
FeaturesDict({
'activity': float32,
'features': FeaturesDict({
'Uppm': float32,
'adjwt': float32,
'basement': string,
'cntyfips': int32,
'county': string,
'dupflag': int32,
'floor': int32,
'idnum': int32,
'lat': float32,
'lon': float32,
'pcterr': float32,
'region': int32,
'rep': int32,
'room': int32,
'startdt': int32,
'starttm': int32,
'state': string,
'state2': string,
'stfips': int32,
'stopdt': int32,
'stoptm': int32,
'stratum': int32,
'typebldg': int32,
'wave': int32,
'windoor': string,
'zip': int32,
'zipflag': int32,
}),
})
- Documentation des fonctionnalités :
Caractéristique | Classe | Façonner | Dtype | Description |
---|---|---|---|---|
FonctionnalitésDict | ||||
activité | Tenseur | float32 | ||
caractéristiques | FonctionnalitésDict | |||
fonctionnalités/Uppm | Tenseur | float32 | ||
fonctionnalités/ajustement | Tenseur | float32 | ||
caractéristiques/sous-sol | Tenseur | chaîne de caractères | ||
fonctionnalités/cntyfips | Tenseur | int32 | ||
caractéristiques/comté | Tenseur | chaîne de caractères | ||
fonctionnalités/dupflag | Tenseur | int32 | ||
caractéristiques/sol | Tenseur | int32 | ||
fonctionnalités/idnum | Tenseur | int32 | ||
fonctionnalités/lat | Tenseur | float32 | ||
caractéristiques/lon | Tenseur | float32 | ||
fonctionnalités/pcterr | Tenseur | float32 | ||
caractéristiques/région | Tenseur | int32 | ||
fonctionnalités/représentation | Tenseur | int32 | ||
caractéristiques/pièce | Tenseur | int32 | ||
fonctionnalités/startdt | Tenseur | int32 | ||
fonctionnalités/démarrage | Tenseur | int32 | ||
caractéristiques/état | Tenseur | chaîne de caractères | ||
caractéristiques/état2 | Tenseur | chaîne de caractères | ||
fonctionnalités/stips | Tenseur | int32 | ||
fonctionnalités/arrêt | Tenseur | int32 | ||
fonctionnalités/arrêt | Tenseur | int32 | ||
caractéristiques/strate | Tenseur | int32 | ||
caractéristiques/typebdg | Tenseur | int32 | ||
fonctionnalités/vague | Tenseur | int32 | ||
caractéristiques/fenêtre | Tenseur | chaîne de caractères | ||
fonctionnalités/zip | Tenseur | int32 | ||
fonctionnalités/zipflag | Tenseur | int32 |
Touches supervisées (Voir
as_supervised
doc ):('features', 'activity')
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ):
- Citation :
@book{GelmanHill:2007,
author = {Gelman, Andrew and Hill, Jennifer},
title = {Data Analysis Using Regression and Multilevel/Hierarchical Models},
publisher = {Cambridge University Press},
series = {Analytical methods for social research},
year = 2007
}