- Descriptif :
Mesures pour trois espèces de manchots observées dans l'archipel Palmer, en Antarctique.
Ces données ont été recueillies de 2007 à 2009 par le Dr Kristen Gorman du Palmer Station Long Term Ecological Research Program , qui fait partie du US Long Term Ecological Research Network . Les données ont été importées à l'origine du portail de données de l' Environmental Data Initiative (EDI) et sont disponibles pour une utilisation sous licence CC0 ("Aucun droit réservé") conformément à la politique de données de Palmer Station. Cette copie a été importée du référentiel GitHub d'Allison Horst .
Page d' accueil : https://allisonhorst.github.io/palmerpenguins/
Code source :
tfds.datasets.penguins.Builder
Versions :
-
1.0.0
(par défaut) : version initiale.
-
Mise en cache automatique ( documentation ): Oui
Figure ( tfds.show_examples ) : non pris en charge.
Citation :
@Manual{,
title = {palmerpenguins: Palmer Archipelago (Antarctica) penguin data},
author = {Allison Marie Horst and Alison Presmanes Hill and Kristen B Gorman},
year = {2020},
note = {R package version 0.1.0},
doi = {10.5281/zenodo.3960218},
url = {https://allisonhorst.github.io/palmerpenguins/},
}
pingouins/traités (config par défaut)
Description de la configuration :
penguins/processed
est un remplacement direct du jeu de donnéesiris
. Il contient 4 caractéristiques numériques normalisées présentées sous la forme d'un seul tenseur, aucune valeur manquante et l'étiquette de classe (espèce) est présentée sous la forme d'un nombre entier (n = 334).Taille du téléchargement :
25.05 KiB
Taille du jeu de données :
17.61 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 334 |
- Structure des fonctionnalités :
FeaturesDict({
'features': Tensor(shape=(4,), dtype=float32),
'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
Caractéristiques | Tenseur | (4,) | float32 | |
espèces | Étiquette de classe | int64 |
Clés supervisées (Voir
as_supervised
doc ):('features', 'species')
Exemples ( tfds.as_dataframe ):
pingouins/simples
Description de la configuration :
penguins/simple
a été traité à partir de l'ensemble de données brutes, avec des étiquettes de classe simplifiées dérivées des champs de texte, des valeurs manquantes marquées comme NaN/NA et ne conserve que 7 caractéristiques significatives (n = 344).Taille du téléchargement :
13.20 KiB
Taille du jeu de données :
56.10 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 344 |
- Structure des fonctionnalités :
FeaturesDict({
'body_mass_g': float32,
'culmen_depth_mm': float32,
'culmen_length_mm': float32,
'flipper_length_mm': float32,
'island': ClassLabel(shape=(), dtype=int64, num_classes=3),
'sex': ClassLabel(shape=(), dtype=int64, num_classes=3),
'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
masse_corps_g | Tenseur | float32 | ||
culmen_depth_mm | Tenseur | float32 | ||
culmen_length_mm | Tenseur | float32 | ||
flipper_length_mm | Tenseur | float32 | ||
île | Étiquette de classe | int64 | ||
sexe | Étiquette de classe | int64 | ||
espèces | Étiquette de classe | int64 |
Clés supervisées (Voir
as_supervised
doc ):({'body_mass_g': 'body_mass_g', 'culmen_depth_mm': 'culmen_depth_mm', 'culmen_length_mm': 'culmen_length_mm', 'flipper_length_mm': 'flipper_length_mm', 'island': 'island', 'sex': 'sex', 'species': 'species'}, 'species')
Exemples ( tfds.as_dataframe ):
pingouins/cru
Description de la configuration :
penguins/raw
est la copie originale non traitée de @allisonhorst, contenant les 17 fonctionnalités, présentées soit sous forme de types numériques, soit sous forme de texte brut (n = 344).Taille du téléchargement :
49.72 KiB
Taille du jeu de données :
164.51 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 344 |
- Structure des fonctionnalités :
FeaturesDict({
'Body Mass (g)': float32,
'Clutch Completion': Text(shape=(), dtype=string),
'Comments': Text(shape=(), dtype=string),
'Culmen Depth (mm)': float32,
'Culmen Length (mm)': float32,
'Date Egg': Text(shape=(), dtype=string),
'Delta 13 C (o/oo)': float32,
'Delta 15 N (o/oo)': float32,
'Flipper Length (mm)': float32,
'Individual ID': Text(shape=(), dtype=string),
'Island': Text(shape=(), dtype=string),
'Region': Text(shape=(), dtype=string),
'Sample Number': int32,
'Sex': Text(shape=(), dtype=string),
'Species': Text(shape=(), dtype=string),
'Stage': Text(shape=(), dtype=string),
'studyName': Text(shape=(), dtype=string),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
Masse corporelle (g) | Tenseur | float32 | ||
Achèvement de l'embrayage | Texte | chaîne de caractères | ||
commentaires | Texte | chaîne de caractères | ||
Profondeur du culmen (mm) | Tenseur | float32 | ||
Longueur du culmen (mm) | Tenseur | float32 | ||
Datte Oeuf | Texte | chaîne de caractères | ||
Delta 13 C (o/oo) | Tenseur | float32 | ||
Delta 15 N (o/oo) | Tenseur | float32 | ||
Longueur de batteur (mm) | Tenseur | float32 | ||
ID individuel | Texte | chaîne de caractères | ||
Île | Texte | chaîne de caractères | ||
Région | Texte | chaîne de caractères | ||
Numéro d'échantillon | Tenseur | int32 | ||
Sexe | Texte | chaîne de caractères | ||
Espèces | Texte | chaîne de caractères | ||
Organiser | Texte | chaîne de caractères | ||
Nom de l'étude | Texte | chaîne de caractères |
Clés supervisées (Voir
as_supervised
doc ):None
Exemples ( tfds.as_dataframe ):