- Descripción :
Medidas para tres especies de pingüinos observadas en el Archipiélago Palmer, Antártida.
Estos datos fueron recolectados entre 2007 y 2009 por la Dra. Kristen Gorman con el Programa de Investigación Ecológica a Largo Plazo de la Estación Palmer , parte de la Red de Investigación Ecológica a Largo Plazo de EE.UU. Los datos se importaron originalmente del Portal de datos de la Iniciativa de datos ambientales (EDI) y están disponibles para su uso con la licencia CC0 ("Sin derechos reservados") de acuerdo con la Política de datos de Palmer Station. Esta copia se importó del repositorio de GitHub de Allison Horst .
Página de inicio: https://allisonhorst.github.io/palmerpenguins/
Código fuente :
tfds.datasets.penguins.Builder
Versiones :
-
1.0.0
(predeterminado): Versión inicial.
-
Almacenamiento automático en caché ( documentación ): Sí
Figura ( tfds.show_examples ): no compatible.
Cita :
@Manual{,
title = {palmerpenguins: Palmer Archipelago (Antarctica) penguin data},
author = {Allison Marie Horst and Alison Presmanes Hill and Kristen B Gorman},
year = {2020},
note = {R package version 0.1.0},
doi = {10.5281/zenodo.3960218},
url = {https://allisonhorst.github.io/palmerpenguins/},
}
pingüinos/procesado (configuración predeterminada)
Descripción de la configuración :
penguins/processed
es un reemplazo directo para el conjunto de datos deiris
. Contiene 4 características numéricas normalizadas presentadas como un solo tensor, sin valores faltantes y la etiqueta de clase (especies) se presenta como un número entero (n = 334).Tamaño de la descarga :
25.05 KiB
Tamaño del conjunto de datos :
17.61 KiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 334 |
- Estructura de características :
FeaturesDict({
'features': Tensor(shape=(4,), dtype=float32),
'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
caracteristicas | Tensor | (4,) | flotar32 | |
especies | Etiqueta de clase | int64 |
Claves supervisadas (Ver
as_supervised
):('features', 'species')
Ejemplos ( tfds.as_dataframe ):
pinguinos/simple
Descripción de configuración :
penguins/simple
se procesó a partir del conjunto de datos sin procesar, con etiquetas de clase simplificadas derivadas de campos de texto, valores faltantes marcados como NaN/NA y conserva solo 7 características significativas (n = 344).Tamaño de descarga :
13.20 KiB
Tamaño del conjunto de datos :
56.10 KiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 344 |
- Estructura de características :
FeaturesDict({
'body_mass_g': float32,
'culmen_depth_mm': float32,
'culmen_length_mm': float32,
'flipper_length_mm': float32,
'island': ClassLabel(shape=(), dtype=int64, num_classes=3),
'sex': ClassLabel(shape=(), dtype=int64, num_classes=3),
'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
cuerpo_masa_g | Tensor | flotar32 | ||
culmen_profundidad_mm | Tensor | flotar32 | ||
culmen_longitud_mm | Tensor | flotar32 | ||
flipper_length_mm | Tensor | flotar32 | ||
isla | Etiqueta de clase | int64 | ||
sexo | Etiqueta de clase | int64 | ||
especies | Etiqueta de clase | int64 |
Teclas supervisadas (Ver
as_supervised
):({'body_mass_g': 'body_mass_g', 'culmen_depth_mm': 'culmen_depth_mm', 'culmen_length_mm': 'culmen_length_mm', 'flipper_length_mm': 'flipper_length_mm', 'island': 'island', 'sex': 'sex', 'species': 'species'}, 'species')
Ejemplos ( tfds.as_dataframe ):
pinguinos/crudo
Descripción de la configuración :
penguins/raw
es la copia original sin procesar de @allisonhorst, que contiene las 17 funciones, presentadas como tipos numéricos o como texto sin procesar (n = 344).Tamaño de la descarga :
49.72 KiB
Tamaño del conjunto de datos :
164.51 KiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 344 |
- Estructura de características :
FeaturesDict({
'Body Mass (g)': float32,
'Clutch Completion': Text(shape=(), dtype=string),
'Comments': Text(shape=(), dtype=string),
'Culmen Depth (mm)': float32,
'Culmen Length (mm)': float32,
'Date Egg': Text(shape=(), dtype=string),
'Delta 13 C (o/oo)': float32,
'Delta 15 N (o/oo)': float32,
'Flipper Length (mm)': float32,
'Individual ID': Text(shape=(), dtype=string),
'Island': Text(shape=(), dtype=string),
'Region': Text(shape=(), dtype=string),
'Sample Number': int32,
'Sex': Text(shape=(), dtype=string),
'Species': Text(shape=(), dtype=string),
'Stage': Text(shape=(), dtype=string),
'studyName': Text(shape=(), dtype=string),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
Masa corporal (g) | Tensor | flotar32 | ||
Finalización del embrague | Texto | cuerda | ||
Comentarios | Texto | cuerda | ||
Profundidad del culmen (mm) | Tensor | flotar32 | ||
Longitud del culmen (mm) | Tensor | flotar32 | ||
Huevo de dátil | Texto | cuerda | ||
Delta 13C (o/oo) | Tensor | flotar32 | ||
Delta 15 N (a/a) | Tensor | flotar32 | ||
Longitud de la aleta (mm) | Tensor | flotar32 | ||
Identificación individual | Texto | cuerda | ||
Isla | Texto | cuerda | ||
Región | Texto | cuerda | ||
Numero de muestra | Tensor | int32 | ||
Sexo | Texto | cuerda | ||
Especies | Texto | cuerda | ||
Escenario | Texto | cuerda | ||
nombre del estudio | Texto | cuerda |
Claves supervisadas (Ver
as_supervised
doc ):None
Ejemplos ( tfds.as_dataframe ):