- Descrizione :
Misurazioni per tre specie di pinguini osservate nell'arcipelago di Palmer, in Antartide.
Questi dati sono stati raccolti dal 2007 al 2009 dalla dott.ssa Kristen Gorman con il programma di ricerca ecologica a lungo termine della stazione di Palmer , parte della rete di ricerca ecologica a lungo termine degli Stati Uniti . I dati sono stati originariamente importati dal portale dati Environmental Data Initiative (EDI) e sono disponibili per l'uso con licenza CC0 ("Nessun diritto riservato") in conformità con la Palmer Station Data Policy. Questa copia è stata importata dal repository GitHub di Allison Horst .
Pagina iniziale : https://allisonhorst.github.io/palmerpenguins/
Codice sorgente :
tfds.datasets.penguins.Builder
Versioni :
-
1.0.0
(impostazione predefinita): versione iniziale.
-
Auto-cache ( documentazione ): Sì
Figura ( tfds.show_examples ): non supportato.
Citazione :
@Manual{,
title = {palmerpenguins: Palmer Archipelago (Antarctica) penguin data},
author = {Allison Marie Horst and Alison Presmanes Hill and Kristen B Gorman},
year = {2020},
note = {R package version 0.1.0},
doi = {10.5281/zenodo.3960218},
url = {https://allisonhorst.github.io/palmerpenguins/},
}
pinguini/processati (configurazione predefinita)
Descrizione della configurazione :
penguins/processed
è un sostituto immediato per il set di datiiris
. Contiene 4 caratteristiche numeriche normalizzate presentate come un singolo tensore, nessun valore mancante e l'etichetta della classe (specie) è presentata come un numero intero (n = 334).Dimensione del download :
25.05 KiB
Dimensione del set di dati:
17.61 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 334 |
- Struttura delle caratteristiche :
FeaturesDict({
'features': Tensor(shape=(4,), dtype=float32),
'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
caratteristiche | Tensore | (4,) | galleggiante32 | |
specie | ClassLabel | int64 |
Chiavi supervisionate (vedi
as_supervised
doc ):('features', 'species')
Esempi ( tfds.as_dataframe ):
pinguini/semplice
Descrizione della configurazione :
penguins/simple
è stato elaborato dal set di dati non elaborato, con etichette di classe semplificate derivate da campi di testo, valori mancanti contrassegnati come NaN/NA e conserva solo 7 caratteristiche significative (n = 344).Dimensione del download :
13.20 KiB
Dimensione del set di dati:
56.10 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 344 |
- Struttura delle caratteristiche :
FeaturesDict({
'body_mass_g': float32,
'culmen_depth_mm': float32,
'culmen_length_mm': float32,
'flipper_length_mm': float32,
'island': ClassLabel(shape=(), dtype=int64, num_classes=3),
'sex': ClassLabel(shape=(), dtype=int64, num_classes=3),
'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
massa_corporea_g | Tensore | galleggiante32 | ||
culmen_profondità_mm | Tensore | galleggiante32 | ||
culmen_lunghezza_mm | Tensore | galleggiante32 | ||
flipper_length_mm | Tensore | galleggiante32 | ||
isola | ClassLabel | int64 | ||
sesso | ClassLabel | int64 | ||
specie | ClassLabel | int64 |
Chiavi supervisionate (vedi
as_supervised
doc ):({'body_mass_g': 'body_mass_g', 'culmen_depth_mm': 'culmen_depth_mm', 'culmen_length_mm': 'culmen_length_mm', 'flipper_length_mm': 'flipper_length_mm', 'island': 'island', 'sex': 'sex', 'species': 'species'}, 'species')
Esempi ( tfds.as_dataframe ):
pinguini/crudo
Descrizione della configurazione :
penguins/raw
è la copia originale non elaborata di @allisonhorst, contenente tutte le 17 funzionalità, presentate come tipi numerici o come testo non elaborato (n = 344).Dimensione del download :
49.72 KiB
Dimensione del set di dati:
164.51 KiB
Divisioni :
Diviso | Esempi |
---|---|
'train' | 344 |
- Struttura delle caratteristiche :
FeaturesDict({
'Body Mass (g)': float32,
'Clutch Completion': Text(shape=(), dtype=string),
'Comments': Text(shape=(), dtype=string),
'Culmen Depth (mm)': float32,
'Culmen Length (mm)': float32,
'Date Egg': Text(shape=(), dtype=string),
'Delta 13 C (o/oo)': float32,
'Delta 15 N (o/oo)': float32,
'Flipper Length (mm)': float32,
'Individual ID': Text(shape=(), dtype=string),
'Island': Text(shape=(), dtype=string),
'Region': Text(shape=(), dtype=string),
'Sample Number': int32,
'Sex': Text(shape=(), dtype=string),
'Species': Text(shape=(), dtype=string),
'Stage': Text(shape=(), dtype=string),
'studyName': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
Massa corporea (g) | Tensore | galleggiante32 | ||
Completamento della frizione | Testo | corda | ||
Commenti | Testo | corda | ||
Profondità del canale (mm) | Tensore | galleggiante32 | ||
Lunghezza culmen (mm) | Tensore | galleggiante32 | ||
Data Uovo | Testo | corda | ||
Delta 13 C (o/oo) | Tensore | galleggiante32 | ||
Delta 15 N (o/oo) | Tensore | galleggiante32 | ||
Lunghezza pinna (mm) | Tensore | galleggiante32 | ||
ID individuale | Testo | corda | ||
Isola | Testo | corda | ||
Regione | Testo | corda | ||
Numero del campione | Tensore | int32 | ||
Sesso | Testo | corda | ||
Specie | Testo | corda | ||
Palcoscenico | Testo | corda | ||
studioNome | Testo | corda |
Chiavi supervisionate (Vedi
as_supervised
doc ):None
Esempi ( tfds.as_dataframe ):