- Deskripsi :
Pengukuran untuk tiga spesies penguin yang diamati di Kepulauan Palmer, Antartika.
Data ini dikumpulkan dari tahun 2007-2009 oleh Dr. Kristen Gorman dengan Program Penelitian Ekologi Jangka Panjang Stasiun Palmer , bagian dari Jaringan Penelitian Ekologi Jangka Panjang AS . Data awalnya diimpor dari Portal Data Inisiatif Data Lingkungan (EDI), dan tersedia untuk digunakan dengan lisensi CC0 ("No Rights Reserved") sesuai dengan Kebijakan Data Palmer Station. Salinan ini diimpor dari repositori GitHub Allison Horst .
Kode sumber :
tfds.datasets.penguins.Builder
Versi :
-
1.0.0
(default): Rilis awal.
-
Di-cache otomatis ( dokumentasi ): Ya
Gambar ( tfds.show_examples ): Tidak didukung.
Kutipan :
@Manual{,
title = {palmerpenguins: Palmer Archipelago (Antarctica) penguin data},
author = {Allison Marie Horst and Alison Presmanes Hill and Kristen B Gorman},
year = {2020},
note = {R package version 0.1.0},
doi = {10.5281/zenodo.3960218},
url = {https://allisonhorst.github.io/palmerpenguins/},
}
penguin/diproses (konfigurasi default)
Deskripsi konfigurasi :
penguins/processed
adalah pengganti drop-in untuk datasetiris
. Ini berisi 4 fitur numerik yang dinormalisasi yang disajikan sebagai tensor tunggal, tidak ada nilai yang hilang dan label kelas (spesies) disajikan sebagai bilangan bulat (n = 334).Ukuran unduhan :
25.05 KiB
Ukuran dataset :
17.61 KiB
Perpecahan :
Membelah | Contoh |
---|---|
'train' | 334 |
- Struktur fitur :
FeaturesDict({
'features': Tensor(shape=(4,), dtype=float32),
'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
fitur | Tensor | (4,) | float32 | |
jenis | LabelKelas | int64 |
Kunci yang diawasi (Lihat
as_supervised
doc ):('features', 'species')
Contoh ( tfds.as_dataframe ):
penguin / sederhana
Deskripsi konfigurasi :
penguins/simple
telah diproses dari kumpulan data mentah, dengan label kelas yang disederhanakan yang berasal dari bidang teks, nilai yang hilang ditandai sebagai NaN/NA dan hanya mempertahankan 7 fitur signifikan (n = 344).Ukuran unduhan :
13.20 KiB
Ukuran dataset :
56.10 KiB
Perpecahan :
Membelah | Contoh |
---|---|
'train' | 344 |
- Struktur fitur :
FeaturesDict({
'body_mass_g': float32,
'culmen_depth_mm': float32,
'culmen_length_mm': float32,
'flipper_length_mm': float32,
'island': ClassLabel(shape=(), dtype=int64, num_classes=3),
'sex': ClassLabel(shape=(), dtype=int64, num_classes=3),
'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
massa_tubuh_g | Tensor | float32 | ||
culmen_depth_mm | Tensor | float32 | ||
culmen_length_mm | Tensor | float32 | ||
sirip_panjang_mm | Tensor | float32 | ||
pulau | LabelKelas | int64 | ||
seks | LabelKelas | int64 | ||
jenis | LabelKelas | int64 |
Kunci yang diawasi (Lihat
as_supervised
doc ):({'body_mass_g': 'body_mass_g', 'culmen_depth_mm': 'culmen_depth_mm', 'culmen_length_mm': 'culmen_length_mm', 'flipper_length_mm': 'flipper_length_mm', 'island': 'island', 'sex': 'sex', 'species': 'species'}, 'species')
Contoh ( tfds.as_dataframe ):
penguin / mentah
Deskripsi konfigurasi :
penguins/raw
adalah salinan asli yang belum diproses dari @allisonhorst, berisi semua 17 fitur, disajikan baik sebagai tipe numerik atau sebagai teks mentah (n = 344).Ukuran unduhan :
49.72 KiB
Ukuran dataset :
164.51 KiB
Perpecahan :
Membelah | Contoh |
---|---|
'train' | 344 |
- Struktur fitur :
FeaturesDict({
'Body Mass (g)': float32,
'Clutch Completion': Text(shape=(), dtype=string),
'Comments': Text(shape=(), dtype=string),
'Culmen Depth (mm)': float32,
'Culmen Length (mm)': float32,
'Date Egg': Text(shape=(), dtype=string),
'Delta 13 C (o/oo)': float32,
'Delta 15 N (o/oo)': float32,
'Flipper Length (mm)': float32,
'Individual ID': Text(shape=(), dtype=string),
'Island': Text(shape=(), dtype=string),
'Region': Text(shape=(), dtype=string),
'Sample Number': int32,
'Sex': Text(shape=(), dtype=string),
'Species': Text(shape=(), dtype=string),
'Stage': Text(shape=(), dtype=string),
'studyName': Text(shape=(), dtype=string),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
Massa Tubuh (g) | Tensor | float32 | ||
Penyelesaian Kopling | Teks | rangkaian | ||
Komentar | Teks | rangkaian | ||
Kedalaman Culmen (mm) | Tensor | float32 | ||
Panjang Kulmen (mm) | Tensor | float32 | ||
Tanggal Telur | Teks | rangkaian | ||
Delta 13 C (o/oo) | Tensor | float32 | ||
Delta 15 N (o/oo) | Tensor | float32 | ||
Panjang Sirip (mm) | Tensor | float32 | ||
identitas individu | Teks | rangkaian | ||
Pulau | Teks | rangkaian | ||
Wilayah | Teks | rangkaian | ||
Nomor Sampel | Tensor | int32 | ||
Seks | Teks | rangkaian | ||
Jenis | Teks | rangkaian | ||
Panggung | Teks | rangkaian | ||
namastudi | Teks | rangkaian |
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Contoh ( tfds.as_dataframe ):