- Mô tả :
Các phép đo đối với ba loài chim cánh cụt được quan sát ở Quần đảo Palmer, Nam Cực.
Những dữ liệu này được Tiến sĩ Kristen Gorman thu thập từ năm 2007 - 2009 với Chương trình Nghiên cứu Sinh thái Dài hạn Trạm Palmer , một phần của Mạng lưới Nghiên cứu Sinh thái Dài hạn của Hoa Kỳ. Dữ liệu ban đầu được nhập từ Cổng dữ liệu Sáng kiến dữ liệu môi trường (EDI) và có sẵn để sử dụng theo giấy phép CC0 ("Không bảo lưu quyền") theo Chính sách dữ liệu của Trạm Palmer. Bản sao này được nhập từ kho lưu trữ GitHub của Allison Horst .
Trang chủ : https://allisonhorst.github.io/palmerpenguins/
Mã nguồn :
tfds.datasets.penguins.Builder
Phiên bản :
-
1.0.0
(mặc định): Bản phát hành đầu tiên.
-
Tự động lưu vào bộ đệm ( tài liệu ): Có
Hình ( tfds.show_examples ): Không được hỗ trợ.
trích dẫn :
@Manual{,
title = {palmerpenguins: Palmer Archipelago (Antarctica) penguin data},
author = {Allison Marie Horst and Alison Presmanes Hill and Kristen B Gorman},
year = {2020},
note = {R package version 0.1.0},
doi = {10.5281/zenodo.3960218},
url = {https://allisonhorst.github.io/palmerpenguins/},
}
chim cánh cụt/đã xử lý (cấu hình mặc định)
Mô tả cấu hình :
penguins/processed
là sự thay thế tùy chọn cho tập dữ liệuiris
. Nó chứa 4 tính năng số được chuẩn hóa được trình bày dưới dạng một tenxơ duy nhất, không có giá trị nào bị thiếu và nhãn lớp (loài) được trình bày dưới dạng số nguyên (n = 334).Kích thước tải xuống :
25.05 KiB
Kích thước tập dữ liệu :
17.61 KiB
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 334 |
- Cấu trúc tính năng :
FeaturesDict({
'features': Tensor(shape=(4,), dtype=float32),
'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
Tính năng, đặc điểm | tenxơ | (4,) | phao32 | |
loài | LớpNhãn | int64 |
Các khóa được giám sát (Xem
as_supervised
doc ):('features', 'species')
Ví dụ ( tfds.as_dataframe ):
chim cánh cụt / đơn giản
Mô tả cấu hình :
penguins/simple
đã được xử lý từ tập dữ liệu thô, với các nhãn lớp được đơn giản hóa bắt nguồn từ các trường văn bản, thiếu các giá trị được đánh dấu là NaN/NA và chỉ giữ lại 7 tính năng quan trọng (n = 344).Kích thước tải xuống :
13.20 KiB
Kích thước tập dữ liệu :
56.10 KiB
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 344 |
- Cấu trúc tính năng :
FeaturesDict({
'body_mass_g': float32,
'culmen_depth_mm': float32,
'culmen_length_mm': float32,
'flipper_length_mm': float32,
'island': ClassLabel(shape=(), dtype=int64, num_classes=3),
'sex': ClassLabel(shape=(), dtype=int64, num_classes=3),
'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
body_mass_g | tenxơ | phao32 | ||
culmen_deep_mm | tenxơ | phao32 | ||
culmen_length_mm | tenxơ | phao32 | ||
flipper_length_mm | tenxơ | phao32 | ||
Đảo | LớpNhãn | int64 | ||
tình dục | LớpNhãn | int64 | ||
loài | LớpNhãn | int64 |
Các khóa được giám sát (Xem
as_supervised
doc ):({'body_mass_g': 'body_mass_g', 'culmen_depth_mm': 'culmen_depth_mm', 'culmen_length_mm': 'culmen_length_mm', 'flipper_length_mm': 'flipper_length_mm', 'island': 'island', 'sex': 'sex', 'species': 'species'}, 'species')
Ví dụ ( tfds.as_dataframe ):
chim cánh cụt / sống
Mô tả cấu hình :
penguins/raw
là bản sao gốc, chưa qua xử lý từ @allisonhorst, chứa tất cả 17 tính năng, được trình bày dưới dạng kiểu số hoặc dưới dạng văn bản thô (n = 344).Kích thước tải xuống :
49.72 KiB
Kích thước tập dữ liệu :
164.51 KiB
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 344 |
- Cấu trúc tính năng :
FeaturesDict({
'Body Mass (g)': float32,
'Clutch Completion': Text(shape=(), dtype=string),
'Comments': Text(shape=(), dtype=string),
'Culmen Depth (mm)': float32,
'Culmen Length (mm)': float32,
'Date Egg': Text(shape=(), dtype=string),
'Delta 13 C (o/oo)': float32,
'Delta 15 N (o/oo)': float32,
'Flipper Length (mm)': float32,
'Individual ID': Text(shape=(), dtype=string),
'Island': Text(shape=(), dtype=string),
'Region': Text(shape=(), dtype=string),
'Sample Number': int32,
'Sex': Text(shape=(), dtype=string),
'Species': Text(shape=(), dtype=string),
'Stage': Text(shape=(), dtype=string),
'studyName': Text(shape=(), dtype=string),
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
Khối lượng cơ thể (g) | tenxơ | phao32 | ||
Hoàn thành ly hợp | Chữ | sợi dây | ||
Bình luận | Chữ | sợi dây | ||
Độ sâu cống (mm) | tenxơ | phao32 | ||
Chiều dài cống (mm) | tenxơ | phao32 | ||
trứng chà là | Chữ | sợi dây | ||
Đồng bằng 13 C (o/oo) | tenxơ | phao32 | ||
Đồng bằng 15 N (o/oo) | tenxơ | phao32 | ||
Chiều dài chân chèo (mm) | tenxơ | phao32 | ||
ID cá nhân | Chữ | sợi dây | ||
Hòn đảo | Chữ | sợi dây | ||
Vùng đất | Chữ | sợi dây | ||
Số mẫu | tenxơ | int32 | ||
giới tính | Chữ | sợi dây | ||
Loài | Chữ | sợi dây | ||
Sân khấu | Chữ | sợi dây | ||
tên học | Chữ | sợi dây |
Các khóa được giám sát (Xem
as_supervised
doc ):None
Ví dụ ( tfds.as_dataframe ):