- 설명 :
남극 팔머 군도에서 관찰된 3종의 펭귄에 대한 측정.
이 데이터는 미국 장기 생태 연구 네트워크 의 일부인 Palmer Station 장기 생태 연구 프로그램 의 Kristen Gorman 박사가 2007-2009년에 수집한 것입니다. 데이터는 원래 EDI( Environmental Data Initiative ) 데이터 포털에서 가져왔으며 Palmer Station 데이터 정책에 따라 CC0 라이선스("권한 없음")로 사용할 수 있습니다. 이 사본은 Allison Horst의 GitHub 저장소 에서 가져왔습니다.
소스 코드 :
tfds.datasets.penguins.Builder
버전 :
-
1.0.0
(기본값): 최초 릴리스.
-
자동 캐시 ( 문서 ): 예
그림 ( tfds.show_examples ): 지원되지 않습니다.
인용 :
@Manual{,
title = {palmerpenguins: Palmer Archipelago (Antarctica) penguin data},
author = {Allison Marie Horst and Alison Presmanes Hill and Kristen B Gorman},
year = {2020},
note = {R package version 0.1.0},
doi = {10.5281/zenodo.3960218},
url = {https://allisonhorst.github.io/palmerpenguins/},
}
펭귄/처리됨(기본 구성)
구성 설명 :
penguins/processed
는iris
데이터 세트를 즉시 대체합니다. 여기에는 단일 텐서로 표시되는 4개의 정규화된 수치 기능이 포함되어 있으며 누락된 값이 없으며 클래스 레이블(종)은 정수(n = 334)로 표시됩니다.다운로드 크기 :
25.05 KiB
데이터 세트 크기 :
17.61 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 334 |
- 기능 구조 :
FeaturesDict({
'features': Tensor(shape=(4,), dtype=float32),
'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
특징 | 텐서 | (4,) | float32 | |
종 | 클래스 레이블 | int64 |
감독 키 (
as_supervised
문서 참조):('features', 'species')
예 ( tfds.as_dataframe ):
펭귄/단순
구성 설명 :
penguins/simple
은 원시 데이터 세트에서 처리되었으며, 텍스트 필드에서 파생된 단순화된 클래스 레이블, NaN/NA로 표시된 누락된 값 및 7개의 중요한 기능(n = 344)만 유지합니다.다운로드 크기 :
13.20 KiB
데이터 세트 크기 :
56.10 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 344 |
- 기능 구조 :
FeaturesDict({
'body_mass_g': float32,
'culmen_depth_mm': float32,
'culmen_length_mm': float32,
'flipper_length_mm': float32,
'island': ClassLabel(shape=(), dtype=int64, num_classes=3),
'sex': ClassLabel(shape=(), dtype=int64, num_classes=3),
'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
body_mass_g | 텐서 | float32 | ||
culmen_depth_mm | 텐서 | float32 | ||
culmen_length_mm | 텐서 | float32 | ||
플리퍼_길이_mm | 텐서 | float32 | ||
섬 | 클래스 레이블 | int64 | ||
섹스 | 클래스 레이블 | int64 | ||
종 | 클래스 레이블 | int64 |
감독 키 (
as_supervised
문서 참조):({'body_mass_g': 'body_mass_g', 'culmen_depth_mm': 'culmen_depth_mm', 'culmen_length_mm': 'culmen_length_mm', 'flipper_length_mm': 'flipper_length_mm', 'island': 'island', 'sex': 'sex', 'species': 'species'}, 'species')
예 ( tfds.as_dataframe ):
펭귄/생
구성 설명 :
penguins/raw
는 @allisonhorst의 처리되지 않은 원본 사본으로 17가지 기능을 모두 포함하며 숫자 유형 또는 원시 텍스트(n = 344)로 표시됩니다.다운로드 크기 :
49.72 KiB
데이터 세트 크기 :
164.51 KiB
분할 :
나뉘다 | 예 |
---|---|
'train' | 344 |
- 기능 구조 :
FeaturesDict({
'Body Mass (g)': float32,
'Clutch Completion': Text(shape=(), dtype=string),
'Comments': Text(shape=(), dtype=string),
'Culmen Depth (mm)': float32,
'Culmen Length (mm)': float32,
'Date Egg': Text(shape=(), dtype=string),
'Delta 13 C (o/oo)': float32,
'Delta 15 N (o/oo)': float32,
'Flipper Length (mm)': float32,
'Individual ID': Text(shape=(), dtype=string),
'Island': Text(shape=(), dtype=string),
'Region': Text(shape=(), dtype=string),
'Sample Number': int32,
'Sex': Text(shape=(), dtype=string),
'Species': Text(shape=(), dtype=string),
'Stage': Text(shape=(), dtype=string),
'studyName': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
체질량(g) | 텐서 | float32 | ||
클러치 완성 | 텍스트 | 끈 | ||
코멘트 | 텍스트 | 끈 | ||
컬멘 깊이(mm) | 텐서 | float32 | ||
줄기 길이(mm) | 텐서 | float32 | ||
데이트 에그 | 텍스트 | 끈 | ||
델타 13C(o/oo) | 텐서 | float32 | ||
델타 15N(o/oo) | 텐서 | float32 | ||
플리퍼 길이(mm) | 텐서 | float32 | ||
개인 아이디 | 텍스트 | 끈 | ||
섬 | 텍스트 | 끈 | ||
지역 | 텍스트 | 끈 | ||
샘플 번호 | 텐서 | int32 | ||
섹스 | 텍스트 | 끈 | ||
종 | 텍스트 | 끈 | ||
단계 | 텍스트 | 끈 | ||
연구 이름 | 텍스트 | 끈 |
감독된 키 (
as_supervised
문서 참조):None
예 ( tfds.as_dataframe ):