- 説明:
南極のパーマー群島で観察された 3 種のペンギンの測定。
これらのデータは、米国長期生態研究ネットワークの一部であるパーマー ステーション長期生態研究プログラムのクリステン ゴーマン博士によって 2007 ~ 2009 年に収集されました。データはもともと環境データ イニシアチブ(EDI) データ ポータルからインポートされたもので、パーマー ステーション データ ポリシーに従って CC0 ライセンス (「権利予約なし」) で使用できます。このコピーは、 Allison Horst の GitHub リポジトリからインポートされました。
ソース コード:
tfds.datasets.penguins.Builder
バージョン:
-
1.0.0
(デフォルト): 初期リリース。
-
自動キャッシュ(ドキュメント): はい
図( tfds.show_examples ): サポートされていません。
引用:
@Manual{,
title = {palmerpenguins: Palmer Archipelago (Antarctica) penguin data},
author = {Allison Marie Horst and Alison Presmanes Hill and Kristen B Gorman},
year = {2020},
note = {R package version 0.1.0},
doi = {10.5281/zenodo.3960218},
url = {https://allisonhorst.github.io/palmerpenguins/},
}
penguins/processed (デフォルト設定)
構成の説明:
penguins/processed
は、iris
データセットのドロップイン置換です。これには、単一のテンソルとして提示される 4 つの正規化された数値的特徴が含まれ、欠損値はなく、クラス ラベル (種) は整数 (n = 334) として提示されます。ダウンロードサイズ:
25.05 KiB
データセットサイズ:
17.61 KiB
スプリット:
スプリット | 例 |
---|---|
'train' | 334 |
- 機能構造:
FeaturesDict({
'features': Tensor(shape=(4,), dtype=float32),
'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
特徴 | テンソル | (4) | float32 | |
種族 | クラスラベル | int64 |
監視キー(
as_supervised
docを参照):('features', 'species')
例( tfds.as_dataframe ):
ペンギン/シンプル
構成の説明:
penguins/simple
は未加工のデータセットから処理され、テキスト フィールドから派生した単純化されたクラス ラベル、NaN/NA としてマークされた欠損値、および 7 つの重要な機能のみが保持されます (n = 344)。ダウンロードサイズ:
13.20 KiB
データセットサイズ:
56.10 KiB
スプリット:
スプリット | 例 |
---|---|
'train' | 344 |
- 機能構造:
FeaturesDict({
'body_mass_g': float32,
'culmen_depth_mm': float32,
'culmen_length_mm': float32,
'flipper_length_mm': float32,
'island': ClassLabel(shape=(), dtype=int64, num_classes=3),
'sex': ClassLabel(shape=(), dtype=int64, num_classes=3),
'species': ClassLabel(shape=(), dtype=int64, num_classes=3),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
body_mass_g | テンソル | float32 | ||
culmen_depth_mm | テンソル | float32 | ||
culmen_length_mm | テンソル | float32 | ||
フリッパーの長さ_mm | テンソル | float32 | ||
小島 | クラスラベル | int64 | ||
セックス | クラスラベル | int64 | ||
種族 | クラスラベル | int64 |
監視キー(
as_supervised
docを参照):({'body_mass_g': 'body_mass_g', 'culmen_depth_mm': 'culmen_depth_mm', 'culmen_length_mm': 'culmen_length_mm', 'flipper_length_mm': 'flipper_length_mm', 'island': 'island', 'sex': 'sex', 'species': 'species'}, 'species')
例( tfds.as_dataframe ):
ペンギン/生
構成の説明:
penguins/raw
は @allisonhorst からの元の未処理のコピーで、数値型または生のテキスト (n = 344) として表示される 17 個の機能すべてを含みます。ダウンロードサイズ:
49.72 KiB
データセットサイズ:
164.51 KiB
スプリット:
スプリット | 例 |
---|---|
'train' | 344 |
- 機能構造:
FeaturesDict({
'Body Mass (g)': float32,
'Clutch Completion': Text(shape=(), dtype=string),
'Comments': Text(shape=(), dtype=string),
'Culmen Depth (mm)': float32,
'Culmen Length (mm)': float32,
'Date Egg': Text(shape=(), dtype=string),
'Delta 13 C (o/oo)': float32,
'Delta 15 N (o/oo)': float32,
'Flipper Length (mm)': float32,
'Individual ID': Text(shape=(), dtype=string),
'Island': Text(shape=(), dtype=string),
'Region': Text(shape=(), dtype=string),
'Sample Number': int32,
'Sex': Text(shape=(), dtype=string),
'Species': Text(shape=(), dtype=string),
'Stage': Text(shape=(), dtype=string),
'studyName': Text(shape=(), dtype=string),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
体重 (g) | テンソル | float32 | ||
クラッチの完成 | 文章 | ストリング | ||
コメント | 文章 | ストリング | ||
カルメン深さ (mm) | テンソル | float32 | ||
カルメン長 (mm) | テンソル | float32 | ||
日付の卵 | 文章 | ストリング | ||
デルタ 13 C (o/oo) | テンソル | float32 | ||
デルタ 15 N (o/oo) | テンソル | float32 | ||
フリッパーの長さ (mm) | テンソル | float32 | ||
個人ID | 文章 | ストリング | ||
小島 | 文章 | ストリング | ||
領域 | 文章 | ストリング | ||
サンプル番号 | テンソル | int32 | ||
セックス | 文章 | ストリング | ||
種族 | 文章 | ストリング | ||
ステージ | 文章 | ストリング | ||
studyName | 文章 | ストリング |
監視されたキー(
as_supervised
docを参照):None
例( tfds.as_dataframe ):