- 説明:
iNaturalist データセット 2021 には、合計 10,000 種が含まれています。完全なトレーニング データセットには、約 270 万枚の画像が含まれています。データセットをよりアクセスしやすくするために、種ごとに 50 個のサンプル、合計 500,000 個の画像を含む「ミニ」トレーニング データセットも作成しました。フル トレーニングtrain
スプリットはmini
スプリットと重複します。 val セットには、種ごとに 10 個の検証画像 (合計 100K) が含まれています。 public_test
分割には合計 500,000 のテスト イメージがあります (グラウンド トゥルース ラベルなし)。
ホームページ: https://github.com/visipedia/inat_comp/tree/master/2021
ソースコード:
tfds.image_classification.i_naturalist2021.INaturalist2021
バージョン:
-
1.0.0
: 初期リリース。 -
2.0.0
: 更新: クラス インデックスは JSON トレイン ファイル内の順序に従います。 -
2.0.1
(デフォルト): 更新: JSON ファイルで提供されているサンプル ID を含めます。
-
ダウンロードサイズ:
316.54 GiB
データセットのサイズ:
318.45 GiB
自動キャッシュ(ドキュメント): いいえ
分割:
スプリット | 例 |
---|---|
'mini' | 500,000 |
'test' | 500,000 |
'train' | 2,686,843 |
'val' | 100,000 |
- 機能の構造:
FeaturesDict({
'file_id': Text(shape=(), dtype=string),
'id': Scalar(shape=(), dtype=int64),
'image': Image(shape=(None, None, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=10000),
'supercategory': ClassLabel(shape=(), dtype=int64, num_classes=11),
})
- 機能ドキュメント:
特徴 | クラス | 形 | Dタイプ | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
ファイルID | 文章 | 弦 | ||
ID | スカラー | int64 | ||
画像 | 画像 | (なし、なし、3) | uint8 | |
ラベル | クラスラベル | int64 | ||
スーパーカテゴリー | クラスラベル | int64 |
監視キー(
as_supervised
docを参照):('image', 'label')
図( tfds.show_examples ):
- 例( tfds.as_dataframe ):
- 引用:
\
@misc{inaturalist21,
Howpublished = {~\url{https://github.com/visipedia/inat_comp/tree/master/2021} },
Title = { {iNaturalist} 2021 competition dataset.},
Year = {2021},
key = { {iNaturalist} 2021 competition dataset},
}