- 説明:
Open Images は、画像レベルのラベル、オブジェクト境界ボックス、オブジェクト セグメンテーション マスク、および視覚的関係で注釈が付けられた約 900 万枚の画像の共同リリースです。この他に類を見ない大規模で多様なデータセットは、画像の分析と理解における最先端の進歩を促進するように設計されています。
これには、競技会の 3 つのオブジェクト検出トラックからのデータが含まれています。このトラックの目標は、500 クラスのすべてのオブジェクト インスタンスの周囲にある厳密な境界ボックスを予測することです。
画像には、特定のオブジェクト クラスが存在することを示すポジティブなイメージ レベルのラベルと、特定のクラスが存在しないことを示すネガティブなイメージ レベルのラベルが付けられます。コンテストでは、他のすべての注釈のないクラスは、そのイメージの評価から除外されます。イメージ内のポジティブなイメージレベルのラベルごとに、イメージ内のそのオブジェクトクラスのすべてのインスタンスに注釈が付けられました。
ホームページ: https://storage.googleapis.com/openimages/web/challenge2019.html
ソースコード:
tfds.datasets.open_images_challenge2019_detection.Builder
バージョン:
-
1.0.0
(デフォルト): リリース ノートはありません。
-
ダウンロードサイズ:
534.63 GiB
自動キャッシュ(ドキュメント): いいえ
分割:
スプリット | 例 |
---|---|
'test' | 99,999 |
'train' | 1,743,042 |
'validation' | 41,620 |
- 機能の構造:
FeaturesDict({
'bobjects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'is_group_of': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
}),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'objects': Sequence({
'confidence': float32,
'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
'source': Text(shape=(), dtype=string),
}),
})
- 機能ドキュメント:
特徴 | クラス | 形 | Dタイプ | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
オブジェクト | 順序 | |||
ボオブジェクト/Bボックス | BBox機能 | (4,) | float32 | |
bobjects/is_group_of | テンソル | ブール | ||
オブジェクト/ラベル | クラスラベル | int64 | ||
ID | 文章 | 弦 | ||
画像 | 画像 | (なし、なし、3) | uint8 | |
オブジェクト | 順序 | |||
オブジェクト/信頼 | テンソル | float32 | ||
オブジェクト/ラベル | クラスラベル | int64 | ||
オブジェクト/ソース | 文章 | 弦 |
監視キー(
as_supervised
docを参照):None
引用:
open_images_challenge2019_detection/200k (デフォルト設定)
構成の説明: 画像は 72 JPEG 品質で最大 200,000 ピクセルを持ちます。
データセットのサイズ:
59.06 GiB
図( tfds.show_examples ):
- 例( tfds.as_dataframe ):
open_images_challenge2019_detection/300k
設定の説明: 画像は 72 JPEG 品質で最大 300,000 ピクセルを持ちます。
データセットのサイズ:
80.10 GiB
図( tfds.show_examples ):
- 例( tfds.as_dataframe ):