- 説明:
WIDER FACE データセットは、公開されている WIDER データセットから画像を選択した顔検出ベンチマーク データセットです。サンプル画像に示されているように、32,203 枚の画像を選択し、393,703 枚の顔にラベルを付けます。 WIDER FACE データセットは、61 のイベント クラスに基づいて編成されています。イベント クラスごとに、40%/10%/50% のデータをトレーニング、検証、およびテスト セットとしてランダムに選択します。 PASCAL VOC データセットで採用されているものと同じ評価指標を採用しています。 MALF および Caltech データセットと同様に、テスト画像のバウンディング ボックスのグラウンド トゥルースは公開しません。ユーザーは、最終的な予測ファイルを提出する必要があり、評価を進めます。
ソース コード:
tfds.object_detection.WiderFace
バージョン:
-
0.1.0
(デフォルト): リリース ノートはありません。
-
ダウンロードサイズ:
3.42 GiB
データセットサイズ:
3.45 GiB
自動キャッシュ(ドキュメント): いいえ
スプリット:
スプリット | 例 |
---|---|
'test' | 16,097 |
'train' | 12,880 |
'validation' | 3,226 |
- 機能構造:
FeaturesDict({
'faces': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'blur': uint8,
'expression': bool,
'illumination': bool,
'invalid': bool,
'occlusion': uint8,
'pose': bool,
}),
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/filename': Text(shape=(), dtype=string),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
顔 | 順序 | |||
顔/bbox | BBoxFeature | (4) | float32 | |
顔/ぼかし | テンソル | uint8 | ||
顔・表情 | テンソル | ブール | ||
顔/イルミネーション | テンソル | ブール | ||
顔/無効 | テンソル | ブール | ||
フェース/オクルージョン | テンソル | uint8 | ||
顔・ポーズ | テンソル | ブール | ||
画像 | 画像 | (なし、なし、3) | uint8 | |
画像/ファイル名 | 文章 | ストリング |
監視されたキー(
as_supervised
docを参照):None
図( tfds.show_examples ):
- 例( tfds.as_dataframe ):
- 引用:
@inproceedings{yang2016wider,
Author = {Yang, Shuo and Luo, Ping and Loy, Chen Change and Tang, Xiaoou},
Booktitle = {IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
Title = {WIDER FACE: A Face Detection Benchmark},
Year = {2016} }