- 説明:
LVIS: 大規模な語彙インスタンスのセグメンテーション用のデータセット。
追加ドキュメント:コード付きの論文について調べる
ホームページ: https://www.lvisdataset.org/
ソースコード:
tfds.datasets.lvis.Builder
バージョン:
-
1.1.0
: フィールドneg_category_ids
およびnot_exhaustive_category_ids
を追加しました。 -
1.2.0
: クラス名を追加しました。 -
1.3.0
(デフォルト): ミニバル分割を追加しました。
-
ダウンロードサイズ:
25.35 GiB
データセットのサイズ:
23.04 GiB
自動キャッシュ(ドキュメント): いいえ
分割:
スプリット | 例 |
---|---|
'minival' | 4,809 |
'test' | 19,822 |
'train' | 100,170 |
'validation' | 19,809 |
- 機能の構造:
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/id': int64,
'neg_category_ids': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=1203)),
'not_exhaustive_category_ids': Sequence(ClassLabel(shape=(), dtype=int64, num_classes=1203)),
'objects': Sequence({
'area': int64,
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'id': int64,
'label': ClassLabel(shape=(), dtype=int64, num_classes=1203),
'segmentation': Image(shape=(None, None, 1), dtype=uint8),
}),
})
- 機能ドキュメント:
特徴 | クラス | 形 | Dタイプ | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
画像 | 画像 | (なし、なし、3) | uint8 | |
画像/ID | テンソル | int64 | ||
neg_category_ids | シーケンス(クラスラベル) | (なし、) | int64 | |
not_exhaustive_category_ids | シーケンス(クラスラベル) | (なし、) | int64 | |
オブジェクト | 順序 | |||
オブジェクト/エリア | テンソル | int64 | ||
オブジェクト/Bボックス | BBox機能 | (4,) | float32 | |
オブジェクト/ID | テンソル | int64 | ||
オブジェクト/ラベル | クラスラベル | int64 | ||
オブジェクト/セグメンテーション | 画像 | (なし、なし、1) | uint8 |
監視キー(
as_supervised
docを参照):None
図( tfds.show_examples ):
- 例( tfds.as_dataframe ):
- 引用:
@inproceedings{gupta2019lvis,
title={ {LVIS}: A Dataset for Large Vocabulary Instance Segmentation},
author={Gupta, Agrim and Dollar, Piotr and Girshick, Ross},
booktitle={Proceedings of the {IEEE} Conference on Computer Vision and Pattern Recognition},
year={2019}
}