- Sự miêu tả :
Open Images là bản phát hành hợp tác của ~9 triệu hình ảnh được chú thích bằng nhãn cấp độ hình ảnh, hộp giới hạn đối tượng, mặt nạ phân đoạn đối tượng và các mối quan hệ trực quan. Bộ dữ liệu đa dạng và lớn độc đáo này được thiết kế để thúc đẩy những tiến bộ hiện đại trong việc phân tích và hiểu hình ảnh.
Phần này chứa dữ liệu từ quá trình Phát hiện đối tượng của cuộc thi. Mục tiêu của bước này là dự đoán một hộp giới hạn chặt chẽ xung quanh tất cả các phiên bản đối tượng của 500 lớp.
Các hình ảnh được chú thích bằng nhãn cấp độ hình ảnh dương, cho biết có một số lớp đối tượng nhất định và bằng nhãn cấp độ hình ảnh âm, cho biết một số lớp nhất định không có. Trong cuộc thi, tất cả các lớp không được chú thích khác đều bị loại khỏi quá trình đánh giá trong hình ảnh đó. Đối với mỗi nhãn cấp độ hình ảnh tích cực trong một hình ảnh, mọi phiên bản của lớp đối tượng đó trong hình ảnh đều được chú thích.
Trang chủ : https://storage.googleapis.com/openimages/web/challenge2019.html
Mã nguồn :
tfds.datasets.open_images_challenge2019_detection.Builder
Phiên bản :
-
1.0.0
(mặc định): Không có ghi chú phát hành.
-
Kích thước tải xuống :
534.63 GiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Không
Chia tách :
Tách ra | Ví dụ |
---|---|
'test' | 99.999 |
'train' | 1.743.042 |
'validation' | 41.620 |
- Cấu trúc tính năng :
FeaturesDict({
'bobjects': Sequence({
'bbox': BBoxFeature(shape=(4,), dtype=float32),
'is_group_of': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
}),
'id': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'objects': Sequence({
'confidence': float32,
'label': ClassLabel(shape=(), dtype=int64, num_classes=500),
'source': Text(shape=(), dtype=string),
}),
})
- Tài liệu tính năng :
Tính năng | Lớp học | Hình dạng | loại D | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
đồ vật | Sự liên tiếp | |||
bobjects/bbox | Tính năng BBox | (4,) | phao32 | |
đối tượng/is_group_of | Tenxơ | bool | ||
đối tượng/nhãn | Nhãn lớp | int64 | ||
nhận dạng | Chữ | sợi dây | ||
hình ảnh | Hình ảnh | (Không, Không, 3) | uint8 | |
các đối tượng | Sự liên tiếp | |||
đồ vật/sự tự tin | Tenxơ | phao32 | ||
đồ vật/nhãn | Nhãn lớp | int64 | ||
đối tượng/nguồn | Chữ | sợi dây |
Khóa được giám sát (Xem
as_supervised
doc ):None
Trích dẫn :
open_images_challenge2019_Detection/200k (cấu hình mặc định)
Mô tả cấu hình : Hình ảnh có tối đa 200.000 pixel, chất lượng 72 JPEG.
Kích thước tập dữ liệu :
59.06 GiB
Hình ( tfds.show_examples ):
- Ví dụ ( tfds.as_dataframe ):
open_images_challenge2019_Detection/300k
Mô tả cấu hình : Hình ảnh có tối đa 300.000 pixel, chất lượng 72 JPEG.
Kích thước tập dữ liệu :
80.10 GiB
Hình ( tfds.show_examples ):
- Ví dụ ( tfds.as_dataframe ):