- 설명 :
Places 데이터 세트는 인간의 시각 인식 원칙에 따라 설계되었습니다. 우리의 목표는 장면 컨텍스트, 개체 인식, 동작 및 이벤트 예측, 마음 이론 추론과 같은 높은 수준의 시각적 이해 작업을 위해 인공 시스템을 훈련하는 데 사용할 수 있는 시각적 지식의 핵심을 구축하는 것입니다.
장소의 시맨틱 범주는 해당 기능에 의해 정의됩니다. 레이블은 환경의 엔트리 레벨을 나타냅니다. 예를 들어, 데이터세트는 동일한 방식으로 작동하지 않고 집 침실, 호텔 침실 또는 보육원에서 다음에 일어날 수 있는 일에 대해 동일한 예측을 하지 않기 때문에 침실 또는 거리 등의 다른 범주를 가지고 있습니다. 전체적으로 Places에는 400개 이상의 고유한 장면 범주로 구성된 1,000만 개 이상의 이미지가 포함되어 있습니다. 데이터 세트는 실제 발생 빈도와 일치하는 클래스당 5000~30,000개의 훈련 이미지를 특징으로 합니다. 합성곱 신경망(CNN)을 사용하는 Places 데이터 세트는 장면 중심 벤치마크에서 새로운 최첨단 성능을 설정하는 것을 목표로 다양한 장면 인식 작업을 위한 심층 장면 기능을 학습할 수 있습니다.
여기서 우리는 학술 연구 및 교육 목적을 위해 장소 데이터베이스와 훈련된 CNN을 제공합니다.
소스 코드 :
tfds.datasets.placesfull.Builder
버전 :
-
1.0.0
(기본값): 릴리스 정보가 없습니다.
-
다운로드 크기 :
143.56 GiB
데이터세트 크기 :
136.56 GiB
자동 캐시 ( 문서 ): 아니요
분할 :
나뉘다 | 예 |
---|---|
'train' | 10,653,087 |
- 기능 구조 :
FeaturesDict({
'filename': Text(shape=(), dtype=string),
'image': Image(shape=(256, 256, 3), dtype=uint8),
'label': ClassLabel(shape=(), dtype=int64, num_classes=435),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
파일 이름 | 텍스트 | 끈 | ||
영상 | 영상 | (256, 256, 3) | uint8 | |
상표 | 클래스 레이블 | int64 |
감독 키 (
as_supervised
문서 참조):('image', 'label', 'filename')
그림 ( tfds.show_examples ):
- 예 ( tfds.as_dataframe ):
- 인용 :
@article{zhou2017places,
title={Places: A 10 million Image Database for Scene Recognition},
author={Zhou, Bolei and Lapedriza, Agata and Khosla, Aditya and Oliva, Aude and Torralba, Antonio},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
year={2017},
publisher={IEEE}
}