장소 가득

  • 설명 :

Places 데이터 세트는 인간의 시각 인식 원칙에 따라 설계되었습니다. 우리의 목표는 장면 컨텍스트, 개체 인식, 동작 및 이벤트 예측, 마음 이론 추론과 같은 높은 수준의 시각적 이해 작업을 위해 인공 시스템을 훈련하는 데 사용할 수 있는 시각적 지식의 핵심을 구축하는 것입니다.

장소의 시맨틱 범주는 해당 기능에 의해 정의됩니다. 레이블은 환경의 엔트리 레벨을 나타냅니다. 예를 들어, 데이터세트는 동일한 방식으로 작동하지 않고 집 침실, 호텔 침실 또는 보육원에서 다음에 일어날 수 있는 일에 대해 동일한 예측을 하지 않기 때문에 침실 또는 거리 등의 다른 범주를 가지고 있습니다. 전체적으로 Places에는 400개 이상의 고유한 장면 범주로 구성된 1,000만 개 이상의 이미지가 포함되어 있습니다. 데이터 세트는 실제 발생 빈도와 일치하는 클래스당 5000~30,000개의 훈련 이미지를 특징으로 합니다. 합성곱 신경망(CNN)을 사용하는 Places 데이터 세트는 장면 중심 벤치마크에서 새로운 최첨단 성능을 설정하는 것을 목표로 다양한 장면 인식 작업을 위한 심층 장면 기능을 학습할 수 있습니다.

여기서 우리는 학술 연구 및 교육 목적을 위해 장소 데이터베이스와 훈련된 CNN을 제공합니다.

나뉘다
'train' 10,653,087
  • 기능 구조 :
FeaturesDict({
    'filename': Text(shape=(), dtype=string),
    'image': Image(shape=(256, 256, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=435),
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
파일 이름 텍스트
영상 영상 (256, 256, 3) uint8
상표 클래스 레이블 int64

심상

  • 인용 :
@article{zhou2017places,
  title={Places: A 10 million Image Database for Scene Recognition},
  author={Zhou, Bolei and Lapedriza, Agata and Khosla, Aditya and Oliva, Aude and Torralba, Antonio},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  year={2017},
  publisher={IEEE}
}