عبور

شرح :

PASS یک مجموعه داده تصویری در مقیاس بزرگ است که شامل هیچ انسان، بخش‌های انسانی یا سایر اطلاعات قابل شناسایی شخصی نمی‌شود. می‌توان از آن برای پیش‌آموزش‌های باکیفیت با نظارت خود استفاده کرد و در عین حال نگرانی‌های مربوط به حریم خصوصی را به‌طور چشمگیری کاهش داد.

PASS شامل 1439589 تصویر بدون هیچ برچسبی است که از YFCC-100M تهیه شده است.

تمامی تصاویر موجود در این مجموعه داده تحت مجوز CC-BY و همچنین خود مجموعه داده دارای مجوز هستند. برای YFCC-100M به http://www.multimediacommons.org/ مراجعه کنید

اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://www.robots.ox.ac.uk/~vgg/data/pass/
کد منبع : tfds.datasets.pass.Builder
نسخه ها :
- 1.0.0 : انتشار اولیه.
- 2.0.0 : v2: 472 تصویر از نسخه 1 حذف شد زیرا حاوی انسان بود. همچنین متادیتا اضافه شده است: datetaken و GPS.
- 3.0.0 (پیش‌فرض): v3: 131 تصویر از نسخه 2 حذف شد زیرا حاوی انسان/خالکوبی بودند.
حجم دانلود : 167.30 GiB
حجم مجموعه داده : 166.43 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :

شکاف	مثال ها
`'train'`	1,439,588

ساختار ویژگی :

FeaturesDict({
    'image': Image(shape=(None, None, 3), dtype=uint8),
    'image/creator_uname': Text(shape=(), dtype=string),
    'image/date_taken': Text(shape=(), dtype=string),
    'image/gps_lat': float32,
    'image/gps_lon': float32,
    'image/hash': Text(shape=(), dtype=string),
})

مستندات ویژگی :

ویژگی	کلاس	شکل	نوع D
	FeaturesDict
تصویر	تصویر	(هیچ، هیچ، 3)	uint8
image/creator_uname	متن		رشته
تصویر/تاریخ_گرفته شده	متن		رشته
image/gps_lat	تانسور		float32
image/gps_lon	تانسور		float32
تصویر/هش	متن		رشته

کلیدهای نظارت شده (به as_supervised doc مراجعه کنید): None
شکل ( tfds.show_examples ):

تجسم

مثال‌ها ( tfds.as_dataframe ):

نقل قول :

@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}