- شرح :
PASS یک مجموعه داده تصویری در مقیاس بزرگ است که شامل هیچ انسان، بخشهای انسانی یا سایر اطلاعات قابل شناسایی شخصی نمیشود. میتوان از آن برای پیشآموزشهای باکیفیت با نظارت خود استفاده کرد و در عین حال نگرانیهای مربوط به حریم خصوصی را بهطور چشمگیری کاهش داد.
PASS شامل 1439589 تصویر بدون هیچ برچسبی است که از YFCC-100M تهیه شده است.
تمامی تصاویر موجود در این مجموعه داده تحت مجوز CC-BY و همچنین خود مجموعه داده دارای مجوز هستند. برای YFCC-100M به http://www.multimediacommons.org/ مراجعه کنید
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://www.robots.ox.ac.uk/~vgg/data/pass/
کد منبع :
tfds.datasets.pass.Builder
نسخه ها :
-
1.0.0
: انتشار اولیه. -
2.0.0
: v2: 472 تصویر از نسخه 1 حذف شد زیرا حاوی انسان بود. همچنین متادیتا اضافه شده است: datetaken و GPS. -
3.0.0
(پیشفرض): v3: 131 تصویر از نسخه 2 حذف شد زیرا حاوی انسان/خالکوبی بودند.
-
حجم دانلود :
167.30 GiB
حجم مجموعه داده :
166.43 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'train' | 1,439,588 |
- ساختار ویژگی :
FeaturesDict({
'image': Image(shape=(None, None, 3), dtype=uint8),
'image/creator_uname': Text(shape=(), dtype=string),
'image/date_taken': Text(shape=(), dtype=string),
'image/gps_lat': float32,
'image/gps_lon': float32,
'image/hash': Text(shape=(), dtype=string),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
تصویر | تصویر | (هیچ، هیچ، 3) | uint8 | |
image/creator_uname | متن | رشته | ||
تصویر/تاریخ_گرفته شده | متن | رشته | ||
image/gps_lat | تانسور | float32 | ||
image/gps_lon | تانسور | float32 | ||
تصویر/هش | متن | رشته |
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
شکل ( tfds.show_examples ):
- مثالها ( tfds.as_dataframe ):
- نقل قول :
@Article{asano21pass,
author = "Yuki M. Asano and Christian Rupprecht and Andrew Zisserman and Andrea Vedaldi",
title = "PASS: An ImageNet replacement for self-supervised pretraining without humans",
journal = "NeurIPS Track on Datasets and Benchmarks",
year = "2021"
}