- الوصف :
ImageNet-PI هي نسخة معاد تسميتها من مجموعة بيانات ImageNet ILSVRC2012 القياسية حيث يتم توفير الملصقات من خلال مجموعة من 16 شبكة عصبية عميقة مع بنى مختلفة مدربة مسبقًا على معيار ILSVRC2012. على وجه التحديد ، يتم تنزيل النماذج المدربة مسبقًا من tf.keras.applications.
بالإضافة إلى الملصقات الجديدة ، توفر ImageNet-PI أيضًا بيانات وصفية حول عملية التعليقات التوضيحية في شكل أسرار للنماذج على ملصقاتها ومعلومات إضافية حول كل نموذج.
لمزيد من المعلومات ، انظر: ImageNet-PI
الصفحة الرئيسية : https://github.com/google-research-datasets/imagenet_pi/
كود المصدر :
tfds.datasets.imagenet_pi.Builder
إصدارات :
-
1.0.0
(افتراضي): الإصدار الأولي.
-
حجم التنزيل :
Unknown size
حجم مجموعة البيانات :
Unknown size
إرشادات التنزيل اليدوي : تتطلب مجموعة البيانات هذه تنزيل بيانات المصدر يدويًا إلى
download_config.manual_dir
(الإعدادات الافتراضية على~/tensorflow_datasets/downloads/manual/
):
يجب أن يحتوي manual_dir على ملفين: ILSVRC2012_img_train.tar و ILSVRC2012_img_val.tar. تحتاج إلى التسجيل في http://www.image-net.org/download-images للحصول على الرابط لتنزيل مجموعة البيانات.التخزين المؤقت التلقائي ( الوثائق ): غير معروف
الانقسامات :
ينقسم | أمثلة |
---|
- هيكل الميزة :
FeaturesDict({
'annotator_confidences': Tensor(shape=(16,), dtype=float32),
'annotator_labels': Tensor(shape=(16,), dtype=int64),
'clean_label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
التعليقات التوضيحية | موتر | (16 ،) | تعويم 32 | |
annotator_labels | موتر | (16 ،) | int64 | |
clean_label | ClassLabel | int64 | ||
اسم الملف | نص | خيط | ||
صورة | صورة | (لا شيء ، لا شيء ، 3) | uint8 |
المفاتيح الخاضعة للإشراف (راجع المستند
as_supervised
):('image', 'annotator_labels')
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ): مفقود.
الاقتباس :
@inproceedings{tram,
author = {Mark Collier and
Rodolphe Jenatton and
Effrosyni Kokiopoulou and
Jesse Berent},
editor = {Kamalika Chaudhuri and
Stefanie Jegelka and
Le Song and
Csaba Szepesv{\'{a} }ri and
Gang Niu and
Sivan Sabato},
title = {Transfer and Marginalize: Explaining Away Label Noise with Privileged
Information},
booktitle = {International Conference on Machine Learning, {ICML} 2022, 17-23 July
2022, Baltimore, Maryland, {USA} },
series = {Proceedings of Machine Learning Research},
volume = {162},
pages = {4219--4237},
publisher = { {PMLR} },
year = {2022},
url = {https://proceedings.mlr.press/v162/collier22a.html},
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}
، - الوصف :
ImageNet-PI هي نسخة معاد تسميتها من مجموعة بيانات ImageNet ILSVRC2012 القياسية حيث يتم توفير الملصقات من خلال مجموعة من 16 شبكة عصبية عميقة مع بنى مختلفة مدربة مسبقًا على معيار ILSVRC2012. على وجه التحديد ، يتم تنزيل النماذج المدربة مسبقًا من tf.keras.applications.
بالإضافة إلى الملصقات الجديدة ، توفر ImageNet-PI أيضًا بيانات وصفية حول عملية التعليقات التوضيحية في شكل أسرار للنماذج على ملصقاتها ومعلومات إضافية حول كل نموذج.
لمزيد من المعلومات ، انظر: ImageNet-PI
الصفحة الرئيسية : https://github.com/google-research-datasets/imagenet_pi/
كود المصدر :
tfds.datasets.imagenet_pi.Builder
إصدارات :
-
1.0.0
(افتراضي): الإصدار الأولي.
-
حجم التنزيل :
Unknown size
حجم مجموعة البيانات :
Unknown size
إرشادات التنزيل اليدوي : تتطلب مجموعة البيانات هذه تنزيل بيانات المصدر يدويًا إلى
download_config.manual_dir
(الإعدادات الافتراضية على~/tensorflow_datasets/downloads/manual/
):
يجب أن يحتوي manual_dir على ملفين: ILSVRC2012_img_train.tar و ILSVRC2012_img_val.tar. تحتاج إلى التسجيل في http://www.image-net.org/download-images للحصول على الرابط لتنزيل مجموعة البيانات.التخزين المؤقت التلقائي ( الوثائق ): غير معروف
الانقسامات :
ينقسم | أمثلة |
---|
- هيكل الميزة :
FeaturesDict({
'annotator_confidences': Tensor(shape=(16,), dtype=float32),
'annotator_labels': Tensor(shape=(16,), dtype=int64),
'clean_label': ClassLabel(shape=(), dtype=int64, num_classes=1000),
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
التعليقات التوضيحية | موتر | (16 ،) | تعويم 32 | |
annotator_labels | موتر | (16 ،) | int64 | |
clean_label | ClassLabel | int64 | ||
اسم الملف | نص | خيط | ||
صورة | صورة | (لا شيء ، لا شيء ، 3) | uint8 |
المفاتيح الخاضعة للإشراف (راجع المستند
as_supervised
):('image', 'annotator_labels')
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ): مفقود.
الاقتباس :
@inproceedings{tram,
author = {Mark Collier and
Rodolphe Jenatton and
Effrosyni Kokiopoulou and
Jesse Berent},
editor = {Kamalika Chaudhuri and
Stefanie Jegelka and
Le Song and
Csaba Szepesv{\'{a} }ri and
Gang Niu and
Sivan Sabato},
title = {Transfer and Marginalize: Explaining Away Label Noise with Privileged
Information},
booktitle = {International Conference on Machine Learning, {ICML} 2022, 17-23 July
2022, Baltimore, Maryland, {USA} },
series = {Proceedings of Machine Learning Research},
volume = {162},
pages = {4219--4237},
publisher = { {PMLR} },
year = {2022},
url = {https://proceedings.mlr.press/v162/collier22a.html},
}
@article{ILSVRC15,
Author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
Title = { {ImageNet Large Scale Visual Recognition Challenge} },
Year = {2015},
journal = {International Journal of Computer Vision (IJCV)},
doi = {10.1007/s11263-015-0816-y},
volume={115},
number={3},
pages={211-252}
}