- وصف :
CLEVR عبارة عن مجموعة بيانات تشخيصية تختبر مجموعة من قدرات التفكير البصري. فهو يحتوي على الحد الأدنى من التحيزات ويحتوي على شروح تفصيلية تصف نوع المنطق الذي يتطلبه كل سؤال.
وثائق إضافية : استكشاف الأوراق باستخدام الكود
الصفحة الرئيسية : https://cs.stanford.edu/people/jcjohns/clevr/
كود المصدر :
tfds.datasets.clevr.Builder
الإصدارات :
-
3.0.0
: لا توجد ملاحظات الإصدار. -
3.1.0
(افتراضي): إضافة نص السؤال/الإجابة.
-
حجم التحميل :
17.72 GiB
حجم مجموعة البيانات :
17.75 GiB
التخزين المؤقت التلقائي ( الوثائق ): لا
الإنشقاقات :
ينقسم | أمثلة |
---|---|
'test' | 15000 |
'train' | 70.000 |
'validation' | 15000 |
- هيكل الميزة :
FeaturesDict({
'file_name': Text(shape=(), dtype=string),
'image': Image(shape=(None, None, 3), dtype=uint8),
'objects': Sequence({
'3d_coords': Tensor(shape=(3,), dtype=float32),
'color': ClassLabel(shape=(), dtype=int64, num_classes=8),
'material': ClassLabel(shape=(), dtype=int64, num_classes=2),
'pixel_coords': Tensor(shape=(3,), dtype=float32),
'rotation': float32,
'shape': ClassLabel(shape=(), dtype=int64, num_classes=3),
'size': ClassLabel(shape=(), dtype=int64, num_classes=2),
}),
'question_answer': Sequence({
'answer': Text(shape=(), dtype=string),
'question': Text(shape=(), dtype=string),
}),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع D | وصف |
---|---|---|---|---|
المميزاتDict | ||||
اسم الملف | نص | خيط | ||
صورة | صورة | (لا شيء، لا شيء، 3) | uint8 | |
أشياء | تسلسل | |||
objects/3d_coords | الموتر | (3،) | float32 | |
الكائنات / اللون | ClassLabel | int64 | ||
الأشياء / المواد | ClassLabel | int64 | ||
الكائنات/pixel_coords | الموتر | (3،) | float32 | |
الكائنات/التناوب | الموتر | float32 | ||
الكائنات / الشكل | ClassLabel | int64 | ||
الكائنات / الحجم | ClassLabel | int64 | ||
جواب السؤال | تسلسل | |||
question_answer/answer | نص | خيط | ||
question_answer/question | نص | خيط |
المفاتيح الخاضعة للإشراف (راجع
as_supervised
doc ):None
الشكل ( tfds.show_examples ):
- أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@inproceedings{johnson2017clevr,
title={ {CLEVR}: A diagnostic dataset for compositional language and elementary visual reasoning},
author={Johnson, Justin and Hariharan, Bharath and van der Maaten, Laurens and Fei-Fei, Li and Lawrence Zitnick, C and Girshick, Ross},
booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
year={2017}
}