- الوصف :
بيانات المصفوفات المولدة من الناحية الإجرائية (PGM) من الورقة التي تقيس الاستدلال المجرد في الشبكات العصبية ، Barrett ، Hill ، Santoro et al. 2018. الهدف هو استنتاج الإجابة الصحيحة من لوحات السياق بناءً على التفكير المجرد.
لاستخدام مجموعة البيانات هذه ، يرجى تنزيل جميع ملفات * .tar.gz من صفحة مجموعة البيانات ووضعها في ~ / tensorflow_datasets / abstract_reasoning /.
يشير\(R\) إلى مجموعة أنواع العلاقات (التقدم ، XOR ، OR ، AND ، اتحاد متناسق) ، \(O\) يشير إلى أنواع الكائنات (الشكل ، الخط) ، و \(A\) يشير إلى أنواع السمات (الحجم ، اللون ، الموضع ، رقم). هيكل المصفوفة ،\(S\)، هو مجموعة ثلاثية \(S={[r, o, a]}\) التي تحدد التحدي الذي تشكله مصفوفة معينة.
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : https://github.com/deepmind/abstract-reasoning-matrices
كود المصدر :
tfds.datasets.abstract_reasoning.Builder
إصدارات :
-
1.0.0
(افتراضي): لا توجد ملاحظات حول الإصدار.
-
حجم التنزيل :
Unknown size
إرشادات التنزيل اليدوي : تتطلب مجموعة البيانات هذه تنزيل بيانات المصدر يدويًا إلى
download_config.manual_dir
(الإعدادات الافتراضية على~/tensorflow_datasets/downloads/manual/
):
يمكن تنزيل البيانات من https://console.cloud.google.com/storage/browser/ravens-matrices يرجى وضع جميع ملفات tar.gz في manual_dir.التخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'test' | 200000 |
'train' | 1200000 |
'validation' | 20000 |
- هيكل الميزة :
FeaturesDict({
'answers': Video(Image(shape=(160, 160, 1), dtype=uint8)),
'context': Video(Image(shape=(160, 160, 1), dtype=uint8)),
'filename': Text(shape=(), dtype=string),
'meta_target': Tensor(shape=(12,), dtype=int64),
'relation_structure_encoded': Tensor(shape=(4, 12), dtype=int64),
'target': ClassLabel(shape=(), dtype=int64, num_classes=8),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
الإجابات | فيديو (صورة) | (8 ، 160 ، 160 ، 1) | uint8 | |
سياق الكلام | فيديو (صورة) | (8 ، 160 ، 160 ، 1) | uint8 | |
اسم الملف | نص | سلسلة | ||
meta_target | موتر | (12 ،) | int64 | |
العلاقة_البنية_مشفرة | موتر | (4 ، 12) | int64 | |
استهداف | ClassLabel | int64 |
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised
):None
الشكل ( tfds.show_examples ): غير مدعوم.
الاقتباس :
@InProceedings{pmlr-v80-barrett18a,
title = {Measuring abstract reasoning in neural networks},
author = {Barrett, David and Hill, Felix and Santoro, Adam and Morcos, Ari and Lillicrap, Timothy},
booktitle = {Proceedings of the 35th International Conference on Machine Learning},
pages = {511--520},
year = {2018},
editor = {Dy, Jennifer and Krause, Andreas},
volume = {80},
series = {Proceedings of Machine Learning Research},
address = {Stockholmsmassan, Stockholm Sweden},
month = {10--15 Jul},
publisher = {PMLR},
pdf = {http://proceedings.mlr.press/v80/barrett18a/barrett18a.pdf},
url = {http://proceedings.mlr.press/v80/barrett18a.html},
abstract = {Whether neural networks can learn abstract reasoning or whetherthey merely rely on superficial statistics is a topic of recent debate. Here, we propose a dataset and challenge designed to probe abstract reasoning, inspired by a well-known human IQ test. To succeed at this challenge, models must cope with various generalisation 'regimes' in which the training data and test questions differ in clearly-defined ways. We show that popular models such as ResNets perform poorly, even when the training and test sets differ only minimally, and we present a novel architecture, with structure designed to encourage reasoning, that does significantly better. When we vary the way in which the test questions and training data differ, we find that our model is notably proficient at certain forms of generalisation, but notably weak at others. We further show that the model's ability to generalise improves markedly if it is trained to predict symbolic explanations for its answers. Altogether, we introduce and explore ways to both measure and induce stronger abstract reasoning in neural networks. Our freely-available dataset should motivate further progress in this direction.}
}
abstract_reasoning / محايد (التكوين الافتراضي)
وصف التكوين : الهياكل التي ترميز المصفوفات في كل من
تحتوي مجموعات التدريب والاختبار على أي ثلاثيات \([r, o, a]\) لـ \(r \\in R\)،
\(o \\in O\)و \(a \\in A\). مجموعات التدريب والاختبار منفصلة ، مع
الفصل الذي يحدث على مستوى متغيرات الإدخال (أي بكسل
مظاهر).حجم مجموعة البيانات :
42.02 GiB
أمثلة ( tfds.as_dataframe ):
abstract_reasoning / الاستيفاء
وصف التكوين : كما هو الحال في الانقسام المحايد ، يتألف \(S\) من أي
ثلاثة أضعاف \([r, o, a]\). للاستيفاء ، في مجموعة التدريب ، عندما يكون
كانت السمة "اللون" أو "الحجم" (أي السمات المرتبة) ، وقيم
كانت السمات مقتصرة على أعضاء مفهرسة زوجي لمجموعة منفصلة ،
بينما في مجموعة الاختبار تم السماح فقط بالقيم المفهرسة الفردية. لاحظ أن كل شيء
احتوى\(S\) على بعض العناصر النائبة \([r, o, a]\) مع سمة اللون أو الحجم.
وبالتالي ، فإن التعميم مطلوب لكل سؤال في مجموعة الاختبار.حجم مجموعة البيانات :
37.09 GiB
أمثلة ( tfds.as_dataframe ):
abstract_reasoning / الاستقراء
وصف التكوين : كما هو الحال في الاستيفاء ، ولكن قيم
السمات مقتصرة على النصف السفلي من المجموعة المنفصلة أثناء
التدريب ، بينما في مجموعة الاختبار أخذوا القيم في النصف العلوي.حجم مجموعة البيانات :
35.91 GiB
أمثلة ( tfds.as_dataframe ):
abstract_reasoning / attr.rel.pairs
وصف التكوين : احتوى كل \(S\) على الأقل ،
\(([r_1,o_1,a_1],[r_2,o_2,a_2]) = (t_1, t_2)\)، منها 400 قابلة للتطبيق. نحن
تم تخصيص 360 عشوائيًا لمجموعة التدريب و 40 لمجموعة الاختبار. أعضاء
\((t_1, t_2)\) من 40 زوجًا ممدودًا لم تحدث معًا في الهياكل\(S\)
في مجموعة التدريب ، وكان لجميع الهياكل \(S\) زوجًا واحدًا على الأقل من هذا القبيل
\((t_1, t_2)\) كمجموعة فرعية.حجم مجموعة البيانات :
41.07 GiB
أمثلة ( tfds.as_dataframe ):
abstract_reasoning / Attr.rels
وصف التكوين : في مجموعة البيانات الخاصة بنا ، يوجد 29 فريدًا ممكنًا
ثلاثة أضعاف \([r,o,a]\). خصصنا سبعة من هؤلاء لمجموعة الاختبار ، بشكل عشوائي ،
ولكن تم تمثيل كل سمة مرة واحدة بالضبط في هذه المجموعة.
لم تحدث هذه الثلاثيات المطولة أبدًا في أسئلة في مجموعة التدريب ، و
احتوى كل \(S\) في مجموعة الاختبار على واحد منهم على الأقل.حجم مجموعة البيانات :
41.45 GiB
أمثلة ( tfds.as_dataframe ):
abstract_reasoning / attrs.pairs
وصف التكوين : احتوى \(S\) على الأقل. يوجد 20
(غير مرتبة) أزواج قابلة للتطبيق \((a_1, a_2)\) مثل تلك الخاصة بالبعض
\(r_i, o_i, ([r_1,o_1,a_1],[r_2,o_2,a_2])\) هو زوج ثلاثي قابل للتطبيق
\(([r_1,o_1,a_1],[r_2,o_2,a_2]) = (t_1, t_2)\). خصصنا 16 من هذه الأزواج
للتدريب وأربعة للاختبار. بالنسبة للزوج \((a_1, a_2)\) في مجموعة الاختبار ،
احتوى\(S\) في مجموعة التدريب على ثلاثيات مع \(a_1\) أو \(a_2\). في الاختبار
مجموعة ، احتوت جميع \(S\) على ثلاثيات مع \(a_1\) و \(a_2\).حجم مجموعة البيانات :
40.98 GiB
أمثلة ( tfds.as_dataframe ):
abstract_reasoning / attrs.shape.color
وصف التكوين : سمة الشكل واللون المحتفظ بها. \(S\)
لا تحتوي مجموعة التدريب على ثلاثة أضعاف مع \(o\)= الشكل و \(a\)= color.
احتوت جميع الهياكل التي تحكم الألغاز في مجموعة الاختبار على ثلاثة أضعاف واحدة على الأقل
مع \(o\)= شكل و \(a\)= لون.حجم مجموعة البيانات :
41.21 GiB
أمثلة ( tfds.as_dataframe ):
abstract_reasoning / attrs.line.type
وصف التكوين : نوع سطر السمة المعلقة. \(S\)
لا تحتوي مجموعة التدريب على ثلاثة أضعاف مع \(o\)= line و \(a\)= type.
احتوت جميع الهياكل التي تحكم الألغاز في مجموعة الاختبار على ثلاثة أضعاف واحدة على الأقل
مع \(o\)= سطر و \(a\)= نوع.حجم مجموعة البيانات :
41.40 GiB
أمثلة ( tfds.as_dataframe ):