- توضیحات :
داده های ماتریس های تولید شده رویه ای (PGM) از مقاله اندازه گیری استدلال انتزاعی در شبکه های عصبی، بارت، هیل، سانتورو و همکاران. 2018. هدف استنتاج پاسخ صحیح از پانل های زمینه بر اساس استدلال انتزاعی است.
برای استفاده از این مجموعه داده، لطفاً همه فایل های *.tar.gz را از صفحه مجموعه داده دانلود کرده و در ~/tensorflow_datasets/abstract_reasoning/ قرار دهید.
\(R\) مجموعه ای از انواع رابطه (پیشرفت، XOR، OR، AND، اتحادیه ثابت)، \(O\) نشان دهنده انواع شی (شکل، خط)، و \(A\) نشان دهنده انواع ویژگی ها (اندازه، رنگ، موقعیت، عدد). ساختار یک ماتریس،\(S\)، مجموعه ای از سه گانه \(S={[r, o, a]}\) است که چالش ایجاد شده توسط یک ماتریس خاص را تعیین می کند.
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://github.com/deepmind/abstract-reasoning-matrices
کد منبع :
tfds.datasets.abstract_reasoning.Builder
نسخه ها :
-
1.0.0
(پیش فرض): بدون یادداشت انتشار.
-
اندازه دانلود :
Unknown size
دستورالعملهای دانلود دستی : این مجموعه داده از شما میخواهد که دادههای منبع را به صورت دستی در
download_config.manual_dir
دانلود کنید (پیشفرض~/tensorflow_datasets/downloads/manual/
):
داده ها را می توان از https://console.cloud.google.com/storage/browser/ravens-matrices دانلود کرد لطفاً همه فایل های tar.gz را در manual_dir قرار دهید.ذخیره خودکار ( اسناد ): خیر
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 200000 |
'train' | 1,200,000 |
'validation' | 20000 |
- ساختار ویژگی :
FeaturesDict({
'answers': Video(Image(shape=(160, 160, 1), dtype=uint8)),
'context': Video(Image(shape=(160, 160, 1), dtype=uint8)),
'filename': Text(shape=(), dtype=string),
'meta_target': Tensor(shape=(12,), dtype=int64),
'relation_structure_encoded': Tensor(shape=(4, 12), dtype=int64),
'target': ClassLabel(shape=(), dtype=int64, num_classes=8),
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
پاسخ می دهد | ویدئو (تصویر) | (8، 160، 160، 1) | uint8 | |
متن نوشته | ویدئو (تصویر) | (8، 160، 160، 1) | uint8 | |
نام فایل | متن | رشته | ||
متا_هدف | تانسور | (12،) | int64 | |
relation_structure_encoded | تانسور | (4، 12) | int64 | |
هدف | ClassLabel | int64 |
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
نقل قول :
@InProceedings{pmlr-v80-barrett18a,
title = {Measuring abstract reasoning in neural networks},
author = {Barrett, David and Hill, Felix and Santoro, Adam and Morcos, Ari and Lillicrap, Timothy},
booktitle = {Proceedings of the 35th International Conference on Machine Learning},
pages = {511--520},
year = {2018},
editor = {Dy, Jennifer and Krause, Andreas},
volume = {80},
series = {Proceedings of Machine Learning Research},
address = {Stockholmsmassan, Stockholm Sweden},
month = {10--15 Jul},
publisher = {PMLR},
pdf = {http://proceedings.mlr.press/v80/barrett18a/barrett18a.pdf},
url = {http://proceedings.mlr.press/v80/barrett18a.html},
abstract = {Whether neural networks can learn abstract reasoning or whetherthey merely rely on superficial statistics is a topic of recent debate. Here, we propose a dataset and challenge designed to probe abstract reasoning, inspired by a well-known human IQ test. To succeed at this challenge, models must cope with various generalisation 'regimes' in which the training data and test questions differ in clearly-defined ways. We show that popular models such as ResNets perform poorly, even when the training and test sets differ only minimally, and we present a novel architecture, with structure designed to encourage reasoning, that does significantly better. When we vary the way in which the test questions and training data differ, we find that our model is notably proficient at certain forms of generalisation, but notably weak at others. We further show that the model's ability to generalise improves markedly if it is trained to predict symbolic explanations for its answers. Altogether, we introduce and explore ways to both measure and induce stronger abstract reasoning in neural networks. Our freely-available dataset should motivate further progress in this direction.}
}
abstract_reasoning/neutral (پیکربندی پیشفرض)
توضیحات پیکربندی : ساختارهایی که ماتریس ها را در هر دو کدگذاری می کنند
مجموعه های آموزشی و آزمایشی حاوی هر سه گانه \([r, o, a]\) برای \(r \\in R\)هستند،
\(o \\in O\)و \(a \\in A\). مجموعه های آموزشی و آزمایشی از هم جدا هستند، با
جداسازی در سطح متغیرهای ورودی (یعنی پیکسل
تظاهرات).حجم مجموعه داده :
42.02 GiB
مثالها ( tfds.as_dataframe ):
abstract_reasoning/interpolation
شرح پیکربندی : مانند تقسیم خنثی، \(S\) شامل هر کدام بود
\([r, o, a]\)را سه برابر می کند. برای درون یابی، در مجموعه آموزشی، زمانی که
ویژگی "رنگ" یا "اندازه" (یعنی صفات مرتب شده)، مقادیر بود
ویژگیها به اعضای زوج نمایهشده یک مجموعه گسسته محدود شدند،
در حالی که در مجموعه آزمایشی فقط مقادیر شاخص فرد مجاز بود. توجه داشته باشید که همه
\(S\) حاوی چند \([r, o, a]\) سه گانه با ویژگی رنگ یا اندازه است.
بنابراین، تعمیم برای هر سؤال در مجموعه آزمون مورد نیاز است.حجم مجموعه داده :
37.09 GiB
مثالها ( tfds.as_dataframe ):
abstract_reasoning/extrapolation
توضیحات پیکربندی : مانند درون یابی است، اما مقادیر
صفات به نیمه پایینی مجموعه گسسته در طول محدود شد
آموزش، در حالی که در مجموعه تست آنها مقادیر را در نیمه بالایی دریافت کردند.حجم مجموعه داده :
35.91 GiB
مثالها ( tfds.as_dataframe ):
abstract_reasoning/attr.rel.pairs
توضیحات پیکربندی : همه \(S\) حداقل شامل دو سه گانه بودند،
\(([r_1,o_1,a_1],[r_2,o_2,a_2]) = (t_1, t_2)\)، که 400 مورد آن قابل اجرا هستند. ما
به طور تصادفی 360 به مجموعه آموزشی و 40 به مجموعه تست اختصاص داده شد. اعضا
\((t_1, t_2)\) از 40 جفت نگهداشته شده با هم در ساختارها رخ ندادند\(S\)
در مجموعه آموزشی، و تمام ساختارهای \(S\) حداقل یک جفت از این قبیل داشتند
\((t_1, t_2)\) به عنوان یک زیر مجموعه.حجم مجموعه داده :
41.07 GiB
مثالها ( tfds.as_dataframe ):
abstract_reasoning/attr.rels
توضیحات پیکربندی : در مجموعه داده ما، 29 مورد منحصر به فرد وجود دارد
\([r,o,a]\)سه برابر می کند. ما هفت مورد از اینها را به صورت تصادفی برای مجموعه آزمایشی اختصاص دادیم.
اما به گونه ای که هر یک از ویژگی ها دقیقاً یک بار در این مجموعه نشان داده شده است.
این سهگانههای نگهداشتهشده هرگز در سؤالات مجموعه آموزشی رخ ندادند، و
هر \(S\) در مجموعه آزمایشی حداقل یکی از آنها را داشت.حجم مجموعه داده :
41.45 GiB
مثالها ( tfds.as_dataframe ):
abstract_reasoning/attrs.pairs
شرح پیکربندی : \(S\) حاوی حداقل دو سه گانه است. 20 تا هستند
(نامرتب) جفت ویژگی های قابل دوام \((a_1, a_2)\) به طوری که برای برخی
\(r_i, o_i, ([r_1,o_1,a_1],[r_2,o_2,a_2])\) یک جفت سه گانه قابل دوام است
\(([r_1,o_1,a_1],[r_2,o_2,a_2]) = (t_1, t_2)\). ما 16 عدد از این جفت ها را اختصاص دادیم
برای آموزش و چهار برای تست. برای یک جفت \((a_1, a_2)\) در مجموعه آزمایشی،
\(S\) در مجموعه آموزشی شامل سه گانه با \(a_1\) یا \(a_2\)بود. در آزمون
مجموعه، همه \(S\) شامل سه گانه با \(a_1\) و \(a_2\)بودند.حجم مجموعه داده :
40.98 GiB
مثالها ( tfds.as_dataframe ):
abstract_reasoning/attrs.shape.color
توضیحات پیکربندی : ویژگی شکل-رنگ مشخص شده است. \(S\) اینچ
مجموعه آموزشی شامل هیچ سه گانه با \(o\)= شکل و \(a\)= رنگ.
تمام ساختارهای حاکم بر پازل ها در مجموعه آزمایشی شامل حداقل یک سه گانه بودند
با \(o\)=شکل و \(a\)=رنگ.حجم مجموعه داده :
41.21 GiB
مثالها ( tfds.as_dataframe ):
abstract_reasoning/attrs.line.type
شرح پیکربندی : نوع خط مشخصه نگه داشته شده. \(S\) اینچ
مجموعه آموزشی شامل هیچ سه گانه با \(o\)=خط و \(a\)=نوع نبود.
تمام ساختارهای حاکم بر پازل ها در مجموعه آزمایشی شامل حداقل یک سه گانه بودند
با \(o\)=خط و \(a\)=نوع.حجم مجموعه داده :
41.40 GiB
مثالها ( tfds.as_dataframe ):