ragionamento_astratto

l10n-placeholder1 denota l'insieme dei tipi di relazione (progressione, XOR, OR, AND, unione coerente), \\(O\\) denota i tipi di oggetto (forma, linea) e \\(A\\) denota i tipi di attributo (dimensione, colore, posizione, numero). La struttura di una matrice, \\(S\\), è l'insieme delle triple \\(S={[r, o, a]}\\) che determinano la sfida posta da una particolare matrice. Per usare questo dataset: ```python import tensorflow_datasets as tfds ds = tfds.load('abstract_reasoning', split='train') for ex in ds.take(4): print(ex) ``` Vedi [la guida ](https://www.tensorflow.org/datasets/overview) per ulteriori informazioni su [tensorflow_datasets](https://www.tensorflow.org/datasets). " />
  • Descrizione :

I dati delle matrici generate proceduralmente (PGM) dal documento Measuring Abstract Reasoning in Neural Networks, Barrett, Hill, Santoro et al. 2018. L'obiettivo è dedurre la risposta corretta dai pannelli contestuali basati su ragionamenti astratti.

Per utilizzare questo set di dati, scarica tutti i file *.tar.gz dalla pagina del set di dati e inseriscili in ~/tensorflow_datasets/abstract_reasoning/.

\(R\) indica l'insieme dei tipi di relazione (progressione, XOR, OR, AND, unione coerente), \(O\) indica i tipi di oggetto (forma, linea) e \(A\) indica i tipi di attributo (dimensione, colore, posizione, numero). La struttura di una matrice,\(S\), è l'insieme delle triple \(S={[r, o, a]}\) che determinano la sfida posta da una particolare matrice.

Diviso Esempi
'test' 200.000
'train' 1.200.000
'validation' 20.000
  • Struttura delle caratteristiche :
FeaturesDict({
    'answers': Video(Image(shape=(160, 160, 1), dtype=uint8)),
    'context': Video(Image(shape=(160, 160, 1), dtype=uint8)),
    'filename': Text(shape=(), dtype=string),
    'meta_target': Tensor(shape=(12,), dtype=int64),
    'relation_structure_encoded': Tensor(shape=(4, 12), dtype=int64),
    'target': ClassLabel(shape=(), dtype=int64, num_classes=8),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
risposte Video (Immagine) (8, 160, 160, 1) uint8
contesto Video (Immagine) (8, 160, 160, 1) uint8
nome del file Testo corda
meta_target Tensore (12,) int64
relazione_struttura_codificata Tensore (4, 12) int64
obbiettivo ClassLabel int64
@InProceedings{pmlr-v80-barrett18a,
  title =    {Measuring abstract reasoning in neural networks},
  author =   {Barrett, David and Hill, Felix and Santoro, Adam and Morcos, Ari and Lillicrap, Timothy},
  booktitle =    {Proceedings of the 35th International Conference on Machine Learning},
  pages =    {511--520},
  year =     {2018},
  editor =   {Dy, Jennifer and Krause, Andreas},
  volume =   {80},
  series =   {Proceedings of Machine Learning Research},
  address =      {Stockholmsmassan, Stockholm Sweden},
  month =    {10--15 Jul},
  publisher =    {PMLR},
  pdf =      {http://proceedings.mlr.press/v80/barrett18a/barrett18a.pdf},
  url =      {http://proceedings.mlr.press/v80/barrett18a.html},
  abstract =     {Whether neural networks can learn abstract reasoning or whetherthey merely rely on superficial statistics is a topic of recent debate. Here, we propose a dataset and challenge designed to probe abstract reasoning, inspired by a well-known human IQ test. To succeed at this challenge, models must cope with various generalisation 'regimes' in which the training data and test questions differ in clearly-defined ways. We show that popular models such as ResNets perform poorly, even when the training and test sets differ only minimally, and we present a novel architecture, with structure designed to encourage reasoning, that does significantly better. When we vary the way in which the test questions and training data differ, we find that our model is notably proficient at certain forms of generalisation, but notably weak at others. We further show that the model's ability to generalise improves markedly if it is trained to predict symbolic explanations for its answers. Altogether, we introduce and explore ways to both measure and induce stronger abstract reasoning in neural networks. Our freely-available dataset should motivate further progress in this direction.}
}

abstract_reasoning/neutral (configurazione predefinita)

  • Descrizione della configurazione : le strutture che codificano le matrici in entrambi i file
    i set di addestramento e test contengono eventuali triple \([r, o, a]\) per \(r \\in R\),
    \(o \\in O\)e \(a \\in A\). I set di addestramento e test sono disgiunti, con
    separazione che avviene a livello delle variabili di input (es. pixel
    manifestazioni).

  • Dimensione del set di dati: 42.02 GiB

  • Esempi ( tfds.as_dataframe ):

ragionamento_astratto/interpolazione

  • Descrizione della configurazione : come nella divisione neutra, \(S\) consisteva in any
    triple \([r, o, a]\). Per l'interpolazione, nel training set, quando il file
    l'attributo era "colore" o "dimensione" (cioè gli attributi ordinati), i valori di
    gli attributi erano limitati ai membri con indice pari di un insieme discreto,
    mentre nel set di test erano consentiti solo valori indicizzati dispari. Nota che tutto
    \(S\) conteneva alcuni tripli \([r, o, a]\) con l'attributo color o size .
    Pertanto, la generalizzazione è richiesta per ogni domanda nel set di test.

  • Dimensione del set di dati: 37.09 GiB

  • Esempi ( tfds.as_dataframe ):

ragionamento_astratto/estrapolazione

  • Descrizione della configurazione : come nell'interpolazione, ma i valori di
    gli attributi sono stati limitati alla metà inferiore del set discreto durante
    training, mentre nel test set hanno assunto valori nella metà superiore.

  • Dimensione del set di dati: 35.91 GiB

  • Esempi ( tfds.as_dataframe ):

abstract_reasoning/attr.rel.pairs

  • Descrizione della configurazione : tutti i \(S\) contenevano almeno due triple,
    \(([r_1,o_1,a_1],[r_2,o_2,a_2]) = (t_1, t_2)\), di cui 400 vitali. Noi
    assegnati casualmente 360 ​​al set di addestramento e 40 al set di test. Membri
    \((t_1, t_2)\) delle 40 coppie trattenute non si sono verificate insieme nelle strutture\(S\)
    nel training set e tutte le strutture \(S\) avevano almeno una di queste coppie
    \((t_1, t_2)\) come sottoinsieme.

  • Dimensione del set di dati: 41.07 GiB

  • Esempi ( tfds.as_dataframe ):

abstract_reasoning/attr.rels

  • Descrizione della configurazione : nel nostro set di dati, ci sono 29 possibili univoci
    triple \([r,o,a]\). Ne abbiamo assegnati sette per il set di test, a caso,
    ma in modo tale che ciascuno degli attributi fosse rappresentato esattamente una volta in questo insieme.
    Queste triple trattenute non si sono mai verificate nelle domande nel set di allenamento e
    ogni \(S\) nel set di test ne conteneva almeno uno.

  • Dimensione del set di dati: 41.45 GiB

  • Esempi ( tfds.as_dataframe ):

abstract_reasoning/attrs.pairs

  • Descrizione della configurazione : \(S\) conteneva almeno due triple. Ce ne sono 20
    (non ordinate) coppie vitali di attributi \((a_1, a_2)\) tali che per alcuni
    \(r_i, o_i, ([r_1,o_1,a_1],[r_2,o_2,a_2])\) è una tripla coppia praticabile
    \(([r_1,o_1,a_1],[r_2,o_2,a_2]) = (t_1, t_2)\). Abbiamo assegnato 16 di queste coppie
    per la formazione e quattro per i test. Per una coppia \((a_1, a_2)\) nel set di test,
    \(S\) nel training set conteneva triple con \(a_1\) o \(a_2\). Nella prova
    set, tutti i \(S\) contenevano triple con \(a_1\) e \(a_2\).

  • Dimensione del set di dati: 40.98 GiB

  • Esempi ( tfds.as_dataframe ):

abstract_reasoning/attrs.shape.color

  • Descrizione della configurazione : attributo Held-out forma-colore. \(S\)
    il training set non conteneva triple con \(o\)=forma e \(a\)=colore.
    Tutte le strutture che governano i puzzle nel set di test contenevano almeno una tripla
    con \(o\)=forma e \(a\)=colore.

  • Dimensione del set di dati: 41.21 GiB

  • Esempi ( tfds.as_dataframe ):

abstract_reasoning/attrs.line.type

  • Descrizione della configurazione : tipo di riga dell'attributo Held-out. \(S\)
    il training set non conteneva triple con \(o\)=line e \(a\)=type.
    Tutte le strutture che governano i puzzle nel set di test contenevano almeno una tripla
    con \(o\)=linea e \(a\)=tipo.

  • Dimensione del set di dati: 41.40 GiB

  • Esempi ( tfds.as_dataframe ):