grounded_scan

Descrizione :

Grounded SCAN (gSCAN) è un set di dati sintetici per valutare la generalizzazione compositiva nella comprensione del linguaggio situato. gSCAN abbina istruzioni in linguaggio naturale a sequenze di azioni e richiede all'agente di interpretare le istruzioni nel contesto di un ambiente di navigazione visiva basato su griglia.

Maggiori informazioni possono essere trovate su:

Per le divisioni compositional_splits e la target_length_split : https://github.com/LauraRuis/groundedSCAN
Per le spatial_relation_splits : https://github.com/google-research/language/tree/master/language/gscan/data
Homepage : https://github.com/LauraRuis/groundedSCAN
Codice sorgente : tfds.vision_language.grounded_scan.GroundedScan
Versioni :
- 1.0.0 : Versione iniziale.
- 1.1.0 : funzione vector modificata in Text().
- 2.0.0 (predefinito): aggiunge la nuova configurazione spaziali_relazione_split.
Cache automatica ( documentazione ): No
Struttura delle caratteristiche :

FeaturesDict({
    'command': Sequence(Text(shape=(), dtype=string)),
    'manner': Text(shape=(), dtype=string),
    'meaning': Sequence(Text(shape=(), dtype=string)),
    'referred_target': Text(shape=(), dtype=string),
    'situation': FeaturesDict({
        'agent_direction': int32,
        'agent_position': FeaturesDict({
            'column': int32,
            'row': int32,
        }),
        'direction_to_target': Text(shape=(), dtype=string),
        'distance_to_target': int32,
        'grid_size': int32,
        'placed_objects': Sequence({
            'object': FeaturesDict({
                'color': Text(shape=(), dtype=string),
                'shape': Text(shape=(), dtype=string),
                'size': int32,
            }),
            'position': FeaturesDict({
                'column': int32,
                'row': int32,
            }),
            'vector': Text(shape=(), dtype=string),
        }),
        'target_object': FeaturesDict({
            'object': FeaturesDict({
                'color': Text(shape=(), dtype=string),
                'shape': Text(shape=(), dtype=string),
                'size': int32,
            }),
            'position': FeaturesDict({
                'column': int32,
                'row': int32,
            }),
            'vector': Text(shape=(), dtype=string),
        }),
    }),
    'target_commands': Sequence(Text(shape=(), dtype=string)),
    'verb_in_command': Text(shape=(), dtype=string),
})

Documentazione delle funzionalità :

Caratteristica	Classe	Forma	Tipo D
	CaratteristicheDict
comando	Sequenza(Testo)	(Nessuno,)	corda
maniera	Testo		corda
significato	Sequenza(Testo)	(Nessuno,)	corda
target_riferito	Testo		corda
situazione	CaratteristicheDict
situazione/direzione_agente	Tensore		int32
situazione/posizione_agente	CaratteristicheDict
situazione/posizione_agente/colonna	Tensore		int32
situazione/posizione_agente/riga	Tensore		int32
situazione/direzione_verso_target	Testo		corda
situazione/distanza_da_target	Tensore		int32
situazione/dimensione_griglia	Tensore		int32
situazione/oggetti_posizionati	Sequenza
situazione/oggetti_posizionati/oggetto	CaratteristicheDict
situazione/oggetti_posizionati/oggetto/colore	Testo		corda
situazione/oggetti_posizionati/oggetto/forma	Testo		corda
situazione/oggetti_posizionati/oggetto/dimensione	Tensore		int32
situazione/oggetti_posizionati/posizione	CaratteristicheDict
situazione/oggetti_posizionati/posizione/colonna	Tensore		int32
situazione/oggetti_posizionati/posizione/riga	Tensore		int32
situazione/oggetti_posizionati/vettore	Testo		corda
situazione/oggetto_target	CaratteristicheDict
situazione/oggetto_target/oggetto	CaratteristicheDict
situazione/oggetto_target/oggetto/colore	Testo		corda
situazione/oggetto_target/oggetto/forma	Testo		corda
situazione/oggetto_target/oggetto/dimensione	Tensore		int32
situazione/oggetto_target/posizione	CaratteristicheDict
situazione/oggetto_target/posizione/colonna	Tensore		int32
situazione/oggetto_target/posizione/riga	Tensore		int32
situazione/oggetto_target/vettore	Testo		corda
target_commands	Sequenza(Testo)	(Nessuno,)	corda
verbo_in_comando	Testo		corda

Chiavi supervisionate (Vedi as_supervised doc ): None
Figura ( tfds.show_examples ): non supportato.
Citazione :

@inproceedings{NEURIPS2020_e5a90182,
 author = {Ruis, Laura and Andreas, Jacob and Baroni, Marco and Bouchacourt, Diane and Lake, Brenden M},
 booktitle = {Advances in Neural Information Processing Systems},
 editor = {H. Larochelle and M. Ranzato and R. Hadsell and M. F. Balcan and H. Lin},
 pages = {19861--19872},
 publisher = {Curran Associates, Inc.},
 title = {A Benchmark for Systematic Generalization in Grounded Language Understanding},
 url = {https://proceedings.neurips.cc/paper/2020/file/e5a90182cc81e12ab5e72d66e0b46fe3-Paper.pdf},
 volume = {33},
 year = {2020}
}

@inproceedings{qiu-etal-2021-systematic,
    title = "Systematic Generalization on g{SCAN}: {W}hat is Nearly Solved and What is Next?",
    author = "Qiu, Linlu  and
      Hu, Hexiang  and
      Zhang, Bowen  and
      Shaw, Peter  and
      Sha, Fei",
    booktitle = "Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing",
    month = nov,
    year = "2021",
    address = "Online and Punta Cana, Dominican Republic",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2021.emnlp-main.166",
    doi = "10.18653/v1/2021.emnlp-main.166",
    pages = "2180--2188",
}

grounded_scan/compositional_splits (configurazione predefinita)

Descrizione della configurazione : esempi di generalizzazione compositiva.
Dimensione del download : 82.10 MiB
Dimensione del set di dati: 998.11 MiB
Divisioni :

Diviso	Esempi
`'adverb_1'`	112.880
`'adverb_2'`	38.582
`'contextual'`	11.460
`'dev'`	3.716
`'situational_1'`	88.642
`'situational_2'`	16.808
`'test'`	19.282
`'train'`	367.933
`'visual'`	37.436
`'visual_easier'`	18.718

Esempi ( tfds.as_dataframe ):

grounded_scan/target_length_split

Descrizione della configurazione : esempi per la generalizzazione a lunghezze di destinazione maggiori.
Dimensione del download : 53.41 MiB
Dimensione del set di dati: 546.73 MiB
Divisioni :

Diviso	Esempi
`'dev'`	1.821
`'target_lengths'`	198.588
`'test'`	37.784
`'train'`	180.301

Esempi ( tfds.as_dataframe ):

grounded_scan/spatial_relation_splits

Descrizione della configurazione : esempi di ragionamento sulle relazioni spaziali.
Dimensione del download : 89.59 MiB
Dimensione del set di dati: 675.09 MiB
Divisioni :

Diviso	Esempi
`'dev'`	2.617
`'referent'`	30.492
`'relation'`	6.285
`'relative_position_1'`	41.576
`'relative_position_2'`	41.529
`'test'`	28.526
`'train'`	259.088
`'visual'`	62.250

Esempi ( tfds.as_dataframe ):