- Descrizione :
Grounded SCAN (gSCAN) è un set di dati sintetici per valutare la generalizzazione compositiva nella comprensione del linguaggio situato. gSCAN abbina istruzioni in linguaggio naturale a sequenze di azioni e richiede all'agente di interpretare le istruzioni nel contesto di un ambiente di navigazione visiva basato su griglia.
Maggiori informazioni possono essere trovate su:
Per le divisioni
compositional_splits
e latarget_length_split
: https://github.com/LauraRuis/groundedSCANPer le
spatial_relation_splits
: https://github.com/google-research/language/tree/master/language/gscan/dataHomepage : https://github.com/LauraRuis/groundedSCAN
Codice sorgente :
tfds.vision_language.grounded_scan.GroundedScan
Versioni :
-
1.0.0
: Versione iniziale. -
1.1.0
: funzionevector
modificata in Text(). -
2.0.0
(predefinito): aggiunge la nuova configurazione spaziali_relazione_split.
-
Cache automatica ( documentazione ): No
Struttura delle caratteristiche :
FeaturesDict({
'command': Sequence(Text(shape=(), dtype=string)),
'manner': Text(shape=(), dtype=string),
'meaning': Sequence(Text(shape=(), dtype=string)),
'referred_target': Text(shape=(), dtype=string),
'situation': FeaturesDict({
'agent_direction': int32,
'agent_position': FeaturesDict({
'column': int32,
'row': int32,
}),
'direction_to_target': Text(shape=(), dtype=string),
'distance_to_target': int32,
'grid_size': int32,
'placed_objects': Sequence({
'object': FeaturesDict({
'color': Text(shape=(), dtype=string),
'shape': Text(shape=(), dtype=string),
'size': int32,
}),
'position': FeaturesDict({
'column': int32,
'row': int32,
}),
'vector': Text(shape=(), dtype=string),
}),
'target_object': FeaturesDict({
'object': FeaturesDict({
'color': Text(shape=(), dtype=string),
'shape': Text(shape=(), dtype=string),
'size': int32,
}),
'position': FeaturesDict({
'column': int32,
'row': int32,
}),
'vector': Text(shape=(), dtype=string),
}),
}),
'target_commands': Sequence(Text(shape=(), dtype=string)),
'verb_in_command': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
comando | Sequenza(Testo) | (Nessuno,) | corda | |
maniera | Testo | corda | ||
significato | Sequenza(Testo) | (Nessuno,) | corda | |
target_riferito | Testo | corda | ||
situazione | CaratteristicheDict | |||
situazione/direzione_agente | Tensore | int32 | ||
situazione/posizione_agente | CaratteristicheDict | |||
situazione/posizione_agente/colonna | Tensore | int32 | ||
situazione/posizione_agente/riga | Tensore | int32 | ||
situazione/direzione_verso_target | Testo | corda | ||
situazione/distanza_da_target | Tensore | int32 | ||
situazione/dimensione_griglia | Tensore | int32 | ||
situazione/oggetti_posizionati | Sequenza | |||
situazione/oggetti_posizionati/oggetto | CaratteristicheDict | |||
situazione/oggetti_posizionati/oggetto/colore | Testo | corda | ||
situazione/oggetti_posizionati/oggetto/forma | Testo | corda | ||
situazione/oggetti_posizionati/oggetto/dimensione | Tensore | int32 | ||
situazione/oggetti_posizionati/posizione | CaratteristicheDict | |||
situazione/oggetti_posizionati/posizione/colonna | Tensore | int32 | ||
situazione/oggetti_posizionati/posizione/riga | Tensore | int32 | ||
situazione/oggetti_posizionati/vettore | Testo | corda | ||
situazione/oggetto_target | CaratteristicheDict | |||
situazione/oggetto_target/oggetto | CaratteristicheDict | |||
situazione/oggetto_target/oggetto/colore | Testo | corda | ||
situazione/oggetto_target/oggetto/forma | Testo | corda | ||
situazione/oggetto_target/oggetto/dimensione | Tensore | int32 | ||
situazione/oggetto_target/posizione | CaratteristicheDict | |||
situazione/oggetto_target/posizione/colonna | Tensore | int32 | ||
situazione/oggetto_target/posizione/riga | Tensore | int32 | ||
situazione/oggetto_target/vettore | Testo | corda | ||
target_commands | Sequenza(Testo) | (Nessuno,) | corda | |
verbo_in_comando | Testo | corda |
Chiavi supervisionate (Vedi
as_supervised
doc ):None
Figura ( tfds.show_examples ): non supportato.
Citazione :
@inproceedings{NEURIPS2020_e5a90182,
author = {Ruis, Laura and Andreas, Jacob and Baroni, Marco and Bouchacourt, Diane and Lake, Brenden M},
booktitle = {Advances in Neural Information Processing Systems},
editor = {H. Larochelle and M. Ranzato and R. Hadsell and M. F. Balcan and H. Lin},
pages = {19861--19872},
publisher = {Curran Associates, Inc.},
title = {A Benchmark for Systematic Generalization in Grounded Language Understanding},
url = {https://proceedings.neurips.cc/paper/2020/file/e5a90182cc81e12ab5e72d66e0b46fe3-Paper.pdf},
volume = {33},
year = {2020}
}
@inproceedings{qiu-etal-2021-systematic,
title = "Systematic Generalization on g{SCAN}: {W}hat is Nearly Solved and What is Next?",
author = "Qiu, Linlu and
Hu, Hexiang and
Zhang, Bowen and
Shaw, Peter and
Sha, Fei",
booktitle = "Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing",
month = nov,
year = "2021",
address = "Online and Punta Cana, Dominican Republic",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2021.emnlp-main.166",
doi = "10.18653/v1/2021.emnlp-main.166",
pages = "2180--2188",
}
grounded_scan/compositional_splits (configurazione predefinita)
Descrizione della configurazione : esempi di generalizzazione compositiva.
Dimensione del download :
82.10 MiB
Dimensione del set di dati:
998.11 MiB
Divisioni :
Diviso | Esempi |
---|---|
'adverb_1' | 112.880 |
'adverb_2' | 38.582 |
'contextual' | 11.460 |
'dev' | 3.716 |
'situational_1' | 88.642 |
'situational_2' | 16.808 |
'test' | 19.282 |
'train' | 367.933 |
'visual' | 37.436 |
'visual_easier' | 18.718 |
- Esempi ( tfds.as_dataframe ):
grounded_scan/target_length_split
Descrizione della configurazione : esempi per la generalizzazione a lunghezze di destinazione maggiori.
Dimensione del download :
53.41 MiB
Dimensione del set di dati:
546.73 MiB
Divisioni :
Diviso | Esempi |
---|---|
'dev' | 1.821 |
'target_lengths' | 198.588 |
'test' | 37.784 |
'train' | 180.301 |
- Esempi ( tfds.as_dataframe ):
grounded_scan/spatial_relation_splits
Descrizione della configurazione : esempi di ragionamento sulle relazioni spaziali.
Dimensione del download :
89.59 MiB
Dimensione del set di dati:
675.09 MiB
Divisioni :
Diviso | Esempi |
---|---|
'dev' | 2.617 |
'referent' | 30.492 |
'relation' | 6.285 |
'relative_position_1' | 41.576 |
'relative_position_2' | 41.529 |
'test' | 28.526 |
'train' | 259.088 |
'visual' | 62.250 |
- Esempi ( tfds.as_dataframe ):