- Descriptif :
Grounded SCAN (gSCAN) est un ensemble de données synthétiques pour évaluer la généralisation compositionnelle dans la compréhension du langage situé. gSCAN associe des instructions en langage naturel à des séquences d'action et oblige l'agent à interpréter les instructions dans le contexte d'un environnement de navigation visuelle basé sur une grille.
Plus d'informations peuvent être trouvées à:
Pour le
compositional_splits
et letarget_length_split
: https://github.com/LauraRuis/groundedSCANPour les
spatial_relation_splits
: https://github.com/google-research/language/tree/master/language/gscan/dataPage d'accueil : https://github.com/LauraRuis/groundedSCAN
Code source :
tfds.vision_language.grounded_scan.GroundedScan
Versions :
-
1.0.0
: Version initiale. -
1.1.0
: fonctionnalitévector
modifiée en texte (). -
2.0.0
(par défaut) : ajoute la nouvelle configuration spatial_relation_splits.
-
Mise en cache automatique ( documentation ): Non
Structure des fonctionnalités :
FeaturesDict({
'command': Sequence(Text(shape=(), dtype=string)),
'manner': Text(shape=(), dtype=string),
'meaning': Sequence(Text(shape=(), dtype=string)),
'referred_target': Text(shape=(), dtype=string),
'situation': FeaturesDict({
'agent_direction': int32,
'agent_position': FeaturesDict({
'column': int32,
'row': int32,
}),
'direction_to_target': Text(shape=(), dtype=string),
'distance_to_target': int32,
'grid_size': int32,
'placed_objects': Sequence({
'object': FeaturesDict({
'color': Text(shape=(), dtype=string),
'shape': Text(shape=(), dtype=string),
'size': int32,
}),
'position': FeaturesDict({
'column': int32,
'row': int32,
}),
'vector': Text(shape=(), dtype=string),
}),
'target_object': FeaturesDict({
'object': FeaturesDict({
'color': Text(shape=(), dtype=string),
'shape': Text(shape=(), dtype=string),
'size': int32,
}),
'position': FeaturesDict({
'column': int32,
'row': int32,
}),
'vector': Text(shape=(), dtype=string),
}),
}),
'target_commands': Sequence(Text(shape=(), dtype=string)),
'verb_in_command': Text(shape=(), dtype=string),
})
- Documentation des fonctionnalités :
Caractéristique | Classer | Forme | Dtype | La description |
---|---|---|---|---|
FonctionnalitésDict | ||||
commande | Séquence (texte) | (Aucun,) | chaîne de caractères | |
manière | Texte | chaîne de caractères | ||
sens | Séquence (texte) | (Aucun,) | chaîne de caractères | |
cible_référée | Texte | chaîne de caractères | ||
situation | FonctionnalitésDict | |||
situation/direction_agent | Tenseur | int32 | ||
situation/poste_agent | FonctionnalitésDict | |||
situation/position_agent/colonne | Tenseur | int32 | ||
situation/agent_position/ligne | Tenseur | int32 | ||
situation/direction_to_target | Texte | chaîne de caractères | ||
situation/distance_to_target | Tenseur | int32 | ||
situation/taille_grille | Tenseur | int32 | ||
situation/objets_placés | Séquence | |||
situation/objets_placés/objet | FonctionnalitésDict | |||
situation/placed_objects/objet/couleur | Texte | chaîne de caractères | ||
situation/placed_objects/objet/forme | Texte | chaîne de caractères | ||
situation/placed_objects/objet/taille | Tenseur | int32 | ||
situation/objets_placés/position | FonctionnalitésDict | |||
situation/placed_objects/position/colonne | Tenseur | int32 | ||
situation/placed_objects/position/ligne | Tenseur | int32 | ||
situation/placed_objects/vecteur | Texte | chaîne de caractères | ||
situation/objet_cible | FonctionnalitésDict | |||
situation/objet_cible/objet | FonctionnalitésDict | |||
situation/cible_objet/objet/couleur | Texte | chaîne de caractères | ||
situation/objet_cible/objet/forme | Texte | chaîne de caractères | ||
situation/objet_cible/objet/taille | Tenseur | int32 | ||
situation/objet_cible/position | FonctionnalitésDict | |||
situation/objet_cible/position/colonne | Tenseur | int32 | ||
situation/objet_cible/position/ligne | Tenseur | int32 | ||
situation/objet_cible/vecteur | Texte | chaîne de caractères | ||
commandes_cibles | Séquence (texte) | (Aucun,) | chaîne de caractères | |
verbe_dans_commande | Texte | chaîne de caractères |
Clés supervisées (Voir
as_supervised
doc ):None
Figure ( tfds.show_examples ) : non pris en charge.
Citation :
@inproceedings{NEURIPS2020_e5a90182,
author = {Ruis, Laura and Andreas, Jacob and Baroni, Marco and Bouchacourt, Diane and Lake, Brenden M},
booktitle = {Advances in Neural Information Processing Systems},
editor = {H. Larochelle and M. Ranzato and R. Hadsell and M. F. Balcan and H. Lin},
pages = {19861--19872},
publisher = {Curran Associates, Inc.},
title = {A Benchmark for Systematic Generalization in Grounded Language Understanding},
url = {https://proceedings.neurips.cc/paper/2020/file/e5a90182cc81e12ab5e72d66e0b46fe3-Paper.pdf},
volume = {33},
year = {2020}
}
@inproceedings{qiu-etal-2021-systematic,
title = "Systematic Generalization on g{SCAN}: {W}hat is Nearly Solved and What is Next?",
author = "Qiu, Linlu and
Hu, Hexiang and
Zhang, Bowen and
Shaw, Peter and
Sha, Fei",
booktitle = "Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing",
month = nov,
year = "2021",
address = "Online and Punta Cana, Dominican Republic",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2021.emnlp-main.166",
doi = "10.18653/v1/2021.emnlp-main.166",
pages = "2180--2188",
}
grounded_scan/compositional_splits (configuration par défaut)
Description de la configuration : Exemples de généralisation compositionnelle.
Taille du téléchargement :
82.10 MiB
Taille du jeu de données :
998.11 MiB
Fractionnements :
Diviser | Exemples |
---|---|
'adverb_1' | 112 880 |
'adverb_2' | 38 582 |
'contextual' | 11 460 |
'dev' | 3 716 |
'situational_1' | 88 642 |
'situational_2' | 16 808 |
'test' | 19 282 |
'train' | 367 933 |
'visual' | 37 436 |
'visual_easier' | 18 718 |
- Exemples ( tfds.as_dataframe ):
grounded_scan/target_length_split
Description de la configuration : Exemples de généralisation à des longueurs cibles plus importantes.
Taille du téléchargement :
53.41 MiB
Taille du jeu de données :
546.73 MiB
Fractionnements :
Diviser | Exemples |
---|---|
'dev' | 1 821 |
'target_lengths' | 198 588 |
'test' | 37 784 |
'train' | 180 301 |
- Exemples ( tfds.as_dataframe ):
grounded_scan/spatial_relation_splits
Description de la configuration : Exemples de raisonnement de relations spatiales.
Taille du téléchargement :
89.59 MiB
Taille du jeu de données :
675.09 MiB
Fractionnements :
Diviser | Exemples |
---|---|
'dev' | 2 617 |
'referent' | 30 492 |
'relation' | 6 285 |
'relative_position_1' | 41 576 |
'relative_position_2' | 41 529 |
'test' | 28 526 |
'train' | 259 088 |
'visual' | 62 250 |
- Exemples ( tfds.as_dataframe ):