المسح الأرضي

  • الوصف :

المسح الأرضي (gSCAN) عبارة عن مجموعة بيانات تركيبية لتقييم التعميم التركيبي في فهم اللغة الموضعية. يقرن gSCAN تعليمات اللغة الطبيعية بتسلسلات الإجراءات ، ويتطلب من الوكيل تفسير التعليمات في سياق بيئة الملاحة المرئية القائمة على الشبكة.

يمكن العثور على مزيد من المعلومات على:

FeaturesDict({
    'command': Sequence(Text(shape=(), dtype=string)),
    'manner': Text(shape=(), dtype=string),
    'meaning': Sequence(Text(shape=(), dtype=string)),
    'referred_target': Text(shape=(), dtype=string),
    'situation': FeaturesDict({
        'agent_direction': int32,
        'agent_position': FeaturesDict({
            'column': int32,
            'row': int32,
        }),
        'direction_to_target': Text(shape=(), dtype=string),
        'distance_to_target': int32,
        'grid_size': int32,
        'placed_objects': Sequence({
            'object': FeaturesDict({
                'color': Text(shape=(), dtype=string),
                'shape': Text(shape=(), dtype=string),
                'size': int32,
            }),
            'position': FeaturesDict({
                'column': int32,
                'row': int32,
            }),
            'vector': Text(shape=(), dtype=string),
        }),
        'target_object': FeaturesDict({
            'object': FeaturesDict({
                'color': Text(shape=(), dtype=string),
                'shape': Text(shape=(), dtype=string),
                'size': int32,
            }),
            'position': FeaturesDict({
                'column': int32,
                'row': int32,
            }),
            'vector': Text(shape=(), dtype=string),
        }),
    }),
    'target_commands': Sequence(Text(shape=(), dtype=string)),
    'verb_in_command': Text(shape=(), dtype=string),
})
  • وثائق الميزة :
ميزة فصل شكل نوع وصف
الميزات
يأمر تسلسل (نص) (لا أحد،) سلسلة
طريقة نص سلسلة
المعنى تسلسل (نص) (لا أحد،) سلسلة
الإشارة_الهدف نص سلسلة
الموقف الميزات
الوضع / اتجاه الوكيل موتر int32
الوضع / وضع الوكيل الميزات
الوضع / وضع الوكيل / العمود موتر int32
الوضع / وضع الوكيل / الصف موتر int32
الوضع / direction_to_target نص سلسلة
الوضع / المسافة إلى_الهدف موتر int32
الوضع / حجم الشبكة موتر int32
الوضع / الكائنات الموضوعة تسلسل
الوضع / الكائنات / الكائنات الموضوعة الميزات
الوضع / الكائنات_الموضوعة / الكائن / اللون نص سلسلة
الوضع / الكائنات_الموضوعة / الكائن / الشكل نص سلسلة
الوضع / الكائنات_ الموضوعة / الكائن / الحجم موتر int32
الوضع / الكائنات_ الموضوعة / الموقف الميزات
الوضع / الكائنات_ الموضوعة / المركز / العمود موتر int32
الوضع / الكائنات_ الموضوعة / الموقف / الصف موتر int32
الوضع / الكائنات الموضوعة / المتجه نص سلسلة
الوضع / الهدف_الموضوع الميزات
الوضع / الكائن المستهدف / الكائن الميزات
الوضع / الكائن المستهدف / الكائن / اللون نص سلسلة
الوضع / الهدف_الجسم / الشكل نص سلسلة
الوضع / الكائن المستهدف / الكائن / الحجم موتر int32
الوضع / الكائن المستهدف / الموقف الميزات
الوضع / الهدف_الجسم / الموقف / العمود موتر int32
الوضع / الهدف_الجسم / الموقف / الصف موتر int32
الوضع / الكائن المستهدف / المتجه نص سلسلة
الأوامر_المستهدفة تسلسل (نص) (لا أحد،) سلسلة
أمر الفعل نص سلسلة
@inproceedings{NEURIPS2020_e5a90182,
 author = {Ruis, Laura and Andreas, Jacob and Baroni, Marco and Bouchacourt, Diane and Lake, Brenden M},
 booktitle = {Advances in Neural Information Processing Systems},
 editor = {H. Larochelle and M. Ranzato and R. Hadsell and M. F. Balcan and H. Lin},
 pages = {19861--19872},
 publisher = {Curran Associates, Inc.},
 title = {A Benchmark for Systematic Generalization in Grounded Language Understanding},
 url = {https://proceedings.neurips.cc/paper/2020/file/e5a90182cc81e12ab5e72d66e0b46fe3-Paper.pdf},
 volume = {33},
 year = {2020}
}

@inproceedings{qiu-etal-2021-systematic,
    title = "Systematic Generalization on g{SCAN}: {W}hat is Nearly Solved and What is Next?",
    author = "Qiu, Linlu  and
      Hu, Hexiang  and
      Zhang, Bowen  and
      Shaw, Peter  and
      Sha, Fei",
    booktitle = "Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing",
    month = nov,
    year = "2021",
    address = "Online and Punta Cana, Dominican Republic",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2021.emnlp-main.166",
    doi = "10.18653/v1/2021.emnlp-main.166",
    pages = "2180--2188",
}

grounded_scan / compositional_splits (التكوين الافتراضي)

  • وصف التكوين : أمثلة على التعميم التركيبي.

  • حجم التحميل : 82.10 MiB

  • حجم مجموعة البيانات : 998.11 MiB

  • الانقسامات :

انشق، مزق أمثلة
'adverb_1' 112.880
'adverb_2' 38،582
'contextual' 11.460
'dev' 3،716
'situational_1' 88642
'situational_2' 16808
'test' 19282
'train' 367.933
'visual' 37436
'visual_easier' 18.718

المسح الأرضي / target_length_split

  • وصف التكوين : أمثلة للتعميم على أطوال مستهدفة أكبر.

  • حجم التحميل : 53.41 MiB

  • حجم مجموعة البيانات : 546.73 MiB

  • الانقسامات :

انشق، مزق أمثلة
'dev' 1،821
'target_lengths' 198.588
'test' 37784
'train' 180301

المسح الأرضي / spatial_relation_splits

  • وصف التكوين : أمثلة لاستدلال العلاقة المكانية.

  • حجم التحميل : 89.59 MiB

  • حجم مجموعة البيانات : 675.09 MiB

  • الانقسامات :

انشق، مزق أمثلة
'dev' 2617
'referent' 30492
'relation' 6285
'relative_position_1' 41576
'relative_position_2' 41.529
'test' 28.526
'train' 259.088
'visual' 62،250