উইকি_টেবিল_প্রশ্ন

  • বর্ণনা :

ডেটাসেটে জোড়া টেবিল-প্রশ্ন এবং সংশ্লিষ্ট উত্তর রয়েছে। প্রশ্নগুলির জন্য বহু-পদক্ষেপের যুক্তি এবং বিভিন্ন ডেটা অপারেশন যেমন তুলনা, সমষ্টি এবং গাণিতিক গণনা প্রয়োজন। অন্তত ৮টি সারি এবং ৫টি কলাম সহ উইকিপিডিয়া টেবিলের মধ্যে টেবিলগুলো এলোমেলোভাবে নির্বাচন করা হয়েছে।

(ডকুমেন্টেশন ব্যবহারের নোট অনুযায়ী)

  • দেব: প্রশিক্ষণ ডেটার তিনটি (পাঁচটি নয়) বিভাজনের উপর গড় নির্ভুলতা। অন্য কথায়, যথাক্রমে 'split-{1,2,3}-train'-এ ট্রেন এবং 'split-{1,2,3}-dev'-এ পরীক্ষা করুন, তারপর যথার্থতা গড় করুন।

  • পরীক্ষা: 'ট্রেনে' ট্রেন এবং 'টেস্ট'-এ পরীক্ষা।

  • অতিরিক্ত ডকুমেন্টেশন : কোড সহ কাগজপত্রে অন্বেষণ করুন

  • হোমপেজ : https://ppasupat.github.io/WikiTableQuestions/#usage-notes

  • সোর্স কোড : tfds.structured.wiki_table_questions.WikiTableQuestions

  • সংস্করণ :

    • 1.0.0 (ডিফল্ট): প্রাথমিক প্রকাশ।
  • ডাউনলোডের আকার : 65.36 MiB

  • ডেটাসেটের আকার : 237.24 MiB

  • স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ

  • বিভাজন :

বিভক্ত উদাহরণ
'split-1-dev' 2,810
'split-1-train' 11,321
'split-2-dev' 2,838
'split-2-train' 11,312
'split-3-dev' 2,838
'split-3-train' 11,311
'test' ৪,৩৪৪
'train' 14,149
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'input_text': FeaturesDict({
        'context': string,
        'table': Sequence({
            'column_header': string,
            'content': string,
            'row_number': int16,
        }),
    }),
    'target_text': string,
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
input_text ফিচারসডিক্ট
ইনপুট_টেক্সট/প্রসঙ্গ টেনসর স্ট্রিং
ইনপুট_টেক্সট/টেবিল ক্রম
ইনপুট_টেক্সট/টেবিল/কলাম_হেডার টেনসর স্ট্রিং
ইনপুট_টেক্সট/টেবিল/সামগ্রী টেনসর স্ট্রিং
ইনপুট_টেক্সট/টেবিল/সারি_সংখ্যা টেনসর int16
টার্গেট_টেক্সট টেনসর স্ট্রিং
  • উদ্ধৃতি :
@inproceedings{pasupat-liang-2015-compositional,
    title = "Compositional Semantic Parsing on Semi-Structured Tables",
    author = "Pasupat, Panupong  and
      Liang, Percy",
    booktitle = "Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing (Volume 1: Long Papers)",
    month = jul,
    year = "2015",
    address = "Beijing, China",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/P15-1142",
    doi = "10.3115/v1/P15-1142",
    pages = "1470--1480",
}