স্কোয়াড_প্রশ্ন_প্রজন্ম

  • বর্ণনা :

'নিউরাল কোয়েশ্চেন জেনারেশন ফ্রম টেক্সট: এ প্রিলিমিনারি স্টাডি' (Zhou et al, 2017) এবং 'Learning to Ask: Neural Question Generation for Reading Comprehension' (Du et al, 2017) এ বর্ণিত ডেটা স্প্লিট ব্যবহার করে স্কোয়াড ডেটাসেট ব্যবহার করে প্রশ্ন তৈরি করা।

@inproceedings{du-etal-2017-learning,
    title = "Learning to Ask: Neural Question Generation for Reading Comprehension",
    author = "Du, Xinya  and Shao, Junru  and Cardie, Claire",
    booktitle = "Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
    month = jul,
    year = "2017",
    address = "Vancouver, Canada",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/P17-1123",
    doi = "10.18653/v1/P17-1123",
    pages = "1342--1352",
}

@inproceedings{rajpurkar-etal-2016-squad,
    title = "{SQ}u{AD}: 100,000+ Questions for Machine Comprehension of Text",
    author = "Rajpurkar, Pranav  and Zhang, Jian  and Lopyrev, Konstantin  and Liang, Percy",
    booktitle = "Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing",
    month = nov,
    year = "2016",
    address = "Austin, Texas",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/D16-1264",
    doi = "10.18653/v1/D16-1264",
    pages = "2383--2392",
}

squad_question_generation/split_du (ডিফল্ট কনফিগারেশন)

  • কনফিগারেশনের বর্ণনা : উত্তরণ-স্তরের প্রসঙ্গ থেকে স্বাধীন প্রশ্ন তৈরির উত্তর দিন (Du et al, 2017)।

  • ডাউনলোড সাইজ : 62.83 MiB

  • ডেটাসেটের আকার : 84.67 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' 11,877
'train' 75,722
'validation' 10,570
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'context_passage': Text(shape=(), dtype=string),
    'question': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
উত্তর পাঠ্য স্ট্রিং
context_passage পাঠ্য স্ট্রিং
প্রশ্ন পাঠ্য স্ট্রিং

স্কোয়াড_প্রশ্ন_প্রজন্ম/বিভক্ত_ঝু

  • কনফিগারেশনের বিবরণ : বাক্য- এবং উত্তরণ-স্তরের প্রসঙ্গ থেকে উত্তর-স্প্যান নির্ভরশীল প্রশ্ন তৈরি করা (Zhou et al, 2017)।

  • ডাউনলোড সাইজ : 62.52 MiB

  • ডেটাসেটের আকার : 111.02 MiB

  • বিভাজন :

বিভক্ত উদাহরণ
'test' ৮,৯৬৪
'train' ৮৬,৬৩৫
'validation' ৮,৯৬৫
  • বৈশিষ্ট্য গঠন :
FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'context_passage': Text(shape=(), dtype=string),
    'context_sentence': Text(shape=(), dtype=string),
    'question': Text(shape=(), dtype=string),
})
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
ফিচারসডিক্ট
উত্তর পাঠ্য স্ট্রিং
context_passage পাঠ্য স্ট্রিং
প্রসঙ্গ_বাক্য পাঠ্য স্ট্রিং
প্রশ্ন পাঠ্য স্ট্রিং