unnatural_instructions

  • विवरण :

पेपर में वर्णित डेटासेट: अप्राकृतिक निर्देश: ट्यूनिंग भाषा मॉडल (लगभग) कोई मानव श्रम नहीं (2022)। वैकल्पिक बाधाओं / एलएलएम-जनित सुधारों के साथ प्राकृतिक-भाषा निर्देशों के सेट शामिल हैं।

  • होमपेज : https://github.com/orhonovich/unnatural-instructions

  • स्रोत कोड : tfds.text.unnatural_instructions.UnnaturalInstructions

  • संस्करण :

    • 0.0.1 (डिफ़ॉल्ट): आरंभिक रिलीज़। निर्देशों/इनपुट को छोड़ दें, क्योंकि उन्हें उपयोग करने के लिए अतिरिक्त प्रोसेसिंग की आवश्यकता होती है। Instruction_with_inputs और सुधारों में निर्देश और संदर्भ होते हैं।
  • डाउनलोड आकार : 17.48 MiB

  • डेटासेट का आकार : 154.71 MiB

  • ऑटो-कैश्ड ( दस्तावेज़ीकरण ): केवल जब shuffle_files=False (ट्रेन)

  • विभाजन :

विभाजित करना उदाहरण
'train' 66,010
  • फ़ीचर संरचना :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'instances': Sequence({
        'constraints': Text(shape=(), dtype=string),
        'input': Text(shape=(), dtype=string),
        'instruction_with_input': Text(shape=(), dtype=string),
        'output': Text(shape=(), dtype=string),
    }),
    'instruction': Text(shape=(), dtype=string),
    'reformulations': Sequence({
        'input': Text(shape=(), dtype=string),
        'instruction': Text(shape=(), dtype=string),
        'instruction_with_input': Text(shape=(), dtype=string),
        'output': Text(shape=(), dtype=string),
    }),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
पहचान लेख डोरी उदाहरण के लिए विशिष्ट पहचानकर्ता।
उदाहरणों अनुक्रम
उदाहरण/बाधाएं लेख डोरी कार्य-विशिष्ट बाधाएँ।
उदाहरण/इनपुट लेख डोरी दिए गए निर्देश के लिए इनपुट को प्लेसहोल्डर्स में फीड किया जाना है।
उदाहरण/निर्देश_with_input लेख डोरी प्लेसहोल्डर्स को दिए गए इनपुट के साथ निर्देश।
उदाहरण/आउटपुट लेख डोरी दिए गए कार्य के लिए लक्ष्य आउटपुट।
अनुदेश लेख डोरी इनपुट के लिए प्लेसहोल्डर के साथ निर्देश।
सुधार अनुक्रम
सुधार / इनपुट लेख डोरी दिए गए निर्देश के लिए इनपुट को प्लेसहोल्डर्स में फीड किया जाना है।
सुधार / निर्देश लेख डोरी इनपुट के लिए प्लेसहोल्डर के साथ निर्देश।
सुधार/निर्देश_with_input लेख डोरी प्लेसहोल्डर्स को दिए गए इनपुट के साथ निर्देश।
सुधार / आउटपुट लेख डोरी दिए गए कार्य के लिए लक्ष्य आउटपुट।
  • उद्धरण :
@misc{honovich2022unnatural,
      title = {Unnatural Instructions: Tuning Language Models with (Almost) No Human Labor},
      author = {Honovich, Or and Scialom, Thomas and Levy, Omer and Schick, Timo},
      url = {https://arxiv.org/abs/2212.09689},
      publisher = {arXiv},
      year={2022}
}