- الوصف :
مجموعة البيانات الموضحة في الورقة: تعليمات غير طبيعية: ضبط نماذج اللغة باستخدام (تقريبًا) بدون عمالة بشرية (2022). يحتوي على مجموعات من تعليمات اللغة الطبيعية ، مع قيود اختيارية / إعادة صياغة مولدة بواسطة LLM.
الصفحة الرئيسية : https://github.com/orhonovich/unnatural-instructions
كود المصدر :
tfds.text.unnatural_instructions.UnnaturalInstructions
إصدارات :
-
0.0.1
(افتراضي): الإصدار الأولي. احذف التعليمات / المدخلات ، لأنها تتطلب معالجة إضافية لاستخدامها. تحتوي Instruction_with_inputs وإعادة الصياغة على تعليمات وسياقات.
-
حجم التحميل :
17.48 MiB
حجم مجموعة البيانات :
154.71 MiB
التخزين المؤقت التلقائي ( التوثيق ): فقط عندما يكون
shuffle_files=False
(قطار)الانقسامات :
انشق، مزق | أمثلة |
---|---|
'train' | 66،010 |
- هيكل الميزة :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'instances': Sequence({
'constraints': Text(shape=(), dtype=string),
'input': Text(shape=(), dtype=string),
'instruction_with_input': Text(shape=(), dtype=string),
'output': Text(shape=(), dtype=string),
}),
'instruction': Text(shape=(), dtype=string),
'reformulations': Sequence({
'input': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'instruction_with_input': Text(shape=(), dtype=string),
'output': Text(shape=(), dtype=string),
}),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
هوية شخصية | نص | سلسلة | معرّف فريد على سبيل المثال. | |
حالات | تسلسل | |||
الأمثلة / القيود | نص | سلسلة | القيود الخاصة بالمهمة. | |
مثيلات / مدخلات | نص | سلسلة | يتم إدخال المدخلات في العناصر النائبة للتعليمات المعطاة. | |
مثيلات / تعليمات مع إدخال | نص | سلسلة | تعليمات مع المدخلات المقدمة للعناصر النائبة. | |
مثيلات / مخرجات | نص | سلسلة | الإخراج المستهدف لمهمة معينة. | |
تعليمات | نص | سلسلة | تعليمات مع عنصر نائب للمدخلات. | |
إعادة الصياغة | تسلسل | |||
إعادة الصياغة / المدخلات | نص | سلسلة | يتم إدخال المدخلات في العناصر النائبة للتعليمات المعطاة. | |
إعادة صياغة / تعليمات | نص | سلسلة | تعليمات مع عنصر نائب للمدخلات. | |
إعادة الصياغة / تعليمات_مع_إدخال | نص | سلسلة | تعليمات مع المدخلات المقدمة للعناصر النائبة. | |
إعادة الصياغة / الإخراج | نص | سلسلة | الإخراج المستهدف لمهمة معينة. |
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised
):None
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@misc{honovich2022unnatural,
title = {Unnatural Instructions: Tuning Language Models with (Almost) No Human Labor},
author = {Honovich, Or and Scialom, Thomas and Levy, Omer and Schick, Timo},
url = {https://arxiv.org/abs/2212.09689},
publisher = {arXiv},
year={2022}
}