- Mô tả :
Bộ dữ liệu được mô tả trong bài báo: Hướng dẫn không tự nhiên: Điều chỉnh mô hình ngôn ngữ mà không cần (Hầu như) không có lao động của con người (2022). Chứa các bộ hướng dẫn ngôn ngữ tự nhiên, với các ràng buộc tùy chọn/các công thức cải cách do LLM tạo.
Trang chủ : https://github.com/orhonovich/unnatural-instructions
Mã nguồn :
tfds.text.unnatural_instructions.UnnaturalInstructions
Phiên bản :
-
0.0.1
(mặc định): Bản phát hành đầu tiên. Bỏ qua các hướng dẫn/đầu vào, vì chúng yêu cầu xử lý bổ sung được sử dụng. Chỉ dẫn_với_đầu vào và công thức định dạng lại chứa các chỉ dẫn và ngữ cảnh.
-
Kích thước tải xuống :
17.48 MiB
Kích thước tập dữ liệu :
154.71 MiB
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Chỉ khi
shuffle_files=False
(đào tạo)Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 66.010 |
- Cấu trúc tính năng :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'instances': Sequence({
'constraints': Text(shape=(), dtype=string),
'input': Text(shape=(), dtype=string),
'instruction_with_input': Text(shape=(), dtype=string),
'output': Text(shape=(), dtype=string),
}),
'instruction': Text(shape=(), dtype=string),
'reformulations': Sequence({
'input': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'instruction_with_input': Text(shape=(), dtype=string),
'output': Text(shape=(), dtype=string),
}),
})
- Tài liệu tính năng :
Đặc tính | Tầng lớp | Hình dạng | Dtype | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
Tôi | Chữ | chuỗi | Định danh duy nhất chẳng hạn. | |
trường hợp | Sự liên tiếp | |||
trường hợp/ràng buộc | Chữ | chuỗi | Các ràng buộc dành riêng cho nhiệm vụ. | |
trường hợp/đầu vào | Chữ | chuỗi | Đầu vào được đưa vào trình giữ chỗ cho hướng dẫn nhất định. | |
phiên bản/instruction_with_input | Chữ | chuỗi | Hướng dẫn với đầu vào được cung cấp cho trình giữ chỗ. | |
phiên bản/đầu ra | Chữ | chuỗi | Đầu ra mục tiêu cho nhiệm vụ nhất định. | |
hướng dẫn | Chữ | chuỗi | Hướng dẫn với trình giữ chỗ cho đầu vào. | |
cải cách công thức | Sự liên tiếp | |||
công thức/đầu vào | Chữ | chuỗi | Đầu vào được đưa vào trình giữ chỗ cho hướng dẫn nhất định. | |
cải cách / hướng dẫn | Chữ | chuỗi | Hướng dẫn với trình giữ chỗ cho đầu vào. | |
công thức lại/hướng dẫn_with_input | Chữ | chuỗi | Hướng dẫn với đầu vào được cung cấp cho trình giữ chỗ. | |
định dạng lại/đầu ra | Chữ | chuỗi | Đầu ra mục tiêu cho nhiệm vụ nhất định. |
Các khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@misc{honovich2022unnatural,
title = {Unnatural Instructions: Tuning Language Models with (Almost) No Human Labor},
author = {Honovich, Or and Scialom, Thomas and Levy, Omer and Schick, Timo},
url = {https://arxiv.org/abs/2212.09689},
publisher = {arXiv},
year={2022}
}