- 설명 :
논문에 설명된 데이터 세트: Unnatural Instructions: Tuning Language Models with (거의) No Human Labor(2022). 선택적 제약 조건/LLM에서 생성된 재공식화와 함께 자연 언어 명령어 집합을 포함합니다.
소스 코드 :
tfds.text.unnatural_instructions.UnnaturalInstructions
버전 :
-
0.0.1
(기본값): 최초 릴리스. 사용하려면 추가 처리가 필요하므로 지침/입력을 생략하십시오. Instruction_with_inputs 및 재구성에는 지침과 컨텍스트가 포함됩니다.
-
다운로드 크기 :
17.48 MiB
데이터 세트 크기 :
154.71 MiB
자동 캐시 됨( 문서 ):
shuffle_files=False
(트레인)인 경우에만분할 :
나뉘다 | 예 |
---|---|
'train' | 66,010 |
- 기능 구조 :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'instances': Sequence({
'constraints': Text(shape=(), dtype=string),
'input': Text(shape=(), dtype=string),
'instruction_with_input': Text(shape=(), dtype=string),
'output': Text(shape=(), dtype=string),
}),
'instruction': Text(shape=(), dtype=string),
'reformulations': Sequence({
'input': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'instruction_with_input': Text(shape=(), dtype=string),
'output': Text(shape=(), dtype=string),
}),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
ID | 텍스트 | 끈 | 예를 들어 고유 식별자입니다. | |
인스턴스 | 순서 | |||
인스턴스/제약 | 텍스트 | 끈 | 작업별 제약. | |
인스턴스/입력 | 텍스트 | 끈 | 주어진 명령에 대해 자리 표시자에 입력할 입력입니다. | |
인스턴스/instruction_with_input | 텍스트 | 끈 | 자리 표시자에 제공된 입력이 있는 명령입니다. | |
인스턴스/출력 | 텍스트 | 끈 | 주어진 작업에 대한 목표 출력. | |
지침 | 텍스트 | 끈 | 입력을 위한 자리 표시자가 있는 명령입니다. | |
재구성 | 순서 | |||
재구성/입력 | 텍스트 | 끈 | 주어진 명령에 대해 자리 표시자에 입력할 입력입니다. | |
재구성/지시 | 텍스트 | 끈 | 입력을 위한 자리 표시자가 있는 명령입니다. | |
재구성/instruction_with_input | 텍스트 | 끈 | 자리 표시자에 제공된 입력이 있는 명령입니다. | |
재구성/출력 | 텍스트 | 끈 | 주어진 작업에 대한 목표 출력. |
감독된 키 (
as_supervised
문서 참조):None
그림 ( tfds.show_examples ): 지원되지 않습니다.
예 ( tfds.as_dataframe ):
- 인용 :
@misc{honovich2022unnatural,
title = {Unnatural Instructions: Tuning Language Models with (Almost) No Human Labor},
author = {Honovich, Or and Scialom, Thomas and Levy, Omer and Schick, Timo},
url = {https://arxiv.org/abs/2212.09689},
publisher = {arXiv},
year={2022}
}