- Descripción :
Conjunto de datos descrito en el documento: Instrucciones antinaturales: ajuste de modelos de lenguaje con (casi) ningún trabajo humano (2022). Contiene conjuntos de instrucciones en lenguaje natural, con restricciones opcionales/reformulaciones generadas por LLM.
Página de inicio: https://github.com/orhonovich/unnatural-instructions
Código fuente :
tfds.text.unnatural_instructions.UnnaturalInstructions
Versiones :
-
0.0.1
(predeterminado): Versión inicial. Omita las instrucciones/entradas, ya que requieren procesamiento adicional para ser utilizadas. Instrucción_con_entradas y reformulaciones contienen instrucciones y contextos.
-
Tamaño de la descarga :
17.48 MiB
Tamaño del conjunto de datos :
154.71 MiB
Auto-caché ( documentación ): Solo cuando
shuffle_files=False
(tren)Divisiones :
Separar | Ejemplos |
---|---|
'train' | 66,010 |
- Estructura de características :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'instances': Sequence({
'constraints': Text(shape=(), dtype=string),
'input': Text(shape=(), dtype=string),
'instruction_with_input': Text(shape=(), dtype=string),
'output': Text(shape=(), dtype=string),
}),
'instruction': Text(shape=(), dtype=string),
'reformulations': Sequence({
'input': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'instruction_with_input': Text(shape=(), dtype=string),
'output': Text(shape=(), dtype=string),
}),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
identificación | Texto | cuerda | Identificador único, por ejemplo. | |
instancias | Secuencia | |||
instancias/restricciones | Texto | cuerda | Restricciones específicas de la tarea. | |
instancias/entrada | Texto | cuerda | Entrada que se introducirá en marcadores de posición para instrucciones dadas. | |
instancias/instrucción_con_entrada | Texto | cuerda | Instrucciones con entradas suministradas a marcadores de posición. | |
instancias/salida | Texto | cuerda | Salida de destino para la tarea dada. | |
instrucción | Texto | cuerda | Instrucción con marcador de posición para entradas. | |
reformulaciones | Secuencia | |||
reformulaciones/entrada | Texto | cuerda | Entrada que se introducirá en marcadores de posición para instrucciones dadas. | |
reformulaciones/instrucciones | Texto | cuerda | Instrucción con marcador de posición para entradas. | |
reformulaciones/instrucción_con_entrada | Texto | cuerda | Instrucciones con entradas suministradas a marcadores de posición. | |
reformulaciones/salida | Texto | cuerda | Salida de destino para la tarea dada. |
Claves supervisadas (Ver
as_supervised
doc ):None
Figura ( tfds.show_examples ): no compatible.
Ejemplos ( tfds.as_dataframe ):
- Cita :
@misc{honovich2022unnatural,
title = {Unnatural Instructions: Tuning Language Models with (Almost) No Human Labor},
author = {Honovich, Or and Scialom, Thomas and Levy, Omer and Schick, Timo},
url = {https://arxiv.org/abs/2212.09689},
publisher = {arXiv},
year={2022}
}