- Descrizione :
Set di dati descritto nel documento: Istruzioni innaturali: ottimizzazione dei modelli linguistici con (quasi) assenza di lavoro umano (2022). Contiene set di istruzioni in linguaggio naturale, con vincoli facoltativi/riformulazioni generate da LLM.
Homepage : https://github.com/orhonovich/unnatural-instructions
Codice sorgente :
tfds.text.unnatural_instructions.UnnaturalInstructions
Versioni :
-
0.0.1
(impostazione predefinita): versione iniziale. Omettere istruzioni/input, in quanto richiedono un'ulteriore elaborazione per essere utilizzati. Instruction_with_inputs e riformulazioni contengono istruzioni e contesti.
-
Dimensione del download :
17.48 MiB
Dimensione del set di dati:
154.71 MiB
Cache automatica ( documentazione ): solo quando
shuffle_files=False
(treno)Divisioni :
Diviso | Esempi |
---|---|
'train' | 66.010 |
- Struttura delle caratteristiche :
FeaturesDict({
'id': Text(shape=(), dtype=string),
'instances': Sequence({
'constraints': Text(shape=(), dtype=string),
'input': Text(shape=(), dtype=string),
'instruction_with_input': Text(shape=(), dtype=string),
'output': Text(shape=(), dtype=string),
}),
'instruction': Text(shape=(), dtype=string),
'reformulations': Sequence({
'input': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'instruction_with_input': Text(shape=(), dtype=string),
'output': Text(shape=(), dtype=string),
}),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
id | Testo | corda | Identificatore univoco, ad esempio. | |
istanze | Sequenza | |||
istanze/vincoli | Testo | corda | Vincoli specifici dell'attività. | |
istanze/input | Testo | corda | Input da inserire nei segnaposto per l'istruzione data. | |
istanze/istruzione_con_input | Testo | corda | Istruzioni con input forniti ai segnaposto. | |
istanze/output | Testo | corda | Output di destinazione per una determinata attività. | |
istruzione | Testo | corda | Istruzione con segnaposto per gli input. | |
riformulazioni | Sequenza | |||
riformulazioni/input | Testo | corda | Input da inserire nei segnaposto per l'istruzione data. | |
riformulazioni/istruzioni | Testo | corda | Istruzione con segnaposto per gli input. | |
riformulazioni/istruzione_con_input | Testo | corda | Istruzioni con input forniti ai segnaposto. | |
riformulazioni/output | Testo | corda | Output di destinazione per una determinata attività. |
Chiavi supervisionate (Vedi
as_supervised
doc ):None
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ):
- Citazione :
@misc{honovich2022unnatural,
title = {Unnatural Instructions: Tuning Language Models with (Almost) No Human Labor},
author = {Honovich, Or and Scialom, Thomas and Levy, Omer and Schick, Timo},
url = {https://arxiv.org/abs/2212.09689},
publisher = {arXiv},
year={2022}
}