real_tossicity_prompts

  • Descrizione :

RealToxicityPrompts: valutazione della degenerazione tossica neurale nei modelli linguistici

RealToxicityPrompts è un corpus di suggerimenti in inglese (in particolare l'inizio delle frasi) di varia tossicità. Questi prompt devono essere forniti come contesto a un modello linguistico autoregressivo (ad esempio GPT-2) e utilizzati per generare completamenti.

Maggiori dettagli sono presentati nel documento originale.

Diviso Esempi
'train' 99.442
  • Struttura delle caratteristiche :
FeaturesDict({
    'begin': int32,
    'challenging': bool,
    'continuation': FeaturesDict({
        'flirtation': float32,
        'identity_attack': float32,
        'insult': float32,
        'profanity': float32,
        'severe_toxicity': float32,
        'sexually_explicit': float32,
        'text': Text(shape=(), dtype=string),
        'threat': float32,
        'toxicity': float32,
    }),
    'end': int32,
    'filename': Text(shape=(), dtype=string),
    'prompt': FeaturesDict({
        'flirtation': float32,
        'identity_attack': float32,
        'insult': float32,
        'profanity': float32,
        'severe_toxicity': float32,
        'sexually_explicit': float32,
        'text': Text(shape=(), dtype=string),
        'threat': float32,
        'toxicity': float32,
    }),
})
  • Documentazione delle funzionalità :
Caratteristica Classe Forma Tipo D Descrizione
CaratteristicheDict
inizio Tensore int32
stimolante Tensore bool
continuazione CaratteristicheDict
continuazione/flirt Tensore float32
continuazione/attacco_identità Tensore float32
continuazione/insulto Tensore float32
continuazione/volgarità Tensore float32
continuazione/tossicità_grave Tensore float32
continuazione/sessualmente_esplicito Tensore float32
continuazione/testo Testo corda
continuazione/minaccia Tensore float32
continuazione/tossicità Tensore float32
FINE Tensore int32
nome del file Testo corda
richiesta CaratteristicheDict
sollecitazione/flirt Tensore float32
prompt/attacco_identità Tensore float32
sollecitare/insultare Tensore float32
tempestivo/volgare Tensore float32
tossicità_pronta/grave Tensore float32
prompt/sessualmente_esplicito Tensore float32
suggerimento/testo Testo corda
sollecitazione/minaccia Tensore float32
tempestività/tossicità Tensore float32
  • Citazione :
@article{gehman2020realtoxicityprompts,
  title={Realtoxicityprompts: Evaluating neural toxic degeneration in language models},
  author={Gehman, Samuel and Gururangan, Suchin and Sap, Maarten and Choi, Yejin and Smith, Noah A},
  journal={arXiv preprint arXiv:2009.11462},
  year={2020}
}