- 설명 :
봇의 적대적 대화 데이터세트.
Bot Adversarial Dialogue 작업의 공격성 라벨이 지정된 대화 데이터 세트입니다. 대화는 인간에게 봇과 적대적으로 대화하도록 요청하여 수집되었습니다.
자세한 내용은 논문 에서 확인하세요.
홈페이지 : https://github.com/facebookresearch/ParlAI/tree/main/parlai/tasks/bot_adversarial_dialogue
버전 :
-
1.0.0
(기본값): 최초 릴리스입니다.
-
자동 캐시 ( 문서 ): 예
감독되는 키 (
as_supervised
doc 참조):None
그림 ( tfds.show_examples ): 지원되지 않습니다.
인용 :
@misc{xu2021recipes,
title={Recipes for Safety in Open-domain Chatbots},
author={Jing Xu and Da Ju and Margaret Li and Y-Lan Boureau and Jason Weston and Emily Dinan},
year={2021},
eprint={2010.07079},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
bot_adversarial_dialogue/dialogue_datasets (기본 구성)
구성 설명 : 학습, 검증 및 테스트 분할로 구분된 대화 데이터 세트입니다.
다운로드 크기 :
3.06 MiB
데이터세트 크기 :
23.38 MiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 2,598 |
'train' | 69,274 |
'valid' | 7,002 |
- 기능 구조 :
FeaturesDict({
'bot_persona': Sequence(Text(shape=(), dtype=string)),
'dialogue_id': float32,
'episode_done': bool,
'id': Text(shape=(), dtype=string),
'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
'round_id': float32,
'speaker_to_eval': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | Dtype | 설명 |
---|---|---|---|---|
특징Dict | ||||
bot_persona | 시퀀스(텍스트) | (없음,) | 끈 | 봇이 가장한 페르소나입니다. |
대화_ID | 텐서 | float32 | ||
에피소드_완료 | 텐서 | 부울 | ||
ID | 텍스트 | 끈 | 샘플의 ID입니다. | |
라벨 | 클래스 라벨 | 정수64 | ||
round_id | 텐서 | float32 | ||
Speaker_to_eval | 텍스트 | 끈 | 라벨이 붙은 발화의 화자입니다. | |
텍스트 | 텍스트 | 끈 | 분류할 발화입니다. |
- 예 ( tfds.as_dataframe ):
bot_adversarial_dialogue/human_nonadv_safety_eval
구성 설명 : 크라우드소싱 작업자가 공격성을 평가한 인간 안전 평가 세트입니다.
다운로드 크기 :
10.57 KiB
데이터세트 크기 :
34.55 KiB
분할 :
나뉘다 | 예 |
---|---|
'test' | 180 |
- 기능 구조 :
FeaturesDict({
'episode_done': bool,
'id': Text(shape=(), dtype=string),
'labels': ClassLabel(shape=(), dtype=int64, num_classes=2),
'text': Text(shape=(), dtype=string),
})
- 기능 문서 :
특징 | 수업 | 모양 | Dtype | 설명 |
---|---|---|---|---|
특징Dict | ||||
에피소드_완료 | 텐서 | 부울 | ||
ID | 텍스트 | 끈 | 샘플의 ID입니다. | |
라벨 | 클래스 라벨 | 정수64 | ||
텍스트 | 텍스트 | 끈 | 분류할 발화입니다. |
- 예 ( tfds.as_dataframe ):