- 설명 :
Opinosis Opinion Dataset은 51개 주제에 대한 리뷰에서 추출한 문장으로 구성됩니다. 주제 및 의견은 Tripadvisor, Edmunds.com 및 Amazon.com에서 가져옵니다.
소스 코드 :
tfds.datasets.opinosis.Builder
버전 :
-
1.0.0
(기본값): 릴리스 정보가 없습니다.
-
다운로드 크기 :
739.65 KiB
데이터 세트 크기 :
725.45 KiB
자동 캐시 ( 문서 ): 예
분할 :
나뉘다 | 예 |
---|---|
'train' | 51 |
- 기능 구조 :
FeaturesDict({
'review_sents': Text(shape=(), dtype=string),
'summaries': Sequence(Text(shape=(), dtype=string)),
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
리뷰_보낸 | 텍스트 | 끈 | ||
요약 | 시퀀스(텍스트) | (없음,) | 끈 |
감독 키 (
as_supervised
문서 참조):('review_sents', 'summaries')
그림 ( tfds.show_examples ): 지원되지 않습니다.
예 ( tfds.as_dataframe ):
- 인용 :
@inproceedings{ganesan2010opinosis,
title={Opinosis: a graph-based approach to abstractive summarization of highly redundant opinions},
author={Ganesan, Kavita and Zhai, ChengXiang and Han, Jiawei},
booktitle={Proceedings of the 23rd International Conference on Computational Linguistics},
pages={340--348},
year={2010},
organization={Association for Computational Linguistics}
}