- Mô tả :
Có hai bộ dữ liệu phụ:
(1) RottenTomatoes: Các nhà phê bình phim và sự đồng thuận được thu thập từ http://rottentomatoes.com/ Nó có các trường "_movie_name", "_movie_id", "_critics" và "_critic_consensus".
(2) IDebate: Các đối số được thu thập từ http://idebate.org/ Nó có các trường "_debate_name", "_debate_id", "_claim", "_claim_id", "_argument_sentences".
Xem thêm https://web.eecs.umich.edu/~wangluxy/datasets/opinion_README.txt
Trang chủ : https://web.eecs.umich.edu/~wangluxy/data.html
Mã nguồn :
tfds.datasets.opinion_abstracts.Builder
Phiên bản :
-
1.0.0
(mặc định): Không có ghi chú phát hành.
-
Kích thước tải xuống :
20.08 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Hình ( tfds.show_examples ): Không được hỗ trợ.
trích dẫn :
@inproceedings{wang-ling-2016-neural,
title = "Neural Network-Based Abstract Generation for Opinions and Arguments",
author = "Wang, Lu and
Ling, Wang",
booktitle = "Proceedings of the 2016 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies",
month = jun,
year = "2016",
address = "San Diego, California",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/N16-1007",
doi = "10.18653/v1/N16-1007",
pages = "47--57",
}
idea_abstracts/rotten_tomatoes (cấu hình mặc định)
Mô tả cấu hình : Các nhà phê bình chuyên nghiệp và sự đồng thuận của 3.731 bộ phim.
Kích thước tập dữ liệu :
50.10 MiB
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 3,731 |
- Cấu trúc tính năng :
FeaturesDict({
'_critic_consensus': string,
'_critics': Sequence({
'key': string,
'value': string,
}),
'_movie_id': string,
'_movie_name': string,
})
- Tài liệu tính năng :
Tính năng | Lớp học | Hình dạng | Dtype | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
_critic_consensus | tenxơ | sợi dây | ||
_nhà phê bình | Sự liên tiếp | |||
_nhà phê bình/key | tenxơ | sợi dây | ||
_phê bình/giá trị | tenxơ | sợi dây | ||
_phim_id | tenxơ | sợi dây | ||
_tên bộ phim | tenxơ | sợi dây |
Các khóa được giám sát (Xem
as_supervised
doc ):('_critics', '_critic_consensus')
Ví dụ ( tfds.as_dataframe ):
ý kiến_abstracts/idebate
Mô tả cấu hình : 2.259 yêu cầu cho 676 cuộc tranh luận.
Kích thước tập dữ liệu :
3.15 MiB
Chia tách :
Tách ra | ví dụ |
---|---|
'train' | 2.259 |
- Cấu trúc tính năng :
FeaturesDict({
'_argument_sentences': Sequence({
'key': string,
'value': string,
}),
'_claim': string,
'_claim_id': string,
'_debate_name': string,
})
- Tài liệu tính năng :
Tính năng | Lớp học | Hình dạng | Dtype | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
_argument_sentences | Sự liên tiếp | |||
_argument_sentences/key | tenxơ | sợi dây | ||
_argument_sentences/giá trị | tenxơ | sợi dây | ||
_khẳng định | tenxơ | sợi dây | ||
_claim_id | tenxơ | sợi dây | ||
_debate_name | tenxơ | sợi dây |
Các khóa được giám sát (Xem
as_supervised
doc ):('_argument_sentences', '_claim')
Ví dụ ( tfds.as_dataframe ):