- Mô tả :
Bộ dữ liệu GoEmotions chứa 58 nghìn bình luận Reddit được tuyển chọn cẩn thận được gắn nhãn cho 27 loại cảm xúc hoặc Trung tính. Các loại cảm xúc là ngưỡng mộ, thích thú, tức giận, khó chịu, tán thành, quan tâm, bối rối, tò mò, ham muốn, thất vọng, không tán thành, ghê tởm, bối rối, phấn khích, sợ hãi, biết ơn, đau buồn, vui sướng, yêu, hồi hộp, lạc quan, tự hào, nhận ra, cứu trợ, hối hận, buồn bã, bất ngờ.
Tài liệu bổ sung : Khám phá trên giấy tờ với mã
Trang chủ : https://github.com/google-research/google-research/tree/master/goemotions
Mã nguồn :
tfds.text.Goemotions
Phiên bản :
-
0.1.0
(mặc định): Không có ghi chú phát hành.
-
Kích thước tải xuống :
4.19 MiB
Kích thước tập dữ liệu :
32.25 MiB
Tự động lưu vào bộ đệm ( tài liệu ): Có
Chia tách :
Tách ra | ví dụ |
---|---|
'test' | 5,427 |
'train' | 43,410 |
'validation' | 5,426 |
- Cấu trúc tính năng :
FeaturesDict({
'admiration': bool,
'amusement': bool,
'anger': bool,
'annoyance': bool,
'approval': bool,
'caring': bool,
'comment_text': Text(shape=(), dtype=string),
'confusion': bool,
'curiosity': bool,
'desire': bool,
'disappointment': bool,
'disapproval': bool,
'disgust': bool,
'embarrassment': bool,
'excitement': bool,
'fear': bool,
'gratitude': bool,
'grief': bool,
'joy': bool,
'love': bool,
'nervousness': bool,
'neutral': bool,
'optimism': bool,
'pride': bool,
'realization': bool,
'relief': bool,
'remorse': bool,
'sadness': bool,
'surprise': bool,
})
- Tài liệu tính năng :
Tính năng | Lớp | Hình dạng | Dtype | Sự mô tả |
---|---|---|---|---|
Tính năngDict | ||||
sự khâm phục | tenxơ | bool | ||
vui chơi giải trí | tenxơ | bool | ||
Sự phẫn nộ | tenxơ | bool | ||
khó chịu | tenxơ | bool | ||
phê duyệt | tenxơ | bool | ||
quan tâm | tenxơ | bool | ||
comment_text | Chữ | sợi dây | ||
sự hoang mang | tenxơ | bool | ||
sự tò mò | tenxơ | bool | ||
khao khát | tenxơ | bool | ||
thất vọng | tenxơ | bool | ||
không tán thành | tenxơ | bool | ||
ghê tởm | tenxơ | bool | ||
sự lúng túng | tenxơ | bool | ||
phấn khích | tenxơ | bool | ||
nỗi sợ | tenxơ | bool | ||
lòng biết ơn | tenxơ | bool | ||
nỗi buồn | tenxơ | bool | ||
vui sướng | tenxơ | bool | ||
yêu và quý | tenxơ | bool | ||
lo lắng | tenxơ | bool | ||
Trung tính | tenxơ | bool | ||
lạc quan | tenxơ | bool | ||
lòng tự trọng | tenxơ | bool | ||
hiện thực hóa | tenxơ | bool | ||
sự cứu tế | tenxơ | bool | ||
hối hận | tenxơ | bool | ||
sự sầu nảo | tenxơ | bool | ||
bất ngờ | tenxơ | bool |
Các khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Ví dụ ( tfds.as_dataframe ):
- trích dẫn :
@inproceedings{demszky-2020-goemotions,
title = "{G}o{E}motions: A Dataset of Fine-Grained Emotions",
author = "Demszky, Dorottya and
Movshovitz-Attias, Dana and
Ko, Jeongwoo and
Cowen, Alan and
Nemade, Gaurav and
Ravi, Sujith",
booktitle = "Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics",
month = jul,
year = "2020",
address = "Online",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/2020.acl-main.372",
pages = "4040--4054",
}