- Deskripsi :
Kumpulan data GoEmotions berisi 58k komentar Reddit yang dikurasi dengan cermat dan diberi label untuk 27 kategori emosi atau Netral. Kategori emosi adalah kekaguman, hiburan, kemarahan, gangguan, persetujuan, perhatian, kebingungan, rasa ingin tahu, keinginan, kekecewaan, ketidaksetujuan, jijik, malu, kegembiraan, ketakutan, terima kasih, kesedihan, kegembiraan, cinta, kegugupan, optimisme, kebanggaan, realisasi, lega, penyesalan, kesedihan, kejutan.
Dokumentasi Tambahan : Jelajahi di Makalah Dengan Kode
Beranda : https://github.com/google-research/google-research/tree/master/goemotions
Kode sumber :
tfds.text.Goemotions
Versi :
-
0.1.0
(default): Tidak ada catatan rilis.
-
Ukuran unduhan :
4.19 MiB
Ukuran dataset :
32.25 MiB
Di-cache otomatis ( dokumentasi ): Ya
Perpecahan :
Membelah | Contoh |
---|---|
'test' | 5.427 |
'train' | 43.410 |
'validation' | 5.426 |
- Struktur fitur :
FeaturesDict({
'admiration': bool,
'amusement': bool,
'anger': bool,
'annoyance': bool,
'approval': bool,
'caring': bool,
'comment_text': Text(shape=(), dtype=string),
'confusion': bool,
'curiosity': bool,
'desire': bool,
'disappointment': bool,
'disapproval': bool,
'disgust': bool,
'embarrassment': bool,
'excitement': bool,
'fear': bool,
'gratitude': bool,
'grief': bool,
'joy': bool,
'love': bool,
'nervousness': bool,
'neutral': bool,
'optimism': bool,
'pride': bool,
'realization': bool,
'relief': bool,
'remorse': bool,
'sadness': bool,
'surprise': bool,
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Dtype | Keterangan |
---|---|---|---|---|
fiturDict | ||||
kekaguman | Tensor | bool | ||
hiburan | Tensor | bool | ||
amarah | Tensor | bool | ||
gangguan | Tensor | bool | ||
persetujuan | Tensor | bool | ||
peduli | Tensor | bool | ||
komentar_teks | Teks | rangkaian | ||
kebingungan | Tensor | bool | ||
rasa ingin tahu | Tensor | bool | ||
menginginkan | Tensor | bool | ||
kekecewaan | Tensor | bool | ||
ketidaksetujuan | Tensor | bool | ||
menjijikkan | Tensor | bool | ||
rasa malu | Tensor | bool | ||
kegembiraan | Tensor | bool | ||
takut | Tensor | bool | ||
rasa syukur | Tensor | bool | ||
duka | Tensor | bool | ||
sukacita | Tensor | bool | ||
cinta | Tensor | bool | ||
kegugupan | Tensor | bool | ||
netral | Tensor | bool | ||
optimisme | Tensor | bool | ||
kebanggaan | Tensor | bool | ||
realisasi | Tensor | bool | ||
lega | Tensor | bool | ||
penyesalan | Tensor | bool | ||
kesedihan | Tensor | bool | ||
kejutan | Tensor | bool |
Kunci yang diawasi (Lihat
as_supervised
doc ):None
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@inproceedings{demszky-2020-goemotions,
title = "{G}o{E}motions: A Dataset of Fine-Grained Emotions",
author = "Demszky, Dorottya and
Movshovitz-Attias, Dana and
Ko, Jeongwoo and
Cowen, Alan and
Nemade, Gaurav and
Ravi, Sujith",
booktitle = "Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics",
month = jul,
year = "2020",
address = "Online",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/2020.acl-main.372",
pages = "4040--4054",
}