- توضیحات :
مجموعه داده GoEmotions شامل 58 هزار نظر ردیت است که با دقت تنظیم شده اند که برای 27 دسته احساسات یا خنثی برچسب گذاری شده اند. دسته بندی احساسات عبارتند از تحسین، سرگرمی، خشم، آزار، تایید، مراقبت، سردرگمی، کنجکاوی، میل، ناامیدی، عدم تایید، انزجار، خجالت، هیجان، ترس، قدردانی، اندوه، شادی، عشق، عصبی بودن، خوش بینی، غرور، درک، تسکین، پشیمانی، اندوه، تعجب.
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://github.com/google-research/google-research/tree/master/goemotions
کد منبع :
tfds.text.Goemotions
نسخه ها :
-
0.1.0
(پیش فرض): بدون یادداشت انتشار.
-
حجم دانلود :
4.19 MiB
حجم مجموعه داده :
32.25 MiB
ذخیره خودکار ( اسناد ): بله
تقسیم ها :
شکاف | مثال ها |
---|---|
'test' | 5,427 |
'train' | 43,410 |
'validation' | 5,426 |
- ساختار ویژگی :
FeaturesDict({
'admiration': bool,
'amusement': bool,
'anger': bool,
'annoyance': bool,
'approval': bool,
'caring': bool,
'comment_text': Text(shape=(), dtype=string),
'confusion': bool,
'curiosity': bool,
'desire': bool,
'disappointment': bool,
'disapproval': bool,
'disgust': bool,
'embarrassment': bool,
'excitement': bool,
'fear': bool,
'gratitude': bool,
'grief': bool,
'joy': bool,
'love': bool,
'nervousness': bool,
'neutral': bool,
'optimism': bool,
'pride': bool,
'realization': bool,
'relief': bool,
'remorse': bool,
'sadness': bool,
'surprise': bool,
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
تحسین | تانسور | بوول | ||
تفریحی | تانسور | بوول | ||
عصبانیت | تانسور | بوول | ||
مزاحمت | تانسور | بوول | ||
تصویب | تانسور | بوول | ||
مراقبت | تانسور | بوول | ||
نظر_متن | متن | رشته | ||
گیجی | تانسور | بوول | ||
کنجکاوی | تانسور | بوول | ||
میل | تانسور | بوول | ||
ناامیدی | تانسور | بوول | ||
عدم تایید | تانسور | بوول | ||
انزجار | تانسور | بوول | ||
خجالت | تانسور | بوول | ||
هیجان | تانسور | بوول | ||
ترس | تانسور | بوول | ||
حق شناسی | تانسور | بوول | ||
غم و اندوه | تانسور | بوول | ||
شادی | تانسور | بوول | ||
عشق | تانسور | بوول | ||
عصبی بودن | تانسور | بوول | ||
خنثی | تانسور | بوول | ||
خوش بینی | تانسور | بوول | ||
غرور | تانسور | بوول | ||
تحقق | تانسور | بوول | ||
تسکین | تانسور | بوول | ||
پشیمانی | تانسور | بوول | ||
غمگینی | تانسور | بوول | ||
تعجب | تانسور | بوول |
کلیدهای نظارت شده (به
as_supervised
doc مراجعه کنید):None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@inproceedings{demszky-2020-goemotions,
title = "{G}o{E}motions: A Dataset of Fine-Grained Emotions",
author = "Demszky, Dorottya and
Movshovitz-Attias, Dana and
Ko, Jeongwoo and
Cowen, Alan and
Nemade, Gaurav and
Ravi, Sujith",
booktitle = "Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics",
month = jul,
year = "2020",
address = "Online",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/2020.acl-main.372",
pages = "4040--4054",
}