- الوصف :
يسمح لك Sentiment140 باكتشاف شعور العلامة التجارية أو المنتج أو الموضوع على Twitter.
البيانات عبارة عن ملف CSV مع إزالة الرموز. يحتوي تنسيق ملف البيانات على 6 حقول:
- قطبية التغريدة (0 = سلبي ، 2 = محايد ، 4 = إيجابي)
- معرف التغريدة (2087)
- تاريخ التغريدة (السبت 16 مايو 23:58:44 بالتوقيت العالمي المنسق 2009)
- الاستعلام (ليكس). إذا لم يكن هناك استعلام ، فهذه القيمة هي NO_QUERY.
- المستخدم الذي غرد (robotickilldozr)
- نص التغريدة (Lyx رائع)
لمزيد من المعلومات ، راجع مقالة تصنيف مشاعر Twitter مع الإشراف البعيد على https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf
وثائق إضافية : استكشف في الأوراق باستخدام الرمز
الصفحة الرئيسية : http://help.sentiment140.com/home
كود المصدر :
tfds.datasets.sentiment140.Builder
إصدارات :
-
1.0.0
(افتراضي): لا توجد ملاحظات حول الإصدار.
-
حجم التحميل :
77.59 MiB
حجم مجموعة البيانات :
305.13 MiB
التخزين المؤقت التلقائي ( التوثيق ): لا
الانقسامات :
انشق، مزق | أمثلة |
---|---|
'test' | 498 |
'train' | 1،600،000 |
- هيكل الميزة :
FeaturesDict({
'date': Text(shape=(), dtype=string),
'polarity': int32,
'query': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
'user': Text(shape=(), dtype=string),
})
- وثائق الميزة :
ميزة | فصل | شكل | نوع | وصف |
---|---|---|---|---|
الميزات | ||||
تاريخ | نص | سلسلة | ||
قطبية | موتر | int32 | ||
استفسار | نص | سلسلة | ||
نص | نص | سلسلة | ||
المستعمل | نص | سلسلة |
المفاتيح الخاضعة للإشراف (انظر المستند
as_supervised
):('text', 'polarity')
الشكل ( tfds.show_examples ): غير مدعوم.
أمثلة ( tfds.as_dataframe ):
- الاقتباس :
@ONLINE {Sentiment140,
author = "Go, Alec and Bhayani, Richa and Huang, Lei",
title = "Twitter Sentiment Classification using Distant Supervision",
year = "2009",
url = "http://help.sentiment140.com/home"
}