- বর্ণনা :
Sentiment140 আপনাকে টুইটারে একটি ব্র্যান্ড, পণ্য বা বিষয়ের অনুভূতি আবিষ্কার করতে দেয়।
ডেটা হল একটি CSV যার ইমোটিকনগুলি সরানো হয়েছে৷ ডেটা ফাইল ফর্ম্যাটে 6 টি ক্ষেত্র রয়েছে:
- টুইটের পোলারিটি (0 = নেতিবাচক, 2 = নিরপেক্ষ, 4 = ইতিবাচক)
- টুইটের আইডি (2087)
- টুইটের তারিখ (শনি মে 16 23:58:44 UTC 2009)
- প্রশ্ন (lyx)। যদি কোন প্রশ্ন না থাকে, তাহলে এই মানটি হল NO_QUERY৷
- যে ব্যবহারকারী টুইট করেছেন (robotickilldozr)
- টুইটের পাঠ্য (লিক্স দুর্দান্ত)
আরও তথ্যের জন্য, https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf- এ দূরবর্তী তদারকি সহ Twitter সেন্টিমেন্ট ক্লাসিফিকেশন কাগজটি দেখুন
হোমপেজ : http://help.sentiment140.com/home
সোর্স কোড :
tfds.datasets.sentiment140.Builder
সংস্করণ :
-
1.0.0
(ডিফল্ট): কোনো রিলিজ নোট নেই।
-
ডাউনলোড সাইজ :
77.59 MiB
ডেটাসেটের আকার :
305.13 MiB
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): না
বিভাজন :
বিভক্ত | উদাহরণ |
---|---|
'test' | 498 |
'train' | 1,600,000 |
- বৈশিষ্ট্য গঠন :
FeaturesDict({
'date': Text(shape=(), dtype=string),
'polarity': int32,
'query': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
'user': Text(shape=(), dtype=string),
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
---|---|---|---|---|
ফিচারসডিক্ট | ||||
তারিখ | পাঠ্য | স্ট্রিং | ||
পোলারিটি | টেনসর | int32 | ||
প্রশ্ন | পাঠ্য | স্ট্রিং | ||
পাঠ্য | পাঠ্য | স্ট্রিং | ||
ব্যবহারকারী | পাঠ্য | স্ট্রিং |
তত্ত্বাবধানে থাকা কীগুলি (
as_supervised
doc হিসাবে ):('text', 'polarity')
চিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদাহরণ ( tfds.as_dataframe ):
- উদ্ধৃতি :
@ONLINE {Sentiment140,
author = "Go, Alec and Bhayani, Richa and Huang, Lei",
title = "Twitter Sentiment Classification using Distant Supervision",
year = "2009",
url = "http://help.sentiment140.com/home"
}