duygu140

  • Açıklama :

Sentiment140, Twitter'da bir markanın, ürünün veya konunun duygusunu keşfetmenizi sağlar.

Veriler, ifade simgeleri kaldırılmış bir CSV'dir. Veri dosyası biçiminde 6 alan vardır:

  1. tweet'in polaritesi (0 = negatif, 2 = nötr, 4 = pozitif)
  2. tweetin kimliği (2087)
  3. tweet tarihi (16 Mayıs Cmt 23:58:44 UTC 2009)
  4. sorgu (lyx). Sorgu yoksa, bu değer NO_QUERY'dir.
  5. tweet atan kullanıcı (robotickilldozr)
  6. tweet'in metni (Lyx harikadır)

Daha fazla bilgi için https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf adresindeki Uzaktan Denetimli Twitter Duyarlılık Sınıflandırması belgesine bakın.

Bölmek örnekler
'test' 498
'train' 1.600.000
  • Özellik yapısı :
FeaturesDict({
    'date': Text(shape=(), dtype=string),
    'polarity': int32,
    'query': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
    'user': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Açıklama
ÖzelliklerDict
tarih Metin sicim
polarite tensör int32
sorgu Metin sicim
metin Metin sicim
kullanıcı Metin sicim
  • Alıntı :
@ONLINE {Sentiment140,
    author = "Go, Alec and Bhayani, Richa and Huang, Lei",
    title  = "Twitter Sentiment Classification using Distant Supervision",
    year   = "2009",
    url    = "http://help.sentiment140.com/home"
}