- Açıklama :
Sentiment140, Twitter'da bir markanın, ürünün veya konunun duygusunu keşfetmenizi sağlar.
Veriler, ifade simgeleri kaldırılmış bir CSV'dir. Veri dosyası biçiminde 6 alan vardır:
- tweet'in polaritesi (0 = negatif, 2 = nötr, 4 = pozitif)
- tweetin kimliği (2087)
- tweet tarihi (16 Mayıs Cmt 23:58:44 UTC 2009)
- sorgu (lyx). Sorgu yoksa, bu değer NO_QUERY'dir.
- tweet atan kullanıcı (robotickilldozr)
- tweet'in metni (Lyx harikadır)
Daha fazla bilgi için https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf adresindeki Uzaktan Denetimli Twitter Duyarlılık Sınıflandırması belgesine bakın.
Ana Sayfa : http://help.sensement140.com/home
Kaynak kodu :
tfds.datasets.sentiment140.Builder
sürümler :
-
1.0.0
(varsayılan): Sürüm notu yok.
-
İndirme boyutu :
77.59 MiB
Veri kümesi boyutu :
305.13 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
Bölmek | örnekler |
---|---|
'test' | 498 |
'train' | 1.600.000 |
- Özellik yapısı :
FeaturesDict({
'date': Text(shape=(), dtype=string),
'polarity': int32,
'query': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
'user': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Açıklama |
---|---|---|---|---|
ÖzelliklerDict | ||||
tarih | Metin | sicim | ||
polarite | tensör | int32 | ||
sorgu | Metin | sicim | ||
metin | Metin | sicim | ||
kullanıcı | Metin | sicim |
Denetlenen tuşlar (Bkz
as_supervised
doc ):('text', 'polarity')
Şekil ( tfds.show_examples ): Desteklenmiyor.
Örnekler ( tfds.as_dataframe ):
- Alıntı :
@ONLINE {Sentiment140,
author = "Go, Alec and Bhayani, Richa and Huang, Lei",
title = "Twitter Sentiment Classification using Distant Supervision",
year = "2009",
url = "http://help.sentiment140.com/home"
}