- 説明:
Sentiment140 を使用すると、Twitter でブランド、製品、またはトピックのセンチメントを発見できます。
データは、絵文字が削除された CSV です。データ ファイル形式には 6 つのフィールドがあります。
- ツイートの極性 (0 = ネガティブ、2 = ニュートラル、4 = ポジティブ)
- ツイートのID (2087)
- ツイートの日付 (Sat May 16 23:58:44 UTC 2009)
- クエリ (lyx)。クエリがない場合、この値は NO_QUERY です。
- ツイートしたユーザー (robotickilldozr)
- ツイートのテキスト (Lyx はクールです)
詳細については、 https: //cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf にある論文「遠隔監視による Twitter 感情分類」を参照してください。
追加のドキュメント:コード を使用したペーパーの探索
ソース コード:
tfds.datasets.sentiment140.Builder
バージョン:
-
1.0.0
(デフォルト): リリース ノートはありません。
-
ダウンロードサイズ:
77.59 MiB
データセットのサイズ:
305.13 MiB
自動キャッシュ(ドキュメント): いいえ
スプリット:
スプリット | 例 |
---|---|
'test' | 498 |
'train' | 160万 |
- 機能構造:
FeaturesDict({
'date': Text(shape=(), dtype=string),
'polarity': int32,
'query': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
'user': Text(shape=(), dtype=string),
})
- 機能のドキュメント:
特徴 | クラス | 形 | Dtype | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
日にち | 文章 | ストリング | ||
極性 | テンソル | int32 | ||
クエリ | 文章 | ストリング | ||
文章 | 文章 | ストリング | ||
ユーザー | 文章 | ストリング |
監視されたキー(
as_supervised
docを参照):('text', 'polarity')
図( tfds.show_examples ): サポートされていません。
例( tfds.as_dataframe ):
- 引用:
@ONLINE {Sentiment140,
author = "Go, Alec and Bhayani, Richa and Huang, Lei",
title = "Twitter Sentiment Classification using Distant Supervision",
year = "2009",
url = "http://help.sentiment140.com/home"
}