- Descrizione :
Sentiment140 ti consente di scoprire il sentimento di un marchio, prodotto o argomento su Twitter.
I dati sono un CSV con le emoticon rimosse. Il formato del file di dati ha 6 campi:
- la polarità del tweet (0=negativo, 2=neutro, 4=positivo)
- l'id del tweet (2087)
- la data del tweet (Sat May 16 23:58:44 UTC 2009)
- la domanda (lyx). Se non è presente alcuna query, questo valore è NO_QUERY.
- l'utente che ha twittato (robotickilldozr)
- il testo del tweet (Lyx è figo)
Per ulteriori informazioni, fare riferimento al documento Twitter Sentiment Classification with Distant Supervision su https://cs.stanford.edu/people/alecmgo/papers/TwitterDistantSupervision09.pdf
Documentazione aggiuntiva : Esplora documenti con codice
Pagina iniziale : http://help.sentiment140.com/home
Codice sorgente :
tfds.datasets.sentiment140.Builder
Versioni :
-
1.0.0
(impostazione predefinita): nessuna nota di rilascio.
-
Dimensione del download :
77.59 MiB
Dimensione del set di dati:
305.13 MiB
Cache automatica ( documentazione ): No
Divisioni :
Diviso | Esempi |
---|---|
'test' | 498 |
'train' | 1.600.000 |
- Struttura delle caratteristiche :
FeaturesDict({
'date': Text(shape=(), dtype=string),
'polarity': int32,
'query': Text(shape=(), dtype=string),
'text': Text(shape=(), dtype=string),
'user': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
CaratteristicheDict | ||||
Data | Testo | corda | ||
polarità | Tensore | int32 | ||
domanda | Testo | corda | ||
testo | Testo | corda | ||
utente | Testo | corda |
Tasti supervisionati (Vedi
as_supervised
doc ):('text', 'polarity')
Figura ( tfds.show_examples ): non supportato.
Esempi ( tfds.as_dataframe ):
- Citazione :
@ONLINE {Sentiment140,
author = "Go, Alec and Bhayani, Richa and Huang, Lei",
title = "Twitter Sentiment Classification using Distant Supervision",
year = "2009",
url = "http://help.sentiment140.com/home"
}