tiếng Urdu_sentiment_corpus

Tài liệu tham khảo:

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:urdu_sentiment_corpus')
  • Sự miêu tả :
Urdu Sentiment Corpus (USC) shares the dat of Urdu tweets for the sentiment analysis and polarity detection.
The dataset is consisting of tweets and overall, the dataset is comprising over 17, 185 tokens
with 52% records as positive, and 48 % records as negative.
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.0.0
  • Chia tách :
Tách ra Ví dụ
'train' 1000
  • Đặc trưng :
    "sentence": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "sentiment": {
        "num_classes": 3,
        "names": [
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"