telugu_news

Tài liệu tham khảo:

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:telugu_news')
  • Sự miêu tả :
This dataset contains Telugu language news articles along with respective
topic labels (business, editorial, entertainment, nation, sport) extracted from
the daily Andhra Jyoti. This dataset could be used to build Classification and Language Models.
  • Giấy phép : Tệp dữ liệu © Tác giả gốc
  • Phiên bản : 1.1.0
  • Chia tách :
Tách ra Ví dụ
'test' 4329
'train' 17312
  • Đặc trưng :
{
    "sno": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "date": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "heading": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "body": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "topic": {
        "num_classes": 5,
        "names": [
            "business",
            "editorial",
            "entertainment",
            "nation",
            "sports"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}