pn_tóm tắt

Tài liệu tham khảo:

1.0.0

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:pn_summary/1.0.0')
  • Sự miêu tả :
A well-structured summarization dataset for the Persian language consists of 93,207 records. It is prepared for Abstractive/Extractive tasks (like cnn_dailymail for English). It can also be used in other scopes like Text Generation, Title Generation, and News Category Classification.
It is imperative to consider that the newlines were replaced with the `[n]` symbol. Please interpret them into normal newlines (for ex. `t.replace("[n]", "
")`) and then use them for your purposes.
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.0.0
  • Chia tách :
Tách ra Ví dụ
'test' 5593
'train' 82022
'validation' 5592
  • Đặc trưng :
{
    "id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "title": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "article": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "summary": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "category": {
        "num_classes": 18,
        "names": [
            "Economy",
            "Roads-Urban",
            "Banking-Insurance",
            "Agriculture",
            "International",
            "Oil-Energy",
            "Industry",
            "Transportation",
            "Science-Technology",
            "Local",
            "Sports",
            "Politics",
            "Art-Culture",
            "Society",
            "Health",
            "Research",
            "Education-University",
            "Tourism"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    },
    "categories": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "network": {
        "num_classes": 6,
        "names": [
            "Tahlilbazaar",
            "Imna",
            "Shana",
            "Mehr",
            "Irna",
            "Khabaronline"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    },
    "link": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}