kinnews_kirnews

Tài liệu tham khảo:

kinnews_raw

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:kinnews_kirnews/kinnews_raw')
  • Sự miêu tả :
Kinyarwanda and Kirundi news classification datasets
  • Giấy phép : Giấy phép MIT
  • Phiên bản : 0.0.0
  • Chia tách :
Tách ra Ví dụ
'test' 4254
'train' 17014
  • Đặc trưng :
{
    "label": {
        "num_classes": 14,
        "names": [
            "politics",
            "sport",
            "economy",
            "health",
            "entertainment",
            "history",
            "technology",
            "tourism",
            "culture",
            "fashion",
            "religion",
            "environment",
            "education",
            "relationship"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    },
    "kin_label": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "en_label": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "url": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "title": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "content": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}

kinnews_cleaned

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:kinnews_kirnews/kinnews_cleaned')
  • Sự miêu tả :
Kinyarwanda and Kirundi news classification datasets
  • Giấy phép : Giấy phép MIT
  • Phiên bản : 0.0.0
  • Chia tách :
Tách ra Ví dụ
'test' 4254
'train' 17014
  • Đặc trưng :
{
    "label": {
        "num_classes": 14,
        "names": [
            "politics",
            "sport",
            "economy",
            "health",
            "entertainment",
            "history",
            "technology",
            "tourism",
            "culture",
            "fashion",
            "religion",
            "environment",
            "education",
            "relationship"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    },
    "title": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "content": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}

kirnews_raw

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:kinnews_kirnews/kirnews_raw')
  • Sự miêu tả :
Kinyarwanda and Kirundi news classification datasets
  • Giấy phép : Giấy phép MIT
  • Phiên bản : 0.0.0
  • Chia tách :
Tách ra Ví dụ
'test' 923
'train' 3689
  • Đặc trưng :
{
    "label": {
        "num_classes": 14,
        "names": [
            "politics",
            "sport",
            "economy",
            "health",
            "entertainment",
            "history",
            "technology",
            "tourism",
            "culture",
            "fashion",
            "religion",
            "environment",
            "education",
            "relationship"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    },
    "kir_label": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "en_label": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "url": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "title": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "content": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}

kirnews_cleaned

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:kinnews_kirnews/kirnews_cleaned')
  • Sự miêu tả :
Kinyarwanda and Kirundi news classification datasets
  • Giấy phép : Giấy phép MIT
  • Phiên bản : 0.0.0
  • Chia tách :
Tách ra Ví dụ
'test' 923
'train' 3689
  • Đặc trưng :
{
    "label": {
        "num_classes": 14,
        "names": [
            "politics",
            "sport",
            "economy",
            "health",
            "entertainment",
            "history",
            "technology",
            "tourism",
            "culture",
            "fashion",
            "religion",
            "environment",
            "education",
            "relationship"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    },
    "title": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "content": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}