Tài liệu tham khảo:
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:kannada_news')
- Sự miêu tả :
The Kannada news dataset contains only the headlines of news article in three categories:
Entertainment, Tech, and Sports.
The data set contains around 6300 news article headlines which collected from Kannada news websites.
The data set has been cleaned and contains train and test set using which can be used to benchmark
classification models in Kannada.
- Giấy phép : CC BY-SA 4.0
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 5167 |
'validation' | 1293 |
- Đặc trưng :
{
"headline": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"label": {
"num_classes": 3,
"names": [
"sports",
"tech",
"entertainment"
],
"names_file": null,
"id": null,
"_type": "ClassLabel"
}
}