Tài liệu tham khảo:
Tiếng Anh
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:hope_edi/english')
- Sự miêu tả :
A Hope Speech dataset for Equality, Diversity and Inclusion (HopeEDI) containing user-generated comments from the social media platform YouTube with 28,451, 20,198 and 10,705 comments in English, Tamil and Malayalam, respectively, manually labelled as containing hope speech or not.
- Giấy phép : Giấy phép quốc tế Creative Commons Ghi công 4.0
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 22762 |
'validation' | 2843 |
- Đặc trưng :
{
"text": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"label": {
"num_classes": 3,
"names": [
"Hope_speech",
"Non_hope_speech",
"not-English"
],
"names_file": null,
"id": null,
"_type": "ClassLabel"
}
}
tamil
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:hope_edi/tamil')
- Sự miêu tả :
A Hope Speech dataset for Equality, Diversity and Inclusion (HopeEDI) containing user-generated comments from the social media platform YouTube with 28,451, 20,198 and 10,705 comments in English, Tamil and Malayalam, respectively, manually labelled as containing hope speech or not.
- Giấy phép : Giấy phép quốc tế Creative Commons Ghi công 4.0
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 16160 |
'validation' | 2018 |
- Đặc trưng :
{
"text": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"label": {
"num_classes": 3,
"names": [
"Hope_speech",
"Non_hope_speech",
"not-Tamil"
],
"names_file": null,
"id": null,
"_type": "ClassLabel"
}
}
tiếng Malayalam
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:hope_edi/malayalam')
- Sự miêu tả :
A Hope Speech dataset for Equality, Diversity and Inclusion (HopeEDI) containing user-generated comments from the social media platform YouTube with 28,451, 20,198 and 10,705 comments in English, Tamil and Malayalam, respectively, manually labelled as containing hope speech or not.
- Giấy phép : Giấy phép quốc tế Creative Commons Ghi công 4.0
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 8564 |
'validation' | 1070 |
- Đặc trưng :
{
"text": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"label": {
"num_classes": 3,
"names": [
"Hope_speech",
"Non_hope_speech",
"not-malayalam"
],
"names_file": null,
"id": null,
"_type": "ClassLabel"
}
}