Tài liệu tham khảo:
vi
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:medical_dialog/en')
- Sự miêu tả :
The MedDialog dataset (English) contains conversations (in English) between doctors and patients.It has 0.26 million dialogues. The data is continuously growing and more dialogues will be added. The raw dialogues are from healthcaremagic.com and icliniq.com.
All copyrights of the data belong to healthcaremagic.com and icliniq.com.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 229674 |
- Đặc trưng :
{
"file_name": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"dialogue_id": {
"dtype": "int32",
"id": null,
"_type": "Value"
},
"dialogue_url": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"dialogue_turns": {
"feature": {
"speaker": {
"num_classes": 2,
"names": [
"Patient",
"Doctor"
],
"id": null,
"_type": "ClassLabel"
},
"utterance": {
"dtype": "string",
"id": null,
"_type": "Value"
}
},
"length": -1,
"id": null,
"_type": "Sequence"
}
}
zh
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:medical_dialog/zh')
- Sự miêu tả :
The MedDialog dataset (English) contains conversations (in English) between doctors and patients.It has 0.26 million dialogues. The data is continuously growing and more dialogues will be added. The raw dialogues are from healthcaremagic.com and icliniq.com.
All copyrights of the data belong to healthcaremagic.com and icliniq.com.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 1921127 |
- Đặc trưng :
{
"file_name": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"dialogue_id": {
"dtype": "int32",
"id": null,
"_type": "Value"
},
"dialogue_url": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"dialogue_turns": {
"feature": {
"speaker": {
"num_classes": 2,
"names": [
"\u75c5\u4eba",
"\u533b\u751f"
],
"id": null,
"_type": "ClassLabel"
},
"utterance": {
"dtype": "string",
"id": null,
"_type": "Value"
}
},
"length": -1,
"id": null,
"_type": "Sequence"
}
}
đã xử lý.en
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:medical_dialog/processed.en')
- Sự miêu tả :
The MedDialog dataset (English) contains conversations (in English) between doctors and patients.It has 0.26 million dialogues. The data is continuously growing and more dialogues will be added. The raw dialogues are from healthcaremagic.com and icliniq.com.
All copyrights of the data belong to healthcaremagic.com and icliniq.com.
- Giấy phép : Bản quyền
- Phiên bản : 2.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'test' | 61 |
'train' | 482 |
'validation' | 60 |
- Đặc trưng :
{
"description": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"utterances": {
"feature": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"length": -1,
"id": null,
"_type": "Sequence"
}
}
đã xử lý.zh
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:medical_dialog/processed.zh')
- Sự miêu tả :
The MedDialog dataset (English) contains conversations (in English) between doctors and patients.It has 0.26 million dialogues. The data is continuously growing and more dialogues will be added. The raw dialogues are from healthcaremagic.com and icliniq.com.
All copyrights of the data belong to healthcaremagic.com and icliniq.com.
- Giấy phép : Bản quyền
- Phiên bản : 2.0.0
- Chia tách :
Tách ra | Ví dụ |
---|---|
'test' | 340754 |
'train' | 2725989 |
'validation' | 340748 |
- Đặc trưng :
{
"utterances": {
"feature": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"length": -1,
"id": null,
"_type": "Sequence"
}
}