Tài liệu tham khảo:
đối thoại_domain
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:doc2dial/dialogue_domain')
- Sự miêu tả :
Doc2dial is dataset of goal-oriented dialogues that are grounded in the associated documents. It includes over 4500 annotated conversations with an average of 14 turns that are grounded in over 450 documents from four domains. Compared to the prior document-grounded dialogue datasets this dataset covers a variety of dialogue scenes in information-seeking conversations.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.1
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 3474 |
'validation' | 661 |
- Đặc trưng :
{
"dial_id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"doc_id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"domain": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"turns": [
{
"turn_id": {
"dtype": "int32",
"id": null,
"_type": "Value"
},
"role": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"da": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"references": [
{
"sp_id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"label": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}
],
"utterance": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}
]
}
tên miền tài liệu
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:doc2dial/document_domain')
- Sự miêu tả :
Doc2dial is dataset of goal-oriented dialogues that are grounded in the associated documents. It includes over 4500 annotated conversations with an average of 14 turns that are grounded in over 450 documents from four domains. Compared to the prior document-grounded dialogue datasets this dataset covers a variety of dialogue scenes in information-seeking conversations.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.1
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 3416 |
- Đặc trưng :
{
"domain": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"doc_id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"title": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"doc_text": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"spans": [
{
"id_sp": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"tag": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"start_sp": {
"dtype": "int32",
"id": null,
"_type": "Value"
},
"end_sp": {
"dtype": "int32",
"id": null,
"_type": "Value"
},
"text_sp": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"title": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"parent_titles": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"id_sec": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"start_sec": {
"dtype": "int32",
"id": null,
"_type": "Value"
},
"text_sec": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"end_sec": {
"dtype": "int32",
"id": null,
"_type": "Value"
}
}
],
"doc_html_ts": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"doc_html_raw": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}
doc2dial_rc
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:doc2dial/doc2dial_rc')
- Sự miêu tả :
Doc2dial is dataset of goal-oriented dialogues that are grounded in the associated documents. It includes over 4500 annotated conversations with an average of 14 turns that are grounded in over 450 documents from four domains. Compared to the prior document-grounded dialogue datasets this dataset covers a variety of dialogue scenes in information-seeking conversations.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.1
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 20431 |
'validation' | 3972 |
- Đặc trưng :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"title": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"context": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"question": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"answers": {
"feature": {
"text": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"answer_start": {
"dtype": "int32",
"id": null,
"_type": "Value"
}
},
"length": -1,
"id": null,
"_type": "Sequence"
},
"domain": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}
Tài liệu tham khảo:
đối thoại_domain
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:doc2dial/dialogue_domain')
- Sự miêu tả :
Doc2dial is dataset of goal-oriented dialogues that are grounded in the associated documents. It includes over 4500 annotated conversations with an average of 14 turns that are grounded in over 450 documents from four domains. Compared to the prior document-grounded dialogue datasets this dataset covers a variety of dialogue scenes in information-seeking conversations.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.1
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 3474 |
'validation' | 661 |
- Đặc trưng :
{
"dial_id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"doc_id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"domain": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"turns": [
{
"turn_id": {
"dtype": "int32",
"id": null,
"_type": "Value"
},
"role": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"da": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"references": [
{
"sp_id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"label": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}
],
"utterance": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}
]
}
tên miền tài liệu
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:doc2dial/document_domain')
- Sự miêu tả :
Doc2dial is dataset of goal-oriented dialogues that are grounded in the associated documents. It includes over 4500 annotated conversations with an average of 14 turns that are grounded in over 450 documents from four domains. Compared to the prior document-grounded dialogue datasets this dataset covers a variety of dialogue scenes in information-seeking conversations.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.1
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 3416 |
- Đặc trưng :
{
"domain": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"doc_id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"title": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"doc_text": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"spans": [
{
"id_sp": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"tag": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"start_sp": {
"dtype": "int32",
"id": null,
"_type": "Value"
},
"end_sp": {
"dtype": "int32",
"id": null,
"_type": "Value"
},
"text_sp": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"title": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"parent_titles": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"id_sec": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"start_sec": {
"dtype": "int32",
"id": null,
"_type": "Value"
},
"text_sec": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"end_sec": {
"dtype": "int32",
"id": null,
"_type": "Value"
}
}
],
"doc_html_ts": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"doc_html_raw": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}
doc2dial_rc
Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:
ds = tfds.load('huggingface:doc2dial/doc2dial_rc')
- Sự miêu tả :
Doc2dial is dataset of goal-oriented dialogues that are grounded in the associated documents. It includes over 4500 annotated conversations with an average of 14 turns that are grounded in over 450 documents from four domains. Compared to the prior document-grounded dialogue datasets this dataset covers a variety of dialogue scenes in information-seeking conversations.
- Giấy phép : Không có giấy phép được biết đến
- Phiên bản : 1.0.1
- Chia tách :
Tách ra | Ví dụ |
---|---|
'train' | 20431 |
'validation' | 3972 |
- Đặc trưng :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"title": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"context": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"question": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"answers": {
"feature": {
"text": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"answer_start": {
"dtype": "int32",
"id": null,
"_type": "Value"
}
},
"length": -1,
"id": null,
"_type": "Sequence"
},
"domain": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}