multi_re_qa

Tài liệu tham khảo:

Tìm kiếmQA

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:multi_re_qa/SearchQA')
  • Sự miêu tả :
MultiReQA contains the sentence boundary annotation from eight publicly available QA datasets including SearchQA, TriviaQA, HotpotQA, NaturalQuestions, SQuAD, BioASQ, RelationExtraction, and TextbookQA. Five of these datasets, including SearchQA, TriviaQA, HotpotQA, NaturalQuestions, SQuAD, contain both training and test data, and three, including BioASQ, RelationExtraction, TextbookQA, contain only the test data
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.0.0
  • Chia tách :
Tách ra Ví dụ
'train' 3163801
'validation' 454836
  • Đặc trưng :
{
    "candidate_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "response_start": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "response_end": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    }
}

TriviaQA

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:multi_re_qa/TriviaQA')
  • Sự miêu tả :
MultiReQA contains the sentence boundary annotation from eight publicly available QA datasets including SearchQA, TriviaQA, HotpotQA, NaturalQuestions, SQuAD, BioASQ, RelationExtraction, and TextbookQA. Five of these datasets, including SearchQA, TriviaQA, HotpotQA, NaturalQuestions, SQuAD, contain both training and test data, and three, including BioASQ, RelationExtraction, TextbookQA, contain only the test data
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.0.0
  • Chia tách :
Tách ra Ví dụ
'train' 1893674
'validation' 238339
  • Đặc trưng :
{
    "candidate_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "response_start": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "response_end": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    }
}

LẩuQA

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:multi_re_qa/HotpotQA')
  • Sự miêu tả :
MultiReQA contains the sentence boundary annotation from eight publicly available QA datasets including SearchQA, TriviaQA, HotpotQA, NaturalQuestions, SQuAD, BioASQ, RelationExtraction, and TextbookQA. Five of these datasets, including SearchQA, TriviaQA, HotpotQA, NaturalQuestions, SQuAD, contain both training and test data, and three, including BioASQ, RelationExtraction, TextbookQA, contain only the test data
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.0.0
  • Chia tách :
Tách ra Ví dụ
'train' 508879
'validation' 52191
  • Đặc trưng :
{
    "candidate_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "response_start": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "response_end": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    }
}

BIỆT ĐỘI

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:multi_re_qa/SQuAD')
  • Sự miêu tả :
MultiReQA contains the sentence boundary annotation from eight publicly available QA datasets including SearchQA, TriviaQA, HotpotQA, NaturalQuestions, SQuAD, BioASQ, RelationExtraction, and TextbookQA. Five of these datasets, including SearchQA, TriviaQA, HotpotQA, NaturalQuestions, SQuAD, contain both training and test data, and three, including BioASQ, RelationExtraction, TextbookQA, contain only the test data
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.0.0
  • Chia tách :
Tách ra Ví dụ
'train' 95659
'validation' 10642
  • Đặc trưng :
{
    "candidate_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "response_start": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "response_end": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    }
}

Câu hỏi tự nhiên

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:multi_re_qa/NaturalQuestions')
  • Sự miêu tả :
MultiReQA contains the sentence boundary annotation from eight publicly available QA datasets including SearchQA, TriviaQA, HotpotQA, NaturalQuestions, SQuAD, BioASQ, RelationExtraction, and TextbookQA. Five of these datasets, including SearchQA, TriviaQA, HotpotQA, NaturalQuestions, SQuAD, contain both training and test data, and three, including BioASQ, RelationExtraction, TextbookQA, contain only the test data
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.0.0
  • Chia tách :
Tách ra Ví dụ
'train' 448355
'validation' 22118
  • Đặc trưng :
{
    "candidate_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "response_start": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "response_end": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    }
}

BioASQ

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:multi_re_qa/BioASQ')
  • Sự miêu tả :
MultiReQA contains the sentence boundary annotation from eight publicly available QA datasets including SearchQA, TriviaQA, HotpotQA, NaturalQuestions, SQuAD, BioASQ, RelationExtraction, and TextbookQA. Five of these datasets, including SearchQA, TriviaQA, HotpotQA, NaturalQuestions, SQuAD, contain both training and test data, and three, including BioASQ, RelationExtraction, TextbookQA, contain only the test data
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.0.0
  • Chia tách :
Tách ra Ví dụ
'test' 14158
  • Đặc trưng :
{
    "candidate_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "response_start": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "response_end": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    }
}

Quan hệTrích xuất

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:multi_re_qa/RelationExtraction')
  • Sự miêu tả :
MultiReQA contains the sentence boundary annotation from eight publicly available QA datasets including SearchQA, TriviaQA, HotpotQA, NaturalQuestions, SQuAD, BioASQ, RelationExtraction, and TextbookQA. Five of these datasets, including SearchQA, TriviaQA, HotpotQA, NaturalQuestions, SQuAD, contain both training and test data, and three, including BioASQ, RelationExtraction, TextbookQA, contain only the test data
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.0.0
  • Chia tách :
Tách ra Ví dụ
'test' 3301
  • Đặc trưng :
{
    "candidate_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "response_start": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "response_end": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    }
}

Sách giáo khoaQA

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:multi_re_qa/TextbookQA')
  • Sự miêu tả :
MultiReQA contains the sentence boundary annotation from eight publicly available QA datasets including SearchQA, TriviaQA, HotpotQA, NaturalQuestions, SQuAD, BioASQ, RelationExtraction, and TextbookQA. Five of these datasets, including SearchQA, TriviaQA, HotpotQA, NaturalQuestions, SQuAD, contain both training and test data, and three, including BioASQ, RelationExtraction, TextbookQA, contain only the test data
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.0.0
  • Chia tách :
Tách ra Ví dụ
'test' 71147
  • Đặc trưng :
{
    "candidate_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "response_start": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "response_end": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    }
}

DuoRC

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:multi_re_qa/DuoRC')
  • Sự miêu tả :
MultiReQA contains the sentence boundary annotation from eight publicly available QA datasets including SearchQA, TriviaQA, HotpotQA, NaturalQuestions, SQuAD, BioASQ, RelationExtraction, and TextbookQA. Five of these datasets, including SearchQA, TriviaQA, HotpotQA, NaturalQuestions, SQuAD, contain both training and test data, and three, including BioASQ, RelationExtraction, TextbookQA, contain only the test data
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.0.0
  • Chia tách :
Tách ra Ví dụ
'test' 5525
  • Đặc trưng :
{
    "candidate_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "response_start": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "response_end": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    }
}