keo dán

Tài liệu tham khảo:


Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:xglue/ner')
  • Sự miêu tả :
XGLUE is a new benchmark dataset to evaluate the performance of cross-lingual pre-trained
models with respect to cross-lingual natural language understanding and generation.
The benchmark is composed of the following 11 tasks:
- POS Tagging (POS)
- News Classification (NC)
- Query-Ad Matching (QADSM)
- Web Page Ranking (WPR)
- QA Matching (QAM)
- Question Generation (QG)
- News Title Generation (NTG)

For more information, please take a look at
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.0.0
  • Chia tách :
Tách ra Ví dụ
'' 3007
'test.en' 3454
'' 1523
'' 5202
'train' 14042
'' 2874
'validation.en' 3252
'' 1923
'' 2895
  • Đặc trưng :
    "words": {
        "feature": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        "length": -1,
        "id": null,
        "_type": "Sequence"
    "ner": {
        "feature": {
            "num_classes": 9,
            "names": [
            "names_file": null,
            "id": null,
            "_type": "ClassLabel"
        "length": -1,
        "id": null,
        "_type": "Sequence"

tư thế

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:xglue/pos')
  • Sự miêu tả :
XGLUE is a new benchmark dataset to evaluate the performance of cross-lingual pre-trained
models with respect to cross-lingual natural language understanding and generation.
The benchmark is composed of the following 11 tasks:
- POS Tagging (POS)
- News Classification (NC)
- Query-Ad Matching (QADSM)
- Web Page Ranking (WPR)
- QA Matching (QAM)
- Question Generation (QG)
- News Title Generation (NTG)

For more information, please take a look at
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.0.0
  • Chia tách :
Tách ra Ví dụ
'' 679
'' 1115
'' 976
'test.el' 455
'test.en' 2076
'' 425
'' 415
'test.hi' 1683
'' 481
'' 595
'' 2214
'' 600
'' 497
'' 982
'test.ur' 534
'' 799
'test.zh' 499
'train' 25376
'' 908
'' 1114
'' 798
'validation.el' 402
'validation.en' 2001
'' 1399
'' 1475
'validation.hi' 1658
'' 563
'' 717
'' 2214
'' 578
'' 497
'' 987
'validation.ur' 551
'' 799
'validation.zh' 499
  • Đặc trưng :
    "words": {
        "feature": {
            "dtype": "string",
            "id": null,
            "_type": "Value"
        "length": -1,
        "id": null,
        "_type": "Sequence"
    "pos": {
        "feature": {
            "num_classes": 17,
            "names": [
            "names_file": null,
            "id": null,
            "_type": "ClassLabel"
        "length": -1,
        "id": null,
        "_type": "Sequence"


Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:xglue/mlqa')
  • Sự miêu tả :
XGLUE is a new benchmark dataset to evaluate the performance of cross-lingual pre-trained
models with respect to cross-lingual natural language understanding and generation.
The benchmark is composed of the following 11 tasks:
- POS Tagging (POS)
- News Classification (NC)
- Query-Ad Matching (QADSM)
- Web Page Ranking (WPR)
- QA Matching (QAM)
- Question Generation (QG)
- News Title Generation (NTG)

For more information, please take a look at
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.0.0
  • Chia tách :
Tách ra Ví dụ
'' 5335
'' 4517
'test.en' 11590
'' 5253
'test.hi' 4918
'' 5495
'test.zh' 5137
'train' 87599
'' 517
'' 512
'validation.en' 1148
'' 500
'validation.hi' 507
'' 511
'validation.zh' 504
  • Đặc trưng :
    "context": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "question": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "answers": {
        "feature": {
            "answer_start": {
                "dtype": "int32",
                "id": null,
                "_type": "Value"
            "text": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
        "length": -1,
        "id": null,
        "_type": "Sequence"


Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:xglue/nc')
  • Sự miêu tả :
XGLUE is a new benchmark dataset to evaluate the performance of cross-lingual pre-trained
models with respect to cross-lingual natural language understanding and generation.
The benchmark is composed of the following 11 tasks:
- POS Tagging (POS)
- News Classification (NC)
- Query-Ad Matching (QADSM)
- Web Page Ranking (WPR)
- QA Matching (QAM)
- Question Generation (QG)
- News Title Generation (NTG)

For more information, please take a look at
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.0.0
  • Chia tách :
Tách ra Ví dụ
'' 10000
'test.en' 10000
'' 10000
'' 10000
'' 10000
'train' 100000
'' 10000
'validation.en' 10000
'' 10000
'' 10000
'' 10000
  • Đặc trưng :
    "news_title": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "news_body": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "news_category": {
        "num_classes": 10,
        "names": [
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"


Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:xglue/xnli')
  • Sự miêu tả :
XGLUE is a new benchmark dataset to evaluate the performance of cross-lingual pre-trained
models with respect to cross-lingual natural language understanding and generation.
The benchmark is composed of the following 11 tasks:
- POS Tagging (POS)
- News Classification (NC)
- Query-Ad Matching (QADSM)
- Web Page Ranking (WPR)
- QA Matching (QAM)
- Question Generation (QG)
- News Title Generation (NTG)

For more information, please take a look at
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.0.0
  • Chia tách :
Tách ra Ví dụ
'' 5010
'' 5010
'' 5010
'test.el' 5010
'test.en' 5010
'' 5010
'' 5010
'test.hi' 5010
'' 5010
'test.sw' 5010
'' 5010
'' 5010
'test.ur' 5010
'' 5010
'test.zh' 5010
'train' 392702
'' 2490
'' 2490
'' 2490
'validation.el' 2490
'validation.en' 2490
'' 2490
'' 2490
'validation.hi' 2490
'' 2490
'validation.sw' 2490
'' 2490
'' 2490
'validation.ur' 2490
'' 2490
'validation.zh' 2490
  • Đặc trưng :
    "premise": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "hypothesis": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "label": {
        "num_classes": 3,
        "names": [
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"

bàn chân-x

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:xglue/paws-x')
  • Sự miêu tả :
XGLUE is a new benchmark dataset to evaluate the performance of cross-lingual pre-trained
models with respect to cross-lingual natural language understanding and generation.
The benchmark is composed of the following 11 tasks:
- POS Tagging (POS)
- News Classification (NC)
- Query-Ad Matching (QADSM)
- Web Page Ranking (WPR)
- QA Matching (QAM)
- Question Generation (QG)
- News Title Generation (NTG)

For more information, please take a look at
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.0.0
  • Chia tách :
Tách ra Ví dụ
'' 2000
'test.en' 2000
'' 2000
'' 2000
'train' 49401
'' 2000
'validation.en' 2000
'' 2000
'' 2000
  • Đặc trưng :
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "label": {
        "num_classes": 2,
        "names": [
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"


Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:xglue/qadsm')
  • Sự miêu tả :
XGLUE is a new benchmark dataset to evaluate the performance of cross-lingual pre-trained
models with respect to cross-lingual natural language understanding and generation.
The benchmark is composed of the following 11 tasks:
- POS Tagging (POS)
- News Classification (NC)
- Query-Ad Matching (QADSM)
- Web Page Ranking (WPR)
- QA Matching (QAM)
- Question Generation (QG)
- News Title Generation (NTG)

For more information, please take a look at
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.0.0
  • Chia tách :
Tách ra Ví dụ
'' 10000
'test.en' 10000
'' 10000
'train' 100000
'' 10000
'validation.en' 10000
'' 10000
  • Đặc trưng :
    "query": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "ad_title": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "ad_description": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "relevance_label": {
        "num_classes": 2,
        "names": [
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"


Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:xglue/wpr')
  • Sự miêu tả :
XGLUE is a new benchmark dataset to evaluate the performance of cross-lingual pre-trained
models with respect to cross-lingual natural language understanding and generation.
The benchmark is composed of the following 11 tasks:
- POS Tagging (POS)
- News Classification (NC)
- Query-Ad Matching (QADSM)
- Web Page Ranking (WPR)
- QA Matching (QAM)
- Question Generation (QG)
- News Title Generation (NTG)

For more information, please take a look at
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.0.0
  • Chia tách :
Tách ra Ví dụ
'' 9997
'test.en' 10004
'' 10006
'' 10020
'' 10001
'' 10015
'test.zh' 9999
'train' 99997
'' 10004
'validation.en' 10008
'' 10004
'' 10005
'' 10003
'' 10001
'validation.zh' 10002
  • Đặc trưng :
    "query": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "web_page_title": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "web_page_snippet": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "relavance_label": {
        "num_classes": 5,
        "names": [
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"


Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:xglue/qam')
  • Sự miêu tả :
XGLUE is a new benchmark dataset to evaluate the performance of cross-lingual pre-trained
models with respect to cross-lingual natural language understanding and generation.
The benchmark is composed of the following 11 tasks:
- POS Tagging (POS)
- News Classification (NC)
- Query-Ad Matching (QADSM)
- Web Page Ranking (WPR)
- QA Matching (QAM)
- Question Generation (QG)
- News Title Generation (NTG)

For more information, please take a look at
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.0.0
  • Chia tách :
Tách ra Ví dụ
'' 10000
'test.en' 10000
'' 10000
'train' 100000
'' 10000
'validation.en' 10000
'' 10000
  • Đặc trưng :
    "question": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "answer": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "label": {
        "num_classes": 2,
        "names": [
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"


Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:xglue/qg')
  • Sự miêu tả :
XGLUE is a new benchmark dataset to evaluate the performance of cross-lingual pre-trained
models with respect to cross-lingual natural language understanding and generation.
The benchmark is composed of the following 11 tasks:
- POS Tagging (POS)
- News Classification (NC)
- Query-Ad Matching (QADSM)
- Web Page Ranking (WPR)
- QA Matching (QAM)
- Question Generation (QG)
- News Title Generation (NTG)

For more information, please take a look at
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.0.0
  • Chia tách :
Tách ra Ví dụ
'' 10000
'test.en' 10000
'' 10000
'' 10000
'' 10000
'' 10000
'train' 100000
'' 10000
'validation.en' 10000
'' 10000
'' 10000
'' 10000
'' 10000
  • Đặc trưng :
    "answer_passage": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "question": {
        "dtype": "string",
        "id": null,
        "_type": "Value"


Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:xglue/ntg')
  • Sự miêu tả :
XGLUE is a new benchmark dataset to evaluate the performance of cross-lingual pre-trained
models with respect to cross-lingual natural language understanding and generation.
The benchmark is composed of the following 11 tasks:
- POS Tagging (POS)
- News Classification (NC)
- Query-Ad Matching (QADSM)
- Web Page Ranking (WPR)
- QA Matching (QAM)
- Question Generation (QG)
- News Title Generation (NTG)

For more information, please take a look at
  • Giấy phép : Không có giấy phép được biết đến
  • Phiên bản : 1.0.0
  • Chia tách :
Tách ra Ví dụ
'' 10000
'test.en' 10000
'' 10000
'' 10000
'' 10000
'train' 300000
'' 10000
'validation.en' 10000
'' 10000
'' 10000
'' 10000
  • Đặc trưng :
    "news_body": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    "news_title": {
        "dtype": "string",
        "id": null,
        "_type": "Value"