پنجه-x

مراجع:

en

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:paws-x/en')
  • توضیحات :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.

This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.

For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • مجوز : مجموعه داده ممکن است آزادانه برای هر هدفی مورد استفاده قرار گیرد، اگرچه تأیید Google LLC ("Google") به عنوان منبع داده قدردانی می شود. مجموعه داده "همانطور که هست" بدون هیچ گونه ضمانت، صریح یا ضمنی ارائه شده است. Google مسئولیت هرگونه خسارت مستقیم یا غیرمستقیم ناشی از استفاده از مجموعه داده را رد می کند.
  • نسخه : 1.1.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 49401
'validation' 2000
  • ویژگی ها :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

de

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:paws-x/de')
  • توضیحات :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.

This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.

For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • مجوز : مجموعه داده ممکن است آزادانه برای هر هدفی مورد استفاده قرار گیرد، اگرچه تأیید Google LLC ("Google") به عنوان منبع داده قدردانی می شود. مجموعه داده "همانطور که هست" بدون هیچ گونه ضمانت، صریح یا ضمنی ارائه شده است. Google مسئولیت هرگونه خسارت مستقیم یا غیرمستقیم ناشی از استفاده از مجموعه داده را رد می کند.
  • نسخه : 1.1.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 49401
'validation' 2000
  • ویژگی ها :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

es

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:paws-x/es')
  • توضیحات :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.

This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.

For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • مجوز : مجموعه داده ممکن است آزادانه برای هر هدفی مورد استفاده قرار گیرد، اگرچه تأیید Google LLC ("Google") به عنوان منبع داده قدردانی می شود. مجموعه داده "همانطور که هست" بدون هیچ گونه ضمانت، صریح یا ضمنی ارائه شده است. Google مسئولیت هرگونه خسارت مستقیم یا غیرمستقیم ناشی از استفاده از مجموعه داده را رد می کند.
  • نسخه : 1.1.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 49401
'validation' 2000
  • ویژگی ها :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

fr

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:paws-x/fr')
  • توضیحات :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.

This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.

For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • مجوز : مجموعه داده ممکن است آزادانه برای هر هدفی مورد استفاده قرار گیرد، اگرچه تأیید Google LLC ("Google") به عنوان منبع داده قدردانی می شود. مجموعه داده "همانطور که هست" بدون هیچ گونه ضمانت، صریح یا ضمنی ارائه شده است. Google مسئولیت هرگونه خسارت مستقیم یا غیرمستقیم ناشی از استفاده از مجموعه داده را رد می کند.
  • نسخه : 1.1.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 49401
'validation' 2000
  • ویژگی ها :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

ja

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:paws-x/ja')
  • توضیحات :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.

This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.

For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • مجوز : مجموعه داده ممکن است آزادانه برای هر هدفی مورد استفاده قرار گیرد، اگرچه تأیید Google LLC ("Google") به عنوان منبع داده قدردانی می شود. مجموعه داده "همانطور که هست" بدون هیچ گونه ضمانت، صریح یا ضمنی ارائه شده است. Google مسئولیت هرگونه خسارت مستقیم یا غیرمستقیم ناشی از استفاده از مجموعه داده را رد می کند.
  • نسخه : 1.1.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 49401
'validation' 2000
  • ویژگی ها :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

ko

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:paws-x/ko')
  • توضیحات :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.

This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.

For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • مجوز : مجموعه داده ممکن است آزادانه برای هر هدفی مورد استفاده قرار گیرد، اگرچه تأیید Google LLC ("Google") به عنوان منبع داده قدردانی می شود. مجموعه داده "همانطور که هست" بدون هیچ گونه ضمانت، صریح یا ضمنی ارائه شده است. Google مسئولیت هرگونه خسارت مستقیم یا غیرمستقیم ناشی از استفاده از مجموعه داده را رد می کند.
  • نسخه : 1.1.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 49401
'validation' 2000
  • ویژگی ها :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

zh

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:paws-x/zh')
  • توضیحات :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.

This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.

For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • مجوز : مجموعه داده ممکن است آزادانه برای هر هدفی مورد استفاده قرار گیرد، اگرچه تأیید Google LLC ("Google") به عنوان منبع داده قدردانی می شود. مجموعه داده "همانطور که هست" بدون هیچ گونه ضمانت، صریح یا ضمنی ارائه شده است. Google مسئولیت هرگونه خسارت مستقیم یا غیرمستقیم ناشی از استفاده از مجموعه داده را رد می کند.
  • نسخه : 1.1.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 2000
'train' 49401
'validation' 2000
  • ویژگی ها :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}