پنجه ها

مراجع:

با برچسب_نهایی

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:paws/labeled_final')
  • توضیحات :
PAWS: Paraphrase Adversaries from Word Scrambling

This dataset contains 108,463 human-labeled and 656k noisily labeled pairs that feature
the importance of modeling structure, context, and word order information for the problem
of paraphrase identification. The dataset has two subsets, one based on Wikipedia and the
other one based on the Quora Question Pairs (QQP) dataset.

For further details, see the accompanying paper: PAWS: Paraphrase Adversaries from Word Scrambling
(https://arxiv.org/abs/1904.01130)

PAWS-QQP is not available due to license of QQP. It must be reconstructed by downloading the original
data and then running our scripts to produce the data and attach the labels.

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • مجوز : مجموعه داده ممکن است آزادانه برای هر هدفی مورد استفاده قرار گیرد، اگرچه تأیید Google LLC ("Google") به عنوان منبع داده قدردانی می شود. مجموعه داده "همانطور که هست" بدون هیچ گونه ضمانت، صریح یا ضمنی ارائه شده است. Google مسئولیت هرگونه خسارت مستقیم یا غیرمستقیم ناشی از استفاده از مجموعه داده را رد می کند.
  • نسخه : 1.1.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'test' 8000
'train' 49401
'validation' 8000
  • ویژگی ها :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

labeled_swap

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:paws/labeled_swap')
  • توضیحات :
PAWS: Paraphrase Adversaries from Word Scrambling

This dataset contains 108,463 human-labeled and 656k noisily labeled pairs that feature
the importance of modeling structure, context, and word order information for the problem
of paraphrase identification. The dataset has two subsets, one based on Wikipedia and the
other one based on the Quora Question Pairs (QQP) dataset.

For further details, see the accompanying paper: PAWS: Paraphrase Adversaries from Word Scrambling
(https://arxiv.org/abs/1904.01130)

PAWS-QQP is not available due to license of QQP. It must be reconstructed by downloading the original
data and then running our scripts to produce the data and attach the labels.

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • مجوز : مجموعه داده ممکن است آزادانه برای هر هدفی مورد استفاده قرار گیرد، اگرچه تأیید Google LLC ("Google") به عنوان منبع داده قدردانی می شود. مجموعه داده "همانطور که هست" بدون هیچ گونه ضمانت، صریح یا ضمنی ارائه شده است. Google مسئولیت هرگونه خسارت مستقیم یا غیرمستقیم ناشی از استفاده از مجموعه داده را رد می کند.
  • نسخه : 1.1.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'train' 30397
  • ویژگی ها :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}

بدون برچسب_نهایی

برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:

ds = tfds.load('huggingface:paws/unlabeled_final')
  • توضیحات :
PAWS: Paraphrase Adversaries from Word Scrambling

This dataset contains 108,463 human-labeled and 656k noisily labeled pairs that feature
the importance of modeling structure, context, and word order information for the problem
of paraphrase identification. The dataset has two subsets, one based on Wikipedia and the
other one based on the Quora Question Pairs (QQP) dataset.

For further details, see the accompanying paper: PAWS: Paraphrase Adversaries from Word Scrambling
(https://arxiv.org/abs/1904.01130)

PAWS-QQP is not available due to license of QQP. It must be reconstructed by downloading the original
data and then running our scripts to produce the data and attach the labels.

Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
  • مجوز : مجموعه داده ممکن است آزادانه برای هر هدفی مورد استفاده قرار گیرد، اگرچه تأیید Google LLC ("Google") به عنوان منبع داده قدردانی می شود. مجموعه داده "همانطور که هست" بدون هیچ گونه ضمانت، صریح یا ضمنی ارائه شده است. Google مسئولیت هرگونه خسارت مستقیم یا غیرمستقیم ناشی از استفاده از مجموعه داده را رد می کند.
  • نسخه : 1.1.0
  • تقسیم ها :
تقسیم کنید نمونه ها
'train' 645652
'validation' 10000
  • ویژگی ها :
{
    "id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "sentence1": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence2": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "label": {
        "num_classes": 2,
        "names": [
            "0",
            "1"
        ],
        "names_file": null,
        "id": null,
        "_type": "ClassLabel"
    }
}