Riferimenti:
etichettato_finale
Utilizzare il comando seguente per caricare questo set di dati in TFDS:
ds = tfds.load('huggingface:paws/labeled_final')
- Descrizione :
PAWS: Paraphrase Adversaries from Word Scrambling
This dataset contains 108,463 human-labeled and 656k noisily labeled pairs that feature
the importance of modeling structure, context, and word order information for the problem
of paraphrase identification. The dataset has two subsets, one based on Wikipedia and the
other one based on the Quora Question Pairs (QQP) dataset.
For further details, see the accompanying paper: PAWS: Paraphrase Adversaries from Word Scrambling
(https://arxiv.org/abs/1904.01130)
PAWS-QQP is not available due to license of QQP. It must be reconstructed by downloading the original
data and then running our scripts to produce the data and attach the labels.
Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
- Licenza : il set di dati può essere utilizzato liberamente per qualsiasi scopo, anche se sarebbe apprezzato il riconoscimento di Google LLC ("Google") come fonte dei dati. Il set di dati viene fornito "COSÌ COM'È" senza alcuna garanzia, espressa o implicita. Google declina ogni responsabilità per eventuali danni, diretti o indiretti, derivanti dall'utilizzo del set di dati.
- Versione : 1.1.0
- Divide :
Diviso | Esempi |
---|---|
'test' | 8000 |
'train' | 49401 |
'validation' | 8000 |
- Caratteristiche :
{
"id": {
"dtype": "int32",
"id": null,
"_type": "Value"
},
"sentence1": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"sentence2": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"label": {
"num_classes": 2,
"names": [
"0",
"1"
],
"names_file": null,
"id": null,
"_type": "ClassLabel"
}
}
etichettato_scambia
Utilizzare il comando seguente per caricare questo set di dati in TFDS:
ds = tfds.load('huggingface:paws/labeled_swap')
- Descrizione :
PAWS: Paraphrase Adversaries from Word Scrambling
This dataset contains 108,463 human-labeled and 656k noisily labeled pairs that feature
the importance of modeling structure, context, and word order information for the problem
of paraphrase identification. The dataset has two subsets, one based on Wikipedia and the
other one based on the Quora Question Pairs (QQP) dataset.
For further details, see the accompanying paper: PAWS: Paraphrase Adversaries from Word Scrambling
(https://arxiv.org/abs/1904.01130)
PAWS-QQP is not available due to license of QQP. It must be reconstructed by downloading the original
data and then running our scripts to produce the data and attach the labels.
Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
- Licenza : il set di dati può essere utilizzato liberamente per qualsiasi scopo, anche se sarebbe apprezzato il riconoscimento di Google LLC ("Google") come fonte dei dati. Il set di dati viene fornito "COSÌ COM'È" senza alcuna garanzia, espressa o implicita. Google declina ogni responsabilità per eventuali danni, diretti o indiretti, derivanti dall'utilizzo del set di dati.
- Versione : 1.1.0
- Divide :
Diviso | Esempi |
---|---|
'train' | 30397 |
- Caratteristiche :
{
"id": {
"dtype": "int32",
"id": null,
"_type": "Value"
},
"sentence1": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"sentence2": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"label": {
"num_classes": 2,
"names": [
"0",
"1"
],
"names_file": null,
"id": null,
"_type": "ClassLabel"
}
}
senzaetichetta_final
Utilizzare il comando seguente per caricare questo set di dati in TFDS:
ds = tfds.load('huggingface:paws/unlabeled_final')
- Descrizione :
PAWS: Paraphrase Adversaries from Word Scrambling
This dataset contains 108,463 human-labeled and 656k noisily labeled pairs that feature
the importance of modeling structure, context, and word order information for the problem
of paraphrase identification. The dataset has two subsets, one based on Wikipedia and the
other one based on the Quora Question Pairs (QQP) dataset.
For further details, see the accompanying paper: PAWS: Paraphrase Adversaries from Word Scrambling
(https://arxiv.org/abs/1904.01130)
PAWS-QQP is not available due to license of QQP. It must be reconstructed by downloading the original
data and then running our scripts to produce the data and attach the labels.
Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
- Licenza : il set di dati può essere utilizzato liberamente per qualsiasi scopo, anche se sarebbe apprezzato il riconoscimento di Google LLC ("Google") come fonte dei dati. Il set di dati viene fornito "COSÌ COM'È" senza alcuna garanzia, espressa o implicita. Google declina ogni responsabilità per eventuali danni, diretti o indiretti, derivanti dall'utilizzo del set di dati.
- Versione : 1.1.0
- Divide :
Diviso | Esempi |
---|---|
'train' | 645652 |
'validation' | 10000 |
- Caratteristiche :
{
"id": {
"dtype": "int32",
"id": null,
"_type": "Value"
},
"sentence1": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"sentence2": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"label": {
"num_classes": 2,
"names": [
"0",
"1"
],
"names_file": null,
"id": null,
"_type": "ClassLabel"
}
}