อ้างอิง:
ห้องน้ำในตัว
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:paws-x/en')
- คำอธิบาย :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.
This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.
For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)
Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
- ใบอนุญาต : ชุดข้อมูลอาจนำไปใช้ได้อย่างอิสระเพื่อวัตถุประสงค์ใดๆ ก็ตาม แม้ว่าจะได้รับการยอมรับจาก Google LLC ("Google") ว่าเป็นแหล่งข้อมูลก็ตาม ชุดข้อมูลมีให้ "ตามที่เป็น" โดยไม่มีการรับประกันใดๆ ทั้งโดยชัดแจ้งหรือโดยนัย Google ไม่มีส่วนรับผิดต่อความเสียหายใดๆ ทั้งทางตรงและทางอ้อมอันเป็นผลมาจากการใช้ชุดข้อมูล
- เวอร์ชั่น : 1.1.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 49401 |
'validation' | 2000 |
- คุณสมบัติ :
{
"id": {
"dtype": "int32",
"id": null,
"_type": "Value"
},
"sentence1": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"sentence2": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"label": {
"num_classes": 2,
"names": [
"0",
"1"
],
"names_file": null,
"id": null,
"_type": "ClassLabel"
}
}
เดอ
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:paws-x/de')
- คำอธิบาย :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.
This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.
For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)
Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
- ใบอนุญาต : ชุดข้อมูลอาจนำไปใช้ได้อย่างอิสระเพื่อวัตถุประสงค์ใดๆ ก็ตาม แม้ว่าจะได้รับการยอมรับจาก Google LLC ("Google") ว่าเป็นแหล่งข้อมูลก็ตาม ชุดข้อมูลมีให้ "ตามที่เป็น" โดยไม่มีการรับประกันใดๆ ทั้งโดยชัดแจ้งหรือโดยนัย Google ไม่มีส่วนรับผิดต่อความเสียหายใดๆ ทั้งทางตรงและทางอ้อมอันเป็นผลมาจากการใช้ชุดข้อมูล
- เวอร์ชั่น : 1.1.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 49401 |
'validation' | 2000 |
- คุณสมบัติ :
{
"id": {
"dtype": "int32",
"id": null,
"_type": "Value"
},
"sentence1": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"sentence2": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"label": {
"num_classes": 2,
"names": [
"0",
"1"
],
"names_file": null,
"id": null,
"_type": "ClassLabel"
}
}
เช่น
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:paws-x/es')
- คำอธิบาย :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.
This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.
For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)
Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
- ใบอนุญาต : ชุดข้อมูลอาจนำไปใช้ได้อย่างอิสระเพื่อวัตถุประสงค์ใดๆ ก็ตาม แม้ว่าจะได้รับการยอมรับจาก Google LLC ("Google") ว่าเป็นแหล่งข้อมูลก็ตาม ชุดข้อมูลมีให้ "ตามที่เป็น" โดยไม่มีการรับประกันใดๆ ทั้งโดยชัดแจ้งหรือโดยนัย Google ไม่มีส่วนรับผิดต่อความเสียหายใดๆ ทั้งทางตรงและทางอ้อมอันเป็นผลมาจากการใช้ชุดข้อมูล
- เวอร์ชั่น : 1.1.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 49401 |
'validation' | 2000 |
- คุณสมบัติ :
{
"id": {
"dtype": "int32",
"id": null,
"_type": "Value"
},
"sentence1": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"sentence2": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"label": {
"num_classes": 2,
"names": [
"0",
"1"
],
"names_file": null,
"id": null,
"_type": "ClassLabel"
}
}
ศ
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:paws-x/fr')
- คำอธิบาย :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.
This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.
For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)
Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
- ใบอนุญาต : ชุดข้อมูลอาจนำไปใช้ได้อย่างอิสระเพื่อวัตถุประสงค์ใดๆ ก็ตาม แม้ว่าจะได้รับการยอมรับจาก Google LLC ("Google") ว่าเป็นแหล่งข้อมูลก็ตาม ชุดข้อมูลมีให้ "ตามที่เป็น" โดยไม่มีการรับประกันใดๆ ทั้งโดยชัดแจ้งหรือโดยนัย Google ไม่มีส่วนรับผิดต่อความเสียหายใดๆ ทั้งทางตรงและทางอ้อมอันเป็นผลมาจากการใช้ชุดข้อมูล
- เวอร์ชั่น : 1.1.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 49401 |
'validation' | 2000 |
- คุณสมบัติ :
{
"id": {
"dtype": "int32",
"id": null,
"_type": "Value"
},
"sentence1": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"sentence2": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"label": {
"num_classes": 2,
"names": [
"0",
"1"
],
"names_file": null,
"id": null,
"_type": "ClassLabel"
}
}
ใช่แล้ว
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:paws-x/ja')
- คำอธิบาย :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.
This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.
For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)
Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
- ใบอนุญาต : ชุดข้อมูลอาจนำไปใช้ได้อย่างอิสระเพื่อวัตถุประสงค์ใดๆ ก็ตาม แม้ว่าจะได้รับการยอมรับจาก Google LLC ("Google") ว่าเป็นแหล่งข้อมูลก็ตาม ชุดข้อมูลมีให้ "ตามที่เป็น" โดยไม่มีการรับประกันใดๆ ทั้งโดยชัดแจ้งหรือโดยนัย Google ไม่มีส่วนรับผิดต่อความเสียหายใดๆ ทั้งทางตรงและทางอ้อมอันเป็นผลมาจากการใช้ชุดข้อมูล
- เวอร์ชั่น : 1.1.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 49401 |
'validation' | 2000 |
- คุณสมบัติ :
{
"id": {
"dtype": "int32",
"id": null,
"_type": "Value"
},
"sentence1": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"sentence2": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"label": {
"num_classes": 2,
"names": [
"0",
"1"
],
"names_file": null,
"id": null,
"_type": "ClassLabel"
}
}
เกาะ
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:paws-x/ko')
- คำอธิบาย :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.
This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.
For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)
Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
- ใบอนุญาต : ชุดข้อมูลอาจนำไปใช้ได้อย่างอิสระเพื่อวัตถุประสงค์ใดๆ ก็ตาม แม้ว่าจะได้รับการยอมรับจาก Google LLC ("Google") ว่าเป็นแหล่งข้อมูลก็ตาม ชุดข้อมูลมีให้ "ตามที่เป็น" โดยไม่มีการรับประกันใดๆ ทั้งโดยชัดแจ้งหรือโดยนัย Google ไม่มีส่วนรับผิดต่อความเสียหายใดๆ ทั้งทางตรงและทางอ้อมอันเป็นผลมาจากการใช้ชุดข้อมูล
- เวอร์ชั่น : 1.1.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 49401 |
'validation' | 2000 |
- คุณสมบัติ :
{
"id": {
"dtype": "int32",
"id": null,
"_type": "Value"
},
"sentence1": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"sentence2": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"label": {
"num_classes": 2,
"names": [
"0",
"1"
],
"names_file": null,
"id": null,
"_type": "ClassLabel"
}
}
จ
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:paws-x/zh')
- คำอธิบาย :
PAWS-X, a multilingual version of PAWS (Paraphrase Adversaries from Word Scrambling) for six languages.
This dataset contains 23,659 human translated PAWS evaluation pairs and 296,406 machine
translated training pairs in six typologically distinct languages: French, Spanish, German,
Chinese, Japanese, and Korean. English language is available by default. All translated
pairs are sourced from examples in PAWS-Wiki.
For further details, see the accompanying paper: PAWS-X: A Cross-lingual Adversarial Dataset
for Paraphrase Identification (https://arxiv.org/abs/1908.11828)
Note: There might be some missing or wrong labels in the dataset and we have replaced them with -1.
- ใบอนุญาต : ชุดข้อมูลอาจนำไปใช้ได้อย่างอิสระเพื่อวัตถุประสงค์ใดๆ ก็ตาม แม้ว่าจะได้รับการยอมรับจาก Google LLC ("Google") ว่าเป็นแหล่งข้อมูลก็ตาม ชุดข้อมูลมีให้ "ตามที่เป็น" โดยไม่มีการรับประกันใดๆ ทั้งโดยชัดแจ้งหรือโดยนัย Google ไม่มีส่วนรับผิดต่อความเสียหายใดๆ ทั้งทางตรงและทางอ้อมอันเป็นผลมาจากการใช้ชุดข้อมูล
- เวอร์ชั่น : 1.1.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 49401 |
'validation' | 2000 |
- คุณสมบัติ :
{
"id": {
"dtype": "int32",
"id": null,
"_type": "Value"
},
"sentence1": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"sentence2": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"label": {
"num_classes": 2,
"names": [
"0",
"1"
],
"names_file": null,
"id": null,
"_type": "ClassLabel"
}
}