- คำอธิบาย :
แปลชุดข้อมูลตามข้อมูลจาก statmt.org
มีเวอร์ชันสำหรับปีต่างๆ โดยใช้แหล่งข้อมูลหลายแหล่งรวมกัน wmt_translate
พื้นฐานช่วยให้คุณสร้างการกำหนดค่าของคุณเองเพื่อเลือกคู่ข้อมูล/ภาษาของคุณเองโดยสร้าง tfds.translate.wmt.WmtConfig
แบบกำหนดเอง
config = tfds.translate.wmt.WmtConfig(
version="0.0.1",
language_pair=("fr", "de"),
subsets={
tfds.Split.TRAIN: ["commoncrawl_frde"],
tfds.Split.VALIDATION: ["euelections_dev2019"],
},
)
builder = tfds.builder("wmt_translate", config=config)
เอกสารประกอบเพิ่มเติม : สำรวจเอกสารด้วยรหัส
รหัสที่มา :
tfds.translate.Wmt15Translate
รุ่น :
-
1.0.0
(ค่าเริ่มต้น): ไม่มีบันทึกประจำรุ่น
-
คำแนะนำในการดาวน์โหลดด้วยตนเอง : ชุดข้อมูลนี้กำหนดให้คุณต้องดาวน์โหลดแหล่งข้อมูลด้วยตนเองลงใน
download_config.manual_dir
(ค่าเริ่มต้นเป็น~/tensorflow_datasets/downloads/manual/
):
การกำหนดค่า wmt บางส่วนที่นี่จำเป็นต้องดาวน์โหลดด้วยตนเอง โปรดดู wmt.py เพื่อดูเส้นทางที่แน่นอน (และชื่อไฟล์) ที่ต้องดาวน์โหลดแคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
การอ้างอิง :
@InProceedings{bojar-EtAl:2015:WMT,
author = {Bojar, Ond
{r}ej and Chatterjee, Rajen and Federmann, Christian and Haddow, Barry and Huck, Matthias and Hokamp, Chris and Koehn, Philipp and Logacheva, Varvara and Monz, Christof and Negri, Matteo and Post, Matt and Scarton, Carolina and Specia, Lucia and Turchi, Marco},
title = {Findings of the 2015 Workshop on Statistical Machine Translation},
booktitle = {Proceedings of the Tenth Workshop on Statistical Machine Translation},
month = {September},
year = {2015},
address = {Lisbon, Portugal},
publisher = {Association for Computational Linguistics},
pages = {1--46},
url = {http://aclweb.org/anthology/W15-3001}
}
wmt15_translate/cs-en (ค่าเริ่มต้น)
คำอธิบาย การกำหนดค่า: ชุดข้อมูลงานแปล WMT 2015 cs-en
ขนาดการดาวน์โหลด :
1.62 GiB
ขนาดชุดข้อมูล :
2.89 GiB
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2,656 |
'train' | 15,793,126 |
'validation' | 3,003 |
- โครงสร้างคุณลักษณะ :
Translation({
'cs': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
แปล | ||||
ค | ข้อความ | สตริง | ||
th | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('cs', 'en')
ตัวอย่าง ( tfds.as_dataframe ):
wmt15_translate/de-en
คำอธิบาย การกำหนดค่า: WMT 2015 de-en ชุดข้อมูลงานแปล
ขนาดการดาวน์โหลด :
1.62 GiB
ขนาดชุดข้อมูล :
1.37 GiB
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2,169 |
'train' | 4,522,998 |
'validation' | 3,003 |
- โครงสร้างคุณลักษณะ :
Translation({
'de': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
แปล | ||||
เดอ | ข้อความ | สตริง | ||
th | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('de', 'en')
ตัวอย่าง ( tfds.as_dataframe ):
wmt15_translate/fi-en
คำอธิบาย การกำหนดค่า: ชุดข้อมูลงานแปล WMT 2015 fi-en
ขนาดการดาวน์โหลด :
260.51 MiB
ขนาดชุดข้อมูล :
623.22 MiB
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 1,370 |
'train' | 2,073,394 |
'validation' | 1,500 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'fi': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
แปล | ||||
th | ข้อความ | สตริง | ||
ไฟ | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('fi', 'en')
ตัวอย่าง ( tfds.as_dataframe ):
wmt15_translate/fr-th
คำอธิบาย การกำหนดค่า : WMT 2015 fr-en ชุดข้อมูลงานแปล
ขนาดการดาวน์โหลด :
6.24 GiB
ขนาดชุดข้อมูล :
14.65 GiB
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 1,500 |
'train' | 40,853,298 |
'validation' | 4,503 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
แปล | ||||
th | ข้อความ | สตริง | ||
fr | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('fr', 'en')
ตัวอย่าง ( tfds.as_dataframe ):
wmt15_translate/ru-en
คำอธิบาย การกำหนดค่า: ชุดข้อมูลงานแปล WMT 2015 ru-en
ขนาดการดาวน์โหลด :
1.02 GiB
ขนาดชุดข้อมูล :
843.90 MiB
แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2,818 |
'train' | 2,495,081 |
'validation' | 3,003 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
แปล | ||||
th | ข้อความ | สตริง | ||
รู | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('ru', 'en')
ตัวอย่าง ( tfds.as_dataframe ):