- คำอธิบาย :
Web-Scale Parallel Corpora สำหรับภาษาทางการของยุโรป
เอกสารประกอบเพิ่มเติม : สำรวจเอกสารด้วยรหัส
หน้าแรก : https://paracrawl.eu/releases.html
รหัสที่มา :
tfds.datasets.para_crawl.Builder
รุ่น :
-
1.2.0
(ค่าเริ่มต้น): ไม่มีบันทึกประจำรุ่น
-
รูปภาพ ( tfds.show_examples ): ไม่รองรับ
การอ้างอิง :
@misc {paracrawl,
title = "ParaCrawl",
year = "2018",
url = "http://paracrawl.eu/download.html."
}
para_crawl/enbg (การกำหนดค่าเริ่มต้น)
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น bg
ขนาดการดาวน์โหลด :
98.94 MiB
ขนาดชุดข้อมูล :
362.46 MiB
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,039,885 |
- โครงสร้างคุณลักษณะ :
Translation({
'bg': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
แปล | ||||
บีจี | ข้อความ | สตริง | ||
th | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('en', 'bg')
ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/encs
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น cs
ขนาดการดาวน์โหลด :
187.31 MiB
ขนาดชุดข้อมูล :
666.34 MiB
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 2,981,949 |
- โครงสร้างคุณลักษณะ :
Translation({
'cs': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
แปล | ||||
ค | ข้อความ | สตริง | ||
th | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('en', 'cs')
ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enda
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็นภาษาดา
ขนาดการดาวน์โหลด :
174.34 MiB
ขนาดชุดข้อมูล :
619.77 MiB
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 2,414,895 |
- โครงสร้างคุณลักษณะ :
Translation({
'da': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
แปล | ||||
ดา | ข้อความ | สตริง | ||
th | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('en', 'da')
ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/สิ้นสุด
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็นภาษาเด
ขนาดการดาวน์โหลด :
1.22 GiB
ขนาดชุดข้อมูล :
4.04 GiB
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 16,264,448 |
- โครงสร้างคุณลักษณะ :
Translation({
'de': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
แปล | ||||
เดอ | ข้อความ | สตริง | ||
th | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('en', 'de')
ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enel
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็นเอล
ขนาดการดาวน์โหลด :
184.59 MiB
ขนาดชุดข้อมูล :
698.75 MiB
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,985,233 |
- โครงสร้างคุณลักษณะ :
Translation({
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
แปล | ||||
เอล | ข้อความ | สตริง | ||
th | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('en', 'el')
ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enes
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น es
ขนาดการดาวน์โหลด :
1.82 GiB
ขนาดชุดข้อมูล :
6.23 GiB
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 21,987,267 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
แปล | ||||
th | ข้อความ | สตริง | ||
อี | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('en', 'es')
ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enet
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น et
ขนาดการดาวน์โหลด :
66.91 MiB
ขนาดชุดข้อมูล :
209.16 MiB
แคชอัตโนมัติ ( เอกสาร ): เฉพาะเมื่อ
shuffle_files=False
(รถไฟ)แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 853,422 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'et': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
แปล | ||||
th | ข้อความ | สตริง | ||
เป็นต้น | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('en', 'et')
ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enfi
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น fi
ขนาดการดาวน์โหลด :
151.83 MiB
ขนาดชุดข้อมูล :
543.85 MiB
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 2,156,069 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'fi': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
แปล | ||||
th | ข้อความ | สตริง | ||
ไฟ | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('en', 'fi')
ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enfr
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็นภาษาฝรั่งเศส
ขนาดการดาวน์โหลด :
2.63 GiB
ขนาดชุดข้อมูล :
9.04 GiB
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 31,374,161 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
แปล | ||||
th | ข้อความ | สตริง | ||
fr | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('en', 'fr')
ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enga
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น ga
ขนาดการดาวน์โหลด :
28.03 MiB
ขนาดชุดข้อมูล :
107.09 MiB
แคชอัตโนมัติ ( เอกสาร ): ใช่
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 357,399 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'ga': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
แปล | ||||
th | ข้อความ | สตริง | ||
กา | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('en', 'ga')
ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enhr
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็นชั่วโมง
ขนาดการดาวน์โหลด :
80.97 MiB
ขนาดชุดข้อมูล :
256.37 MiB
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,002,053 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'hr': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
แปล | ||||
th | ข้อความ | สตริง | ||
ชม | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('en', 'hr')
ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enhu
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น hu
ขนาดการดาวน์โหลด :
114.24 MiB
ขนาดชุดข้อมูล :
421.40 MiB
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,901,342 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'hu': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
แปล | ||||
th | ข้อความ | สตริง | ||
ฮ | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('en', 'hu')
ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enit
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น
ขนาดการดาวน์โหลด :
1017.30 MiB
ขนาดชุดข้อมูล :
3.36 GiB
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 12,162,239 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'it': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
แปล | ||||
th | ข้อความ | สตริง | ||
มัน | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('en', 'it')
ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enlt
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น lt
ขนาดการดาวน์โหลด :
63.28 MiB
ขนาดชุดข้อมูล :
204.70 MiB
แคชอัตโนมัติ ( เอกสาร ): เฉพาะเมื่อ
shuffle_files=False
(รถไฟ)แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 844,643 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'lt': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
แปล | ||||
th | ข้อความ | สตริง | ||
ร.ท | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('en', 'lt')
ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enlv
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น lv
ขนาดการดาวน์โหลด :
45.17 MiB
ขนาดชุดข้อมูล :
147.09 MiB
แคชอัตโนมัติ ( เอกสาร ): เฉพาะเมื่อ
shuffle_files=False
(รถไฟ)แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 553,060 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'lv': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
แปล | ||||
th | ข้อความ | สตริง | ||
เลเวล | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('en', 'lv')
ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enmt
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็นภูเขา
ขนาดการดาวน์โหลด :
18.15 MiB
ขนาดชุดข้อมูล :
54.36 MiB
แคชอัตโนมัติ ( เอกสาร ): ใช่
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 195,502 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'mt': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
แปล | ||||
th | ข้อความ | สตริง | ||
ภูเขา | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('en', 'mt')
ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/ennl
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น nl
ขนาดการดาวน์โหลด :
400.63 MiB
ขนาดชุดข้อมูล :
1.40 GiB
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 5,659,268 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'nl': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
แปล | ||||
th | ข้อความ | สตริง | ||
nl | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('en', 'nl')
ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enpl
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น pl
ขนาดการดาวน์โหลด :
257.90 MiB
ขนาดชุดข้อมูล :
885.63 MiB
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 3,503,276 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'pl': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
แปล | ||||
th | ข้อความ | สตริง | ||
กรุณา | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('en', 'pl')
ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enpt
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น pt
ขนาดการดาวน์โหลด :
608.62 MiB
ขนาดชุดข้อมูล :
2.05 GiB
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 8,141,940 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
แปล | ||||
th | ข้อความ | สตริง | ||
พ | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('en', 'pt')
ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/enro
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น ro
ขนาดการดาวน์โหลด :
153.24 MiB
ขนาดชุดข้อมูล :
534.34 MiB
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,952,043 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'ro': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
แปล | ||||
th | ข้อความ | สตริง | ||
ro | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('en', 'ro')
ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/ensk
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็นภาษา sk
ขนาดการดาวน์โหลด :
96.61 MiB
ขนาดชุดข้อมูล :
352.91 MiB
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 1,591,831 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'sk': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
แปล | ||||
th | ข้อความ | สตริง | ||
สก | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('en', 'sk')
ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/ensl
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น sl
ขนาดการดาวน์โหลด :
62.02 MiB
ขนาดชุดข้อมูล :
187.66 MiB
แคชอัตโนมัติ ( เอกสาร ): เฉพาะเมื่อ
shuffle_files=False
(รถไฟ)แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 660,161 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'sl': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
แปล | ||||
th | ข้อความ | สตริง | ||
ส | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('en', 'sl')
ตัวอย่าง ( tfds.as_dataframe ):
para_crawl/ensv
คำอธิบาย การกำหนดค่า : ชุดข้อมูลการแปลจากภาษาอังกฤษเป็น sv
ขนาดการดาวน์โหลด :
262.76 MiB
ขนาดชุดข้อมูล :
905.72 MiB
แคชอัตโนมัติ ( เอกสารประกอบ ): ไม่
แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 3,476,729 |
- โครงสร้างคุณลักษณะ :
Translation({
'en': Text(shape=(), dtype=string),
'sv': Text(shape=(), dtype=string),
})
- เอกสารคุณสมบัติ :
ลักษณะเฉพาะ | ระดับ | รูปร่าง | Dประเภท | คำอธิบาย |
---|---|---|---|---|
แปล | ||||
th | ข้อความ | สตริง | ||
sv | ข้อความ | สตริง |
คีย์ภายใต้การดูแล (ดู
as_supervised
doc ):('en', 'sv')
ตัวอย่าง ( tfds.as_dataframe ):