อ้างอิง:
af-en
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/af-en')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 275512 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"af",
"en"
],
"id": null,
"_type": "Translation"
}
}
แอม
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/am-en')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 89027 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"am",
"en"
],
"id": null,
"_type": "Translation"
}
}
อัน-en
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/an-en')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 6961 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"an",
"en"
],
"id": null,
"_type": "Translation"
}
}
ar-en
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/ar-en')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"ar",
"en"
],
"id": null,
"_type": "Translation"
}
}
as-en
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/as-en')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 138479 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"as",
"en"
],
"id": null,
"_type": "Translation"
}
}
az-en
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/az-en')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 262089 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"az",
"en"
],
"id": null,
"_type": "Translation"
}
}
เป็น-en
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/be-en')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 67312 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"be",
"en"
],
"id": null,
"_type": "Translation"
}
}
บีจี-th
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/bg-en')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"bg",
"en"
],
"id": null,
"_type": "Translation"
}
}
bn-en
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/bn-en')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"bn",
"en"
],
"id": null,
"_type": "Translation"
}
}
br-en
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/br-en')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 153447 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"br",
"en"
],
"id": null,
"_type": "Translation"
}
}
bs-en
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/bs-en')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"bs",
"en"
],
"id": null,
"_type": "Translation"
}
}
คา-เอ็น
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/ca-en')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"ca",
"en"
],
"id": null,
"_type": "Translation"
}
}
cs-en
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/cs-en')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"cs",
"en"
],
"id": null,
"_type": "Translation"
}
}
ไซ-เอ็น
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/cy-en')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 289521 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"cy",
"en"
],
"id": null,
"_type": "Translation"
}
}
ดาเอน
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/da-en')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"da",
"en"
],
"id": null,
"_type": "Translation"
}
}
ดี-เอ็น
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/de-en')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"de",
"en"
],
"id": null,
"_type": "Translation"
}
}
dz-en
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/dz-en')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 624 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"dz",
"en"
],
"id": null,
"_type": "Translation"
}
}
เอล-เอ็น
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/el-en')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"el",
"en"
],
"id": null,
"_type": "Translation"
}
}
en-eo
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-eo')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 337106 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"eo"
],
"id": null,
"_type": "Translation"
}
}
en-es
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-es')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"es"
],
"id": null,
"_type": "Translation"
}
}
en-et
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-et')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"et"
],
"id": null,
"_type": "Translation"
}
}
en-eu
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-eu')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"eu"
],
"id": null,
"_type": "Translation"
}
}
en-fa
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-fa')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"fa"
],
"id": null,
"_type": "Translation"
}
}
en-fi
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-fi')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"fi"
],
"id": null,
"_type": "Translation"
}
}
en-fr
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-fr')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"fr"
],
"id": null,
"_type": "Translation"
}
}
en-fy
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-fy')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 54342 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"fy"
],
"id": null,
"_type": "Translation"
}
}
en-ga
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-ga')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 289524 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"ga"
],
"id": null,
"_type": "Translation"
}
}
en-gd
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-gd')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 1606 |
'train' | 16316 |
'validation' | 1605 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"gd"
],
"id": null,
"_type": "Translation"
}
}
ภาษาอังกฤษ
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-gl')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 515344 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"gl"
],
"id": null,
"_type": "Translation"
}
}
en-gu
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-gu')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 318306 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"gu"
],
"id": null,
"_type": "Translation"
}
}
en-ฮ่า
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-ha')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 97983 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"ha"
],
"id": null,
"_type": "Translation"
}
}
en-เขา
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-he')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"he"
],
"id": null,
"_type": "Translation"
}
}
สวัสดี
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-hi')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 534319 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"hi"
],
"id": null,
"_type": "Translation"
}
}
en-hr
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-hr')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"hr"
],
"id": null,
"_type": "Translation"
}
}
en-hu
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-hu')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"hu"
],
"id": null,
"_type": "Translation"
}
}
en-hy
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-hy')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 7059 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"hy"
],
"id": null,
"_type": "Translation"
}
}
รหัส
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-id')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"id"
],
"id": null,
"_type": "Translation"
}
}
อีเมล
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-ig')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2386 |
'train' | 18415 |
'validation' | 2386 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"ig"
],
"id": null,
"_type": "Translation"
}
}
en-is
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-is')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"is"
],
"id": null,
"_type": "Translation"
}
}
en-it
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-it')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"it"
],
"id": null,
"_type": "Translation"
}
}
เอนจา
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-ja')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"ja"
],
"id": null,
"_type": "Translation"
}
}
เอ็นก้า
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-ka')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 377306 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"ka"
],
"id": null,
"_type": "Translation"
}
}
en-kk
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-kk')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 79927 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"kk"
],
"id": null,
"_type": "Translation"
}
}
en-กม
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-km')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 111483 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"km"
],
"id": null,
"_type": "Translation"
}
}
เอ็น-โกะ
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-ko')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"ko"
],
"id": null,
"_type": "Translation"
}
}
en-kn
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-kn')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 918 |
'train' | 14537 |
'validation' | 917 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"kn"
],
"id": null,
"_type": "Translation"
}
}
en-ku
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-ku')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 144844 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"ku"
],
"id": null,
"_type": "Translation"
}
}
เอ็น-กี้
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-ky')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 27215 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"ky"
],
"id": null,
"_type": "Translation"
}
}
en-li
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-li')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 25535 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"li"
],
"id": null,
"_type": "Translation"
}
}
ภาษาอังกฤษ
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-lt')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"lt"
],
"id": null,
"_type": "Translation"
}
}
en-lv
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-lv')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"lv"
],
"id": null,
"_type": "Translation"
}
}
en-มก
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-mg')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 590771 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"mg"
],
"id": null,
"_type": "Translation"
}
}
en-mk
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-mk')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"mk"
],
"id": null,
"_type": "Translation"
}
}
en-ml
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-ml')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 822746 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"ml"
],
"id": null,
"_type": "Translation"
}
}
en-mn
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-mn')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 4294 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"mn"
],
"id": null,
"_type": "Translation"
}
}
en-mr
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-mr')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 27007 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"mr"
],
"id": null,
"_type": "Translation"
}
}
en-ms
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-ms')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"ms"
],
"id": null,
"_type": "Translation"
}
}
en-ภูเขา
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-mt')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"mt"
],
"id": null,
"_type": "Translation"
}
}
en-ของฉัน
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-my')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 24594 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"my"
],
"id": null,
"_type": "Translation"
}
}
en-nb
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-nb')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 142906 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"nb"
],
"id": null,
"_type": "Translation"
}
}
en-ne
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-ne')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 406381 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"ne"
],
"id": null,
"_type": "Translation"
}
}
en-nl
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-nl')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"nl"
],
"id": null,
"_type": "Translation"
}
}
en-nn
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-nn')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 486055 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"nn"
],
"id": null,
"_type": "Translation"
}
}
ไม่ใช่
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-no')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"no"
],
"id": null,
"_type": "Translation"
}
}
en-oc
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-oc')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 35791 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"oc"
],
"id": null,
"_type": "Translation"
}
}
en-or
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-or')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 1318 |
'train' | 14273 |
'validation' | 1317 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"or"
],
"id": null,
"_type": "Translation"
}
}
en-pa
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-pa')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 107296 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"pa"
],
"id": null,
"_type": "Translation"
}
}
ภาษาอังกฤษ
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-pl')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"pl"
],
"id": null,
"_type": "Translation"
}
}
en-ป.ล
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-ps')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 79127 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"ps"
],
"id": null,
"_type": "Translation"
}
}
ภาษาอังกฤษ
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-pt')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"pt"
],
"id": null,
"_type": "Translation"
}
}
en-ro
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-ro')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"ro"
],
"id": null,
"_type": "Translation"
}
}
en-ru
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-ru')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"ru"
],
"id": null,
"_type": "Translation"
}
}
en-rw
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-rw')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 173823 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"rw"
],
"id": null,
"_type": "Translation"
}
}
en-se
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-se')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 35907 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"se"
],
"id": null,
"_type": "Translation"
}
}
en-sh
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-sh')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 267211 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"sh"
],
"id": null,
"_type": "Translation"
}
}
en-si
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-si')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 979109 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"si"
],
"id": null,
"_type": "Translation"
}
}
en-sk
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-sk')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"sk"
],
"id": null,
"_type": "Translation"
}
}
en-sl
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-sl')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"sl"
],
"id": null,
"_type": "Translation"
}
}
ตร.ม
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-sq')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"sq"
],
"id": null,
"_type": "Translation"
}
}
en-sr
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-sr')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"sr"
],
"id": null,
"_type": "Translation"
}
}
en-sv
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-sv')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"sv"
],
"id": null,
"_type": "Translation"
}
}
en-ta
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-ta')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 227014 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"ta"
],
"id": null,
"_type": "Translation"
}
}
en-te
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-te')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 64352 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"te"
],
"id": null,
"_type": "Translation"
}
}
en-tg
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-tg')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 193882 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"tg"
],
"id": null,
"_type": "Translation"
}
}
en-th
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-th')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"th"
],
"id": null,
"_type": "Translation"
}
}
en-tk
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-tk')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 1852 |
'train' | 13110 |
'validation' | 1852 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"tk"
],
"id": null,
"_type": "Translation"
}
}
en-tr
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-tr')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"tr"
],
"id": null,
"_type": "Translation"
}
}
en-tt
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-tt')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 100843 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"tt"
],
"id": null,
"_type": "Translation"
}
}
en-ug
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-ug')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 72170 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"ug"
],
"id": null,
"_type": "Translation"
}
}
อังกฤษ
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-uk')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"uk"
],
"id": null,
"_type": "Translation"
}
}
en-ur
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-ur')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 753913 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"ur"
],
"id": null,
"_type": "Translation"
}
}
en-uz
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-uz')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 173157 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"uz"
],
"id": null,
"_type": "Translation"
}
}
en-vi
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-vi')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"vi"
],
"id": null,
"_type": "Translation"
}
}
en-wa
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-wa')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 104496 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"wa"
],
"id": null,
"_type": "Translation"
}
}
en-xh
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-xh')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 439671 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"xh"
],
"id": null,
"_type": "Translation"
}
}
เอน-ยี
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-yi')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 15010 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"yi"
],
"id": null,
"_type": "Translation"
}
}
เอ็น-โย่
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-yo')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'train' | 10375 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"yo"
],
"id": null,
"_type": "Translation"
}
}
en-zh
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-zh')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 1000000 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"zh"
],
"id": null,
"_type": "Translation"
}
}
en-zu
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/en-zu')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
'train' | 38616 |
'validation' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"en",
"zu"
],
"id": null,
"_type": "Translation"
}
}
ar-de
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/ar-de')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"ar",
"de"
],
"id": null,
"_type": "Translation"
}
}
ar-fr
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/ar-fr')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"ar",
"fr"
],
"id": null,
"_type": "Translation"
}
}
อาร์-เนล
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/ar-nl')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"ar",
"nl"
],
"id": null,
"_type": "Translation"
}
}
อารู
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/ar-ru')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"ar",
"ru"
],
"id": null,
"_type": "Translation"
}
}
ar-zh
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/ar-zh')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"ar",
"zh"
],
"id": null,
"_type": "Translation"
}
}
ยกเลิกเ
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/de-fr')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"de",
"fr"
],
"id": null,
"_type": "Translation"
}
}
เดอ-nl
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/de-nl')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"de",
"nl"
],
"id": null,
"_type": "Translation"
}
}
เดอรู
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/de-ru')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"de",
"ru"
],
"id": null,
"_type": "Translation"
}
}
เดอ-zh
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/de-zh')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"de",
"zh"
],
"id": null,
"_type": "Translation"
}
}
fr-nl
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/fr-nl')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"fr",
"nl"
],
"id": null,
"_type": "Translation"
}
}
fr-ru
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/fr-ru')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"fr",
"ru"
],
"id": null,
"_type": "Translation"
}
}
fr-zh
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/fr-zh')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"fr",
"zh"
],
"id": null,
"_type": "Translation"
}
}
nl-ru
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/nl-ru')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"nl",
"ru"
],
"id": null,
"_type": "Translation"
}
}
nl-zh
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/nl-zh')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"nl",
"zh"
],
"id": null,
"_type": "Translation"
}
}
รู-zh
ใช้คำสั่งต่อไปนี้เพื่อโหลดชุดข้อมูลนี้ใน TFDS:
ds = tfds.load('huggingface:opus100/ru-zh')
- คำอธิบาย :
OPUS-100 is English-centric, meaning that all training pairs include English on either the source or target side.
The corpus covers 100 languages (including English).OPUS-100 contains approximately 55M sentence pairs.
Of the 99 language pairs, 44 have 1M sentence pairs of training data, 73 have at least 100k, and 95 have at least 10k.
- ใบอนุญาต : ไม่มีใบอนุญาตที่รู้จัก
- เวอร์ชั่น : 0.0.0
- แยก :
แยก | ตัวอย่าง |
---|---|
'test' | 2000 |
- คุณสมบัติ :
{
"translation": {
"languages": [
"ru",
"zh"
],
"id": null,
"_type": "Translation"
}
}