مراجع:
كما بكالوريوس
استخدم الأمر التالي لتحميل مجموعة البيانات هذه في TFDS:
ds = tfds.load('huggingface:opus_ubuntu/as-bs')
- وصف :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- الترخيص : لا يوجد ترخيص معروف
- الإصدار : 1.0.0
- الإنشقاقات :
ينقسم | أمثلة |
---|---|
'train' | 8583 |
- سمات :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"as",
"bs"
],
"id": null,
"_type": "Translation"
}
}
من الألف إلى الياء CS
استخدم الأمر التالي لتحميل مجموعة البيانات هذه في TFDS:
ds = tfds.load('huggingface:opus_ubuntu/az-cs')
- وصف :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- الترخيص : لا يوجد ترخيص معروف
- الإصدار : 1.0.0
- الإنشقاقات :
ينقسم | أمثلة |
---|---|
'train' | 293 |
- سمات :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"az",
"cs"
],
"id": null,
"_type": "Translation"
}
}
حرس الحدود دي
استخدم الأمر التالي لتحميل مجموعة البيانات هذه في TFDS:
ds = tfds.load('huggingface:opus_ubuntu/bg-de')
- وصف :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- الترخيص : لا يوجد ترخيص معروف
- الإصدار : 1.0.0
- الإنشقاقات :
ينقسم | أمثلة |
---|---|
'train' | 184 |
- سمات :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"bg",
"de"
],
"id": null,
"_type": "Translation"
}
}
br-es_PR
استخدم الأمر التالي لتحميل مجموعة البيانات هذه في TFDS:
ds = tfds.load('huggingface:opus_ubuntu/br-es_PR')
- وصف :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- الترخيص : لا يوجد ترخيص معروف
- الإصدار : 1.0.0
- الإنشقاقات :
ينقسم | أمثلة |
---|---|
'train' | 125 |
- سمات :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"br",
"es_PR"
],
"id": null,
"_type": "Translation"
}
}
مليار جا
استخدم الأمر التالي لتحميل مجموعة البيانات هذه في TFDS:
ds = tfds.load('huggingface:opus_ubuntu/bn-ga')
- وصف :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- الترخيص : لا يوجد ترخيص معروف
- الإصدار : 1.0.0
- الإنشقاقات :
ينقسم | أمثلة |
---|---|
'train' | 7324 |
- سمات :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"bn",
"ga"
],
"id": null,
"_type": "Translation"
}
}
بر-مرحبا
استخدم الأمر التالي لتحميل مجموعة البيانات هذه في TFDS:
ds = tfds.load('huggingface:opus_ubuntu/br-hi')
- وصف :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- الترخيص : لا يوجد ترخيص معروف
- الإصدار : 1.0.0
- الإنشقاقات :
ينقسم | أمثلة |
---|---|
'train' | 15551 |
- سمات :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"br",
"hi"
],
"id": null,
"_type": "Translation"
}
}
br-la
استخدم الأمر التالي لتحميل مجموعة البيانات هذه في TFDS:
ds = tfds.load('huggingface:opus_ubuntu/br-la')
- وصف :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- الترخيص : لا يوجد ترخيص معروف
- الإصدار : 1.0.0
- الإنشقاقات :
ينقسم | أمثلة |
---|---|
'train' | 527 |
- سمات :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"br",
"la"
],
"id": null,
"_type": "Translation"
}
}
بكالوريوس-szl
استخدم الأمر التالي لتحميل مجموعة البيانات هذه في TFDS:
ds = tfds.load('huggingface:opus_ubuntu/bs-szl')
- وصف :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- الترخيص : لا يوجد ترخيص معروف
- الإصدار : 1.0.0
- الإنشقاقات :
ينقسم | أمثلة |
---|---|
'train' | 646 |
- سمات :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"bs",
"szl"
],
"id": null,
"_type": "Translation"
}
}
br-uz
استخدم الأمر التالي لتحميل مجموعة البيانات هذه في TFDS:
ds = tfds.load('huggingface:opus_ubuntu/br-uz')
- وصف :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- الترخيص : لا يوجد ترخيص معروف
- الإصدار : 1.0.0
- الإنشقاقات :
ينقسم | أمثلة |
---|---|
'train' | 1416 |
- سمات :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"br",
"uz"
],
"id": null,
"_type": "Translation"
}
}
br-yi
استخدم الأمر التالي لتحميل مجموعة البيانات هذه في TFDS:
ds = tfds.load('huggingface:opus_ubuntu/br-yi')
- وصف :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- الترخيص : لا يوجد ترخيص معروف
- الإصدار : 1.0.0
- الإنشقاقات :
ينقسم | أمثلة |
---|---|
'train' | 2799 |
- سمات :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"br",
"yi"
],
"id": null,
"_type": "Translation"
}
}