Referencias:
como-bs
Utilice el siguiente comando para cargar este conjunto de datos en TFDS:
ds = tfds.load('huggingface:opus_ubuntu/as-bs')
- Descripción :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- Licencia : Sin licencia conocida
- Versión : 1.0.0
- Divisiones :
Separar | Ejemplos |
---|---|
'train' | 8583 |
- Características :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"as",
"bs"
],
"id": null,
"_type": "Translation"
}
}
az-cs
Utilice el siguiente comando para cargar este conjunto de datos en TFDS:
ds = tfds.load('huggingface:opus_ubuntu/az-cs')
- Descripción :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- Licencia : Sin licencia conocida
- Versión : 1.0.0
- Divisiones :
Separar | Ejemplos |
---|---|
'train' | 293 |
- Características :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"az",
"cs"
],
"id": null,
"_type": "Translation"
}
}
bg-de
Utilice el siguiente comando para cargar este conjunto de datos en TFDS:
ds = tfds.load('huggingface:opus_ubuntu/bg-de')
- Descripción :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- Licencia : Sin licencia conocida
- Versión : 1.0.0
- Divisiones :
Separar | Ejemplos |
---|---|
'train' | 184 |
- Características :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"bg",
"de"
],
"id": null,
"_type": "Translation"
}
}
br-es_PR
Utilice el siguiente comando para cargar este conjunto de datos en TFDS:
ds = tfds.load('huggingface:opus_ubuntu/br-es_PR')
- Descripción :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- Licencia : Sin licencia conocida
- Versión : 1.0.0
- Divisiones :
Separar | Ejemplos |
---|---|
'train' | 125 |
- Características :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"br",
"es_PR"
],
"id": null,
"_type": "Translation"
}
}
bn-ga
Utilice el siguiente comando para cargar este conjunto de datos en TFDS:
ds = tfds.load('huggingface:opus_ubuntu/bn-ga')
- Descripción :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- Licencia : Sin licencia conocida
- Versión : 1.0.0
- Divisiones :
Separar | Ejemplos |
---|---|
'train' | 7324 |
- Características :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"bn",
"ga"
],
"id": null,
"_type": "Translation"
}
}
br-hola
Utilice el siguiente comando para cargar este conjunto de datos en TFDS:
ds = tfds.load('huggingface:opus_ubuntu/br-hi')
- Descripción :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- Licencia : Sin licencia conocida
- Versión : 1.0.0
- Divisiones :
Separar | Ejemplos |
---|---|
'train' | 15551 |
- Características :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"br",
"hi"
],
"id": null,
"_type": "Translation"
}
}
br-la
Utilice el siguiente comando para cargar este conjunto de datos en TFDS:
ds = tfds.load('huggingface:opus_ubuntu/br-la')
- Descripción :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- Licencia : Sin licencia conocida
- Versión : 1.0.0
- Divisiones :
Separar | Ejemplos |
---|---|
'train' | 527 |
- Características :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"br",
"la"
],
"id": null,
"_type": "Translation"
}
}
bs-szl
Utilice el siguiente comando para cargar este conjunto de datos en TFDS:
ds = tfds.load('huggingface:opus_ubuntu/bs-szl')
- Descripción :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- Licencia : Sin licencia conocida
- Versión : 1.0.0
- Divisiones :
Separar | Ejemplos |
---|---|
'train' | 646 |
- Características :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"bs",
"szl"
],
"id": null,
"_type": "Translation"
}
}
br-uz
Utilice el siguiente comando para cargar este conjunto de datos en TFDS:
ds = tfds.load('huggingface:opus_ubuntu/br-uz')
- Descripción :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- Licencia : Sin licencia conocida
- Versión : 1.0.0
- Divisiones :
Separar | Ejemplos |
---|---|
'train' | 1416 |
- Características :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"br",
"uz"
],
"id": null,
"_type": "Translation"
}
}
br-yi
Utilice el siguiente comando para cargar este conjunto de datos en TFDS:
ds = tfds.load('huggingface:opus_ubuntu/br-yi')
- Descripción :
A parallel corpus of Ubuntu localization files. Source: https://translations.launchpad.net
244 languages, 23,988 bitexts
total number of files: 30,959
total number of tokens: 29.84M
total number of sentence fragments: 7.73M
- Licencia : Sin licencia conocida
- Versión : 1.0.0
- Divisiones :
Separar | Ejemplos |
---|---|
'train' | 2799 |
- Características :
{
"id": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"translation": {
"languages": [
"br",
"yi"
],
"id": null,
"_type": "Translation"
}
}