opus_dgt

Referencias:

bg-ga

Utilice el siguiente comando para cargar este conjunto de datos en TFDS:

ds = tfds.load('huggingface:opus_dgt/bg-ga')
  • Descripción :
A collection of translation memories provided by the JRC. Source: https://ec.europa.eu/jrc/en/language-technologies/dgt-translation-memory
25 languages, 299 bitexts
total number of files
: 817,410
total number of tokens
: 2.13G
total number of sentence fragments
: 113.52M
  • Licencia : Sin licencia conocida
  • Versión : 1.0.0
  • Divisiones :
Separar Ejemplos
'train' 179142
  • Características :
{
   
"id": {
       
"dtype": "string",
       
"id": null,
       
"_type": "Value"
   
},
   
"translation": {
       
"languages": [
           
"bg",
           
"ga"
       
],
       
"id": null,
       
"_type": "Translation"
   
}
}

bg-hr

Utilice el siguiente comando para cargar este conjunto de datos en TFDS:

ds = tfds.load('huggingface:opus_dgt/bg-hr')
  • Descripción :
A collection of translation memories provided by the JRC. Source: https://ec.europa.eu/jrc/en/language-technologies/dgt-translation-memory
25 languages, 299 bitexts
total number of files
: 817,410
total number of tokens
: 2.13G
total number of sentence fragments
: 113.52M
  • Licencia : Sin licencia conocida
  • Versión : 1.0.0
  • Divisiones :
Separar Ejemplos
'train' 701572
  • Características :
{
   
"id": {
       
"dtype": "string",
       
"id": null,
       
"_type": "Value"
   
},
   
"translation": {
       
"languages": [
           
"bg",
           
"hr"
       
],
       
"id": null,
       
"_type": "Translation"
   
}
}

bg-sh

Utilice el siguiente comando para cargar este conjunto de datos en TFDS:

ds = tfds.load('huggingface:opus_dgt/bg-sh')
  • Descripción :
A collection of translation memories provided by the JRC. Source: https://ec.europa.eu/jrc/en/language-technologies/dgt-translation-memory
25 languages, 299 bitexts
total number of files
: 817,410
total number of tokens
: 2.13G
total number of sentence fragments
: 113.52M
  • Licencia : Sin licencia conocida
  • Versión : 1.0.0
  • Divisiones :
Separar Ejemplos
'train' 1488507
  • Características :
{
   
"id": {
       
"dtype": "string",
       
"id": null,
       
"_type": "Value"
   
},
   
"translation": {
       
"languages": [
           
"bg",
           
"sh"
       
],
       
"id": null,
       
"_type": "Translation"
   
}
}

figa

Utilice el siguiente comando para cargar este conjunto de datos en TFDS:

ds = tfds.load('huggingface:opus_dgt/fi-ga')
  • Descripción :
A collection of translation memories provided by the JRC. Source: https://ec.europa.eu/jrc/en/language-technologies/dgt-translation-memory
25 languages, 299 bitexts
total number of files
: 817,410
total number of tokens
: 2.13G
total number of sentence fragments
: 113.52M
  • Licencia : Sin licencia conocida
  • Versión : 1.0.0
  • Divisiones :
Separar Ejemplos
'train' 178619
  • Características :
{
   
"id": {
       
"dtype": "string",
       
"id": null,
       
"_type": "Value"
   
},
   
"translation": {
       
"languages": [
           
"fi",
           
"ga"
       
],
       
"id": null,
       
"_type": "Translation"
   
}
}

es-ga

Utilice el siguiente comando para cargar este conjunto de datos en TFDS:

ds = tfds.load('huggingface:opus_dgt/es-ga')
  • Descripción :
A collection of translation memories provided by the JRC. Source: https://ec.europa.eu/jrc/en/language-technologies/dgt-translation-memory
25 languages, 299 bitexts
total number of files
: 817,410
total number of tokens
: 2.13G
total number of sentence fragments
: 113.52M
  • Licencia : Sin licencia conocida
  • Versión : 1.0.0
  • Divisiones :
Separar Ejemplos
'train' 178696
  • Características :
{
   
"id": {
       
"dtype": "string",
       
"id": null,
       
"_type": "Value"
   
},
   
"translation": {
       
"languages": [
           
"es",
           
"ga"
       
],
       
"id": null,
       
"_type": "Translation"
   
}
}

tajo

Utilice el siguiente comando para cargar este conjunto de datos en TFDS:

ds = tfds.load('huggingface:opus_dgt/ga-sh')
  • Descripción :
A collection of translation memories provided by the JRC. Source: https://ec.europa.eu/jrc/en/language-technologies/dgt-translation-memory
25 languages, 299 bitexts
total number of files
: 817,410
total number of tokens
: 2.13G
total number of sentence fragments
: 113.52M
  • Licencia : Sin licencia conocida
  • Versión : 1.0.0
  • Divisiones :
Separar Ejemplos
'train' 91613
  • Características :
{
   
"id": {
       
"dtype": "string",
       
"id": null,
       
"_type": "Value"
   
},
   
"translation": {
       
"languages": [
           
"ga",
           
"sh"
       
],
       
"id": null,
       
"_type": "Translation"
   
}
}

hr-sk

Utilice el siguiente comando para cargar este conjunto de datos en TFDS:

ds = tfds.load('huggingface:opus_dgt/hr-sk')
  • Descripción :
A collection of translation memories provided by the JRC. Source: https://ec.europa.eu/jrc/en/language-technologies/dgt-translation-memory
25 languages, 299 bitexts
total number of files
: 817,410
total number of tokens
: 2.13G
total number of sentence fragments
: 113.52M
  • Licencia : Sin licencia conocida
  • Versión : 1.0.0
  • Divisiones :
Separar Ejemplos
'train' 689263
  • Características :
{
   
"id": {
       
"dtype": "string",
       
"id": null,
       
"_type": "Value"
   
},
   
"translation": {
       
"languages": [
           
"hr",
           
"sk"
       
],
       
"id": null,
       
"_type": "Translation"
   
}
}

mt-sh

Utilice el siguiente comando para cargar este conjunto de datos en TFDS:

ds = tfds.load('huggingface:opus_dgt/mt-sh')
  • Descripción :
A collection of translation memories provided by the JRC. Source: https://ec.europa.eu/jrc/en/language-technologies/dgt-translation-memory
25 languages, 299 bitexts
total number of files
: 817,410
total number of tokens
: 2.13G
total number of sentence fragments
: 113.52M
  • Licencia : Sin licencia conocida
  • Versión : 1.0.0
  • Divisiones :
Separar Ejemplos
'train' 1450424
  • Características :
{
   
"id": {
       
"dtype": "string",
       
"id": null,
       
"_type": "Value"
   
},
   
"translation": {
       
"languages": [
           
"mt",
           
"sh"
       
],
       
"id": null,
       
"_type": "Translation"
   
}
}

hr-sv

Utilice el siguiente comando para cargar este conjunto de datos en TFDS:

ds = tfds.load('huggingface:opus_dgt/hr-sv')
  • Descripción :
A collection of translation memories provided by the JRC. Source: https://ec.europa.eu/jrc/en/language-technologies/dgt-translation-memory
25 languages, 299 bitexts
total number of files
: 817,410
total number of tokens
: 2.13G
total number of sentence fragments
: 113.52M
  • Licencia : Sin licencia conocida
  • Versión : 1.0.0
  • Divisiones :
Separar Ejemplos
'train' 696334
  • Características :
{
   
"id": {
       
"dtype": "string",
       
"id": null,
       
"_type": "Value"
   
},
   
"translation": {
       
"languages": [
           
"hr",
           
"sv"
       
],
       
"id": null,
       
"_type": "Translation"
   
}
}

ga-nl

Utilice el siguiente comando para cargar este conjunto de datos en TFDS:

ds = tfds.load('huggingface:opus_dgt/ga-nl')
  • Descripción :
A collection of translation memories provided by the JRC. Source: https://ec.europa.eu/jrc/en/language-technologies/dgt-translation-memory
25 languages, 299 bitexts
total number of files
: 817,410
total number of tokens
: 2.13G
total number of sentence fragments
: 113.52M
  • Licencia : Sin licencia conocida
  • Versión : 1.0.0
  • Divisiones :
Separar Ejemplos
'train' 170644
  • Características :
{
   
"id": {
       
"dtype": "string",
       
"id": null,
       
"_type": "Value"
   
},
   
"translation": {
       
"languages": [
           
"ga",
           
"nl"
       
],
       
"id": null,
       
"_type": "Translation"
   
}
}