- Descrizione :
Set di dati derivati dalle trascrizioni dei discorsi TED per il confronto di coppie linguistiche simili in cui una è ad alta risorsa e l'altra è a bassa risorsa.
Pagina iniziale : https://github.com/neulab/word-embeddings-for-nmt
Codice sorgente :
tfds.datasets.ted_hrlr_translate.Builder
Versioni :
-
1.0.0
(impostazione predefinita): nuova API divisa ( https://tensorflow.org/datasets/splits )
-
Dimensioni del download :
124.94 MiB
Auto-cache ( documentazione ): Sì
Figura ( tfds.show_examples ): non supportato.
Citazione :
@inproceedings{Ye2018WordEmbeddings,
author = {Ye, Qi and Devendra, Sachan and Matthieu, Felix and Sarguna, Padmanabhan and Graham, Neubig},
title = {When and Why are pre-trained word embeddings useful for Neural Machine Translation},
booktitle = {HLT-NAACL},
year = {2018},
}
ted_hrlr_translate/az_to_en (configurazione predefinita)
Descrizione della configurazione : set di dati di traduzione da az a en in testo normale.
Dimensione del set di dati :
1.61 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 903 |
'train' | 5.946 |
'validation' | 671 |
- Struttura delle caratteristiche :
Translation({
'az': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
Traduzione | ||||
az | Testo | corda | ||
it | Testo | corda |
Chiavi supervisionate (vedi
as_supervised
doc ):('az', 'en')
Esempi ( tfds.as_dataframe ):
ted_hrlr_translate/aztr_to_en
Descrizione della configurazione : set di dati di traduzione da az_tr a en in testo normale.
Dimensione del set di dati :
42.54 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 903 |
'train' | 188.396 |
'validation' | 671 |
- Struttura delle caratteristiche :
Translation({
'az_tr': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
Traduzione | ||||
az_tr | Testo | corda | ||
it | Testo | corda |
Chiavi supervisionate (vedi
as_supervised
doc ):('az_tr', 'en')
Esempi ( tfds.as_dataframe ):
ted_hrlr_translate/be_to_en
Descrizione della configurazione : set di dati di traduzione da be a en in testo normale.
Dimensione del set di dati :
1.47 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 664 |
'train' | 4.509 |
'validation' | 248 |
- Struttura delle caratteristiche :
Translation({
'be': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
Traduzione | ||||
Essere | Testo | corda | ||
it | Testo | corda |
Chiavi supervisionate (vedi
as_supervised
doc ):('be', 'en')
Esempi ( tfds.as_dataframe ):
ted_hrlr_translate/beru_to_it
Descrizione della configurazione : set di dati di traduzione da be_ru a en in testo normale.
Dimensione del set di dati :
62.45 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 664 |
'train' | 212.614 |
'validation' | 248 |
- Struttura delle caratteristiche :
Translation({
'be_ru': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
Traduzione | ||||
essere_ru | Testo | corda | ||
it | Testo | corda |
Chiavi supervisionate (vedi
as_supervised
doc ):('be_ru', 'en')
Esempi ( tfds.as_dataframe ):
ted_hrlr_translate/es_to_pt
Descrizione della configurazione : set di dati di traduzione da es a pt in testo normale.
Dimensione del set di dati :
9.62 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 1.763 |
'train' | 44.938 |
'validation' | 1.016 |
- Struttura delle caratteristiche :
Translation({
'es': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
Traduzione | ||||
es | Testo | corda | ||
pt | Testo | corda |
Chiavi supervisionate (vedi
as_supervised
doc ):('es', 'pt')
Esempi ( tfds.as_dataframe ):
ted_hrlr_translate/fr_to_pt
Descrizione della configurazione : set di dati di traduzione da fr a pt in testo normale.
Dimensione del set di dati :
9.74 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 1.494 |
'train' | 43.873 |
'validation' | 1.131 |
- Struttura delle caratteristiche :
Translation({
'fr': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
Traduzione | ||||
fr | Testo | corda | ||
pt | Testo | corda |
Chiavi supervisionate (Vedi
as_supervised
doc ):('fr', 'pt')
Esempi ( tfds.as_dataframe ):
ted_hrlr_translate/gl_to_it
Descrizione della configurazione : set di dati di traduzione da gl a en in testo normale.
Dimensione del set di dati :
2.41 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 1.007 |
'train' | 10.017 |
'validation' | 682 |
- Struttura delle caratteristiche :
Translation({
'en': Text(shape=(), dtype=string),
'gl': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
Traduzione | ||||
it | Testo | corda | ||
gl | Testo | corda |
Chiavi supervisionate (vedi
as_supervised
doc ):('gl', 'en')
Esempi ( tfds.as_dataframe ):
ted_hrlr_translate/glpt_to_it
Descrizione della configurazione : set di dati di traduzione da gl_pt a en in testo normale.
Dimensione del set di dati :
12.90 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 1.007 |
'train' | 61.802 |
'validation' | 682 |
- Struttura delle caratteristiche :
Translation({
'en': Text(shape=(), dtype=string),
'gl_pt': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
Traduzione | ||||
it | Testo | corda | ||
gl_pt | Testo | corda |
Chiavi supervisionate (vedi
as_supervised
doc ):('gl_pt', 'en')
Esempi ( tfds.as_dataframe ):
ted_hrlr_translate/he_to_pt
Descrizione della configurazione : set di dati di traduzione da lui a pt in testo normale.
Dimensione del set di dati :
11.71 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 1.623 |
'train' | 48.511 |
'validation' | 1.145 |
- Struttura delle caratteristiche :
Translation({
'he': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
Traduzione | ||||
Lui | Testo | corda | ||
pt | Testo | corda |
Chiavi supervisionate (Vedi
as_supervised
doc ):('he', 'pt')
Esempi ( tfds.as_dataframe ):
ted_hrlr_translate/it_to_pt
Descrizione della configurazione : set di dati di traduzione da esso a pt in testo normale.
Dimensione del set di dati :
9.94 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 1.669 |
'train' | 46.259 |
'validation' | 1.162 |
- Struttura delle caratteristiche :
Translation({
'it': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
Traduzione | ||||
Esso | Testo | corda | ||
pt | Testo | corda |
Chiavi supervisionate (Vedi
as_supervised
doc ):('it', 'pt')
Esempi ( tfds.as_dataframe ):
ted_hrlr_translate/pt_to_it
Descrizione della configurazione : set di dati di traduzione da pt a en in testo normale.
Dimensione del set di dati :
10.89 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 1.803 |
'train' | 51.785 |
'validation' | 1.193 |
- Struttura delle caratteristiche :
Translation({
'en': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
Traduzione | ||||
it | Testo | corda | ||
pt | Testo | corda |
Chiavi supervisionate (vedi
as_supervised
doc ):('pt', 'en')
Esempi ( tfds.as_dataframe ):
ted_hrlr_translate/ru_to_en
Descrizione della configurazione : set di dati di traduzione da ru a en in testo normale.
Dimensione del set di dati :
63.22 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 5.476 |
'train' | 208,106 |
'validation' | 4.805 |
- Struttura delle caratteristiche :
Translation({
'en': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
Traduzione | ||||
it | Testo | corda | ||
ru | Testo | corda |
Chiavi supervisionate (vedi
as_supervised
doc ):('ru', 'en')
Esempi ( tfds.as_dataframe ):
ted_hrlr_translate/ru_to_pt
Descrizione della configurazione : set di dati di traduzione da ru a pt in testo normale.
Dimensione del set di dati :
13.00 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 1.588 |
'train' | 47.278 |
'validation' | 1.184 |
- Struttura delle caratteristiche :
Translation({
'pt': Text(shape=(), dtype=string),
'ru': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
Traduzione | ||||
pt | Testo | corda | ||
ru | Testo | corda |
Chiavi supervisionate (Vedi
as_supervised
doc ):('ru', 'pt')
Esempi ( tfds.as_dataframe ):
ted_hrlr_translate/tr_to_it
Descrizione della configurazione : set di dati di traduzione da tr a en in testo normale.
Dimensione del set di dati :
42.33 MiB
Divisioni :
Diviso | Esempi |
---|---|
'test' | 5.029 |
'train' | 182.450 |
'validation' | 4.045 |
- Struttura delle caratteristiche :
Translation({
'en': Text(shape=(), dtype=string),
'tr': Text(shape=(), dtype=string),
})
- Documentazione delle funzionalità :
Caratteristica | Classe | Forma | Tipo D | Descrizione |
---|---|---|---|---|
Traduzione | ||||
it | Testo | corda | ||
tr | Testo | corda |
Chiavi supervisionate (vedi
as_supervised
doc ):('tr', 'en')
Esempi ( tfds.as_dataframe ):