ted_hrlr_translate

  • Açıklama :

Birinin yüksek kaynak ve diğerinin düşük kaynak olduğu benzer dil çiftlerini karşılaştırmak için TED konuşma transkriptlerinden türetilen veri setleri.

@inproceedings{Ye2018WordEmbeddings,
  author  = {Ye, Qi and Devendra, Sachan and Matthieu, Felix and Sarguna, Padmanabhan and Graham, Neubig},
  title   = {When and Why are pre-trained word embeddings useful for Neural Machine Translation},
  booktitle = {HLT-NAACL},
  year    = {2018},
  }

ted_hrlr_translate/az_to_en (varsayılan yapılandırma)

  • Yapılandırma açıklaması : Düz metin olarak az'dan en'e çeviri veri kümesi.

  • Veri kümesi boyutu : 1.61 MiB

  • bölmeler :

Bölmek örnekler
'test' 903
'train' 5.946
'validation' 671
  • Özellik yapısı :
Translation({
    'az': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
Tercüme
az Metin sicim
tr Metin sicim

ted_hrlr_translate/aztr_to_en

  • Yapılandırma açıklaması : Düz metin olarak az_tr'den tr'ye çeviri veri kümesi.

  • Veri kümesi boyutu : 42.54 MiB

  • bölmeler :

Bölmek örnekler
'test' 903
'train' 188.396
'validation' 671
  • Özellik yapısı :
Translation({
    'az_tr': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
Tercüme
az_tr Metin sicim
tr Metin sicim

ted_hrlr_translate/be_to_en

  • Yapılandırma açıklaması : be'den en'e çeviri veri kümesi düz metin olarak.

  • Veri kümesi boyutu : 1.47 MiB

  • bölmeler :

Bölmek örnekler
'test' 664
'train' 4.509
'validation' 248
  • Özellik yapısı :
Translation({
    'be': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
Tercüme
olmak Metin sicim
tr Metin sicim

ted_hrlr_translate/beru_to_en

  • Yapılandırma açıklaması : be_ru'dan en'e düz metin olarak çeviri veri kümesi.

  • Veri kümesi boyutu : 62.45 MiB

  • bölmeler :

Bölmek örnekler
'test' 664
'train' 212.614
'validation' 248
  • Özellik yapısı :
Translation({
    'be_ru': Text(shape=(), dtype=string),
    'en': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
Tercüme
be_ru Metin sicim
tr Metin sicim

ted_hrlr_translate/es_to_pt

  • Yapılandırma açıklaması : Düz metin olarak es'den pt'ye çeviri veri kümesi.

  • Veri kümesi boyutu : 9.62 MiB

  • bölmeler :

Bölmek örnekler
'test' 1.763
'train' 44.938
'validation' 1.016
  • Özellik yapısı :
Translation({
    'es': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
Tercüme
es Metin sicim
nokta Metin sicim

ted_hrlr_translate/fr_to_pt

  • Yapılandırma açıklaması : Düz metin olarak fr'den pt'ye çeviri veri kümesi.

  • Veri kümesi boyutu : 9.74 MiB

  • bölmeler :

Bölmek örnekler
'test' 1.494
'train' 43.873
'validation' 1.131
  • Özellik yapısı :
Translation({
    'fr': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
Tercüme
fr Metin sicim
nokta Metin sicim

ted_hrlr_translate/gl_to_en

  • Yapılandırma açıklaması : Düz metin olarak gl'den en'e çeviri veri kümesi.

  • Veri kümesi boyutu : 2.41 MiB

  • bölmeler :

Bölmek örnekler
'test' 1.007
'train' 10.017
'validation' 682
  • Özellik yapısı :
Translation({
    'en': Text(shape=(), dtype=string),
    'gl': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
Tercüme
tr Metin sicim
gl Metin sicim

ted_hrlr_translate/glpt_to_en

  • Yapılandırma açıklaması : Düz metin olarak gl_pt'den tr'ye çeviri veri kümesi.

  • Veri kümesi boyutu : 12.90 MiB

  • bölmeler :

Bölmek örnekler
'test' 1.007
'train' 61.802
'validation' 682
  • Özellik yapısı :
Translation({
    'en': Text(shape=(), dtype=string),
    'gl_pt': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
Tercüme
tr Metin sicim
gl_pt Metin sicim

ted_hrlr_translate/he_to_pt

  • Yapılandırma açıklaması : He'den pt'ye düz metin olarak çeviri veri kümesi.

  • Veri kümesi boyutu : 11.71 MiB

  • bölmeler :

Bölmek örnekler
'test' 1.623
'train' 48.511
'validation' 1.145
  • Özellik yapısı :
Translation({
    'he': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
Tercüme
O Metin sicim
nokta Metin sicim

ted_hrlr_translate/it_to_pt

  • Yapılandırma açıklaması : Düz metin olarak ondan pt'ye çeviri veri kümesi.

  • Veri kümesi boyutu : 9.94 MiB

  • bölmeler :

Bölmek örnekler
'test' 1.669
'train' 46.259
'validation' 1.162
  • Özellik yapısı :
Translation({
    'it': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
Tercüme
BT Metin sicim
nokta Metin sicim

ted_hrlr_translate/pt_to_en

  • Yapılandırma açıklaması : Düz metin olarak pt'den en'e çeviri veri kümesi.

  • Veri kümesi boyutu : 10.89 MiB

  • bölmeler :

Bölmek örnekler
'test' 1.803
'train' 51.785
'validation' 1.193
  • Özellik yapısı :
Translation({
    'en': Text(shape=(), dtype=string),
    'pt': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
Tercüme
tr Metin sicim
nokta Metin sicim

ted_hrlr_translate/ru_to_en

  • Yapılandırma açıklaması : Düz metin olarak ru'dan en'e çeviri veri kümesi.

  • Veri kümesi boyutu : 63.22 MiB

  • bölmeler :

Bölmek örnekler
'test' 5.476
'train' 208.106
'validation' 4.805
  • Özellik yapısı :
Translation({
    'en': Text(shape=(), dtype=string),
    'ru': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
Tercüme
tr Metin sicim
ru Metin sicim

ted_hrlr_translate/ru_to_pt

  • Yapılandırma açıklaması : Düz metin olarak ru'dan pt'ye çeviri veri kümesi.

  • Veri kümesi boyutu : 13.00 MiB

  • bölmeler :

Bölmek örnekler
'test' 1.588
'train' 47.278
'validation' 1.184
  • Özellik yapısı :
Translation({
    'pt': Text(shape=(), dtype=string),
    'ru': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
Tercüme
nokta Metin sicim
ru Metin sicim

ted_hrlr_translate/tr_to_en

  • Yapılandırma açıklaması : Düz metin olarak tr'den en'e çeviri veri kümesi.

  • Veri kümesi boyutu : 42.33 MiB

  • bölmeler :

Bölmek örnekler
'test' 5.029
'train' 182.450
'validation' 4.045
  • Özellik yapısı :
Translation({
    'en': Text(shape=(), dtype=string),
    'tr': Text(shape=(), dtype=string),
})
  • Özellik belgeleri :
Özellik Sınıf Şekil Dtipi Tanım
Tercüme
tr Metin sicim
tr Metin sicim