tatoeba

  • Descriptif :

Ces données sont extraites du corpus Tatoeba, daté du samedi 17/11/2018.

Pour chaque langue, nous avons sélectionné 1000 phrases en anglais et leurs traductions, si disponibles. Veuillez consulter cet article pour une description des langues, de leurs familles et écritures ainsi que des résultats de base.

Veuillez noter que les phrases en anglais ne sont pas identiques pour toutes les paires de langues. Cela signifie que les résultats ne sont pas directement comparables entre les langues.

FeaturesDict({
    'source_language': Text(shape=(), dtype=string),
    'source_sentence': Text(shape=(), dtype=string),
    'target_language': Text(shape=(), dtype=string),
    'target_sentence': Text(shape=(), dtype=string),
})
  • Documentation des fonctionnalités :
Fonctionnalité Classe Forme Dtype Description
FonctionnalitésDict
langue originelle Texte chaîne
phrase_source Texte chaîne
langue cible Texte chaîne
phrase_cible Texte chaîne
@article{tatoeba,
          title={Massively Multilingual Sentence Embeddings for Zero-Shot
                   Cross-Lingual Transfer and Beyond},
          author={Mikel, Artetxe and Holger, Schwenk,},
          journal={arXiv:1812.10464v2},
          year={2018}
}

@InProceedings{TIEDEMANN12.463,
  author = {J{\"o}rg}rg Tiedemann},
  title = {Parallel Data, Tools and Interfaces in OPUS},
  booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
  year = {2012},
  month = {may},
  date = {23-25},
  address = {Istanbul, Turkey},
  editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Ugur Dogan and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis},
  publisher = {European Language Resources Association (ELRA)},
  isbn = {978-2-9517408-7-7},
  language = {english}
}

tatoeba/tatoeba_af (configuration par défaut)

  • Taille du téléchargement : 58.24 KiB

  • Taille du jeu de données : 162.74 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 000

tatoeba/tatoeba_ar

  • Taille du téléchargement : 70.95 KiB

  • Taille du jeu de données : 175.46 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 000

tatoeba/tatoeba_bg

  • Taille du téléchargement : 99.88 KiB

  • Taille du jeu de données : 204.64 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 000

tatoeba/tatoeba_bn

  • Taille du téléchargement : 89.55 KiB

  • Taille du jeu de données : 194.24 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 000

tatoeba/tatoeba_de

  • Taille du téléchargement : 103.09 KiB

  • Taille du jeu de données : 207.93 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 000

tatoeba/tatoeba_el

  • Taille du téléchargement : 77.11 KiB

  • Taille du jeu de données : 181.65 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 000

tatoeba/tatoeba_es

  • Taille du téléchargement : 70.57 KiB

  • Taille du jeu de données : 175.12 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 000

tatoeba/tatoeba_et

  • Taille du téléchargement : 58.33 KiB

  • Taille du jeu de données : 162.85 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 000

tatoeba/tatoeba_eu

  • Taille du téléchargement : 64.52 KiB

  • Taille du jeu de données : 169.02 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 000

tatoeba/tatoeba_fa

  • Taille du téléchargement : 91.52 KiB

  • Taille du jeu de données : 196.15 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 000

tatoeba/tatoeba_fi

  • Taille du téléchargement : 73.90 KiB

  • Taille du jeu de données : 178.47 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 000

tatoeba/tatoeba_fr

  • Taille du téléchargement : 78.14 KiB

  • Taille du jeu de données : 182.68 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 000

tatoeba/tatoeba_he

  • Taille du téléchargement : 81.54 KiB

  • Taille du jeu de données : 186.15 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 000

tatoeba/tatoeba_hi

  • Taille du téléchargement : 119.69 KiB

  • Taille du jeu de données : 224.89 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 000

tatoeba/tatoeba_hu

  • Taille du téléchargement : 67.27 KiB

  • Taille du jeu de données : 171.78 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 000

tatoeba/tatoeba_id

  • Taille du téléchargement : 73.09 KiB

  • Taille du jeu de données : 177.61 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 000

tatoeba/tatoeba_it

  • Taille du téléchargement : 64.29 KiB

  • Taille du jeu de données : 168.81 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 000

tatoeba/tatoeba_ja

  • Taille du téléchargement : 90.90 KiB

  • Taille du jeu de données : 195.53 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 000

tatoeba/tatoeba_jv

  • Taille du téléchargement : 13.59 KiB

  • Taille du jeu de données : 35.01 KiB

  • Fractionnements :

Diviser Exemples
'train' 205

tatoeba/tatoeba_ka

  • Taille du téléchargement : 70.47 KiB

  • Taille du jeu de données : 148.67 KiB

  • Fractionnements :

Diviser Exemples
'train' 746

tatoeba/tatoeba_kk

  • Taille du téléchargement : 46.07 KiB

  • Taille du jeu de données : 106.25 KiB

  • Fractionnements :

Diviser Exemples
'train' 575

tatoeba/tatoeba_ko

  • Taille du téléchargement : 77.28 KiB

  • Taille du jeu de données : 181.88 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 000

tatoeba/tatoeba_ml

  • Taille du téléchargement : 92.50 KiB

  • Taille du jeu de données : 165.14 KiB

  • Fractionnements :

Diviser Exemples
'train' 687

tatoeba/tatoeba_mr

  • Taille du téléchargement : 98.19 KiB

  • Taille du jeu de données : 202.96 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 000

tatoeba/tatoeba_nl

  • Taille du téléchargement : 71.55 KiB

  • Taille du jeu de données : 176.10 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 000

tatoeba/tatoeba_pt

  • Taille du téléchargement : 73.42 KiB

  • Taille du jeu de données : 177.95 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 000

tatoeba/tatoeba_ru

  • Taille du téléchargement : 90.30 KiB

  • Taille du jeu de données : 194.92 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 000

tatoeba/tatoeba_sw

  • Taille du téléchargement : 19.99 KiB

  • Taille du jeu de données : 60.75 KiB

  • Fractionnements :

Diviser Exemples
'train' 390

tatoeba/tatoeba_ta

  • Taille du téléchargement : 38.52 KiB

  • Taille du jeu de données : 70.93 KiB

  • Fractionnements :

Diviser Exemples
'train' 307

tatoeba/tatoeba_te

  • Taille du téléchargement : 24.55 KiB

  • Taille du jeu de données : 49.07 KiB

  • Fractionnements :

Diviser Exemples
'train' 234

tatoeba/tatoeba_th

  • Taille du téléchargement : 61.72 KiB

  • Taille du jeu de données : 119.32 KiB

  • Fractionnements :

Diviser Exemples
'train' 548

tatoeba/tatoeba_tl

  • Taille du téléchargement : 66.54 KiB

  • Taille du jeu de données : 171.04 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 000

tatoeba/tatoeba_tr

  • Taille du téléchargement : 70.20 KiB

  • Taille du jeu de données : 174.70 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 000

tatoeba/tatoeba_ur

  • Taille du téléchargement : 86.63 KiB

  • Taille du jeu de données : 191.20 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 000

tatoeba/tatoeba_vi

  • Taille du téléchargement : 89.26 KiB

  • Taille du jeu de données : 193.89 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 000

tatoeba/tatoeba_zh

  • Taille du téléchargement : 67.32 KiB

  • Taille du jeu de données : 171.85 KiB

  • Fractionnements :

Diviser Exemples
'train' 1 000