- Descriptif :
Ces données sont extraites du corpus Tatoeba, daté du samedi 17/11/2018.
Pour chaque langue, nous avons sélectionné 1000 phrases en anglais et leurs traductions, si disponibles. Veuillez consulter cet article pour une description des langues, de leurs familles et écritures ainsi que des résultats de base.
Veuillez noter que les phrases en anglais ne sont pas identiques pour toutes les paires de langues. Cela signifie que les résultats ne sont pas directement comparables entre les langues.
Page d'accueil : http://opus.nlpl.eu/Tatoeba.php
Code source :
tfds.datasets.tatoeba.Builder
Versions :
-
1.0.0
(par défaut) : version initiale.
-
Mise en cache automatique ( documentation ): Oui
Structure des fonctionnalités :
FeaturesDict({
'source_language': Text(shape=(), dtype=string),
'source_sentence': Text(shape=(), dtype=string),
'target_language': Text(shape=(), dtype=string),
'target_sentence': Text(shape=(), dtype=string),
})
- Documentation des fonctionnalités :
Fonctionnalité | Classe | Forme | Dtype | Description |
---|---|---|---|---|
FonctionnalitésDict | ||||
langue originelle | Texte | chaîne | ||
phrase_source | Texte | chaîne | ||
langue cible | Texte | chaîne | ||
phrase_cible | Texte | chaîne |
Clés supervisées (Voir
as_supervised
doc ):None
Figure ( tfds.show_examples ) : non pris en charge.
Citation :
@article{tatoeba,
title={Massively Multilingual Sentence Embeddings for Zero-Shot
Cross-Lingual Transfer and Beyond},
author={Mikel, Artetxe and Holger, Schwenk,},
journal={arXiv:1812.10464v2},
year={2018}
}
@InProceedings{TIEDEMANN12.463,
author = {J{\"o}rg}rg Tiedemann},
title = {Parallel Data, Tools and Interfaces in OPUS},
booktitle = {Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12)},
year = {2012},
month = {may},
date = {23-25},
address = {Istanbul, Turkey},
editor = {Nicoletta Calzolari (Conference Chair) and Khalid Choukri and Thierry Declerck and Mehmet Ugur Dogan and Bente Maegaard and Joseph Mariani and Jan Odijk and Stelios Piperidis},
publisher = {European Language Resources Association (ELRA)},
isbn = {978-2-9517408-7-7},
language = {english}
}
tatoeba/tatoeba_af (configuration par défaut)
Taille du téléchargement :
58.24 KiB
Taille du jeu de données :
162.74 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_ar
Taille du téléchargement :
70.95 KiB
Taille du jeu de données :
175.46 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_bg
Taille du téléchargement :
99.88 KiB
Taille du jeu de données :
204.64 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_bn
Taille du téléchargement :
89.55 KiB
Taille du jeu de données :
194.24 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_de
Taille du téléchargement :
103.09 KiB
Taille du jeu de données :
207.93 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_el
Taille du téléchargement :
77.11 KiB
Taille du jeu de données :
181.65 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_es
Taille du téléchargement :
70.57 KiB
Taille du jeu de données :
175.12 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_et
Taille du téléchargement :
58.33 KiB
Taille du jeu de données :
162.85 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_eu
Taille du téléchargement :
64.52 KiB
Taille du jeu de données :
169.02 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_fa
Taille du téléchargement :
91.52 KiB
Taille du jeu de données :
196.15 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_fi
Taille du téléchargement :
73.90 KiB
Taille du jeu de données :
178.47 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_fr
Taille du téléchargement :
78.14 KiB
Taille du jeu de données :
182.68 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_he
Taille du téléchargement :
81.54 KiB
Taille du jeu de données :
186.15 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_hi
Taille du téléchargement :
119.69 KiB
Taille du jeu de données :
224.89 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_hu
Taille du téléchargement :
67.27 KiB
Taille du jeu de données :
171.78 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_id
Taille du téléchargement :
73.09 KiB
Taille du jeu de données :
177.61 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_it
Taille du téléchargement :
64.29 KiB
Taille du jeu de données :
168.81 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_ja
Taille du téléchargement :
90.90 KiB
Taille du jeu de données :
195.53 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_jv
Taille du téléchargement :
13.59 KiB
Taille du jeu de données :
35.01 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 205 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_ka
Taille du téléchargement :
70.47 KiB
Taille du jeu de données :
148.67 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 746 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_kk
Taille du téléchargement :
46.07 KiB
Taille du jeu de données :
106.25 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 575 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_ko
Taille du téléchargement :
77.28 KiB
Taille du jeu de données :
181.88 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_ml
Taille du téléchargement :
92.50 KiB
Taille du jeu de données :
165.14 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 687 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_mr
Taille du téléchargement :
98.19 KiB
Taille du jeu de données :
202.96 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_nl
Taille du téléchargement :
71.55 KiB
Taille du jeu de données :
176.10 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_pt
Taille du téléchargement :
73.42 KiB
Taille du jeu de données :
177.95 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_ru
Taille du téléchargement :
90.30 KiB
Taille du jeu de données :
194.92 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_sw
Taille du téléchargement :
19.99 KiB
Taille du jeu de données :
60.75 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 390 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_ta
Taille du téléchargement :
38.52 KiB
Taille du jeu de données :
70.93 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 307 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_te
Taille du téléchargement :
24.55 KiB
Taille du jeu de données :
49.07 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 234 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_th
Taille du téléchargement :
61.72 KiB
Taille du jeu de données :
119.32 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 548 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_tl
Taille du téléchargement :
66.54 KiB
Taille du jeu de données :
171.04 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_tr
Taille du téléchargement :
70.20 KiB
Taille du jeu de données :
174.70 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_ur
Taille du téléchargement :
86.63 KiB
Taille du jeu de données :
191.20 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_vi
Taille du téléchargement :
89.26 KiB
Taille du jeu de données :
193.89 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Exemples ( tfds.as_dataframe ):
tatoeba/tatoeba_zh
Taille du téléchargement :
67.32 KiB
Taille du jeu de données :
171.85 KiB
Fractionnements :
Diviser | Exemples |
---|---|
'train' | 1 000 |
- Exemples ( tfds.as_dataframe ):