- Açıklama :
OPUS, web'den çevrilmiş metinlerin bir koleksiyonudur.
Hangi veri / dil çiftinin yükleneceğini seçmek için kendi yapılandırmanızı oluşturun.
config = tfds.translate.opus.OpusConfig(
version=tfds.core.Version('0.1.0'),
language_pair=("de", "en"),
subsets=["GNOME", "EMEA"]
)
builder = tfds.builder("opus", config=config)
Ana sayfa : http://opus.nlpl.eu/
Kaynak kodu :
tfds.datasets.opus.Builder
sürümler :
-
0.1.0
(varsayılan): Sürüm notu yok.
-
Özellik yapısı :
Translation({
'de': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Özellik belgeleri :
Özellik | Sınıf | Şekil | Dtipi | Tanım |
---|---|---|---|---|
Tercüme | ||||
de | Metin | sicim | ||
tr | Metin | sicim |
Denetlenen anahtarlar (Bkz
as_supervised
doc ):('de', 'en')
Şekil ( tfds.show_examples ): Desteklenmiyor.
Alıntı :
@inproceedings{Tiedemann2012ParallelData,
author = {Tiedemann, J},
title = {Parallel Data, Tools and Interfaces in OPUS},
booktitle = {LREC}
year = {2012} }
opus/tıbbi (varsayılan yapılandırma)
Yapılandırma açıklaması : tıbbi belgeler
İndirme boyutu :
34.29 MiB
Veri kümesi boyutu :
188.85 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Yalnızca
shuffle_files=False
(tren) olduğundabölmeler :
Bölmek | örnekler |
---|---|
'train' | 1.108.752 |
- Örnekler ( tfds.as_dataframe ):
eser/hukuk
Yapılandırma açıklaması : yasa belgeleri
İndirme boyutu :
46.99 MiB
Veri kümesi boyutu :
214.44 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Yalnızca
shuffle_files=False
(tren) olduğundabölmeler :
Bölmek | örnekler |
---|---|
'train' | 719.372 |
- Örnekler ( tfds.as_dataframe ):
yapıt/kur'an
Yapılandırma açıklaması : Kuran belgeleri
İndirme boyutu :
35.42 MiB
Veri kümesi boyutu :
117.54 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 537.128 |
- Örnekler ( tfds.as_dataframe ):
yapıt/BT
Yapılandırma açıklaması : BT belgeleri
İndirme boyutu :
10.33 MiB
Veri kümesi boyutu :
42.51 MiB
Otomatik önbelleğe alınmış ( belgeleme ): Evet
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 347.817 |
- Örnekler ( tfds.as_dataframe ):
yapıt/altyazılar
Yapılandırma açıklaması : altyazı belgeleri
İndirme boyutu :
677.64 MiB
Veri kümesi boyutu :
2.01 GiB
Otomatik önbelleğe alınmış ( belgeleme ): Hayır
bölmeler :
Bölmek | örnekler |
---|---|
'train' | 22.512.639 |
- Örnekler ( tfds.as_dataframe ):