europarl_バイリンガル

参考文献:

バックグラウンド-CS

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/bg-cs')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 402657
  • 特徴
{
    "translation": {
        "languages": [
            "bg",
            "cs"
        ],
        "id": null,
        "_type": "Translation"
    }
}

バックダ

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/bg-da')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 393449
  • 特徴
{
    "translation": {
        "languages": [
            "bg",
            "da"
        ],
        "id": null,
        "_type": "Translation"
    }
}

バックグラウンド

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/bg-de')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 393298
  • 特徴
{
    "translation": {
        "languages": [
            "bg",
            "de"
        ],
        "id": null,
        "_type": "Translation"
    }
}

バックエル

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/bg-el')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 377341
  • 特徴
{
    "translation": {
        "languages": [
            "bg",
            "el"
        ],
        "id": null,
        "_type": "Translation"
    }
}

バックグラウンド

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/bg-en')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 408290
  • 特徴
{
    "translation": {
        "languages": [
            "bg",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

バックグラウンド

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/bg-es')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 388226
  • 特徴
{
    "translation": {
        "languages": [
            "bg",
            "es"
        ],
        "id": null,
        "_type": "Translation"
    }
}

背景

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/bg-et')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 400712
  • 特徴
{
    "translation": {
        "languages": [
            "bg",
            "et"
        ],
        "id": null,
        "_type": "Translation"
    }
}

バックグラウンドファイ

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/bg-fi')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 396624
  • 特徴
{
    "translation": {
        "languages": [
            "bg",
            "fi"
        ],
        "id": null,
        "_type": "Translation"
    }
}

バックグラウンド

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/bg-fr')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 393644
  • 特徴
{
    "translation": {
        "languages": [
            "bg",
            "fr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

バックグラウンドヒュー

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/bg-hu')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 382773
  • 特徴
{
    "translation": {
        "languages": [
            "bg",
            "hu"
        ],
        "id": null,
        "_type": "Translation"
    }
}

うーん、それ

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/bg-it')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 377822
  • 特徴
{
    "translation": {
        "languages": [
            "bg",
            "it"
        ],
        "id": null,
        "_type": "Translation"
    }
}

バックグラウンド

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/bg-lt')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 392554
  • 特徴
{
    "translation": {
        "languages": [
            "bg",
            "lt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

バックグラウンドレベル

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/bg-lv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 398355
  • 特徴
{
    "translation": {
        "languages": [
            "bg",
            "lv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

バックグラウンド

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/bg-nl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 388273
  • 特徴
{
    "translation": {
        "languages": [
            "bg",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

BG-PL

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/bg-pl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 395269
  • 特徴
{
    "translation": {
        "languages": [
            "bg",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

バックグラウンドポイント

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/bg-pt')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 388972
  • 特徴
{
    "translation": {
        "languages": [
            "bg",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

バックグラウンド

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/bg-ro')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 389381
  • 特徴
{
    "translation": {
        "languages": [
            "bg",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

BGM

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/bg-sk')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 393815
  • 特徴
{
    "translation": {
        "languages": [
            "bg",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

bg-sl

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/bg-sl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 380231
  • 特徴
{
    "translation": {
        "languages": [
            "bg",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

バックグラウンドSV

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/bg-sv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 398236
  • 特徴
{
    "translation": {
        "languages": [
            "bg",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-da

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/cs-da')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 618055
  • 特徴
{
    "translation": {
        "languages": [
            "cs",
            "da"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-de

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/cs-de')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 568589
  • 特徴
{
    "translation": {
        "languages": [
            "cs",
            "de"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-el

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/cs-el')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 599489
  • 特徴
{
    "translation": {
        "languages": [
            "cs",
            "el"
        ],
        "id": null,
        "_type": "Translation"
    }
}

CS-ja

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/cs-en')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 647095
  • 特徴
{
    "translation": {
        "languages": [
            "cs",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-es

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/cs-es')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 619774
  • 特徴
{
    "translation": {
        "languages": [
            "cs",
            "es"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-et

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/cs-et')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 636512
  • 特徴
{
    "translation": {
        "languages": [
            "cs",
            "et"
        ],
        "id": null,
        "_type": "Translation"
    }
}

CS-Fi

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/cs-fi')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 619320
  • 特徴
{
    "translation": {
        "languages": [
            "cs",
            "fi"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-fr

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/cs-fr')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 628200
  • 特徴
{
    "translation": {
        "languages": [
            "cs",
            "fr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-hu

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/cs-hu')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 616160
  • 特徴
{
    "translation": {
        "languages": [
            "cs",
            "hu"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-it

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/cs-it')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 607017
  • 特徴
{
    "translation": {
        "languages": [
            "cs",
            "it"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-lt

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/cs-lt')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 624292
  • 特徴
{
    "translation": {
        "languages": [
            "cs",
            "lt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-lv

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/cs-lv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 627873
  • 特徴
{
    "translation": {
        "languages": [
            "cs",
            "lv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-nl

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/cs-nl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 618414
  • 特徴
{
    "translation": {
        "languages": [
            "cs",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-pl

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/cs-pl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 621387
  • 特徴
{
    "translation": {
        "languages": [
            "cs",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-pt

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/cs-pt')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 609729
  • 特徴
{
    "translation": {
        "languages": [
            "cs",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-ro

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/cs-ro')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 392085
  • 特徴
{
    "translation": {
        "languages": [
            "cs",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-sk

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/cs-sk')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 636128
  • 特徴
{
    "translation": {
        "languages": [
            "cs",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-sl

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/cs-sl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 611624
  • 特徴
{
    "translation": {
        "languages": [
            "cs",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

cs-sv

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/cs-sv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 631544
  • 特徴
{
    "translation": {
        "languages": [
            "cs",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

だで

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/da-de')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1928414
  • 特徴
{
    "translation": {
        "languages": [
            "da",
            "de"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ダーエル

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/da-el')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1280579
  • 特徴
{
    "translation": {
        "languages": [
            "da",
            "el"
        ],
        "id": null,
        "_type": "Translation"
    }
}

だえん

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/da-en')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1991647
  • 特徴
{
    "translation": {
        "languages": [
            "da",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ダエス

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/da-es')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1943931
  • 特徴
{
    "translation": {
        "languages": [
            "da",
            "es"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ダエット

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/da-et')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 635018
  • 特徴
{
    "translation": {
        "languages": [
            "da",
            "et"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ダフィ

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/da-fi')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1917260
  • 特徴
{
    "translation": {
        "languages": [
            "da",
            "fi"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ダーフル

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/da-fr')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1992590
  • 特徴
{
    "translation": {
        "languages": [
            "da",
            "fr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ダーフー

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/da-hu')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 617519
  • 特徴
{
    "translation": {
        "languages": [
            "da",
            "hu"
        ],
        "id": null,
        "_type": "Translation"
    }
}

だ、それ

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/da-it')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1876703
  • 特徴
{
    "translation": {
        "languages": [
            "da",
            "it"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ダルト

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/da-lt')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 614923
  • 特徴
{
    "translation": {
        "languages": [
            "da",
            "lt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ダールブ

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/da-lv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 627809
  • 特徴
{
    "translation": {
        "languages": [
            "da",
            "lv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

だ~んる

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/da-nl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1987498
  • 特徴
{
    "translation": {
        "languages": [
            "da",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ダ・プル

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/da-pl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 642544
  • 特徴
{
    "translation": {
        "languages": [
            "da",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

だーpt

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/da-pt')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1930454
  • 特徴
{
    "translation": {
        "languages": [
            "da",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

だろ

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/da-ro')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 388156
  • 特徴
{
    "translation": {
        "languages": [
            "da",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ダスク

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/da-sk')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 621907
  • 特徴
{
    "translation": {
        "languages": [
            "da",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ダスル

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/da-sl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 595944
  • 特徴
{
    "translation": {
        "languages": [
            "da",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ダ-SV

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/da-sv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1871171
  • 特徴
{
    "translation": {
        "languages": [
            "da",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

デエル

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/de-el')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1223026
  • 特徴
{
    "translation": {
        "languages": [
            "de",
            "el"
        ],
        "id": null,
        "_type": "Translation"
    }
}

デ・エン

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/de-en')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1961119
  • 特徴
{
    "translation": {
        "languages": [
            "de",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ディーエス

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/de-es')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1887879
  • 特徴
{
    "translation": {
        "languages": [
            "de",
            "es"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ディエット

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/de-et')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 578248
  • 特徴
{
    "translation": {
        "languages": [
            "de",
            "et"
        ],
        "id": null,
        "_type": "Translation"
    }
}

非金融

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/de-fi')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1871185
  • 特徴
{
    "translation": {
        "languages": [
            "de",
            "fi"
        ],
        "id": null,
        "_type": "Translation"
    }
}

デフランス

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/de-fr')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1942666
  • 特徴
{
    "translation": {
        "languages": [
            "de",
            "fr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

デフ

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/de-hu')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 563571
  • 特徴
{
    "translation": {
        "languages": [
            "de",
            "hu"
        ],
        "id": null,
        "_type": "Translation"
    }
}

脱IT

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/de-it')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1832989
  • 特徴
{
    "translation": {
        "languages": [
            "de",
            "it"
        ],
        "id": null,
        "_type": "Translation"
    }
}

削除

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/de-lt')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 565892
  • 特徴
{
    "translation": {
        "languages": [
            "de",
            "lt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

レベル解除

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/de-lv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 573226
  • 特徴
{
    "translation": {
        "languages": [
            "de",
            "lv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

非nl

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/de-nl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1934111
  • 特徴
{
    "translation": {
        "languages": [
            "de",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

脱PL

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/de-pl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 579166
  • 特徴
{
    "translation": {
        "languages": [
            "de",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

部門

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/de-pt')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1884176
  • 特徴
{
    "translation": {
        "languages": [
            "de",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

デロ

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/de-ro')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 385663
  • 特徴
{
    "translation": {
        "languages": [
            "de",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/de-sk')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 569381
  • 特徴
{
    "translation": {
        "languages": [
            "de",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

デススラ

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/de-sl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 546212
  • 特徴
{
    "translation": {
        "languages": [
            "de",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

非SV

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/de-sv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1842026
  • 特徴
{
    "translation": {
        "languages": [
            "de",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エルエン

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/el-en')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1292180
  • 特徴
{
    "translation": {
        "languages": [
            "el",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エルエス

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/el-es')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1272383
  • 特徴
{
    "translation": {
        "languages": [
            "el",
            "es"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エルエット

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/el-et')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 599915
  • 特徴
{
    "translation": {
        "languages": [
            "el",
            "et"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エルフィ

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/el-fi')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1227612
  • 特徴
{
    "translation": {
        "languages": [
            "el",
            "fi"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エルフ

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/el-fr')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1290796
  • 特徴
{
    "translation": {
        "languages": [
            "el",
            "fr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エルフ

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/el-hu')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 586250
  • 特徴
{
    "translation": {
        "languages": [
            "el",
            "hu"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エルイット

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/el-it')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1231222
  • 特徴
{
    "translation": {
        "languages": [
            "el",
            "it"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エルト

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/el-lt')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 590850
  • 特徴
{
    "translation": {
        "languages": [
            "el",
            "lt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エルルブ

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/el-lv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 596929
  • 特徴
{
    "translation": {
        "languages": [
            "el",
            "lv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エルンル

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/el-nl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1277297
  • 特徴
{
    "translation": {
        "languages": [
            "el",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エルプル

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/el-pl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 591069
  • 特徴
{
    "translation": {
        "languages": [
            "el",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エルポイント

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/el-pt')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1261188
  • 特徴
{
    "translation": {
        "languages": [
            "el",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エルロ

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/el-ro')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 372839
  • 特徴
{
    "translation": {
        "languages": [
            "el",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エルスク

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/el-sk')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 600684
  • 特徴
{
    "translation": {
        "languages": [
            "el",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エル・スル

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/el-sl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 579109
  • 特徴
{
    "translation": {
        "languages": [
            "el",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エルSV

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/el-sv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1273743
  • 特徴
{
    "translation": {
        "languages": [
            "el",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エンエス

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/en-es')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 2009073
  • 特徴
{
    "translation": {
        "languages": [
            "en",
            "es"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エンエット

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/en-et')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 651236
  • 特徴
{
    "translation": {
        "languages": [
            "en",
            "et"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エンファイ

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/en-fi')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1969624
  • 特徴
{
    "translation": {
        "languages": [
            "en",
            "fi"
        ],
        "id": null,
        "_type": "Translation"
    }
}

フランス

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/en-fr')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 2051014
  • 特徴
{
    "translation": {
        "languages": [
            "en",
            "fr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エンフ

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/en-hu')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 625178
  • 特徴
{
    "translation": {
        "languages": [
            "en",
            "hu"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エンイット

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/en-it')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1946253
  • 特徴
{
    "translation": {
        "languages": [
            "en",
            "it"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-lt

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/en-lt')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 634284
  • 特徴
{
    "translation": {
        "languages": [
            "en",
            "lt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

英語版

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/en-lv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 639318
  • 特徴
{
    "translation": {
        "languages": [
            "en",
            "lv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-nl

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/en-nl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 2027447
  • 特徴
{
    "translation": {
        "languages": [
            "en",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

英語

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/en-pl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 631160
  • 特徴
{
    "translation": {
        "languages": [
            "en",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-pt

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/en-pt')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 2002943
  • 特徴
{
    "translation": {
        "languages": [
            "en",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エンロ

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/en-ro')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 400356
  • 特徴
{
    "translation": {
        "languages": [
            "en",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エンスク

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/en-sk')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 639958
  • 特徴
{
    "translation": {
        "languages": [
            "en",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

英語/スペイン語

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/en-sl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 624803
  • 特徴
{
    "translation": {
        "languages": [
            "en",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en-SV

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/en-sv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1892723
  • 特徴
{
    "translation": {
        "languages": [
            "en",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エスエット

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/es-et')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 618350
  • 特徴
{
    "translation": {
        "languages": [
            "es",
            "et"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エスファイ

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/es-fi')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1901596
  • 特徴
{
    "translation": {
        "languages": [
            "es",
            "fi"
        ],
        "id": null,
        "_type": "Translation"
    }
}

es-fr

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/es-fr')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1982990
  • 特徴
{
    "translation": {
        "languages": [
            "es",
            "fr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エスフ

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/es-hu')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 604007
  • 特徴
{
    "translation": {
        "languages": [
            "es",
            "hu"
        ],
        "id": null,
        "_type": "Translation"
    }
}

そうだね

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/es-it')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1880982
  • 特徴
{
    "translation": {
        "languages": [
            "es",
            "it"
        ],
        "id": null,
        "_type": "Translation"
    }
}

es-lt

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/es-lt')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 611082
  • 特徴
{
    "translation": {
        "languages": [
            "es",
            "lt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

es-lv

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/es-lv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 615496
  • 特徴
{
    "translation": {
        "languages": [
            "es",
            "lv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

es-nl

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/es-nl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1954351
  • 特徴
{
    "translation": {
        "languages": [
            "es",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エスプリ

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/es-pl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 609297
  • 特徴
{
    "translation": {
        "languages": [
            "es",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エスポイント

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/es-pt')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1933321
  • 特徴
{
    "translation": {
        "languages": [
            "es",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エスロ

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/es-ro')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 387653
  • 特徴
{
    "translation": {
        "languages": [
            "es",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エススク

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/es-sk')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 619027
  • 特徴
{
    "translation": {
        "languages": [
            "es",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エスエスエル

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/es-sl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 599168
  • 特徴
{
    "translation": {
        "languages": [
            "es",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

es-sv

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/es-sv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1826855
  • 特徴
{
    "translation": {
        "languages": [
            "es",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

et-fi

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/et-fi')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 620939
  • 特徴
{
    "translation": {
        "languages": [
            "et",
            "fi"
        ],
        "id": null,
        "_type": "Translation"
    }
}

et-fr

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/et-fr')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 630126
  • 特徴
{
    "translation": {
        "languages": [
            "et",
            "fr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エトフ

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/et-hu')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 628044
  • 特徴
{
    "translation": {
        "languages": [
            "et",
            "hu"
        ],
        "id": null,
        "_type": "Translation"
    }
}

それで

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/et-it')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 607088
  • 特徴
{
    "translation": {
        "languages": [
            "et",
            "it"
        ],
        "id": null,
        "_type": "Translation"
    }
}

et-lt

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/et-lt')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 622003
  • 特徴
{
    "translation": {
        "languages": [
            "et",
            "lt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

et-lv

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/et-lv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 637468
  • 特徴
{
    "translation": {
        "languages": [
            "et",
            "lv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

et-nl

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/et-nl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 621150
  • 特徴
{
    "translation": {
        "languages": [
            "et",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

et-pl

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/et-pl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 639046
  • 特徴
{
    "translation": {
        "languages": [
            "et",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

et-pt

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/et-pt')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 616238
  • 特徴
{
    "translation": {
        "languages": [
            "et",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

エトロ

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/et-ro')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 389087
  • 特徴
{
    "translation": {
        "languages": [
            "et",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

et-sk

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/et-sk')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 634168
  • 特徴
{
    "translation": {
        "languages": [
            "et",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

et-sl

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/et-sl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 609731
  • 特徴
{
    "translation": {
        "languages": [
            "et",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

et-sv

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/et-sv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 656646
  • 特徴
{
    "translation": {
        "languages": [
            "et",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fi-fr

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/fi-fr')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1964126
  • 特徴
{
    "translation": {
        "languages": [
            "fi",
            "fr"
        ],
        "id": null,
        "_type": "Translation"
    }
}

フィフ

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/fi-hu')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 606348
  • 特徴
{
    "translation": {
        "languages": [
            "fi",
            "hu"
        ],
        "id": null,
        "_type": "Translation"
    }
}

フィット

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/fi-it')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1845203
  • 特徴
{
    "translation": {
        "languages": [
            "fi",
            "it"
        ],
        "id": null,
        "_type": "Translation"
    }
}

フィルト

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/fi-lt')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 613113
  • 特徴
{
    "translation": {
        "languages": [
            "fi",
            "lt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fi-lv

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/fi-lv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 616816
  • 特徴
{
    "translation": {
        "languages": [
            "fi",
            "lv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

フィ-ンル

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/fi-nl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1940808
  • 特徴
{
    "translation": {
        "languages": [
            "fi",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fi-pl

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/fi-pl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 612689
  • 特徴
{
    "translation": {
        "languages": [
            "fi",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fi-pt

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/fi-pt')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 1885062
  • 特徴
{
    "translation": {
        "languages": [
            "fi",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

フィーロ

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/fi-ro')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 391430
  • 特徴
{
    "translation": {
        "languages": [
            "fi",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

フィスク

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/fi-sk')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 623686
  • 特徴
{
    "translation": {
        "languages": [
            "fi",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fi-sl

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/fi-sl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス: データセットには、元のソースと同じライセンスが付属します。 http://opus.nlpl.eu/Europarl-v8.phpに記載されているソースに関する情報を確認してください。

  • バージョン: 8.0.0

  • 分割:

スプリット
'train' 596661
  • 特徴
{
    "translation": {
        "languages": [
            "fi",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fi-sv

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/fi-sv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 1883314
  • 特徴
{
    "translation": {
        "languages": [
            "fi",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fr-hu

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/fr-hu')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 615791
  • 特徴
{
    "translation": {
        "languages": [
            "fr",
            "hu"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fr-it

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/fr-it')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 1943673
  • 特徴
{
    "translation": {
        "languages": [
            "fr",
            "it"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fr-lt

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/fr-lt')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 620660
  • 特徴
{
    "translation": {
        "languages": [
            "fr",
            "lt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fr-lv

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/fr-lv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 626280
  • 特徴
{
    "translation": {
        "languages": [
            "fr",
            "lv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fr-nl

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/fr-nl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 2029551
  • 特徴
{
    "translation": {
        "languages": [
            "fr",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fr-pl

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/fr-pl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 621402
  • 特徴
{
    "translation": {
        "languages": [
            "fr",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fr-pt

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/fr-pt')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 1980132
  • 特徴
{
    "translation": {
        "languages": [
            "fr",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fr-ro

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/fr-ro')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 387846
  • 特徴
{
    "translation": {
        "languages": [
            "fr",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fr-sk

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/fr-sk')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 631846
  • 特徴
{
    "translation": {
        "languages": [
            "fr",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fr-sl

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/fr-sl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 606897
  • 特徴
{
    "translation": {
        "languages": [
            "fr",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

FR-SV

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/fr-sv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 1880390
  • 特徴
{
    "translation": {
        "languages": [
            "fr",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

hu-it

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/hu-it')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 589563
  • 特徴
{
    "translation": {
        "languages": [
            "hu",
            "it"
        ],
        "id": null,
        "_type": "Translation"
    }
}

hu-lt

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/hu-lt')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 610298
  • 特徴
{
    "translation": {
        "languages": [
            "hu",
            "lt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

hu-lv

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/hu-lv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 621101
  • 特徴
{
    "translation": {
        "languages": [
            "hu",
            "lv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

hu-nl

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/hu-nl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 605806
  • 特徴
{
    "translation": {
        "languages": [
            "hu",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

hu-pl

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/hu-pl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 621820
  • 特徴
{
    "translation": {
        "languages": [
            "hu",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

hu-pt

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/hu-pt')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 599639
  • 特徴
{
    "translation": {
        "languages": [
            "hu",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

hu-ro

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/hu-ro')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 377239
  • 特徴
{
    "translation": {
        "languages": [
            "hu",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/hu-sk')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 618247
  • 特徴
{
    "translation": {
        "languages": [
            "hu",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

hu-sl

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/hu-sl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 601671
  • 特徴
{
    "translation": {
        "languages": [
            "hu",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

hu-sv

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/hu-sv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 631872
  • 特徴
{
    "translation": {
        "languages": [
            "hu",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

it-lt

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/it-lt')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 593003
  • 特徴
{
    "translation": {
        "languages": [
            "it",
            "lt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

IT-LV

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/it-lv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 599394
  • 特徴
{
    "translation": {
        "languages": [
            "it",
            "lv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

it-nl

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/it-nl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 1919855
  • 特徴
{
    "translation": {
        "languages": [
            "it",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

it-pl

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/it-pl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 594472
  • 特徴
{
    "translation": {
        "languages": [
            "it",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

it-pt

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/it-pt')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 1877432
  • 特徴
{
    "translation": {
        "languages": [
            "it",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

it-ro

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/it-ro')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 367904
  • 特徴
{
    "translation": {
        "languages": [
            "it",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

it-sk

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/it-sk')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 603467
  • 特徴
{
    "translation": {
        "languages": [
            "it",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

it-sl

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/it-sl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 579968
  • 特徴
{
    "translation": {
        "languages": [
            "it",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

IT-SV

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/it-sv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 1766096
  • 特徴
{
    "translation": {
        "languages": [
            "it",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

lt-lv

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/lt-lv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 621857
  • 特徴
{
    "translation": {
        "languages": [
            "lt",
            "lv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

lt-nl

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/lt-nl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 613308
  • 特徴
{
    "translation": {
        "languages": [
            "lt",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

lt-pl

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/lt-pl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 617296
  • 特徴
{
    "translation": {
        "languages": [
            "lt",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

lt-pt

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/lt-pt')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 603223
  • 特徴
{
    "translation": {
        "languages": [
            "lt",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

lt-ro

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/lt-ro')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 384679
  • 特徴
{
    "translation": {
        "languages": [
            "lt",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

lt-sk

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/lt-sk')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 622997
  • 特徴
{
    "translation": {
        "languages": [
            "lt",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

lt-sl

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/lt-sl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 602442
  • 特徴
{
    "translation": {
        "languages": [
            "lt",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

LT-SV

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/lt-sv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 628817
  • 特徴
{
    "translation": {
        "languages": [
            "lt",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

lv-nl

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/lv-nl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 618352
  • 特徴
{
    "translation": {
        "languages": [
            "lv",
            "nl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

LV-PL

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/lv-pl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 638453
  • 特徴
{
    "translation": {
        "languages": [
            "lv",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

lv-pt

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/lv-pt')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 615580
  • 特徴
{
    "translation": {
        "languages": [
            "lv",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

lv-ro

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/lv-ro')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 390857
  • 特徴
{
    "translation": {
        "languages": [
            "lv",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

lv-sk

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/lv-sk')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 629803
  • 特徴
{
    "translation": {
        "languages": [
            "lv",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

lv-sl

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/lv-sl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 607381
  • 特徴
{
    "translation": {
        "languages": [
            "lv",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

LV-SV

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/lv-sv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 643600
  • 特徴
{
    "translation": {
        "languages": [
            "lv",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

NL-PL

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/nl-pl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 612797
  • 特徴
{
    "translation": {
        "languages": [
            "nl",
            "pl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

nl-pt

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/nl-pt')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 1957189
  • 特徴
{
    "translation": {
        "languages": [
            "nl",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

NL-RO

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/nl-ro')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 380736
  • 特徴
{
    "translation": {
        "languages": [
            "nl",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

NL-SK

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/nl-sk')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 622650
  • 特徴
{
    "translation": {
        "languages": [
            "nl",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

NL-SL

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/nl-sl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 600023
  • 特徴
{
    "translation": {
        "languages": [
            "nl",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

NL-SV

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/nl-sv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 1870685
  • 特徴
{
    "translation": {
        "languages": [
            "nl",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

pl-pt

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/pl-pt')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 608181
  • 特徴
{
    "translation": {
        "languages": [
            "pl",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

pl-ro

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/pl-ro')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 389341
  • 特徴
{
    "translation": {
        "languages": [
            "pl",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

pl-sk

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/pl-sk')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 624330
  • 特徴
{
    "translation": {
        "languages": [
            "pl",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

pl-sl

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/pl-sl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 600511
  • 特徴
{
    "translation": {
        "languages": [
            "pl",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

PL-SV

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/pl-sv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 657951
  • 特徴
{
    "translation": {
        "languages": [
            "pl",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

PT-RO

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/pt-ro')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 381404
  • 特徴
{
    "translation": {
        "languages": [
            "pt",
            "ro"
        ],
        "id": null,
        "_type": "Translation"
    }
}

PT-SK

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/pt-sk')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 611895
  • 特徴
{
    "translation": {
        "languages": [
            "pt",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

PT-SL

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/pt-sl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 593455
  • 特徴
{
    "translation": {
        "languages": [
            "pt",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

PT-SV

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:europarl_bilingual/pt-sv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 1823402
  • 特徴
{
    "translation": {
        "languages": [
            "pt",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ro-sk

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/ro-sk')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 387839
  • 特徴
{
    "translation": {
        "languages": [
            "ro",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ro-sl

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/ro-sl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 374859
  • 特徴
{
    "translation": {
        "languages": [
            "ro",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

RO-SV

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/ro-sv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 390133
  • 特徴
{
    "translation": {
        "languages": [
            "ro",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

SK-SL

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/sk-sl')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 609698
  • 特徴
{
    "translation": {
        "languages": [
            "sk",
            "sl"
        ],
        "id": null,
        "_type": "Translation"
    }
}

SK-SV

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/sk-sv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 636353
  • 特徴
{
    "translation": {
        "languages": [
            "sk",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}

SL-SV

次のコマンドを使用して、このデータセットをTFDにロードします。

ds = tfds.load('huggingface:europarl_bilingual/sl-sv')
  • 説明
A parallel corpus extracted from the European Parliament web site by Philipp Koehn (University of Edinburgh). The main intended use is to aid statistical machine translation research.
  • ライセンス:データセットには、元のソースと同じライセンスが付属しています。 http://opus.nlpl.eu/europarl-v8.phpで提供されているソースに関する情報を確認してください

  • バージョン:8.0.0

  • 分割:

スプリット
'train' 608740
  • 特徴
{
    "translation": {
        "languages": [
            "sl",
            "sv"
        ],
        "id": null,
        "_type": "Translation"
    }
}