ted_hrlr

参考文献:

az_to_ja

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:ted_hrlr/az_to_en')
  • 説明
Data sets derived from TED talk transcripts for comparing similar language pairs
where one is high resource and the other is low resource.
  • ライセンス: 既知のライセンスはありません
  • バージョン: 1.0.0
  • 分割:
スプリット
'test' 904
'train' 5947
'validation' 672
  • 特徴
{
    "translation": {
        "languages": [
            "az",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

aztr_to_ja

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:ted_hrlr/aztr_to_en')
  • 説明
Data sets derived from TED talk transcripts for comparing similar language pairs
where one is high resource and the other is low resource.
  • ライセンス: 既知のライセンスはありません
  • バージョン: 1.0.0
  • 分割:
スプリット
'test' 904
'train' 188397
'validation' 672
  • 特徴
{
    "translation": {
        "languages": [
            "az_tr",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

be_to_ja

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:ted_hrlr/be_to_en')
  • 説明
Data sets derived from TED talk transcripts for comparing similar language pairs
where one is high resource and the other is low resource.
  • ライセンス: 既知のライセンスはありません
  • バージョン: 1.0.0
  • 分割:
スプリット
'test' 665
'train' 4510
'validation' 249
  • 特徴
{
    "translation": {
        "languages": [
            "be",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

beru_to_ja

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:ted_hrlr/beru_to_en')
  • 説明
Data sets derived from TED talk transcripts for comparing similar language pairs
where one is high resource and the other is low resource.
  • ライセンス: 既知のライセンスはありません
  • バージョン: 1.0.0
  • 分割:
スプリット
'test' 665
'train' 212615
'validation' 249
  • 特徴
{
    "translation": {
        "languages": [
            "be_ru",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

es_to_pt

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:ted_hrlr/es_to_pt')
  • 説明
Data sets derived from TED talk transcripts for comparing similar language pairs
where one is high resource and the other is low resource.
  • ライセンス: 既知のライセンスはありません
  • バージョン: 1.0.0
  • 分割:
スプリット
'test' 1764年
'train' 44939
'validation' 1017
  • 特徴
{
    "translation": {
        "languages": [
            "es",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

fr_to_pt

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:ted_hrlr/fr_to_pt')
  • 説明
Data sets derived from TED talk transcripts for comparing similar language pairs
where one is high resource and the other is low resource.
  • ライセンス: 既知のライセンスはありません
  • バージョン: 1.0.0
  • 分割:
スプリット
'test' 1495年
'train' 43874
'validation' 1132
  • 特徴
{
    "translation": {
        "languages": [
            "fr",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

gl_to_ja

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:ted_hrlr/gl_to_en')
  • 説明
Data sets derived from TED talk transcripts for comparing similar language pairs
where one is high resource and the other is low resource.
  • ライセンス: 既知のライセンスはありません
  • バージョン: 1.0.0
  • 分割:
スプリット
'test' 1008
'train' 10018
'validation' 683
  • 特徴
{
    "translation": {
        "languages": [
            "gl",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

glpt_to_en

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:ted_hrlr/glpt_to_en')
  • 説明
Data sets derived from TED talk transcripts for comparing similar language pairs
where one is high resource and the other is low resource.
  • ライセンス: 既知のライセンスはありません
  • バージョン: 1.0.0
  • 分割:
スプリット
'test' 1008
'train' 61803
'validation' 683
  • 特徴
{
    "translation": {
        "languages": [
            "gl_pt",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

彼とpt

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:ted_hrlr/he_to_pt')
  • 説明
Data sets derived from TED talk transcripts for comparing similar language pairs
where one is high resource and the other is low resource.
  • ライセンス: 既知のライセンスはありません
  • バージョン: 1.0.0
  • 分割:
スプリット
'test' 1624年
'train' 48512
'validation' 1146
  • 特徴
{
    "translation": {
        "languages": [
            "he",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

it_to_pt

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:ted_hrlr/it_to_pt')
  • 説明
Data sets derived from TED talk transcripts for comparing similar language pairs
where one is high resource and the other is low resource.
  • ライセンス: 既知のライセンスはありません
  • バージョン: 1.0.0
  • 分割:
スプリット
'test' 1670年
'train' 46260
'validation' 1163
  • 特徴
{
    "translation": {
        "languages": [
            "it",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

pt_to_ja

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:ted_hrlr/pt_to_en')
  • 説明
Data sets derived from TED talk transcripts for comparing similar language pairs
where one is high resource and the other is low resource.
  • ライセンス: 既知のライセンスはありません
  • バージョン: 1.0.0
  • 分割:
スプリット
'test' 1804年
'train' 51786
'validation' 1194
  • 特徴
{
    "translation": {
        "languages": [
            "pt",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ru_to_ja

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:ted_hrlr/ru_to_en')
  • 説明
Data sets derived from TED talk transcripts for comparing similar language pairs
where one is high resource and the other is low resource.
  • ライセンス: 既知のライセンスはありません
  • バージョン: 1.0.0
  • 分割:
スプリット
'test' 5477
'train' 208107
'validation' 4806
  • 特徴
{
    "translation": {
        "languages": [
            "ru",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ru_to_pt

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:ted_hrlr/ru_to_pt')
  • 説明
Data sets derived from TED talk transcripts for comparing similar language pairs
where one is high resource and the other is low resource.
  • ライセンス: 既知のライセンスはありません
  • バージョン: 1.0.0
  • 分割:
スプリット
'test' 1589年
'train' 47279
'validation' 1185
  • 特徴
{
    "translation": {
        "languages": [
            "ru",
            "pt"
        ],
        "id": null,
        "_type": "Translation"
    }
}

tr_to_ja

次のコマンドを使用して、このデータセットを TFDS にロードします。

ds = tfds.load('huggingface:ted_hrlr/tr_to_en')
  • 説明
Data sets derived from TED talk transcripts for comparing similar language pairs
where one is high resource and the other is low resource.
  • ライセンス: 既知のライセンスはありません
  • バージョン: 1.0.0
  • 分割:
スプリット
'test' 5030
'train' 182451
'validation' 4046
  • 特徴
{
    "translation": {
        "languages": [
            "tr",
            "en"
        ],
        "id": null,
        "_type": "Translation"
    }
}