ओपस_ग्नोम

सन्दर्भ:

अर-बाल

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:opus_gnome/ar-bal')
  • विवरण :
A parallel corpus of GNOME localization files. Source: https://l10n.gnome.org

187 languages, 12,822 bitexts
total number of files: 113,344
total number of tokens: 267.27M
total number of sentence fragments: 58.12M
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.0.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 60
  • विशेषताएँ :
{
    "id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "translation": {
        "languages": [
            "ar",
            "bal"
        ],
        "id": null,
        "_type": "Translation"
    }
}

बीजी-सीएसबी

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:opus_gnome/bg-csb')
  • विवरण :
A parallel corpus of GNOME localization files. Source: https://l10n.gnome.org

187 languages, 12,822 bitexts
total number of files: 113,344
total number of tokens: 267.27M
total number of sentence fragments: 58.12M
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.0.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 1768
  • विशेषताएँ :
{
    "id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "translation": {
        "languages": [
            "bg",
            "csb"
        ],
        "id": null,
        "_type": "Translation"
    }
}

ca-en_GB

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:opus_gnome/ca-en_GB')
  • विवरण :
A parallel corpus of GNOME localization files. Source: https://l10n.gnome.org

187 languages, 12,822 bitexts
total number of files: 113,344
total number of tokens: 267.27M
total number of sentence fragments: 58.12M
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.0.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 7982
  • विशेषताएँ :
{
    "id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "translation": {
        "languages": [
            "ca",
            "en_GB"
        ],
        "id": null,
        "_type": "Translation"
    }
}

सीएस-ईओ

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:opus_gnome/cs-eo')
  • विवरण :
A parallel corpus of GNOME localization files. Source: https://l10n.gnome.org

187 languages, 12,822 bitexts
total number of files: 113,344
total number of tokens: 267.27M
total number of sentence fragments: 58.12M
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.0.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 73
  • विशेषताएँ :
{
    "id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "translation": {
        "languages": [
            "cs",
            "eo"
        ],
        "id": null,
        "_type": "Translation"
    }
}

दे-हा

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:opus_gnome/de-ha')
  • विवरण :
A parallel corpus of GNOME localization files. Source: https://l10n.gnome.org

187 languages, 12,822 bitexts
total number of files: 113,344
total number of tokens: 267.27M
total number of sentence fragments: 58.12M
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.0.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 216
  • विशेषताएँ :
{
    "id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "translation": {
        "languages": [
            "de",
            "ha"
        ],
        "id": null,
        "_type": "Translation"
    }
}

सीएस-टीके

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:opus_gnome/cs-tk')
  • विवरण :
A parallel corpus of GNOME localization files. Source: https://l10n.gnome.org

187 languages, 12,822 bitexts
total number of files: 113,344
total number of tokens: 267.27M
total number of sentence fragments: 58.12M
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.0.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 18686
  • विशेषताएँ :
{
    "id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "translation": {
        "languages": [
            "cs",
            "tk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

दा-वि

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:opus_gnome/da-vi')
  • विवरण :
A parallel corpus of GNOME localization files. Source: https://l10n.gnome.org

187 languages, 12,822 bitexts
total number of files: 113,344
total number of tokens: 267.27M
total number of sentence fragments: 58.12M
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.0.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 149
  • विशेषताएँ :
{
    "id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "translation": {
        "languages": [
            "da",
            "vi"
        ],
        "id": null,
        "_type": "Translation"
    }
}

en_GB-मेरा

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:opus_gnome/en_GB-my')
  • विवरण :
A parallel corpus of GNOME localization files. Source: https://l10n.gnome.org

187 languages, 12,822 bitexts
total number of files: 113,344
total number of tokens: 267.27M
total number of sentence fragments: 58.12M
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.0.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 28232
  • विशेषताएँ :
{
    "id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "translation": {
        "languages": [
            "en_GB",
            "my"
        ],
        "id": null,
        "_type": "Translation"
    }
}

एल-स्क

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:opus_gnome/el-sk')
  • विवरण :
A parallel corpus of GNOME localization files. Source: https://l10n.gnome.org

187 languages, 12,822 bitexts
total number of files: 113,344
total number of tokens: 267.27M
total number of sentence fragments: 58.12M
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.0.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 150
  • विशेषताएँ :
{
    "id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "translation": {
        "languages": [
            "el",
            "sk"
        ],
        "id": null,
        "_type": "Translation"
    }
}

डी-टीटी

इस डेटासेट को TFDS में लोड करने के लिए निम्नलिखित कमांड का उपयोग करें:

ds = tfds.load('huggingface:opus_gnome/de-tt')
  • विवरण :
A parallel corpus of GNOME localization files. Source: https://l10n.gnome.org

187 languages, 12,822 bitexts
total number of files: 113,344
total number of tokens: 267.27M
total number of sentence fragments: 58.12M
  • लाइसेंस : कोई ज्ञात लाइसेंस नहीं
  • संस्करण : 1.0.0
  • विभाजन :
विभाजित करना उदाहरण
'train' 2169
  • विशेषताएँ :
{
    "id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "translation": {
        "languages": [
            "de",
            "tt"
        ],
        "id": null,
        "_type": "Translation"
    }
}