lm1b

Riferimenti:

testo_normale

Utilizzare il comando seguente per caricare questo set di dati in TFDS:

ds = tfds.load('huggingface:lm1b/plain_text')

A benchmark corpus to be used for measuring progress in statistical language modeling. This has almost one billion words in the training data.

Diviso	Esempi
`'test'`	306688
`'train'`	30301028

{
    "text": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}

Salvo quando diversamente specificato, i contenuti di questa pagina sono concessi in base alla licenza Creative Commons Attribution 4.0, mentre gli esempi di codice sono concessi in base alla licenza Apache 2.0. Per ulteriori dettagli, consulta le norme del sito di Google Developers. Java è un marchio registrato di Oracle e/o delle sue consociate.

Ultimo aggiornamento 2024-12-17 UTC.