concettuale_12m

Riferimenti:

Utilizzare il comando seguente per caricare questo set di dati in TFDS:

ds = tfds.load('huggingface:conceptual_12m')
  • Descrizione :
Conceptual 12M is a large-scale dataset of 12 million
image-text pairs specifically meant to be used for visionand-language pre-training.
Its data collection pipeline is a relaxed version of the one used in Conceptual Captions 3M.
  • Licenza : il set di dati può essere utilizzato liberamente per qualsiasi scopo, anche se sarebbe apprezzato il riconoscimento di Google LLC ("Google") come fonte dei dati. Il set di dati viene fornito "COSÌ COM'È" senza alcuna garanzia, espressa o implicita. Google declina ogni responsabilità per eventuali danni, diretti o indiretti, derivanti dall'utilizzo del set di dati.

  • Versione : 0.0.0

  • Divide :

Diviso Esempi
'train' 12423374
  • Caratteristiche :
{
    "image_url": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "caption": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}