conceptual_12m

Referencias:

Utilice el siguiente comando para cargar este conjunto de datos en TFDS:

ds = tfds.load('huggingface:conceptual_12m')
  • Descripción :
Conceptual 12M is a large-scale dataset of 12 million
image-text pairs specifically meant to be used for visionand-language pre-training.
Its data collection pipeline is a relaxed version of the one used in Conceptual Captions 3M.
  • Licencia : el conjunto de datos se puede utilizar libremente para cualquier propósito, aunque se agradecería el reconocimiento de Google LLC ("Google") como fuente de datos. El conjunto de datos se proporciona "TAL CUAL" sin ninguna garantía, expresa o implícita. Google renuncia a toda responsabilidad por cualquier daño, directo o indirecto, resultante del uso del conjunto de datos.

  • Versión : 0.0.0

  • Divisiones :

Dividir Ejemplos
'train' 12423374
  • Características :
{
    "image_url": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "caption": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}