Referencias:
Utilice el siguiente comando para cargar este conjunto de datos en TFDS:
ds = tfds.load('huggingface:conceptual_12m')
- Descripción :
Conceptual 12M is a large-scale dataset of 12 million
image-text pairs specifically meant to be used for visionand-language pre-training.
Its data collection pipeline is a relaxed version of the one used in Conceptual Captions 3M.
Licencia : el conjunto de datos se puede utilizar libremente para cualquier propósito, aunque se agradecería el reconocimiento de Google LLC ("Google") como fuente de datos. El conjunto de datos se proporciona "TAL CUAL" sin ninguna garantía, expresa o implícita. Google se exime de toda responsabilidad por cualquier daño, directo o indirecto, que resulte del uso del conjunto de datos.
Versión : 0.0.0
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 12423374 |
- Características :
{
"image_url": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"caption": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}