مراجع:
برای بارگذاری این مجموعه داده در TFDS از دستور زیر استفاده کنید:
ds = tfds.load('huggingface:conceptual_12m')
- توضیحات :
Conceptual 12M is a large-scale dataset of 12 million
image-text pairs specifically meant to be used for visionand-language pre-training.
Its data collection pipeline is a relaxed version of the one used in Conceptual Captions 3M.
مجوز : مجموعه داده ممکن است آزادانه برای هر هدفی مورد استفاده قرار گیرد، اگرچه تأیید Google LLC ("Google") به عنوان منبع داده قدردانی می شود. مجموعه داده "همانطور که هست" بدون هیچ گونه ضمانت، صریح یا ضمنی ارائه شده است. Google مسئولیت هرگونه خسارت مستقیم یا غیرمستقیم ناشی از استفاده از مجموعه داده را رد می کند.
نسخه : 0.0.0
تقسیم ها :
تقسیم کنید | نمونه ها |
---|---|
'train' | 12423374 |
- ویژگی ها :
{
"image_url": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"caption": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}