مراجع:
استخدم الأمر التالي لتحميل مجموعة البيانات هذه في TFDS:
ds = tfds.load('huggingface:conceptual_12m')
- وصف :
Conceptual 12M is a large-scale dataset of 12 million
image-text pairs specifically meant to be used for visionand-language pre-training.
Its data collection pipeline is a relaxed version of the one used in Conceptual Captions 3M.
الترخيص : يمكن استخدام مجموعة البيانات بحرية لأي غرض، على الرغم من أن الاعتراف بشركة Google LLC ("Google") كمصدر للبيانات سيكون موضع تقدير. يتم توفير مجموعة البيانات "كما هي" دون أي ضمان، صريحًا أو ضمنيًا. تُخلي Google مسؤوليتها الكاملة عن أي أضرار، مباشرة أو غير مباشرة، تنتج عن استخدام مجموعة البيانات.
الإصدار : 0.0.0
الإنشقاقات :
ينقسم | أمثلة |
---|---|
'train' | 12423374 |
- سمات :
{
"image_url": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"caption": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}