Referanslar:
Bu veri kümesini TFDS'ye yüklemek için aşağıdaki komutu kullanın:
ds = tfds.load('huggingface:conceptual_12m')
- Tanım :
Conceptual 12M is a large-scale dataset of 12 million
image-text pairs specifically meant to be used for visionand-language pre-training.
Its data collection pipeline is a relaxed version of the one used in Conceptual Captions 3M.
Lisans : Veri kümesi herhangi bir amaç için serbestçe kullanılabilir, ancak veri kaynağı olarak Google LLC'nin ("Google") tanınması memnuniyetle karşılanacaktır. Veri seti, açık veya zımni herhangi bir garanti olmaksızın "OLDUĞU GİBİ" sağlanmaktadır. Google, veri kümesinin kullanımından kaynaklanan doğrudan veya dolaylı hiçbir zarara ilişkin hiçbir sorumluluk kabul etmez.
Sürüm : 0.0.0
Bölünmeler :
Bölmek | Örnekler |
---|---|
'train' | 12423374 |
- Özellikler :
{
"image_url": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"caption": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}