Referensi:
Gunakan perintah berikut untuk memuat kumpulan data ini di TFDS:
ds = tfds.load('huggingface:conceptual_12m')
- Keterangan :
Conceptual 12M is a large-scale dataset of 12 million
image-text pairs specifically meant to be used for visionand-language pre-training.
Its data collection pipeline is a relaxed version of the one used in Conceptual Captions 3M.
Lisensi : Kumpulan data dapat digunakan secara bebas untuk tujuan apa pun, meskipun pengakuan terhadap Google LLC ("Google") sebagai sumber data akan dihargai. Kumpulan data disediakan "APA ADANYA" tanpa jaminan apa pun, tersurat maupun tersirat. Google melepaskan tanggung jawab apa pun atas segala kerusakan, langsung atau tidak langsung, yang diakibatkan oleh penggunaan kumpulan data.
Versi : 0.0.0
Perpecahan :
Membelah | Contoh |
---|---|
'train' | 12423374 |
- Fitur :
{
"image_url": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"caption": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}