Referencje:
Użyj następującego polecenia, aby załadować ten zestaw danych do TFDS:
ds = tfds.load('huggingface:conceptual_12m')
- Opis :
Conceptual 12M is a large-scale dataset of 12 million
image-text pairs specifically meant to be used for visionand-language pre-training.
Its data collection pipeline is a relaxed version of the one used in Conceptual Captions 3M.
Licencja : Zbiór danych może być swobodnie wykorzystywany w dowolnym celu, jednakże mile widziane będzie podanie Google LLC („Google”) jako źródła danych. Zbiór danych jest dostarczany „TAK JAK JEST”, bez jakiejkolwiek gwarancji, wyraźnej lub dorozumianej. Google zrzeka się wszelkiej odpowiedzialności za jakiekolwiek szkody, bezpośrednie lub pośrednie, wynikające z wykorzystania zbioru danych.
Wersja : 0.0.0
Podziały :
Podział | Przykłady |
---|---|
'train' | 12423374 |
- Cechy :
{
"image_url": {
"dtype": "string",
"id": null,
"_type": "Value"
},
"caption": {
"dtype": "string",
"id": null,
"_type": "Value"
}
}