מושגית_12 מ'

הפניות:

השתמש בפקודה הבאה כדי לטעון מערך נתונים זה ב-TFDS:

ds = tfds.load('huggingface:conceptual_12m')
  • תיאור :
Conceptual 12M is a large-scale dataset of 12 million
image-text pairs specifically meant to be used for visionand-language pre-training.
Its data collection pipeline is a relaxed version of the one used in Conceptual Captions 3M.
  • רישיון : ניתן להשתמש במערך הנתונים באופן חופשי לכל מטרה, אם כי הודאה של Google LLC ("Google") כמקור הנתונים תתקבל בברכה. מערך הנתונים מסופק "כמות שהוא" ללא כל אחריות, מפורשת או משתמעת. Google מתנערת מכל אחריות לכל נזק, ישיר או עקיף, הנובע מהשימוש במערך הנתונים.

  • גרסה : 0.0.0

  • פיצולים :

לְפַצֵל דוגמאות
'train' 12423374
  • תכונות :
{
    "image_url": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "caption": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}