khái niệm_12m

Tài liệu tham khảo:

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:conceptual_12m')
  • Sự miêu tả :
Conceptual 12M is a large-scale dataset of 12 million
image-text pairs specifically meant to be used for visionand-language pre-training.
Its data collection pipeline is a relaxed version of the one used in Conceptual Captions 3M.
  • Giấy phép : Tập dữ liệu có thể được sử dụng tự do cho bất kỳ mục đích nào, mặc dù việc thừa nhận Google LLC ("Google") là nguồn dữ liệu sẽ được đánh giá cao. Tập dữ liệu được cung cấp "NGUYÊN TRẠNG" mà không có bất kỳ sự bảo đảm, rõ ràng hay ngụ ý nào. Google từ chối mọi trách nhiệm pháp lý đối với mọi thiệt hại, trực tiếp hoặc gián tiếp, phát sinh từ việc sử dụng tập dữ liệu.

  • Phiên bản : 0.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 12423374
  • Đặc trưng :
{
    "image_url": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "caption": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}