Bộ dữ liệu TensorFlow: tập hợp các bộ dữ liệu sẵn sàng sử dụng.
Tập dữ liệu TensorFlow là một tập hợp các tập dữ liệu sẵn sàng để sử dụng, với TensorFlow hoặc các khuôn khổ Python ML khác, chẳng hạn như Jax. Tất cả các bộ dữ liệu được hiển thị dưới dạng
tf.data.Datasets
, cho phép các đường ống đầu vào dễ sử dụng và hiệu suất cao. Để bắt đầu, hãy xem hướng dẫn và danh sách các bộ dữ liệu của chúng tôi.
import tensorflow as tf import tensorflow_datasets as tfds # Construct a tf.data.Dataset ds = tfds.load('mnist', split='train', shuffle_files=True) # Build your input pipeline ds = ds.shuffle(1024).batch(32).prefetch(tf.data.AUTOTUNE) for example in ds.take(1): image, label = example["image"], example["label"]