Ensembles de données TensorFlow : une collection d'ensembles de données prêts à l'emploi.
TensorFlow Datasets est une collection d'ensembles de données prêts à être utilisés avec TensorFlow ou d'autres frameworks de ML Python tels que Jax.
Tous les ensembles de données sont présentés sous la forme de
tf.data.Datasets
, ce qui permet d'obtenir des pipelines d'entrée hautes performances faciles à utiliser.
Pour commencer, consultez le guide et notre liste d'ensembles de données.
import tensorflow.compat.v2 as tf import tensorflow_datasets as tfds # Construct a tf.data.Dataset ds = tfds.load('mnist', split='train', shuffle_files=True) # Build your input pipeline ds = ds.shuffle(1024).batch(32).prefetch(tf.data.experimental.AUTOTUNE) for example in ds.take(1): image, label = example["image"], example["label"]