TensorFlow Datasets

TFDS supporte désormais le format Croissant 🥐 ! Lisez la documentation pour en savoir plus.

Ensembles de données TensorFlow : une collection d'ensembles de données prêts à l'emploi.

TensorFlow Datasets est une collection d'ensembles de données prêts à être utilisés avec TensorFlow ou d'autres frameworks de ML Python tels que Jax. Tous les ensembles de données sont présentés sous la forme de tf.data.Datasets , ce qui permet d'obtenir des pipelines d'entrée hautes performances faciles à utiliser. Pour commencer, consultez le guide et notre liste d'ensembles de données.

import tensorflow.compat.v2 as tf
import tensorflow_datasets as tfds

# Construct a tf.data.Dataset
ds = tfds.load('mnist', split='train', shuffle_files=True)

# Build your input pipeline
ds = ds.shuffle(1024).batch(32).prefetch(tf.data.experimental.AUTOTUNE)
for example in ds.take(1):
  image, label = example["image"], example["label"]

Exécuter dans un notebook

Explorer les ensembles de données avec Connaître ses données

Présentation des ensembles de données TensorFlow

Ensembles de données TensorFlow sur GitHub