TFDS اکنون از فرمت Croissant 🥐 پشتیبانی می کند! برای دانستن بیشتر مستندات را بخوانید.

TFDS CLI

TFDS CLI یک ابزار خط فرمان است که دستورات مختلفی را برای کار آسان با مجموعه داده های TensorFlow ارائه می دهد.

مشاهده در TensorFlow.org

در Google Colab اجرا شود

مشاهده منبع در GitHub

دانلود دفترچه یادداشت

غیرفعال کردن گزارش‌های TF در هنگام واردات

%%capture
%env TF_CPP_MIN_LOG_LEVEL=1  # Disable logs on TF import

نصب و راه اندازی

ابزار CLI با tensorflow-datasets tensorflow (یا tfds-nightly ) نصب می‌شود.

pip install -q tfds-nightly
tfds --version

برای لیست تمام دستورات CLI:

tfds --help

usage: tfds [-h] [--helpfull] [--version] {build,new} ...

Tensorflow Datasets CLI tool

optional arguments:
  -h, --help   show this help message and exit
  --helpfull   show full help message and exit
  --version    show program's version number and exit

command:
  {build,new}
    build      Commands for downloading and preparing datasets.
    new        Creates a new dataset directory from the template.

`tfds new` : پیاده سازی یک مجموعه داده جدید

این دستور به شما کمک می‌کند تا با ایجاد یک <dataset_name>/ حاوی فایل‌های پیاده‌سازی پیش‌فرض، شروع به نوشتن مجموعه داده پایتون جدید خود کنید.

استفاده:

tfds new my_dataset

2022-02-07 04:04:10.397902: E tensorflow/stream_executor/cuda/cuda_driver.cc:271] failed call to cuInit: CUDA_ERROR_NO_DEVICE: no CUDA-capable device is detected
Dataset generated at /tmpfs/src/temp/docs/my_dataset
You can start searching `TODO(my_dataset)` to complete the implementation.
Please check https://www.tensorflow.org/datasets/add_dataset for additional details.

خواهم ساخت:

ls -1 my_dataset/

__init__.py
checksums.tsv
dummy_data/
my_dataset.py
my_dataset_test.py

برای اطلاعات بیشتر به راهنمای مجموعه داده نوشتاری ما مراجعه کنید.

گزینه های موجود:

tfds new --help

usage: tfds new [-h] [--helpfull] [--dir DIR] dataset_name

positional arguments:
  dataset_name  Name of the dataset to be created (in snake_case)

optional arguments:
  -h, --help    show this help message and exit
  --helpfull    show full help message and exit
  --dir DIR     Path where the dataset directory will be created. Defaults to
                current directory.

`tfds build` : یک مجموعه داده را دانلود و آماده کنید

از tfds build <my_dataset> برای تولید مجموعه داده جدید استفاده کنید. <my_dataset> می تواند باشد:

مسیری به dataset/ پوشه یا فایل dataset.py (خالی برای فهرست فعلی):
- tfds build datasets/my_dataset/
- cd datasets/my_dataset/ && tfds build
- cd datasets/my_dataset/ && tfds build my_dataset
- cd datasets/my_dataset/ && tfds build my_dataset.py
مجموعه داده ثبت شده:
- tfds build mnist
- tfds build my_dataset --imports my_project.datasets