Pembelajaran Penguatan dengan TensorFlow
Agen membuat perancangan, penerapan, dan pengujian algoritme RL baru menjadi lebih mudah, dengan menyediakan komponen modular yang telah teruji dan dapat dimodifikasi dan diperluas. Ini memungkinkan iterasi kode yang cepat, dengan integrasi pengujian dan benchmarking yang baik.
Untuk memulai, kami sarankan untuk membaca salah satu tutorial kami.
Instalasi
TF-Agents menerbitkan build setiap malam dan stabil. Untuk daftar rilis, baca bagian Rilis . Perintah di bawah ini mencakup pemasangan TF-Agents stable dan nightly dari pypi.org serta dari klon GitHub.
:peringatan: Jika menggunakan Reverb (replay buffer), yang sangat umum, TF-Agents hanya akan bekerja dengan Linux.
Stabil
Jalankan perintah di bawah ini untuk menginstal rilis stabil terbaru. Dokumentasi API untuk rilis ini ada di tensorflow.org .
$ pip install --user tf-agents[reverb]
# Use keras-2
$ export TF_USE_LEGACY_KERAS=1
# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.19.0
Jika Anda ingin menginstal TF-Agents dengan versi Tensorflow atau Reverb yang ditandai sebagai tidak kompatibel oleh pemeriksaan ketergantungan pip, gunakan pola berikut di bawah dengan risiko yang Anda tanggung sendiri.
$ pip install --user tensorflow
$ pip install --user tf-keras
$ pip install --user dm-reverb
$ pip install --user tf-agents
Jika Anda ingin menggunakan TF-Agents dengan TensorFlow 1.15 atau 2.0, instal versi 0.3.0:
# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0
Malam
Versi Nightly mencakup fitur-fitur yang lebih baru, tetapi mungkin kurang stabil dibandingkan rilis berversi. Pembangunan nightly didorong sebagai tf-agents-nightly
. Kami menyarankan untuk menginstal TensorFlow versi nightly ( tf-nightly
) dan Probabilitas TensorFlow ( tfp-nightly
) karena itulah versi yang diuji oleh TF-Agents nightly.
Untuk menginstal versi nightly build, jalankan perintah berikut:
# Use keras-2
$ export TF_USE_LEGACY_KERAS=1
# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tf-keras-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly
# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly
Dari GitHub
Setelah mengkloning repositori, dependensi dapat diinstal dengan menjalankan pip install -e .[tests]
. TensorFlow perlu diinstal secara independen: pip install --user tf-nightly
.
Berkontribusi
Kami sangat ingin berkolaborasi dengan Anda! Lihat CONTRIBUTING.md
untuk panduan tentang cara berkontribusi. Proyek ini mematuhi kode etik TensorFlow. Dengan berpartisipasi, Anda diharapkan menjunjung tinggi kode ini.
Rilis
Agen TF memiliki rilis stabil dan setiap malam. Rilis malam sering kali baik-baik saja tetapi dapat mengalami masalah karena perpustakaan upstream sedang berubah-ubah. Tabel di bawah mencantumkan versi TensorFlow yang selaras dengan setiap rilis Agen TF. Versi rilis yang menarik:
- 0.19.0 mendukung tensorflow-2.15.0.
- 0.18.0 menghentikan dukungan Python 3.8.
- 0.16.0 adalah versi pertama yang mendukung Python 3.11.
- 0.15.0 adalah rilis terakhir yang kompatibel dengan Python 3.7.
- Jika menggunakan numpy < 1.19, gunakan TF-Agents 0.15.0 atau versi lebih lama.
- 0.9.0 adalah rilis terakhir yang kompatibel dengan Python 3.6.
- 0.3.0 adalah rilis terakhir yang kompatibel dengan Python 2.x.
Melepaskan | Cabang / Tag | Versi TensorFlow | Versi dm-reverb |
---|---|---|---|
Malam | menguasai | tf-setiap malam | dm-reverb-malam |
0.19.0 | v0.19.0 | 2.15.0 | 0.14.0 |
0.18.0 | v0.18.0 | 2.14.0 | 0.13.0 |
0.17.0 | v0.17.0 | 2.13.0 | 0.12.0 |
0.16.0 | v0.16.0 | 2.12.0 | 0.11.0 |
0.15.0 | v0.15.0 | 2.11.0 | 0.10.0 |
0.14.0 | v0.14.0 | 2.10.0 | 0.9.0 |
0.13.0 | v0.13.0 | 2.9.0 | 0.8.0 |
0.12.0 | v0.12.0 | 2.8.0 | 0.7.0 |
0.11.0 | v0.11.0 | 2.7.0 | 0.6.0 |
0.10.0 | v0.10.0 | 2.6.0 | |
0.9.0 | v0.9.0 | 2.6.0 | |
0.8.0 | v0.8.0 | 2.5.0 | |
0.7.1 | v0.7.1 | 2.4.0 | |
0.6.0 | v0.6.0 | 2.3.0 | |
0.5.0 | v0.5.0 | 2.2.0 | |
0.4.0 | v0.4.0 | 2.1.0 | |
0.3.0 | v0.3.0 | 1.15.0 dan 2.0.0. |
Prinsip
Proyek ini menganut prinsip AI Google . Dengan berpartisipasi, menggunakan, atau berkontribusi pada proyek ini, Anda diharapkan mematuhi prinsip-prinsip ini.
Kutipan
Jika Anda menggunakan kode ini, harap kutip sebagai:
@misc{TFAgents,
title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
Vincent Vanhoucke and Eugene Brevdo},
howpublished = {\url{https://github.com/tensorflow/agents} },
url = "https://github.com/tensorflow/agents",
year = 2018,
note = "[Online; accessed 25-June-2019]"
}