TensorFlow ile Takviyeli Öğrenme
Agents, iyi test edilmiş, değiştirilebilen ve genişletilebilen modüler bileşenler sağlayarak yeni RL algoritmalarının tasarlanmasını, uygulanmasını ve test edilmesini kolaylaştırır. İyi test entegrasyonu ve kıyaslama ile hızlı kod yinelemesine olanak tanır.
Başlamak için eğitimlerimizden birine göz atmanızı öneririz.
Kurulum
TF-Agents her gece ve kararlı sürümler yayınlıyor. Sürümlerin listesi için Sürümler bölümünü okuyun. Aşağıdaki komutlar, TF-Agent'ların istikrarlı ve gecelik olarak pypi.org'dan ve GitHub klonundan kurulmasını kapsar.
:uyarı: Çok yaygın olan Reverb (tekrar oynatma arabelleği) kullanılıyorsa, TF-Agent'lar yalnızca Linux ile çalışacaktır.
Stabil
En güncel kararlı sürümü yüklemek için aşağıdaki komutları çalıştırın. Sürüme ilişkin API belgeleri tensorflow.org adresinde bulunmaktadır.
$ pip install --user tf-agents[reverb]
# Use keras-2
$ export TF_USE_LEGACY_KERAS=1
# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.19.0
TF-Agent'ları, pip bağımlılığı kontrolü tarafından uyumlu değil olarak işaretlenen Tensorflow veya Reverb sürümleriyle yüklemek istiyorsanız, risk size ait olmak üzere aşağıdaki modeli kullanın.
$ pip install --user tensorflow
$ pip install --user tf-keras
$ pip install --user dm-reverb
$ pip install --user tf-agents
TF-Agents'ı TensorFlow 1.15 veya 2.0 ile kullanmak istiyorsanız 0.3.0 sürümünü yükleyin:
# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0
her gece
Gecelik sürümler daha yeni özellikler içerir ancak sürümlendirilmiş sürümlere göre daha az kararlı olabilir. Nightly yapısı tf-agents-nightly
olarak aktarılır. TensorFlow'un ( tf-nightly
) ve TensorFlow Probability'nin ( tfp-nightly
) gecelik sürümlerini yüklemenizi öneririz çünkü bunlar, TF-Agent'ların gecelik olarak test edildiği sürümlerdir.
Gecelik derleme sürümünü yüklemek için aşağıdakileri çalıştırın:
# Use keras-2
$ export TF_USE_LEGACY_KERAS=1
# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tf-keras-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly
# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly
GitHub'dan
Depoyu klonladıktan sonra bağımlılıklar pip install -e .[tests]
çalıştırılarak kurulabilir. TensorFlow'un bağımsız olarak kurulması gerekir: pip install --user tf-nightly
.
Katkıda Bulunmak
Sizinle işbirliği yapmak için sabırsızlanıyoruz! Nasıl katkıda bulunacağınıza ilişkin bir kılavuz için CONTRIBUTING.md
bakın. Bu proje TensorFlow'un davranış kurallarına uygundur. Katılarak bu kurallara uymanız bekleniyor.
Bültenler
TF Agents'ın istikrarlı ve gecelik sürümleri vardır. Gecelik sürümler genellikle iyidir ancak yukarı akış kitaplıklarının akış halinde olması nedeniyle sorunlar yaşayabilir. Aşağıdaki tablo, her TF Agent sürümüyle uyumlu TensorFlow sürümlerini listelemektedir. İlgilenilen sürümler:
- 0.19.0, tensorflow-2.15.0'ı destekler.
- 0.18.0, Python 3.8 desteğini düşürdü.
- 0.16.0, Python 3.11'i destekleyen ilk sürümdür.
- 0.15.0, Python 3.7 ile uyumlu son sürümdür.
- Numpy < 1.19 kullanıyorsanız TF-Agents 0.15.0 veya önceki sürümünü kullanın.
- 0.9.0, Python 3.6 ile uyumlu son sürümdür.
- 0.3.0, Python 2.x ile uyumlu son sürümdür.
Serbest bırakmak | Şube / Etiket | TensorFlow Sürümü | dm-reverb Sürümü |
---|---|---|---|
her gece | usta | tf-gecelik | dm-reverb-gecelik |
0.19.0 | v0.19.0 | 2.15.0 | 0.14.0 |
0.18.0 | v0.18.0 | 2.14.0 | 0.13.0 |
0.17.0 | v0.17.0 | 2.13.0 | 0.12.0 |
0.16.0 | v0.16.0 | 2.12.0 | 0.11.0 |
0.15.0 | v0.15.0 | 2.11.0 | 0.10.0 |
0.14.0 | v0.14.0 | 2.10.0 | 0.9.0 |
0.13.0 | v0.13.0 | 2.9.0 | 0.8.0 |
0.12.0 | v0.12.0 | 2.8.0 | 0.7.0 |
0.11.0 | v0.11.0 | 2.7.0 | 0.6.0 |
0.10.0 | v0.10.0 | 2.6.0 | |
0.9.0 | v0.9.0 | 2.6.0 | |
0.8.0 | v0.8.0 | 2.5.0 | |
0.7.1 | v0.7.1 | 2.4.0 | |
0.6.0 | v0.6.0 | 2.3.0 | |
0.5.0 | v0.5.0 | 2.2.0 | |
0.4.0 | v0.4.0 | 2.1.0 | |
0.3.0 | v0.3.0 | 1.15.0 ve 2.0.0. |
İlkeler
Bu proje Google'ın yapay zeka ilkelerine uygundur. Bu projeye katılarak, kullanarak veya katkıda bulunarak bu ilkelere bağlı kalmanız beklenmektedir.
Alıntı
Bu kodu kullanıyorsanız lütfen şu şekilde belirtin:
@misc{TFAgents,
title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
Vincent Vanhoucke and Eugene Brevdo},
howpublished = {\url{https://github.com/tensorflow/agents} },
url = "https://github.com/tensorflow/agents",
year = 2018,
note = "[Online; accessed 25-June-2019]"
}