یادگیری تقویتی با TensorFlow
Agents طراحی، پیادهسازی و آزمایش الگوریتمهای جدید RL را با ارائه مولفههای مدولار به خوبی آزمایش شده که قابل تغییر و توسعه هستند، آسانتر میکند. این امکان تکرار سریع کد را با یکپارچه سازی تست خوب و محک زدن فراهم می کند.
برای شروع، توصیه می کنیم یکی از آموزش های ما را بررسی کنید.
نصب و راه اندازی
TF-Agents بیلدهای شبانه و پایدار را منتشر می کند. برای فهرستی از نسخهها، بخش نسخهها را بخوانید. دستورات زیر نصب TF-Agents پایدار و شبانه از pypi.org و همچنین از یک کلون GitHub را پوشش می دهد.
:warning: در صورت استفاده از Reverb (بازپخش بافر) که بسیار رایج است، TF-Agents فقط با لینوکس کار می کند.
پایدار
برای نصب آخرین نسخه پایدار، دستورات زیر را اجرا کنید. اسناد API برای انتشار در tensorflow.org است.
$ pip install --user tf-agents[reverb]
# Use keras-2
$ export TF_USE_LEGACY_KERAS=1
# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.19.0
اگر میخواهید TF-Agents را با نسخههایی از Tensorflow یا Reverb نصب کنید که توسط بررسی وابستگی پیپ بهعنوان ناسازگار علامتگذاری شدهاند، از الگوی زیر با مسئولیت خود استفاده کنید.
$ pip install --user tensorflow
$ pip install --user tf-keras
$ pip install --user dm-reverb
$ pip install --user tf-agents
اگر می خواهید از TF-Agents با TensorFlow 1.15 یا 2.0 استفاده کنید، نسخه 0.3.0 را نصب کنید:
# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0
شبانه
ساختهای شبانه دارای ویژگیهای جدیدتری هستند، اما ممکن است نسبت به نسخههای نسخهشده پایدارتر باشند. ساخت شبانه به عنوان tf-agents-nightly
قرار داده شده است. پیشنهاد میکنیم نسخههای شبانه TensorFlow ( tf-nightly
) و TensorFlow Probability ( tfp-nightly
) را نصب کنید، زیرا این نسخهها نسخههایی هستند که TF-Agents شبانه روی آنها آزمایش میشوند.
برای نصب نسخه شبانه بیلد، موارد زیر را اجرا کنید:
# Use keras-2
$ export TF_USE_LEGACY_KERAS=1
# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tf-keras-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly
# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly
از GitHub
پس از کلون سازی مخزن، وابستگی ها را می توان با اجرای pip install -e .[tests]
نصب کرد. TensorFlow باید به طور مستقل نصب شود: pip install --user tf-nightly
.
کمک کردن
ما مشتاق همکاری با شما هستیم! برای راهنمایی در مورد نحوه مشارکت به CONTRIBUTING.md
مراجعه کنید. این پروژه به آیین نامه رفتار تنسورفلو پایبند است. با شرکت، از شما انتظار می رود که این کد را حفظ کنید.
منتشر می کند
TF Agents نسخه های پایدار و شبانه دارد. نسخههای شبانه اغلب خوب هستند، اما به دلیل در جریان بودن کتابخانههای بالادست، ممکن است مشکلاتی داشته باشند. جدول زیر نسخه(های) TensorFlow را فهرست می کند که با هر نسخه از TF Agents همخوانی دارند. نسخه های مورد علاقه:
- 0.19.0 از tensorflow-2.15.0 پشتیبانی می کند.
- 0.18.0 پشتیبانی Python 3.8 را حذف کرد.
- 0.16.0 اولین نسخه ای است که پایتون 3.11 را پشتیبانی می کند.
- 0.15.0 آخرین نسخه سازگار با پایتون 3.7 است.
- اگر از numpy < 1.19 استفاده می کنید، از TF-Agents 0.15.0 یا قبل از آن استفاده کنید.
- 0.9.0 آخرین نسخه سازگار با پایتون 3.6 است.
- 0.3.0 آخرین نسخه سازگار با Python 2.x است.
رها کنید | شعبه / برچسب | نسخه TensorFlow | نسخه dm-reverb |
---|---|---|---|
شبانه | استاد | tf-شب | dm-reverb-nightly |
0.19.0 | نسخه 0.19.0 | 2.15.0 | 0.14.0 |
0.18.0 | نسخه 0.18.0 | 2.14.0 | 0.13.0 |
0.17.0 | نسخه 0.17.0 | 2.13.0 | 0.12.0 |
0.16.0 | نسخه 0.16.0 | 2.12.0 | 0.11.0 |
0.15.0 | نسخه 0.15.0 | 2.11.0 | 0.10.0 |
0.14.0 | نسخه 0.14.0 | 2.10.0 | 0.9.0 |
0.13.0 | نسخه 0.13.0 | 2.9.0 | 0.8.0 |
0.12.0 | نسخه 0.12.0 | 2.8.0 | 0.7.0 |
0.11.0 | نسخه 0.11.0 | 2.7.0 | 0.6.0 |
0.10.0 | نسخه 0.10.0 | 2.6.0 | |
0.9.0 | نسخه 0.9.0 | 2.6.0 | |
0.8.0 | نسخه 0.8.0 | 2.5.0 | |
0.7.1 | نسخه 0.7.1 | 2.4.0 | |
0.6.0 | نسخه 0.6.0 | 2.3.0 | |
0.5.0 | نسخه 0.5.0 | 2.2.0 | |
0.4.0 | نسخه 0.4.0 | 2.1.0 | |
0.3.0 | نسخه 0.3.0 | 1.15.0 و 2.0.0. |
اصول
این پروژه به اصول هوش مصنوعی گوگل پایبند است. با شرکت، استفاده یا مشارکت در این پروژه از شما انتظار می رود که به این اصول پایبند باشید.
نقل قول
اگر از این کد استفاده می کنید، لطفاً آن را به صورت زیر ذکر کنید:
@misc{TFAgents,
title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
Vincent Vanhoucke and Eugene Brevdo},
howpublished = {\url{https://github.com/tensorflow/agents} },
url = "https://github.com/tensorflow/agents",
year = 2018,
note = "[Online; accessed 25-June-2019]"
}