למידת חיזוק עם TensorFlow
Agents מקל על תכנון, הטמעה ובדיקת אלגוריתמי RL חדשים, על ידי אספקת רכיבים מודולריים שנבדקו היטב הניתנים לשינוי ולהרחבה. הוא מאפשר איטרציה מהירה של קוד, עם אינטגרציה טובה של בדיקות ומידוד.
כדי להתחיל, אנו ממליצים לבדוק את אחד מהמדריכים שלנו.
הַתקָנָה
TF-Agents מפרסם פריטים ליליים ויציבים. לרשימה של מהדורות קרא את הסעיף מהדורות . הפקודות למטה מכסות התקנת TF-Agents יציבה ולילה מ- pypi.org כמו גם משבט GitHub.
:אזהרה: אם משתמשים ב-Reverb (חיץ חוזר), שהוא נפוץ מאוד, TF-Agents יפעלו רק עם לינוקס.
יַצִיב
הפעל את הפקודות למטה כדי להתקין את המהדורה היציבה האחרונה. תיעוד API עבור המהדורה נמצא באתר tensorflow.org .
$ pip install --user tf-agents[reverb]
# Use keras-2
$ export TF_USE_LEGACY_KERAS=1
# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.19.0
אם אתה רוצה להתקין TF-Agents עם גרסאות של Tensorflow או Reverb המסומנות כלא תואמות על ידי בדיקת התלות ב-pip, השתמש בדפוס הבא למטה על אחריותך בלבד.
$ pip install --user tensorflow
$ pip install --user tf-keras
$ pip install --user dm-reverb
$ pip install --user tf-agents
אם ברצונך להשתמש ב-TF-Agents עם TensorFlow 1.15 או 2.0, התקן את גרסה 0.3.0:
# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0
לֵילִי
בנייה לילית כוללת תכונות חדשות יותר, אך עשויות להיות פחות יציבות מהגרסאות המהדורות. המבנה הלילי נדחף כ- tf-agents-nightly
. אנו מציעים להתקין גרסאות ליליות של TensorFlow ( tf-nightly
) ושל TensorFlow Probability ( tfp-nightly
) מכיוון שאלו הן הגרסאות ש-TF-Agents מדי לילה נבדקות נגדן.
כדי להתקין את גרסת הבנייה הלילית, הפעל את הפעולות הבאות:
# Use keras-2
$ export TF_USE_LEGACY_KERAS=1
# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tf-keras-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly
# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly
מ-GitHub
לאחר שיבוט המאגר, ניתן להתקין את התלות על ידי הפעלת pip install -e .[tests]
. יש להתקין את TensorFlow באופן עצמאי: pip install --user tf-nightly
.
תורם
אנחנו להוטים לשתף איתך פעולה! ראה CONTRIBUTING.md
למדריך כיצד לתרום. פרויקט זה עומד בקוד ההתנהגות של TensorFlow. על ידי השתתפות, אתה צפוי לקיים קוד זה.
משחרר
ל-TF Agents יש מהדורות יציבות ולילות. המהדורות הליליות לרוב בסדר, אך יכולות להיות בעיות עקב יציבות של ספריות במעלה הזרם. הטבלה שלהלן מפרטת את הגירסאות של TensorFlow שמתאימות לגרסה של כל TF Agents. גרסאות שחרור של עניין:
- 0.19.0 תומך ב-tensorflow-2.15.0.
- 0.18.0 ירד מהתמיכה של Python 3.8.
- 0.16.0 היא הגרסה הראשונה שתומכת ב-Python 3.11.
- 0.15.0 הוא המהדורה האחרונה התואמת לפייתון 3.7.
- אם אתה משתמש ב-numpy < 1.19, אז השתמש ב-TF-Agents 0.15.0 או קודם לכן.
- 0.9.0 הוא המהדורה האחרונה התואמת לפיתון 3.6.
- 0.3.0 הוא המהדורה האחרונה התואמת ל-Python 2.x.
לְשַׁחְרֵר | סניף / תג | גרסת TensorFlow | גרסת dm-reverb |
---|---|---|---|
לֵילִי | לִשְׁלוֹט | tf-לילי | dm-reverb-לילי |
0.19.0 | v0.19.0 | 2.15.0 | 0.14.0 |
0.18.0 | v0.18.0 | 2.14.0 | 0.13.0 |
0.17.0 | v0.17.0 | 2.13.0 | 0.12.0 |
0.16.0 | v0.16.0 | 2.12.0 | 0.11.0 |
0.15.0 | v0.15.0 | 2.11.0 | 0.10.0 |
0.14.0 | v0.14.0 | 2.10.0 | 0.9.0 |
0.13.0 | v0.13.0 | 2.9.0 | 0.8.0 |
0.12.0 | v0.12.0 | 2.8.0 | 0.7.0 |
0.11.0 | v0.11.0 | 2.7.0 | 0.6.0 |
0.10.0 | v0.10.0 | 2.6.0 | |
0.9.0 | v0.9.0 | 2.6.0 | |
0.8.0 | v0.8.0 | 2.5.0 | |
0.7.1 | v0.7.1 | 2.4.0 | |
0.6.0 | v0.6.0 | 2.3.0 | |
0.5.0 | v0.5.0 | 2.2.0 | |
0.4.0 | v0.4.0 | 2.1.0 | |
0.3.0 | v0.3.0 | 1.15.0 ו-2.0.0. |
עקרונות
פרויקט זה עומד בעקרונות הבינה המלאכותית של גוגל . על ידי השתתפות, שימוש או תרומה לפרויקט זה מצופה ממך לדבוק בעקרונות אלו.
צִיטָטָה
אם אתה משתמש בקוד זה, נא לצטט אותו כ:
@misc{TFAgents,
title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
Vincent Vanhoucke and Eugene Brevdo},
howpublished = {\url{https://github.com/tensorflow/agents} },
url = "https://github.com/tensorflow/agents",
year = 2018,
note = "[Online; accessed 25-June-2019]"
}