Aprendizado por reforço com TensorFlow
Os agentes facilitam o projeto, a implementação e o teste de novos algoritmos RL, fornecendo componentes modulares bem testados que podem ser modificados e estendidos. Ele permite iteração rápida de código, com boa integração de testes e benchmarking.
Para começar, recomendamos conferir um de nossos tutoriais .
Instalação
TF-Agents publica compilações noturnas e estáveis. Para obter uma lista de lançamentos, leia a seção Lançamentos . Os comandos abaixo cobrem a instalação de TF-Agents estáveis e noturnos de pypi.org , bem como de um clone do GitHub.
:warning: Se estiver usando Reverb (replay buffer), o que é muito comum, TF-Agents só funcionará com Linux.
Estábulo
Execute os comandos abaixo para instalar a versão estável mais recente. A documentação da API para o lançamento está em tensorflow.org .
$ pip install --user tf-agents[reverb]
# Use this tag get the matching examples and colabs.
$ git clone https://github.com/tensorflow/agents.git
$ cd agents
$ git checkout v0.18.0
Se você deseja instalar TF-Agents com versões do Tensorflow ou Reverb sinalizadas como incompatíveis pela verificação de dependência do pip, use o seguinte padrão abaixo por sua própria conta e risco.
$ pip install --user tensorflow
$ pip install --user dm-reverb
$ pip install --user tf-agents
Se você quiser usar TF-Agents com TensorFlow 1.15 ou 2.0, instale a versão 0.3.0:
# Newer versions of tensorflow-probability require newer versions of TensorFlow.
$ pip install tensorflow-probability==0.8.0
$ pip install tf-agents==0.3.0
Todas as noites
As compilações noturnas incluem recursos mais recentes, mas podem ser menos estáveis do que as versões versionadas. A compilação noturna é enviada como tf-agents-nightly
. Sugerimos a instalação de versões noturnas do TensorFlow ( tf-nightly
) e do TensorFlow Probability ( tfp-nightly
), pois essas são as versões nas quais os TF-Agents nightly são testados.
Para instalar a versão noturna, execute o seguinte:
# `--force-reinstall helps guarantee the right versions.
$ pip install --user --force-reinstall tf-nightly
$ pip install --user --force-reinstall tfp-nightly
$ pip install --user --force-reinstall dm-reverb-nightly
# Installing with the `--upgrade` flag ensures you'll get the latest version.
$ pip install --user --upgrade tf-agents-nightly
Do GitHub
Após clonar o repositório, as dependências podem ser instaladas executando pip install -e .[tests]
. O TensorFlow precisa ser instalado de forma independente: pip install --user tf-nightly
.
Contribuindo
Estamos ansiosos para colaborar com você! Consulte CONTRIBUTING.md
para obter um guia sobre como contribuir. Este projeto segue o código de conduta do TensorFlow. Ao participar, espera-se que você cumpra este código.
Lançamentos
TF Agents tem lançamentos estáveis e noturnos. Os lançamentos noturnos geralmente são bons, mas podem ter problemas devido ao fluxo das bibliotecas upstream. A tabela abaixo lista as versões do TensorFlow que se alinham com a versão de cada TF Agents. Versões de lançamento de interesse:
- 0.18.0 abandonou o suporte ao Python 3.8.
- 0.16.0 é a primeira versão a suportar Python 3.11.
- 0.15.0 é a última versão compatível com Python 3.7.
- Se estiver usando numpy <1.19, use TF-Agents 0.15.0 ou anterior.
- 0.9.0 é a última versão compatível com Python 3.6.
- 0.3.0 é a última versão compatível com Python 2.x.
Liberar | Filial/Etiqueta | Versão do TensorFlow | Versão dm-reverb |
---|---|---|---|
Todas as noites | mestre | tf-noturno | dm-reverb-noturno |
0.18.0 | v0.18.0 | 2.14.0 | 0.13.0 |
0.17.0 | v0.17.0 | 2.13.0 | 0.12.0 |
0.16.0 | v0.16.0 | 2.12.0 | 0.11.0 |
0.15.0 | v0.15.0 | 2.11.0 | 0.10.0 |
0.14.0 | v0.14.0 | 2.10.0 | 0.9.0 |
0.13.0 | v0.13.0 | 2.9.0 | 0.8.0 |
0.12.0 | v0.12.0 | 2.8.0 | 0.7.0 |
0.11.0 | v0.11.0 | 2.7.0 | 0.6.0 |
0.10.0 | v0.10.0 | 2.6.0 | |
0.9.0 | v0.9.0 | 2.6.0 | |
0.8.0 | v0.8.0 | 2.5.0 | |
0.7.1 | v0.7.1 | 2.4.0 | |
0.6.0 | v0.6.0 | 2.3.0 | |
0.5.0 | v0.5.0 | 2.2.0 | |
0.4.0 | v0.4.0 | 2.1.0 | |
0.3.0 | v0.3.0 | 1.15.0 e 2.0.0. |
Princípios
Este projeto segue os princípios de IA do Google . Ao participar, utilizar ou contribuir para este projeto, espera-se que você cumpra estes princípios.
Citação
Se você usar este código, cite-o como:
@misc{TFAgents,
title = { {TF-Agents}: A library for Reinforcement Learning in TensorFlow},
author = {Sergio Guadarrama and Anoop Korattikara and Oscar Ramirez and
Pablo Castro and Ethan Holly and Sam Fishman and Ke Wang and
Ekaterina Gonina and Neal Wu and Efi Kokiopoulou and Luciano Sbaiz and
Jamie Smith and Gábor Bartók and Jesse Berent and Chris Harris and
Vincent Vanhoucke and Eugene Brevdo},
howpublished = {\url{https://github.com/tensorflow/agents} },
url = "https://github.com/tensorflow/agents",
year = 2018,
note = "[Online; accessed 25-June-2019]"
}