TensorFlow Decision Forests

import tensorflow_decision_forests as tfdf
import pandas as pd

# Load a dataset in a Pandas dataframe.
train_df = pd.read_csv("project/train.csv")
test_df = pd.read_csv("project/test.csv")

# Convert the dataset into a TensorFlow dataset.
train_ds = tfdf.keras.pd_dataframe_to_tf_dataset(train_df, label="my_label")
test_ds = tfdf.keras.pd_dataframe_to_tf_dataset(test_df, label="my_label")

# Train a Random Forest model.
model = tfdf.keras.RandomForestModel()
model.fit(train_ds)

# Summary of the model structure.
model.summary()

# Evaluate the model.
model.evaluate(test_ds)

# Export the model to a SavedModel.
model.save("project/model")

TensorFlow Decision Forests (TF-DF) es una colección de algoritmos de vanguardia para el entrenamiento, la deriva y la interpretación de modelos de bosques de decisión. La biblioteca es una colección de modelos de Keras y admite clasificación, regresión y rangos.

TF-DF es un wrapper alrededor de las bibliotecas C++ Yggdrasil Decision Forest. Los modelos entrenados con TF-DF son compatibles con los modelos Yggdrasil Decision Forest, y viceversa.

Desafortunadamente, TF-DF aún no se encuentra disponible para Mac (#16) o Windows (#3); pero estamos trabajando en ello.

Palabras clave: bosques de decisión, TensorFlow, bosque aleatorio, árboles impulsados por gradientes, árboles de clasificación y regresión (CART), interpretación de modelos.

Comunidad

Los siguientes recursos se encuentran disponibles:

Contribuye

Agradecemos las contribuciones a los bosques de decisión de TensorFlow y de Yggdrasil. Si deseas contribuir, asegúrate de revisar el manual para desarrolladores.