TensorFlow Decision Forests

import tensorflow_decision_forests as tfdf
import pandas as pd

# Load a dataset in a Pandas dataframe.
train_df = pd.read_csv("project/train.csv")
test_df = pd.read_csv("project/test.csv")

# Convert the dataset into a TensorFlow dataset.
train_ds = tfdf.keras.pd_dataframe_to_tf_dataset(train_df, label="my_label")
test_ds = tfdf.keras.pd_dataframe_to_tf_dataset(test_df, label="my_label")

# Train a Random Forest model.
model = tfdf.keras.RandomForestModel()
model.fit(train_ds)

# Summary of the model structure.
model.summary()

# Evaluate the model.
model.evaluate(test_ds)

# Export the model to a SavedModel.
model.save("project/model")

TensorFlow Decision Forests (TF-DF) est une bibliothèque d'algorithmes de pointe destinés à l'entraînement, à l'inférence et à l'interprétation des modèles de forêt de décision. Cette bibliothèque est une collection de modèles Keras et accepte les opérations de classification, de régression et de classement.

TF-DF est un wrapper pour les bibliothèques C++ d'Yggdrasil Decision Forests. Les modèles entraînés avec TF-DF sont compatibles avec les modèles Yggdrasil Decision Forests, et inversement.

TF-DF n'est pas encore disponible pour Mac (n° 16) ou Windows (n° 3), mais nous y travaillons.

Mots clés : Decision Forests, TensorFlow, forêt d'arbres décisionnels, arbres de décision à boosting de gradient, CART, interprétation des modèles.

Communauté

Les ressources suivantes sont disponibles :

Contribution

Toute contribution à TensorFlow Decision Forests et à Yggdrasil Decision Forests est la bienvenue. Si vous souhaitez contribuer, veuillez commencer par consulter le manuel du développeur.