TensorFlow Lite のロードマップ

更新日: 2021 年 5 月

以下は、ロードマップの概要です。このロードマップは変更される可能性があり、以下に示される順序は優先順位を示すものではないことに注意してください。

このロードマップは、ユーザビリティ、パフォーマンス、最適化、および移植性という 4 つの主要区分に分けられています。ぜひロードマップにコメントを残し、TensorFlow Lite ディスカッショングループにフィードバックをご提供いただきますようお願いいたします。

ユーザビリティ

  • 演算子の対応範囲の拡大
    • ユーザーのフィードバックに基づき、ターゲット演算子を追加。
    • 特定のドメインとエリアにランダム演算子、基礎 Keras レイヤー演算子、ハッシュテーブル、トレーニング選択演算子などのターゲット演算子を追加。
  • 支援ツールの拡大
    • TensorFlow グラフにアノテーション機能と、トレーニング中と変換後の TFLite とハードウェアアクセラレータの互換性を検証するための互換性ツールを追加。
    • 変換中に、特定のアクセラレータのターゲットと最適化を可能にする。
  • オンデバイストレーニング
    • エンドツーエンドの使用方法を示す Colab など、パーソナル化と転移学習を行えるよう、オンデバイストレーニングをサポート。
    • 変数/リソース型のサポート(推論とトレーニング)
    • 複数の関数(またはシグネチャ)のエントリポイントによるグラフの変換と実行をサポート。
  • Android Studio 統合の強化
    • TFLite モデルを Android Studio にドラッグアンドドロップしてモデルのインターフェースを生成。
    • メモリプロファイリングなど、Android Studio のプロファイリングサポートを改善。
  • Model Maker
    • オブジェクト検出、推奨、および音声分類など、より新しいタスクをサポートして、一般的な使用に広範に対応。
    • 転移学習をより簡単に行えるよう、より多くのデータセットをサポート。
  • タスクライブラリ
    • より多くのモデルタイプ(音声、NLP など)と関連するプリプロセッシングとポストプロセッシング機能をサポート。
    • Task API でより多くのリファレンスサンプルを更新。
    • 初期状態で使用できる全タスク向けのアクセラレーションをサポート。
  • SOTA モデルと例の追加
    • モデルの使用方法だけでなく、新機能や API などを実演する、各種プラットフォームに対応した例(音声、NLP、構造化データ関連)の追加。
    • トレーニングとデプロイのコストを削減するために、オンデバイス向けの共有可能なバックボーンモデルを作成。
  • 複数のプラットフォームでシームレスなデプロイ
    • ウェブで TensorFlow Lite モデルを実行。
  • クロスプラットフォームサポートの改善
    • Android での Java、iOS での Swift、RPi での Python 向けに API を拡張・改善。
    • CMake サポートを強化(より広範なアクセラレータサポートなど)。
  • フロントエンドサポートの改善
    • Keras、tf.numpy など、さまざまなオーサリングフロントエンドとの互換性を改善。

パフォーマンス

  • ツールの改善
    • リリースごとのパフォーマンスゲインを追跡する公開ダッシュボード。
    • ターゲットアクセラレータとのグラフの互換性をより理解できるようにするためのツーリング。
  • CPU パフォーマンスの改善
    • 浮動小数点の推論をより素早く行えるよう、デフォルトで XNNPack を有効化。
    • カーネルの最適化によるエンドツーエンドの半精度(float16)サポート。
  • NN API サポートの更新
    • 新しい Android バージョン NN API 機能、演算子、および型のフルサポート。
  • GPU の最適化
    • デリゲートシリアル化サポートによりスタートアップ時間を改善。
    • ゼロコピー推論を行うためのハードウェアバッファ相互運用性。
    • 利用できるデバイスアクセラレーションの拡大。
    • 対応演算子の拡大。

最適化

  • 量子化

    • 特定のレイヤーを量子化から除外する、選択的ポストトレーニング量子化。
    • 量子化誤差損失をレイヤーごとに検査するための量子化デバッガ。
    • 量子化対応トレーニングを、TensorFlow Model Garden などより多くのモデルカバレッジに適用。
    • ポストトレーニングダイナミックレンジ量子化の品質とパフォーマンスの改善。
    • SVD などの圧縮アルゴリズムを利用できるようにする Tensor Compression API。
  • プルーニング / スパース化

    • 構成可能なトレーニング時間(プルーニング + 量子化対応トレーニング)の混合 API。
    • TF Model Garden モデルでのスパース適用の増加。
    • TensorFlow Lite におけるスパースモデルの実行サポート。

移植性

  • マイクロコントローラのサポート
    • スピーチと画像分類における 32 ビット MCU アーキテクチャのユースケースのサポート追加。
    • 音声フロントエンド: グラフ内音声プリプロセッシングとアクセラレーションサポート。
    • ビジョンデータと音声データ用のサンプルコードとモデル。