パブリック最終クラスDecodeWav
16 ビット PCM WAV ファイルを浮動小数点テンソルにデコードします。
-32768 ~ 32767 の符号付き 16 ビット値は、float で -1.0 ~ 1.0 にスケールされます。
desired_channels が設定されている場合、入力に含まれるチャネルがこれより少ない場合、最後のチャネルが複製されて要求された数が与えられます。そうでない場合、入力に要求されたチャネルよりも多くのチャネルが含まれる場合、追加のチャネルは無視されます。
desired_samples が設定されている場合、オーディオは切り取られるか、要求された長さまでゼロが埋め込まれます。
最初の出力には、オーディオ サンプルのコンテンツを含む Tensor が含まれています。最も低い次元はチャンネル数、2 番目はサンプル数になります。たとえば、10 サンプルの長さのステレオ WAV ファイルの出力形状は [10, 2] になります。
ネストされたクラス
クラス | デコードWav.オプション | DecodeWav のオプションの属性 |
定数
弦 | OP_NAME | TensorFlow コア エンジンによって認識される、この演算の名前 |
パブリックメソッド
出力< TFloat32 > | オーディオ() 形状 `[長さ、チャネル]` の 2 次元。 |
静的デコードWav | |
静的DecodeWav.Options | desiredChannels (長い望ましいチャネル) |
静的DecodeWav.Options | 望ましいサンプル(長い間望ましいサンプル) |
出力< TInt32 > | サンプルレート() WAV ヘッダーにあるサンプル レートを保持するスカラー。 |
継承されたメソッド
定数
パブリック静的最終文字列OP_NAME
TensorFlow コア エンジンによって認識される、この演算の名前
定数値: "DecodeWav"
パブリックメソッド
public static DecodeWav create (スコープスコープ、オペランド< TString > の内容、オプション...オプション)
新しい DecodeWav 操作をラップするクラスを作成するファクトリ メソッド。
パラメーター
範囲 | 現在のスコープ |
---|---|
コンテンツ | 通常はファイルからの WAV エンコードされたオーディオ。 |
オプション | オプションの属性値を持ちます |
戻り値
- DecodeWav の新しいインスタンス