AudioSummary

lớp cuối cùng công khai AudioSummary

Xuất ra bộ đệm giao thức `Tóm tắt` kèm theo âm thanh.

Bản tóm tắt có tối đa `max_outputs` giá trị tóm tắt chứa âm thanh. Âm thanh được tạo từ `tensor` phải là 3-D với hình dạng `[batch_size, Frames, Channels]` hoặc 2-D với hình dạng `[batch_size, Frames]`. Các giá trị được giả định nằm trong phạm vi `[-1,0, 1,0]` với tốc độ mẫu là `sample_rate`.

Đối số `tag` là một `Tensor` vô hướng thuộc loại `string`. Nó được sử dụng để xây dựng `tag` của các giá trị tóm tắt:

  • Nếu `max_outputs` là 1, thẻ giá trị tóm tắt là ' tag /audio'.
  • Nếu `max_outputs` lớn hơn 1, các thẻ giá trị tóm tắt được tạo tuần tự dưới dạng ' tag /audio/0', ' tag /audio/1', v.v.

Các lớp lồng nhau

lớp học AudioSummary.Options Thuộc tính tùy chọn cho AudioSummary

Hằng số

Sợi dây OP_NAME Tên của op này, được biết đến bởi công cụ lõi TensorFlow

Phương pháp công khai

Đầu ra < TString >
asOutput ()
Trả về tay cầm tượng trưng của tensor.
âm thanh tĩnhTóm tắt
tạo ( Phạm vi phạm vi , thẻ Toán hạng < TString >, Toán hạng < TFloat32 > tensor, Toán hạng < TFloat32 > sampleRate, Tùy chọn... tùy chọn)
Phương thức gốc để tạo một lớp bao bọc một thao tác AudioSummary mới.
AudioSummary.Options tĩnh
maxOutputs (Đầu ra tối đa dài)
Đầu ra < TString >
bản tóm tắt ()
Vô hướng.

Phương pháp kế thừa

Hằng số

Chuỗi cuối cùng tĩnh công khai OP_NAME

Tên của op này, được biết đến bởi công cụ lõi TensorFlow

Giá trị không đổi: "AudioSummaryV2"

Phương pháp công khai

Đầu ra công khai < TString > asOutput ()

Trả về tay cầm tượng trưng của tensor.

Đầu vào của các hoạt động TensorFlow là đầu ra của một hoạt động TensorFlow khác. Phương pháp này được sử dụng để thu được một thẻ điều khiển mang tính biểu tượng đại diện cho việc tính toán đầu vào.

tạo AudioSummary tĩnh công khai ( Phạm vi phạm vi , thẻ Toán hạng < TString >, Toán hạng < TFloat32 > tensor, Toán hạng < TFloat32 > sampleRate, Tùy chọn... tùy chọn)

Phương thức gốc để tạo một lớp bao bọc một thao tác AudioSummary mới.

Thông số
phạm vi phạm vi hiện tại
nhãn Vô hướng. Được sử dụng để xây dựng thuộc tính `tag` của các giá trị tóm tắt.
tenxơ Hình dạng 2-D `[batch_size, khung]`.
tỷ lệ mẫu Tốc độ lấy mẫu của tín hiệu tính bằng hertz.
tùy chọn mang các giá trị thuộc tính tùy chọn
Trả lại
  • một phiên bản mới của AudioSummary

công khai AudioSummary.Options maxOutputs (Đầu ra tối đa dài)

Thông số
đầu ra tối đa Số phần tử lô tối đa để tạo âm thanh.

Đầu ra công khai < TString > tóm tắt ()

Vô hướng. Bộ đệm giao thức `Tóm tắt` được tuần tự hóa.