AudioSummary

공개 최종 수업 오디오요약

오디오와 함께 '요약' 프로토콜 버퍼를 출력합니다.

요약에는 오디오를 포함하는 최대 `max_outputs` 요약 값이 있습니다. 오디오는 `[batch_size, 프레임, 채널]` 형태의 3D 또는 `[batch_size, 프레임]` 형태의 2D여야 하는 '텐서'로 구축됩니다. 값은 샘플링 속도가 `sample_rate`인 `[-1.0, 1.0]` 범위에 있는 것으로 가정됩니다.

`tag` 인수는 `string` 유형의 스칼라 `Tensor`입니다. 요약 값의 `태그`를 작성하는 데 사용됩니다.

  • `max_outputs`가 1인 경우 요약 값 태그는 ' tag /audio'입니다.
  • `max_outputs`가 1보다 큰 경우 요약 값 태그는 ' tag /audio/0', ' tag /audio/1' 등으로 순차적으로 생성됩니다.

중첩 클래스

수업 오디오요약.옵션 AudioSummary 의 선택적 속성

상수

OP_NAME TensorFlow 코어 엔진에서 알려진 이 작업의 이름

공개 방법

출력 < TString >
출력 ()
텐서의 기호 핸들을 반환합니다.
정적 오디오요약
생성 ( Scope 범위, Operand < TString > 태그, Operand < TFloat32 > 텐서, Operand < TFloat32 > SampleRate, 옵션... 옵션)
새로운 AudioSummary 작업을 래핑하는 클래스를 생성하는 팩토리 메서드입니다.
정적 AudioSummary.Options
maxOutputs (긴 maxOutputs)
출력 < TString >
요약 ()
스칼라.

상속된 메서드

상수

공개 정적 최종 문자열 OP_NAME

TensorFlow 코어 엔진에서 알려진 이 작업의 이름

상수 값: "AudioSummaryV2"

공개 방법

공개 출력 < TString > asOutput ()

텐서의 기호 핸들을 반환합니다.

TensorFlow 작업에 대한 입력은 다른 TensorFlow 작업의 출력입니다. 이 메서드는 입력 계산을 나타내는 기호 핸들을 얻는 데 사용됩니다.

공개 정적 AudioSummary 생성 ( 범위 범위, Operand < TString > 태그, Operand < TFloat32 > 텐서, Operand < TFloat32 > SampleRate, 옵션... 옵션)

새로운 AudioSummary 작업을 래핑하는 클래스를 생성하는 팩토리 메서드입니다.

매개변수
범위 현재 범위
꼬리표 스칼라. 요약 값의 `tag` 속성을 구축하는 데 사용됩니다.
텐서 `[batch_size, 프레임]` 모양의 2D입니다.
샘플 속도 헤르츠 단위의 신호 샘플링 속도입니다.
옵션 선택적 속성 값을 전달합니다.
보고
  • AudioSummary의 새로운 인스턴스

공개 정적 AudioSummary.Options maxOutputs (Long maxOutputs)

매개변수
최대 출력 오디오를 생성할 최대 배치 요소 수입니다.

공개 출력 < TString > 요약 ()

스칼라. 직렬화된 '요약' 프로토콜 버퍼.