입력에 제공된 로짓에 대해 빔 검색 디코딩을 수행합니다.
merge_repeated 속성에 대한 참고 사항: 빔 검색 디코더의 경우 이는 빔의 연속 항목이 동일한 경우 이들 중 첫 번째 항목만 방출됨을 의미합니다. 즉, 최상위 경로가 "ABBBB"인 경우 merge_repeated = True이면 "AB"가 반환되고 merge_repeated = False이면 "ABBBB"가 반환됩니다.
중첩 클래스
수업 | CtcBeamSearchDecoder.Options | CtcBeamSearchDecoder 의 선택적 속성 |
상수
끈 | OP_NAME | TensorFlow 핵심 엔진에서 알려진 이 작업의 이름 |
공개 방법
static <T는 TNumber를 확장합니다. > CtcBeamSearchDecoder <T> | |
목록< 출력 < TInt64 >> | 디코딩된 인덱스 () 인덱스 행렬의 목록(길이: top_paths)입니다. |
목록< 출력 < TInt64 >> | 디코딩된모양 () 모양 벡터의 목록(길이: top_paths)입니다. |
목록< 출력 < TInt64 >> | 디코딩된 값 () 값 벡터의 목록(길이: top_paths)입니다. |
출력 <T> | 로그확률 () '(batch_size x top_paths)' 모양의 행렬입니다. |
정적 CtcBeamSearchDecoder.Options | mergeRepeated (부울 mergeRepeated) |
상속된 메서드
상수
공개 정적 최종 문자열 OP_NAME
TensorFlow 핵심 엔진에서 알려진 이 작업의 이름
공개 방법
공개 정적 CtcBeamSearchDecoder <T> 생성 ( 범위 범위, 피연산자 <T> 입력, 피연산자 < TInt32 > 시퀀스 길이, 긴 빔 폭, 긴 topPaths, 옵션... 옵션)
새로운 CtcBeamSearchDecoder 작업을 래핑하는 클래스를 생성하는 팩토리 메서드입니다.
매개변수
범위 | 현재 범위 |
---|---|
입력 | 3차원, 모양: `(max_time x 배치_크기 x num_classes)`, 로지트. |
시퀀스 길이 | 시퀀스 길이, 크기 `(배치)`를 포함하는 벡터입니다. |
빔폭 | 스칼라 >= 0(빔 검색 빔 폭). |
topPaths | 스칼라 >= 0, <= 빔_폭(출력 크기 제어) |
옵션 | 선택적 속성 값을 전달합니다. |
보고
- CtcBeamSearchDecoder의 새로운 인스턴스
공개 목록< 출력 < TInt64 >> decodedIndices ()
인덱스 행렬의 목록(길이: top_paths)입니다. 행렬 j, 크기 `(total_decoded_outputs[j] x 2)`에는 `SparseTensor의 인덱스가 있습니다.
공개 목록< 출력 < TInt64 >> decodedShape ()
모양 벡터의 목록(길이: top_paths)입니다. 벡터 j, 크기 `(2)`는 디코딩된 `SparseTensor[j]`의 모양을 저장합니다. 해당 값은 `[batch_size, max_decoded_length[j]]`입니다.
공개 목록< 출력 < TInt64 >> decodedValues ()
값 벡터의 목록(길이: top_paths)입니다. 벡터 j, 크기 `(length total_decoded_outputs[j])`는 `SparseTensor의 값을 갖습니다.
공개 정적 CtcBeamSearchDecoder.Options mergeRepeated (부울 mergeRepeated)
매개변수
병합반복 | true인 경우 반복되는 클래스를 출력에 병합합니다. |
---|