텐서플로우:: 작전:: 문자열 Ngram
#include <string_ops.h>
비정형 문자열 데이터에서 ngram을 생성합니다.
요약
이 작업은 문자열만 포함하는 1개의 비정형 차원이 있는 비정형 텐서를 허용하고 가장 안쪽 축을 따라 결합된 해당 문자열의 ngram을 포함하는 1개의 비정형 차원을 포함하는 비정형 텐서를 출력합니다.
인수:
- 범위: 범위 개체
- data: ngram을 만들 비정형 문자열 텐서의 값 텐서입니다. 1D 문자열 텐서여야 합니다.
- data_splits: ngram을 만들기 위한 비정형 문자열 텐서의 분할 텐서입니다.
- 구분 기호: 토큰 요소 사이에 추가할 문자열입니다. 구분 기호가 없으면 ""를 사용하세요.
- ngram_widths: 생성할 ngram의 크기입니다.
- left_pad: ngram 시퀀스의 왼쪽을 채우는 데 사용할 문자열입니다. pad_width != 0인 경우에만 사용됩니다.
- right_pad: ngram 시퀀스의 오른쪽을 채우는 데 사용할 문자열입니다. pad_width != 0인 경우에만 사용됩니다.
- pad_width: 각 시퀀스의 각 측면에 추가할 패딩 요소 수입니다. 패딩은 이 값에 관계없이 'ngram_widths'-1보다 클 수 없습니다.
pad_width=-1
인 경우max(ngram_widths)-1
요소를 추가합니다.
보고:
생성자와 소멸자 | |
---|---|
StringNGrams (const :: tensorflow::Scope & scope, :: tensorflow::Input data, :: tensorflow::Input data_splits, StringPiece separator, const gtl::ArraySlice< int > & ngram_widths, StringPiece left_pad, StringPiece right_pad, int64 pad_width, bool preserve_short_sequences) |
공개 속성 | |
---|---|
ngrams | |
ngrams_splits | |
operation |
공개 속성
엔그램
::tensorflow::Output ngrams
ngrams_splits
::tensorflow::Output ngrams_splits
작업
Operation operation
공공 기능
문자열 Ngram
StringNGrams( const ::tensorflow::Scope & scope, ::tensorflow::Input data, ::tensorflow::Input data_splits, StringPiece separator, const gtl::ArraySlice< int > & ngram_widths, StringPiece left_pad, StringPiece right_pad, int64 pad_width, bool preserve_short_sequences )