입력 Tensor의 각 문자열을 버킷 수만큼 해시 모드로 변환합니다.
해시 함수는 프로세스 내의 문자열 내용에 대해 결정적입니다. 해시 함수는 'key' 속성이 해시 함수의 키를 정의하는 키 해시 함수입니다. `key`는 2개 요소의 배열입니다.
추가 구성 요소가 포함된 URL과 같이 입력이 악의적일 수 있는 경우 강력한 해시가 중요합니다. 공격자는 서비스 거부 공격을 위해 입력을 동일한 버킷에 해시하거나 결과를 왜곡하려고 시도할 수 있습니다. 강력한 해시를 사용하면 버킷에 걸쳐 해시 값 분포가 왜곡된 입력을 찾기 어렵게 만들 수 있습니다. 이를 위해서는 해시 함수가 적에게 알려지지 않은 높은 엔트로피(임의) "키"에 의해 시드되어야 합니다.
추가 견고성은 `tf.string_to_hash_bucket_fast`보다 계산 시간이 약 4배 더 길어집니다.
예:
>>> tf.strings.to_hash_bucket_strong(["안녕하세요", "TF"], 3, [1, 2]).numpy() 배열([2, 0])
상수
끈 | OP_NAME | TensorFlow 핵심 엔진에서 알려진 이 작업의 이름 |
공개 방법
출력 <TInt64> | 출력 () 텐서의 기호 핸들을 반환합니다. |
정적 ToHashBucketStrong | |
출력 <TInt64> | 출력 () 입력 `string_tensor`와 동일한 모양의 Tensor입니다. |
상속된 메서드
상수
공개 정적 최종 문자열 OP_NAME
TensorFlow 핵심 엔진에서 알려진 이 작업의 이름
공개 방법
공개 출력 < TInt64 > asOutput ()
텐서의 기호 핸들을 반환합니다.
TensorFlow 작업에 대한 입력은 다른 TensorFlow 작업의 출력입니다. 이 메서드는 입력 계산을 나타내는 기호 핸들을 얻는 데 사용됩니다.
공개 정적 ToHashBucketStrong 생성 ( 범위 범위, 피연산자 < TString > 입력, Long numBuckets, List<Long> 키)
새로운 ToHashBucketStrong 작업을 래핑하는 클래스를 생성하는 팩토리 메서드입니다.
매개변수
범위 | 현재 범위 |
---|---|
입력 | 해시 버킷을 할당할 문자열입니다. |
버킷 수 | 버킷 수. |
열쇠 | 해시 함수를 시드하는 데 사용되는 키로, 두 개의 uint64 요소 목록으로 전달됩니다. |
보고
- ToHashBucketStrong의 새 인스턴스