텐서플로우:: 작전:: FixUnigramCandidateSampler:: 속성

#include <candidate_sampling_ops.h>

FixUnigramCandidateSampler 에 대한 선택적 속성 설정자입니다.

요약

공개 속성

distortion_ = 1.0f
float
num_reserved_ids_ = 0
int64
num_shards_ = 1
int64
seed2_ = 0
int64
seed_ = 0
int64
shard_ = 0
int64
unigrams_ = {}
gtl::ArraySlice< float >
vocab_file_ = ""
StringPiece

공공 기능

Distortion (float x)
TF_MUST_USE_RESULT Attrs
왜곡은 유니그램 확률 분포를 왜곡하는 데 사용됩니다.
NumReservedIds (int64 x)
TF_MUST_USE_RESULT Attrs
선택적으로 사용자가 일부 예약된 ID를 [0, ..., num_reserved_ids) 범위에 추가할 수 있습니다.
NumShards (int64 x)
TF_MUST_USE_RESULT Attrs
병렬성을 통해 전체 계산 속도를 높이기 위해 샘플러를 사용하여 원래 범위의 하위 집합에서 샘플링할 수 있습니다.
Seed (int64 x)
TF_MUST_USE_RESULT Attrs
Seed 또는 Seed2가 0이 아닌 값으로 설정된 경우 난수 생성기는 지정된 시드에 의해 시드됩니다.
Seed2 (int64 x)
TF_MUST_USE_RESULT Attrs
시드 충돌을 피하기 위한 두 번째 시드입니다.
Shard (int64 x)
TF_MUST_USE_RESULT Attrs
병렬성을 통해 전체 계산 속도를 높이기 위해 샘플러를 사용하여 원래 범위의 하위 집합에서 샘플링할 수 있습니다.
Unigrams (const gtl::ArraySlice< float > & x)
TF_MUST_USE_RESULT Attrs
ID당 하나씩 순차적으로 표시되는 유니그램 수 또는 확률 목록입니다.
VocabFile (StringPiece x)
TF_MUST_USE_RESULT Attrs
이 파일의 각 유효한 줄(CSV 형식이어야 함)은 유효한 단어 ID에 해당합니다.

공개 속성

왜곡_

float tensorflow::ops::FixedUnigramCandidateSampler::Attrs::distortion_ = 1.0f

num_reserved_ids_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_reserved_ids_ = 0

num_shards_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::num_shards_ = 1

씨앗2_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed2_ = 0

씨앗_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::seed_ = 0

사금파리_

int64 tensorflow::ops::FixedUnigramCandidateSampler::Attrs::shard_ = 0

유니그램_

gtl::ArraySlice< float > tensorflow::ops::FixedUnigramCandidateSampler::Attrs::unigrams_ = {}

어휘_파일_

StringPiece tensorflow::ops::FixedUnigramCandidateSampler::Attrs::vocab_file_ = ""

공공 기능

왜곡

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Distortion(
  float x
)

왜곡은 유니그램 확률 분포를 왜곡하는 데 사용됩니다.

내부 유니그램 분포에 추가하기 전에 먼저 각 가중치를 왜곡의 거듭제곱으로 올립니다. 결과적으로 왜곡 = 1.0은 일반 유니그램 샘플링(단어 파일에 정의된 대로)을 제공하고 왜곡 = 0.0은 균일한 분포를 제공합니다.

기본값은 1입니다.

예약된 ID 수

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumReservedIds(
  int64 x
)

선택적으로 사용자가 일부 예약된 ID를 [0, ..., num_reserved_ids) 범위에 추가할 수 있습니다.

한 가지 사용 사례는 특수한 알려지지 않은 단어 토큰이 ID 0으로 사용되는 것입니다. 이러한 ID의 샘플링 확률은 0입니다.

기본값은 0입니다.

샤드 수

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::NumShards(
  int64 x
)

병렬성을 통해 전체 계산 속도를 높이기 위해 샘플러를 사용하여 원래 범위의 하위 집합에서 샘플링할 수 있습니다.

이 매개변수('shard'와 함께)는 전체 계산에 사용되는 파티션 수를 나타냅니다.

기본값은 1입니다.

씨앗

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed(
  int64 x
)

Seed 또는 Seed2가 0이 아닌 값으로 설정된 경우 난수 생성기는 지정된 시드에 의해 시드됩니다.

그렇지 않으면 무작위 시드에 의해 시드됩니다.

기본값은 0입니다.

시드2

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Seed2(
  int64 x
)

시드 충돌을 피하기 위한 두 번째 시드입니다.

기본값은 0

사금파리

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Shard(
  int64 x
)

병렬성을 통해 전체 계산 속도를 높이기 위해 샘플러를 사용하여 원래 범위의 하위 집합에서 샘플링할 수 있습니다.

이 매개변수('num_shards'와 함께)는 분할이 사용될 때 샘플러 작업의 특정 파티션 번호를 나타냅니다.

기본값은 0입니다.

유니그램

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::Unigrams(
  const gtl::ArraySlice< float > & x
)

ID당 하나씩 순차적으로 표시되는 유니그램 수 또는 확률 목록입니다.

vocab_file과 유니그램 중 정확히 하나가 이 작업에 전달되어야 합니다.

기본값은 []

어휘파일

TF_MUST_USE_RESULT Attrs tensorflow::ops::FixedUnigramCandidateSampler::Attrs::VocabFile(
  StringPiece x
)

이 파일의 각 유효한 줄(CSV 형식이어야 함)은 유효한 단어 ID에 해당합니다.

ID는 num_reserved_ids부터 순차적으로 나열됩니다. 각 줄의 마지막 항목은 개수 또는 상대 확률에 해당하는 값이 될 것으로 예상됩니다. vocab_file과 유니그램 중 정확히 하나가 이 작업에 전달되어야 합니다.

기본값은 ""입니다.