FixedUnigramCandidateSampler.Options

คงสาธารณะคลาสคงที่ คงUnigramCandidateSampler.Options

แอ็ตทริบิวต์ทางเลือกสำหรับ FixedUnigramCandidateSampler

วิธีการสาธารณะ

แก้ไข UnigramCandidateSampler.Options
การบิดเบือน (การบิดเบือนแบบลอย)
แก้ไข UnigramCandidateSampler.Options
numReservedIds (ยาว numReservedIds)
แก้ไข UnigramCandidateSampler.Options
numShards (ยาว numShards)
แก้ไข UnigramCandidateSampler.Options
เมล็ด (เมล็ดยาว)
แก้ไข UnigramCandidateSampler.Options
เมล็ด2 (เมล็ดยาว2)
แก้ไข UnigramCandidateSampler.Options
เศษ (เศษยาว)
แก้ไข UnigramCandidateSampler.Options
ยูนิแกรม (รายการ<Float> ยูนิแกรม)
แก้ไข UnigramCandidateSampler.Options
vocabFile (ไฟล์คำศัพท์สตริง)

วิธีการสืบทอด

วิธีการสาธารณะ

สาธารณะ คงการบิดเบือน UnigramCandidateSampler.Options (ความผิดเพี้ยนแบบลอย)

พารามิเตอร์
การบิดเบือน การบิดเบือนจะใช้เพื่อบิดเบือนการแจกแจงความน่าจะเป็นแบบยูนิแกรม ตุ้มน้ำหนักแต่ละอันจะถูกยกขึ้นตามกำลังของการบิดเบือนก่อนจึงจะเพิ่มไปยังการแจกแจงแบบยูนิแกรมภายใน ผลก็คือ ความบิดเบี้ยว = 1.0 ให้การสุ่มตัวอย่างแบบยูนิแกรมปกติ (ตามที่กำหนดโดยไฟล์คำศัพท์) และการบิดเบือน = 0.0 ให้การแจกแจงแบบสม่ำเสมอ

สาธารณะ FixedUnigramCandidateSampler.Options numReservedIds (Long numReservedIds)

พารามิเตอร์
numReservedIds นอกจากนี้ ผู้ใช้ยังสามารถเพิ่ม ID ที่สงวนไว้บางส่วนในช่วง [0, ..., num_reserved_ids) ได้ กรณีการใช้งานประการหนึ่งคือมีการใช้โทเค็นคำพิเศษที่ไม่รู้จักเป็น ID 0 รหัสเหล่านี้จะมีความน่าจะเป็นในการสุ่มตัวอย่างเป็น 0

สาธารณะ คง UnigramCandidateSampler.Options numShards (Long numShards)

พารามิเตอร์
numShards เครื่องเก็บตัวอย่างสามารถใช้เพื่อสุ่มตัวอย่างจากชุดย่อยของช่วงดั้งเดิมเพื่อเร่งความเร็วการคำนวณทั้งหมดผ่านการขนาน พารามิเตอร์นี้ (ร่วมกับ 'shard') ระบุจำนวนพาร์ติชันที่ใช้ในการคำนวณโดยรวม

เมล็ดพันธุ์ FixUnigramCandidateSampler.Options สาธารณะ (เมล็ดยาว)

พารามิเตอร์
เมล็ดพันธุ์ หากเมล็ดพืชหรือเมล็ดพืช2 ถูกตั้งค่าไม่เป็นศูนย์ เครื่องกำเนิดตัวเลขสุ่มจะถูกเพาะโดยเมล็ดที่ให้มา มิฉะนั้นจะถูกเพาะโดยเมล็ดแบบสุ่ม

สาธารณะ FixedUnigramCandidateSampler.Options seed2 (Long seed2)

พารามิเตอร์
เมล็ดพันธุ์2 เมล็ดที่สองเพื่อหลีกเลี่ยงการชนกันของเมล็ด

สาธารณะ FixedUnigramCandidateSampler.Options shard (Long shard)

พารามิเตอร์
เศษ เครื่องเก็บตัวอย่างสามารถใช้เพื่อสุ่มตัวอย่างจากชุดย่อยของช่วงดั้งเดิมเพื่อเร่งความเร็วการคำนวณทั้งหมดผ่านการขนาน พารามิเตอร์นี้ (ร่วมกับ 'num_shards') ระบุหมายเลขพาร์ติชันเฉพาะของแซมเพลอร์ op เมื่อใช้การแบ่งพาร์ติชัน

สาธารณะ FixedUnigramCandidateSampler.Options unigrams (รายการ <Float> unigrams)

พารามิเตอร์
ยูนิแกรม รายการจำนวนยูนิแกรมหรือความน่าจะเป็น หนึ่งรายการต่อ ID ตามลำดับ ควรส่ง vocab_file และ unigrams หนึ่งรายการไปยัง op นี้

สาธารณะ FixedUnigramCandidateSampler.Options vocabFile (สตริง vocabFile)

พารามิเตอร์
vocabFile แต่ละบรรทัดที่ถูกต้องในไฟล์นี้ (ซึ่งควรมีรูปแบบคล้าย CSV) สอดคล้องกับรหัสคำที่ถูกต้อง รหัสจะเรียงลำดับตามลำดับ โดยเริ่มจาก num_reserved_ids รายการสุดท้ายในแต่ละบรรทัดคาดว่าจะเป็นค่าที่สอดคล้องกับการนับหรือความน่าจะเป็นแบบสัมพันธ์ ต้องส่ง vocab_file และ unigrams หนึ่งรายการไปยัง op นี้