สร้างป้ายกำกับสำหรับการสุ่มตัวอย่างที่มีการกระจายแบบสม่ำเสมอ
ดูคำอธิบายของการสุ่มตัวอย่างผู้สมัครและรูปแบบข้อมูลที่ go/candidate-sampling
สำหรับแต่ละชุด ฝ่ายปฏิบัติการนี้จะเลือกชุดป้ายกำกับตัวอย่างที่สุ่มตัวอย่างชุดเดียว
ข้อดีของการเลือกตัวอย่างต่อชุดคือความเรียบง่ายและความเป็นไปได้ของการคูณเมทริกซ์หนาแน่นอย่างมีประสิทธิภาพ ข้อเสียคือต้องเลือกผู้สมัครตัวอย่างโดยอิสระจากบริบทและป้ายกำกับที่แท้จริง
คลาสที่ซ้อนกัน
ระดับ | UniformCandidateSampler.Options | แอ็ตทริบิวต์ทางเลือกสำหรับ UniformCandidateSampler |
ค่าคงที่
สตริง | OP_NAME | ชื่อของ op นี้ ซึ่งรู้จักกันในชื่อของเอ็นจิ้นหลัก TensorFlow |
วิธีการสาธารณะ
UniformCandidateSampler แบบคงที่ | สร้าง (ขอบเขต ขอบเขต ตัวดำเนินการ < TInt64 > trueClasses, Long numTrue, Long numSampled, Boolean Unique, Long rangeMax, Options... options) วิธีการจากโรงงานเพื่อสร้างคลาสที่ห่อการดำเนินการ UniformCandidateSampler ใหม่ |
เอาท์พุต <TInt64> | ผู้สมัครตัวอย่าง () เวกเตอร์ที่มีความยาว num_sampled ซึ่งแต่ละองค์ประกอบเป็น ID ของตัวเลือกที่สุ่มตัวอย่าง |
เอาท์พุต < TFloat32 > | ตัวอย่างที่คาดหวังจำนวน () เวกเตอร์ที่มีความยาว num_sampled สำหรับผู้สมัครที่ถูกสุ่มตัวอย่างแต่ละตัว ซึ่งแสดงถึงจำนวนครั้งที่ผู้สมัครคาดว่าจะเกิดขึ้นในชุดของผู้สมัครที่ถูกสุ่มตัวอย่าง |
คง UniformCandidateSampler.Options | เมล็ด (เมล็ดยาว) |
คง UniformCandidateSampler.Options | เมล็ด2 (เมล็ดยาว2) |
เอาท์พุต < TFloat32 > | trueExpectedCount () เมทริกซ์batch_size * num_true แสดงถึงจำนวนครั้งที่ผู้สมัครแต่ละคนคาดว่าจะเกิดขึ้นในชุดของผู้สมัครตัวอย่าง |
วิธีการสืบทอด
ค่าคงที่
สตริงสุดท้ายแบบคงที่สาธารณะ OP_NAME
ชื่อของ op นี้ ซึ่งรู้จักกันในชื่อของเอ็นจิ้นหลัก TensorFlow
วิธีการสาธารณะ
สร้าง UniformCandidateSampler แบบคงที่สาธารณะ (ขอบเขต ขอบเขต ตัวดำเนินการ < TInt64 > trueClasses, Long numTrue, Long numSampled, Boolean Unique, Long rangeMax, Options... options)
วิธีการจากโรงงานเพื่อสร้างคลาสที่ห่อการดำเนินการ UniformCandidateSampler ใหม่
พารามิเตอร์
ขอบเขต | ขอบเขตปัจจุบัน |
---|---|
ทรูคลาส | เมทริกซ์ bat_size * num_true ซึ่งแต่ละแถวมี ID ของ num_true target_classes ในป้ายกำกับดั้งเดิมที่เกี่ยวข้อง |
numTrue | จำนวนป้ายกำกับที่แท้จริงต่อบริบท |
จำนวนตัวอย่าง | จำนวนผู้สมัครที่จะสุ่มตัวอย่าง |
มีเอกลักษณ์ | หากค่าไม่ซ้ำกันเป็นจริง เราจะสุ่มตัวอย่างด้วยการปฏิเสธ เพื่อให้ผู้สมัครสุ่มตัวอย่างทั้งหมดในแบตช์ไม่ซ้ำกัน ซึ่งต้องมีการประมาณเพื่อประเมินความน่าจะเป็นของการสุ่มตัวอย่างหลังการปฏิเสธ |
ช่วงสูงสุด | ตัวเก็บตัวอย่างจะสุ่มตัวอย่างจำนวนเต็มจากช่วง [0, range_max) |
ตัวเลือก | มีค่าแอตทริบิวต์ทางเลือก |
การส่งคืน
- อินสแตนซ์ใหม่ของ UniformCandidateSampler
เอาท์พุท สาธารณะ <TInt64> SampledCandidates ()
เวกเตอร์ที่มีความยาว num_sampled ซึ่งแต่ละองค์ประกอบเป็น ID ของตัวเลือกที่สุ่มตัวอย่าง
เอาท์พุท สาธารณะ < TFloat32 > SampledExpectedCount ()
เวกเตอร์ที่มีความยาว num_sampled สำหรับผู้สมัครที่ถูกสุ่มตัวอย่างแต่ละตัว ซึ่งแสดงถึงจำนวนครั้งที่ผู้สมัครคาดว่าจะเกิดขึ้นในชุดของผู้สมัครที่ถูกสุ่มตัวอย่าง หากไม่ซ้ำกัน=จริง นี่คือความน่าจะเป็น
เมล็ดพันธุ์ UniformCandidateSampler.Options แบบคงที่สาธารณะ (เมล็ดยาว)
พารามิเตอร์
เมล็ดพันธุ์ | หากเมล็ดพืชหรือเมล็ดพืช2 ถูกตั้งค่าไม่เป็นศูนย์ เครื่องกำเนิดตัวเลขสุ่มจะถูกเพาะโดยเมล็ดที่ให้มา มิฉะนั้นจะถูกเพาะโดยเมล็ดแบบสุ่ม |
---|
สาธารณะคง UniformCandidateSampler.Options seed2 (Long seed2)
พารามิเตอร์
เมล็ดพันธุ์2 | เมล็ดที่สองเพื่อหลีกเลี่ยงการชนกันของเมล็ด |
---|