เอาท์พุตเทนเซอร์ที่มีการลดลงในเทนเซอร์อินพุตทั้งหมด
ส่งออกเทนเซอร์ที่มีการลดลงในเทนเซอร์อินพุตทั้งหมดที่ส่งผ่านไปยัง ops ภายใน `shared_name เดียวกัน
ควรสร้างกราฟขึ้นมา ดังนั้นหาก op หนึ่งรันด้วยค่า shared_name `c` ดังนั้น `num_devices` ops จะทำงานด้วยค่า shared_name `c` หากไม่ทำเช่นนั้นจะทำให้การประมวลผลกราฟล้มเหลวจนเสร็จสมบูรณ์
อินพุต: อินพุตของข้อมูลการลด: ค่าของการลดในอุปกรณ์ `num_devices` ทั้งหมด การลดลง: การดำเนินการลดที่จะดำเนินการ num_devices: จำนวนอุปกรณ์ที่เข้าร่วมการลดนี้ shared_name: ตัวระบุที่แชร์ระหว่าง ops ของการลดลงเดียวกัน
ค่าคงที่
สตริง | OP_NAME | ชื่อของ op นี้ ซึ่งรู้จักกันในชื่อของเอ็นจิ้นหลัก TensorFlow |
วิธีการสาธารณะ
เอาท์พุต <T> | เป็นเอาท์พุต () ส่งกลับค่าแฮนเดิลสัญลักษณ์ของเทนเซอร์ |
คง <T ขยาย TNumber > NcclAllReduce <T> | |
เอาท์พุต <T> | ข้อมูล () |
วิธีการสืบทอด
ค่าคงที่
สตริงสุดท้ายแบบคงที่สาธารณะ OP_NAME
ชื่อของ op นี้ ซึ่งรู้จักกันในชื่อของเอ็นจิ้นหลัก TensorFlow
วิธีการสาธารณะ
เอาท์ พุท สาธารณะ <T> asOutput ()
ส่งกลับค่าแฮนเดิลสัญลักษณ์ของเทนเซอร์
อินพุตสำหรับการดำเนินการ TensorFlow คือเอาต์พุตของการดำเนินการ TensorFlow อื่น วิธีการนี้ใช้เพื่อรับหมายเลขอ้างอิงสัญลักษณ์ที่แสดงถึงการคำนวณอินพุต
สร้าง NcclAllReduce <T> แบบคงที่สาธารณะ (ขอบเขต ขอบเขต , อินพุต Operand <T>, การลดสตริง, numDevices แบบยาว, สตริง sharedName)
วิธีการจากโรงงานเพื่อสร้างคลาสที่รวมการดำเนินการ NcclAllReduce ใหม่
พารามิเตอร์
ขอบเขต | ขอบเขตปัจจุบัน |
---|
การส่งคืน
- อินสแตนซ์ใหม่ของ NcclAllReduce