공개 최종 클래스 CrossReplicaSum
복제된 TPU 인스턴스 전체에서 입력을 합산하는 작업입니다.
각 인스턴스는 자체 입력을 제공합니다.
예를 들어 `[A, B, C, D, E, F, G, H]`라는 8개의 TPU 인스턴스가 있다고 가정합니다. group_location=`[[0,2,4,6],[1,3,5,7]]`을 전달하면 `A, C, E, G`를 그룹 0으로 설정하고 `B, D, F, H`를 설정합니다. 그룹 1로. 따라서 출력은 다음과 같습니다: `[A+C+E+G, B+D+F+H, A+C+E+G, B+D+F+H, A+C+E+ G, B+D+F+H, A+C+E+G, B+D+F+H]`.
상수
끈 | OP_NAME | TensorFlow 코어 엔진에서 알려진 이 작업의 이름 |
공개 방법
출력 <T> | 출력 () 텐서의 기호 핸들을 반환합니다. |
static <T는 TNumber를 확장합니다. > CrossReplicaSum <T> | |
출력 <T> | 출력 () 모든 분산 입력의 합계입니다. |
상속된 메서드
상수
공개 정적 최종 문자열 OP_NAME
TensorFlow 코어 엔진에서 알려진 이 작업의 이름
상수 값: "CrossReplicaSum"
공개 방법
공개 출력 <T> asOutput ()
텐서의 기호 핸들을 반환합니다.
TensorFlow 작업에 대한 입력은 다른 TensorFlow 작업의 출력입니다. 이 메서드는 입력 계산을 나타내는 기호 핸들을 얻는 데 사용됩니다.
공개 정적 CrossReplicaSum <T> 생성 ( 범위 범위, 피연산자 <T> 입력, 피연산자 < TInt32 > groupAssignment)
새로운 CrossReplicaSum 작업을 래핑하는 클래스를 생성하는 팩토리 메서드입니다.
매개변수
범위 | 현재 범위 |
---|---|
입력 | 합계에 대한 로컬 입력입니다. |
그룹할당 | [num_groups, num_replicas_per_group] 형태의 int32 텐서. `group_location[i]`는 i번째 하위 그룹의 복제본 ID를 나타냅니다. |
보고
- CrossReplicaSum의 새 인스턴스