각 기능에 대한 이득을 계산하고 기능에 대해 가능한 최상의 분할 정보를 반환합니다.
분할 정보는 각 기능에 대한 노드당 최상의 임계값(버킷 ID), 이득 및 왼쪽/오른쪽 노드 기여도입니다.
각 기능에서 모든 노드를 분할할 수는 없을 수도 있습니다. 따라서 가능한 노드 목록은 기능마다 다를 수 있습니다. 따라서 이 기능을 사용하여 분할할 수 있는 노드 목록이 포함된 각 기능에 대해 'node_ids_list'를 반환합니다.
이러한 방식으로 출력은 기능별 및 노드별로 최상의 분할이므로 나중에 결합하여 (가능한 모든 기능 중에서) 각 노드에 대해 최상의 분할을 생성해야 합니다.
출력 형태는 모든 텐서의 첫 번째 차원이 동일하고 각 기능에 대해 가능한 분할 노드 수와 동일한 방식으로 호환됩니다.
중첩 클래스
수업 | BoostedTreesSparseCalculateBestFeatureSplit.Options | BoostedTreesSparseCalculateBestFeatureSplit 의 선택적 속성 |
상수
끈 | OP_NAME | TensorFlow 코어 엔진에서 알려진 이 작업의 이름 |
공개 방법
정적 BoostedTreesSparseCalculateBestFeatureSplit | create ( Scope 범위, Operand < TInt32 > nodeIdRange, Operand < TInt32 > statsSummaryIndices, Operand < TFloat32 > statsSummaryValues, Operand < TInt32 > statsSummaryShape, Operand < TFloat32 > l1, Operand < TFloat32 > l2, Operand < TFloat32 > treeComplexity, Operand < TFlo at32 > minNodeWeight, Long logitsDimension, 옵션... 옵션) 새로운 BoostedTreesSparseCalculateBestFeatureSplit 작업을 래핑하는 클래스를 생성하는 팩토리 메서드입니다. |
출력 < TInt32 > | 기능크기 () 각 노드에 대해 분할할 각 특성에 대한 최상의 특성 차원을 나타내는 순위 1 텐서. |
출력 < TFloat32 > | 이득 () 각 노드를 분할하는 데 필요한 최고의 이득을 나타내는 순위 1 텐서. |
출력 < TFloat32 > | leftNodeContribs () 각 특성에 대해 지정된 임계값만큼 상위 노드에서 왼쪽 방향으로 분기할 때 왼쪽 노드의 기여도를 나타내는 순위 2 텐서입니다. |
출력 < TInt32 > | 노드 ID () 분할될 수 있는 가능한 노드 ID를 나타내는 순위 1 텐서. |
출력 < TFloat32 > | rightNodeContribs () left_node_contribs_list와 동일한 모양/조건을 갖는 순위 2 텐서이지만 값은 오른쪽 노드에 대한 것입니다. |
정적 BoostedTreesSparseCalculateBestFeatureSplit.Options | 분할 유형 (문자열 분할 유형) |
출력 < TString > | SplitWithDefaultDirections () 데이터가 누락된 경우 이동할 방향을 나타내는 순위 1 텐서입니다. |
출력 < TInt32 > | 임계값 () 각 노드의 분할에 대해 (임계값으로) 비교할 버킷 ID를 나타내는 순위 1 텐서입니다. |
상속된 메서드
상수
공개 정적 최종 문자열 OP_NAME
TensorFlow 코어 엔진에서 알려진 이 작업의 이름
공개 방법
public static BoostedTreesSparseCalculateBestFeatureSplit create ( Scope 범위, Operand < TInt32 > nodeIdRange, Operand < TInt32 > statsSummaryIndices, Operand < TFloat32 > statsSummaryValues, Operand < TFloat32 > statsSummaryShape, Operand < TFloat32 > l1, Operand < TFloat32 > l2, Opera nd < TFloat32 > treeComplexity, 피연산자 < TFloat32 > minNodeWeight, Long logitsDimension, 옵션... 옵션)
새로운 BoostedTreesSparseCalculateBestFeatureSplit 작업을 래핑하는 클래스를 생성하는 팩토리 메서드입니다.
매개변수
범위 | 현재 범위 |
---|---|
nodeIdRange | `stats_summary_list` 내에서 처리할 노드 ID의 범위[첫 번째, 마지막)를 지정하는 순위 1 텐서(모양=[2]). 노드는 'for node_id in range(node_id_range[0], node_id_range[1])'처럼 텐서에 의해 지정된 두 노드 사이에서 반복됩니다(마지막 인덱스 node_id_range[1]은 제외됩니다). |
통계요약지수 | 각 기능의 버킷당 노드당 누적 통계 요약(그라데이션/헤시안)에 대한 밀집 형태 [N, 4](N은 0이 아닌 값의 수를 지정)의 순위 2 int64 텐서입니다. 두 번째 차원에는 노드 ID, 기능 차원, 버킷 ID 및 통계 희미가 포함됩니다. stats 희미함은 로짓 차원과 헤세 차원의 합이며, 헤세 차원은 대각선 헤세를 사용하는 경우 로지트 차원일 수 있고, 전체 헤세를 사용하는 경우 로지트 차원^2일 수 있습니다. |
통계요약값 | summary_indices의 각 요소에 대한 값을 제공하는 조밀한 형태 [N](N은 0이 아닌 값의 수를 지정)의 순위 1 부동 텐서입니다. |
통계요약모양 | 희소 텐서의 조밀한 형태를 지정하는 조밀한 형태의 랭크 1 부동 텐서[4], 즉 [트리 노드 수, 기능 차원, 버킷 수, 통계 희미]. |
l1 | l1 인스턴스 기반 리프 가중치에 대한 정규화 인자. |
l2 | l2 인스턴스 기반 리프 가중치에 대한 정규화 인자입니다. |
트리복잡성 | 리프별로 이득을 조정합니다. |
minNodeWeight | 노드 분할을 고려하기 전에 노드에 있는 헤센의 최소 평균입니다. |
로지트차원 | 로짓의 차원, 즉 클래스 수. |
옵션 | 선택적 속성 값을 전달합니다. |
보고
- BoostedTreesSparseCalculateBestFeatureSplit의 새로운 인스턴스
공개 출력 < TFloat32 > leftNodeContribs ()
각 특성에 대해 지정된 임계값만큼 상위 노드에서 왼쪽 방향으로 분기할 때 왼쪽 노드의 기여도를 나타내는 순위 2 텐서입니다. 이 값은 부모 노드 값에 더해 왼쪽 노드 값을 만드는 데 사용됩니다. 두 번째 차원 크기는 로지트 차원입니다.
공개 출력 < TFloat32 > rightNodeContribs ()
left_node_contribs_list와 동일한 모양/조건을 갖는 순위 2 텐서이지만 값은 오른쪽 노드에 대한 것입니다.
공개 정적 BoostedTreesSparseCalculateBestFeatureSplit.Options 분할 유형 (문자열 분할 유형)
매개변수
분할 유형 | 이 작업이 불일치 분할을 수행해야 하는지 또는 동등 분할을 수행해야 하는지를 나타내는 문자열입니다. |
---|
공개 출력 < TString > SplitWithDefaultDirections ()
데이터가 누락된 경우 이동할 방향을 나타내는 순위 1 텐서입니다. 기본 왼쪽과의 부등식은 0을 반환하고, 기본 오른쪽과의 부등식은 1을 반환하며, 기본 오른쪽과의 동일성은 2를 반환합니다.