Calcula os ganhos para cada recurso e retorna as melhores informações de divisão possíveis para o recurso.
As informações divididas são o melhor limite (id do bucket), ganhos e contribuições do nó esquerdo/direito por nó para cada recurso.
É possível que nem todos os nós possam ser divididos em cada recurso. Conseqüentemente, a lista de nós possíveis pode diferir entre os recursos. Portanto, retornamos `node_ids_list` para cada recurso, contendo a lista de nós que este recurso pode ser usado para dividir.
Desta forma, a saída é a melhor divisão por características e por nó, de modo que precisa ser combinada posteriormente para produzir a melhor divisão para cada nó (entre todas as características possíveis).
As formas de saída são compatíveis de forma que a primeira dimensão de todos os tensores seja a mesma e igual ao número de nós de divisão possíveis para cada recurso.
Classes aninhadas
aula | BoostedTreesSparseCalculateBestFeatureSplit.Options | Atributos opcionais para BoostedTreesSparseCalculateBestFeatureSplit |
Métodos Públicos
estática BoostedTreesSparseCalculateBestFeatureSplit | create ( Escopo do escopo , Operando <Integer> nodeIdRange, Operando <Integer> statsSummaryIndices, Operando <Float> statsSummaryValues, Operando <Integer> statsSummaryShape, Operando <Float> l1, Operando <Float> l2, Operando <Float> treeComplexity, Operando <Float > minNodeWeight, Long logitsDimension, Opções... opções) Método de fábrica para criar uma classe que envolve uma nova operação BoostedTreesSparseCalculateBestFeatureSplit. |
Saída <Inteiro> | recursoDimensões () Um tensor de classificação 1 indicando a melhor dimensão de recurso para cada recurso a ser dividido para cada nó. |
Saída <flutuante> | ganhos () Um tensor de Rank 1 indicando os melhores ganhos para dividir cada nó. |
Saída <flutuante> | leftNodeContribs () Um tensor de classificação 2 que indica a contribuição dos nós esquerdos ao ramificar dos nós pais para a direção esquerda pelo limite fornecido para cada recurso. |
Saída <Inteiro> | nodeIds () Um tensor de classificação 1 indicando possíveis IDs de nós que podem ser divididos. |
Saída <flutuante> | rightNodeContribs () Um tensor de classificação 2, com a mesma forma/condições que left_node_contribs_list, mas apenas que o valor é para o nó direito. |
estática BoostedTreesSparseCalculateBestFeatureSplit.Options | splitType (String splitType) |
Saída <String> | splitWithDefaultDirections () Um tensor de classificação 1 indicando qual direção seguir se faltarem dados. |
Saída <Inteiro> | limites () Um tensor de classificação 1 indicando o ID do bucket para comparar (como um limite) para divisão em cada nó. |
Métodos herdados
Métodos Públicos
public static BoostedTreesSparseCalculateBestFeatureSplit create ( Escopo escopo , Operando <Integer> nodeIdRange, Operando <Integer> statsSummaryIndices, Operando <Float> statsSummaryValues, Operando <Integer> statsSummaryShape, Operando <Float> l1, Operando <Float> l2, Operando <Float> treeComplexity, Operando <Float> minNodeWeight, Long logitsDimension, Opções... opções)
Método de fábrica para criar uma classe que envolve uma nova operação BoostedTreesSparseCalculateBestFeatureSplit.
Parâmetros
escopo | escopo atual |
---|---|
nodeIdRange | Um tensor de classificação 1 (shape=[2]) para especificar o intervalo [primeiro, último) de IDs de nó a serem processados em `stats_summary_list`. Os nós são iterados entre os dois nós especificados pelo tensor, como `for node_id in range(node_id_range[0], node_id_range[1])` (Observe que o último índice node_id_range[1] é exclusivo). |
estatísticasSummaryIndices | Um tensor int64 de classificação 2 de forma densa [N, 4] (N especifica o número de valores diferentes de zero) para resumo de estatísticas acumuladas (gradiente/hessiano) por nó por balde para cada recurso. A segunda dimensão contém ID do nó, dimensão do recurso, ID do bucket e estatísticas dim. stats dim é a soma da dimensão logits e da dimensão hessiana, a dimensão hessiana pode ser a dimensão logits se a diagonal hessiana for usada ou a dimensão logits ^ 2 se a hessiana completa for usada. |
estatísticasResumoValores | Um tensor flutuante de classificação 1 de formato denso [N] (N especifica o número de valores diferentes de zero), que fornece os valores para cada elemento em summary_indices. |
estatísticasResumoForma | Um tensor flutuante de classificação 1 de forma densa [4], que especifica a forma densa do tensor esparso, que é [num tree nodes, feature dimensions, num buckets, stats dim]. |
l1 | l1 fator de regularização nos pesos das folhas, com base em instância. |
l2 | Fator de regularização l2 nos pesos das folhas, com base em instância. |
árvoreComplexidade | ajuste ao ganho, por folha. |
minNodePeso | média mínima de hessianas em um nó antes necessária para que o nó seja considerado para divisão. |
logitsDimensão | A dimensão do logit, ou seja, número de classes. |
opções | carrega valores de atributos opcionais |
Devoluções
- uma nova instância de BoostedTreesSparseCalculateBestFeatureSplit
saída pública <inteiro> featureDimensions ()
Um tensor de classificação 1 indicando a melhor dimensão de recurso para cada recurso a ser dividido para cada nó.
ganhos de saída pública <Float> ()
Um tensor de Rank 1 indicando os melhores ganhos para dividir cada nó.
Saída pública <Float> leftNodeContribs ()
Um tensor de classificação 2 que indica a contribuição dos nós esquerdos ao ramificar dos nós pais para a direção esquerda pelo limite fornecido para cada recurso. Este valor será usado para criar o valor do nó esquerdo, adicionando ao valor do nó pai. O tamanho da segunda dimensão é a dimensão logits.
Saída pública <Inteiro> nodeIds ()
Um tensor de classificação 1 indicando possíveis IDs de nós que podem ser divididos.
Saída pública <Float> rightNodeContribs ()
Um tensor de classificação 2, com a mesma forma/condições que left_node_contribs_list, mas apenas que o valor é para o nó direito.
público estático BoostedTreesSparseCalculateBestFeatureSplit.Options splitType (String splitType)
Parâmetros
splitType | Uma string indicando se este Op deve realizar divisão por desigualdade ou divisão por igualdade. |
---|
Saída pública <String> splitWithDefaultDirections ()
Um tensor de classificação 1 indicando qual direção seguir se faltarem dados. A desigualdade com o padrão à esquerda retorna 0, a desigualdade com o padrão à direita retorna 1, a igualdade com o padrão à direita retorna 2.
limites de saída pública <inteiro> ()
Um tensor de classificação 1 indicando o ID do bucket para comparação (como limite) para divisão em cada nó.