Вычисляет выигрыш для каждой функции и возвращает наилучшую возможную информацию о разбиении для этой функции.
Информация о разделении представляет собой лучший порог (идентификатор сегмента), приросты и вклады левого/правого узла на узел для каждого объекта.
Возможно, не все узлы можно разделить по каждому признаку. Следовательно, список возможных узлов может различаться в зависимости от объекта. Поэтому мы возвращаем node_ids_list для каждого объекта, содержащий список узлов, для разделения которых можно использовать этот объект.
Таким образом, выходные данные представляют собой наилучшее разделение по объектам и узлам, поэтому их необходимо объединить позже, чтобы получить наилучшее разделение для каждого узла (среди всех возможных функций).
Все выходные списки имеют одинаковую длину `num_features`. Выходные формы совместимы таким образом, что первое измерение всех тензоров всех списков одинаково и равно количеству возможных узлов разделения для каждого объекта.
Константы
Нить | OP_NAME | Название этой операции, известное основному движку TensorFlow. |
Публичные методы
static BoostedTreesCalculateBestGainsPerFeature | create ( Область видимости , Операнд < TInt32 > nodeIdRange, Iterable< Операнд < TFloat32 >> statsSummaryList, Операнд < TFloat32 > l1, Операнд < TFloat32 > l2, Операнд < TFloat32 > TreeComplexity, Операнд < TFloat32 > minNodeWeight, Long maxSplits) Фабричный метод для создания класса, обертывающего новую операцию BoostedTreesCalculateBestGainsPerFeature. |
Список < Вывод < TFloat32 >> | Список выигрышей () Выходной список тензоров ранга 1, указывающий наилучший выигрыш для каждого признака для разделения на определенные узлы. |
Список < Вывод < TFloat32 >> | левыйNodeContribsList () Список тензоров ранга 2, указывающий вклад левых узлов при разветвлении от родительских узлов (задаваемых элементом тензора в выходном node_ids_list) влево по заданному порогу для каждого признака. |
Список< Вывод <TInt32> > | список_узлов () Выходной список тензоров ранга 1, указывающий возможные идентификаторы узлов разделения для каждого объекта. |
Список < Вывод < TFloat32 >> | rightNodeContribsList () Список тензоров ранга 2 с той же формой/условиями, что и left_node_contribs_list, но значением является только правый узел. |
Список< Вывод <TInt32> > | список порогов () Выходной список тензоров ранга 1, указывающий идентификатор сегмента для сравнения (в качестве порога) для разделения в каждом узле. |
Унаследованные методы
Константы
общедоступная статическая финальная строка OP_NAME
Название этой операции, известное основному движку TensorFlow.
Публичные методы
public static BoostedTreesCalculateBestGainsPerFeature create ( Область видимости , Operand < TInt32 > nodeIdRange, Iterable< Operand < TFloat32 >> statsSummaryList, Operand < TFloat32 > l1, Operand < TFloat32 > l2, Operand < TFloat32 > TreeComplexity, Operand < TFloat32 > minNodeWeight, Длинные maxSplits)
Фабричный метод для создания класса, обертывающего новую операцию BoostedTreesCalculateBestGainsPerFeature.
Параметры
объем | текущий объем |
---|---|
узелидранже | Тензор ранга 1 (shape=[2]) для указания диапазона [первый, последний) идентификаторов узлов для обработки в `stats_summary_list`. Узлы перебираются между двумя узлами, указанными тензором, как например `for node_id в диапазоне(node_id_range[0], node_id_range[1])` (обратите внимание, что последний индекс node_id_range[1] является исключительным). |
статистикаСводкаСписок | Список тензоров ранга 3 (#shape=[max_splits, Bucket, 2]) для суммарной сводной статистики (градиент/гессиан) для каждого узла по сегментам для каждого объекта. Первое измерение тензора — это максимальное количество разбиений, поэтому будут использоваться не все его элементы, а только индексы, указанные node_ids. |
л1 | Коэффициент регуляризации l1 для весов листьев, в зависимости от экземпляра. |
л2 | Коэффициент регуляризации l2 для весов листьев, в зависимости от экземпляра. |
деревоСложность | регулировка усиления на основе листа. |
minNodeWeight | минимальное среднее количество гессианов в узле, необходимое для того, чтобы узел можно было рассматривать для разделения. |
maxSplits | количество узлов, которые можно разделить во всем дереве. Используется как размерность выходных тензоров. |
Возврат
- новый экземпляр BoostedTreesCalculateBestGainsPerFeature
общедоступный список < Вывод < TFloat32 >> GainsList ()
Выходной список тензоров ранга 1, указывающий наилучший выигрыш для каждого признака для разделения на определенные узлы. Подробную информацию о формах и размерах см. выше.
общедоступный список < Вывод < TFloat32 >> leftNodeContribsList ()
Список тензоров ранга 2, указывающий вклад левых узлов при разветвлении от родительских узлов (задаваемых элементом тензора в выходном node_ids_list) влево по заданному порогу для каждого признака. Это значение будет использоваться для создания значения левого узла путем добавления к значению родительского узла. Размер второго измерения равен 1 для одномерных логитов, но будет больше для задач с несколькими классами. Подробную информацию о формах и размерах см. выше.
общедоступный список < Вывод < TInt32 >> nodeIdsList ()
Выходной список тензоров ранга 1, указывающий возможные идентификаторы узлов разделения для каждого объекта. Длина списка — num_features, но каждый тензор имеет разный размер, поскольку каждый объект предоставляет разные возможные узлы. Подробную информацию о формах и размерах см. выше.
общедоступный список < Вывод < TFloat32 >> rightNodeContribsList ()
Список тензоров ранга 2 с той же формой/условиями, что и left_node_contribs_list, но значением является только правый узел.