Menghitung keuntungan untuk setiap fitur dan mengembalikan informasi pemisahan terbaik untuk fitur tersebut.
Informasi yang dipisahkan adalah ambang batas terbaik (id keranjang), perolehan, dan kontribusi node kiri/kanan per node untuk setiap fitur.
Ada kemungkinan tidak semua node dapat dipecah pada setiap fitur. Oleh karena itu, daftar kemungkinan node dapat berbeda antar fitur. Oleh karena itu, kami mengembalikan `node_ids_list` untuk setiap fitur, yang berisi daftar node yang dapat digunakan untuk dipisahkan oleh fitur ini.
Dengan cara ini, outputnya adalah pemisahan terbaik per fitur dan per node, sehingga nantinya perlu digabungkan untuk menghasilkan pemisahan terbaik untuk setiap node (di antara semua fitur yang mungkin).
Bentuk keluaran kompatibel sedemikian rupa sehingga dimensi pertama semua tensor sama dan sama dengan jumlah kemungkinan node terpisah untuk setiap fitur.
Kelas Bersarang
kelas | BoostedTreesCalculateBestFeatureSplit.Options | Atribut opsional untuk BoostedTreesCalculateBestFeatureSplit |
Konstanta
Rangkaian | OP_NAME | Nama operasi ini dikenal dengan mesin inti TensorFlow |
Metode Publik
BoostedTreesCalculateBestFeatureSplit statis | buat ( Cakupan cakupan , Operan < TInt32 > nodeIdRange, Operan < TFloat32 > statsSummary, Operan < TFloat32 > l1, Operan < TFloat32 > l2, Operan < TFloat32 > treeComplexity, Operan < TFloat32 > minNodeWeight, LogitsDimension panjang, Opsi... pilihan) Metode pabrik untuk membuat kelas yang membungkus operasi BoostedTreesCalculateBestFeatureSplit baru. |
Keluaran < TInt32 > | fiturDimensi () Tensor Peringkat 1 yang menunjukkan dimensi fitur terbaik untuk setiap fitur yang akan dipisahkan untuk node tertentu jika fitur tersebut multidimensi. |
Keluaran < TFloat32 > | keuntungan () Tensor Peringkat 1 yang menunjukkan perolehan terbaik untuk setiap fitur yang akan dibagi untuk node tertentu. |
Keluaran < TFloat32 > | kiriNodeContribs () Tensor peringkat 2 yang menunjukkan kontribusi node kiri ketika bercabang dari node induk (diberikan oleh elemen tensor di output node_ids_list) ke arah kiri dengan ambang batas yang diberikan untuk setiap fitur. |
Keluaran < TInt32 > | nodeId () Tensor Peringkat 1 yang menunjukkan kemungkinan id node terpisah untuk setiap fitur. |
Keluaran < TFloat32 > | kananNodeContribs () Tensor peringkat 2, dengan bentuk/kondisi yang sama dengan left_node_contribs_list, tetapi nilainya hanya untuk node kanan. |
BoostedTreesCalculateBestFeatureSplit.Options statis | splitType (String splitType) |
Keluaran <TString> | splitDenganDefaultDirections () Tensor Peringkat 1 yang menunjukkan arah mana yang harus dituju jika data hilang. |
Keluaran < TInt32 > | ambang batas () Tensor Peringkat 1 yang menunjukkan id keranjang yang akan dibandingkan (sebagai ambang batas) untuk pemisahan di setiap node. |
Metode Warisan
Konstanta
String akhir statis publik OP_NAME
Nama operasi ini dikenal dengan mesin inti TensorFlow
Metode Publik
public static BoostedTreesCalculateBestFeatureSplit buat ( Cakupan cakupan , Operan < TInt32 > nodeIdRange, Operan < TFloat32 > statsSummary, Operan < TFloat32 > l1, Operan < TFloat32 > l2, Operan < TFloat32 > treeComplexity, Operan < TFloat32 > minNodeWeight, LogitsDimension panjang, Opsi.. . pilihan)
Metode pabrik untuk membuat kelas yang membungkus operasi BoostedTreesCalculateBestFeatureSplit baru.
Parameter
cakupan | ruang lingkup saat ini |
---|---|
nodeIdRange | Tensor Peringkat 1 (bentuk=[2]) untuk menentukan rentang [pertama, terakhir) dari id node yang akan diproses dalam `stats_summary_list`. Node diiterasi antara dua node yang ditentukan oleh tensor, seperti `untuk node_id dalam rentang(node_id_range[0], node_id_range[1])` (Perhatikan bahwa indeks terakhir node_id_range[1] bersifat eksklusif). |
statistikRingkasan | Tensor Peringkat 4 (#shape=[max_splits, feature_dims, bucket, stats_dims]) untuk akumulasi ringkasan statistik (gradien/hessian) per node, per dimensi, per bucket untuk setiap fitur. Dimensi pertama tensor adalah jumlah pemisahan maksimum, sehingga tidak semua elemennya akan digunakan, tetapi hanya indeks yang ditentukan oleh node_ids yang akan digunakan. |
l1 | l1 faktor regularisasi pada bobot daun, berdasarkan per contoh. |
l2 | l2 faktor regularisasi pada bobot daun, berdasarkan per contoh. |
kompleksitas pohon | penyesuaian terhadap keuntungan, berdasarkan per daun. |
minNodeBerat | rata-rata minimum goni dalam sebuah node sebelum diperlukan agar node tersebut dipertimbangkan untuk dipecah. |
LogitsDimensi | Dimensi logit, yaitu jumlah kelas. |
pilihan | membawa nilai atribut opsional |
Kembali
- contoh baru dari BoostedTreesCalculateBestFeatureSplit
Output publik < TInt32 > featureDimensions ()
Tensor Peringkat 1 yang menunjukkan dimensi fitur terbaik untuk setiap fitur yang akan dipisahkan untuk node tertentu jika fitur tersebut multidimensi. Lihat di atas untuk detail seperti bentuk dan ukuran.
Output publik < TFloat32 > keuntungan ()
Tensor Peringkat 1 yang menunjukkan perolehan terbaik untuk setiap fitur yang akan dibagi untuk node tertentu. Lihat di atas untuk detail seperti bentuk dan ukuran.
Keluaran publik < TFloat32 > leftNodeContribs ()
Tensor peringkat 2 yang menunjukkan kontribusi node kiri ketika bercabang dari node induk (diberikan oleh elemen tensor di output node_ids_list) ke arah kiri dengan ambang batas yang diberikan untuk setiap fitur. Nilai ini akan digunakan untuk membuat nilai simpul kiri dengan menambahkan nilai simpul induk. Ukuran dimensi kedua adalah 1 untuk logit 1 dimensi, tetapi akan lebih besar untuk masalah kelas jamak. Lihat di atas untuk detail seperti bentuk dan ukuran.
Keluaran publik < TInt32 > nodeIds ()
Tensor Peringkat 1 yang menunjukkan kemungkinan id node terpisah untuk setiap fitur. Panjang daftarnya adalah num_features, tetapi setiap tensor memiliki ukuran berbeda karena setiap fitur menyediakan kemungkinan node yang berbeda. Lihat di atas untuk detail seperti bentuk dan ukuran.
Keluaran publik < TFloat32 > rightNodeContribs ()
Tensor peringkat 2, dengan bentuk/kondisi yang sama dengan left_node_contribs_list, tetapi nilainya hanya untuk node kanan.
publik statis BoostedTreesCalculateBestFeatureSplit.Options splitType (String splitType)
Parameter
Tipe terpisah | Sebuah string yang menunjukkan apakah Operasi ini harus melakukan pemisahan ketidaksetaraan atau pemisahan kesetaraan. |
---|
Keluaran publik < TString > splitWithDefaultDirections ()
Tensor Peringkat 1 yang menunjukkan arah mana yang harus dituju jika data hilang. Lihat di atas untuk detail seperti bentuk dan ukuran. Pertidaksamaan dengan kiri bawaan menghasilkan 0, pertidaksamaan dengan kanan bawaan menghasilkan 1, persamaan dengan kanan bawaan menghasilkan 2.