Cập nhật các mục nhập có liên quan trong '*var' và '*accum' theo sơ đồ động lượng.
Đặt use_nesterov = True nếu bạn muốn sử dụng đà Nesterov.
Đó là đối với các hàng chúng tôi có grad, chúng tôi cập nhật var và accum như sau:
tích lũy = tích lũy * động lượng - lr * grad var += tích lũy
Các lớp lồng nhau
lớp học | ResourceSparseApplyKerasMomentum.Options | Thuộc tính tùy chọn cho ResourceSparseApplyKerasMomentum |
Hằng số
Sợi dây | OP_NAME | Tên của op này, được biết đến bởi công cụ lõi TensorFlow |
Phương pháp công khai
tĩnh <T mở rộng TType > ResourceSparseApplyKerasMomentum | |
tĩnh ResourceSparseApplyKerasMomentum.Options | useLocking (Boolean useLocking) |
tĩnh ResourceSparseApplyKerasMomentum.Options | useNesterov (Sử dụng BooleanNesterov) |
Phương pháp kế thừa
Hằng số
Chuỗi cuối cùng tĩnh công khai OP_NAME
Tên của op này, được biết đến bởi công cụ lõi TensorFlow
Phương pháp công khai
public static ResourceSparseApplyKerasMomentum tạo ( Phạm vi phạm vi, Toán hạng <?> var, Toán hạng <?> accum, Toán hạng <T> lr, Toán hạng <T> grad, Toán hạng <? mở rộng TNumber > chỉ số, Động lượng Toán hạng <T>, Tùy chọn... tùy chọn)
Phương thức gốc để tạo một lớp bao bọc một hoạt động ResourceSparseApplyKerasMomentum mới.
Thông số
phạm vi | phạm vi hiện tại |
---|---|
var | Phải từ một Biến(). |
tích lũy | Phải từ một Biến(). |
lr | Tỷ lệ học. Phải là một vô hướng. |
tốt nghiệp | Độ dốc. |
chỉ số | Một vectơ chỉ số theo chiều thứ nhất của var và accum. |
Quán tính | Quán tính. Phải là một vô hướng. |
tùy chọn | mang các giá trị thuộc tính tùy chọn |
Trả lại
- một phiên bản mới của ResourceSparseApplyKerasMomentum
public static ResourceSparseApplyKerasMomentum.Options useLocking (Boolean useLocking)
Thông số
sử dụngKhóa | Nếu `True`, việc cập nhật các tensor var và accum sẽ được bảo vệ bằng khóa; mặt khác, hành vi không được xác định, nhưng có thể ít gây tranh cãi hơn. |
---|
public static ResourceSparseApplyKerasMomentum.Options useNesterov (Boolean useNesterov)
Thông số
sử dụngNesterov | Nếu `True`, tenxơ được truyền để tính grad sẽ là var + momen * accum, nên cuối cùng, var bạn nhận được thực tế là var + momen * accum. |
---|