CTCLossV2

lớp cuối cùng công khai CTCLossV2

Tính toán tổn thất CTC (xác suất nhật ký) cho mỗi mục nhập lô. Cũng tính toán

độ dốc. Lớp này thực hiện thao tác softmax cho bạn, vì vậy đầu vào phải là các phép chiếu tuyến tính của đầu ra theo LSTM.

Các lớp lồng nhau

lớp học CTCLossV2.Options Thuộc tính tùy chọn cho CTCLossV2

Hằng số

Sợi dây OP_NAME Tên của op này, được biết đến bởi công cụ lõi TensorFlow

Phương pháp công khai

CTCLossV2 tĩnh
tạo ( Phạm vi phạm vi, Toán hạng < TFloat32 > đầu vào, Toán hạng < TInt64 > nhãn Chỉ số, Toán hạng < TInt32 > nhãn Giá trị, Toán hạng < TInt32 > chuỗi Độ dài, Tùy chọn... tùy chọn)
Phương thức gốc để tạo một lớp bao bọc hoạt động CTCLossV2 mới.
CTCLossV2.Options tĩnh
ctcMergeRepeated (Boolean ctcMergeRepeated)
Đầu ra < TFloat32 >
dốc ()
Độ dốc của `loss`.
CTCLossV2.Options tĩnh
bỏ quaLongerOutputsThanInputs (Boolean bỏ quaLongerOutputsThanInputs)
Đầu ra < TFloat32 >
sự mất mát ()
Một vectơ (đợt) chứa xác suất log.
CTCLossV2.Options tĩnh
preprocessCollapseRepeated (Boolean preprocessCollapseRepeated)

Phương pháp kế thừa

Hằng số

Chuỗi cuối cùng tĩnh công khai OP_NAME

Tên của op này, được biết đến bởi công cụ lõi TensorFlow

Giá trị không đổi: "CTCLossV2"

Phương pháp công khai

tạo CTCLossV2 tĩnh công khai ( Phạm vi phạm vi , Toán hạng < TFloat32 > đầu vào, Toán hạng < TInt64 > nhãn Chỉ số, Toán hạng < TInt32 > nhãn Giá trị, Toán hạng < TInt32 > trình tự Độ dài, Tùy chọn... tùy chọn)

Phương thức gốc để tạo một lớp bao bọc hoạt động CTCLossV2 mới.

Thông số
phạm vi phạm vi hiện tại
đầu vào 3-D, hình dạng: `(max_time x batch_size x num_classes)`, logits. Nhãn trống mặc định là 0 thay vì num_classes - 1.
nhãnChỉ số Các chỉ số của một `SparseTensor `. `labels_indices(i, :) == [b, t]` có nghĩa là `labels_values(i)` lưu trữ id cho `(batch b, time t)`.
nhãnGiá trị Các giá trị (nhãn) liên quan đến lô và thời gian nhất định.
trình tựĐộ dài Một vectơ chứa độ dài chuỗi (lô).
tùy chọn mang các giá trị thuộc tính tùy chọn
Trả lại
  • một phiên bản mới của CTCLossV2

CTCLossV2.Options tĩnh công cộng ctcMergeRepeated (Boolean ctcMergeRepeated)

Thông số
ctcHợp nhấtLặp lại Vô hướng. Nếu được đặt thành sai, trong quá trình tính toán CTC, các nhãn không trống lặp lại sẽ không được hợp nhất và được hiểu là các nhãn riêng lẻ. Đây là phiên bản đơn giản hóa của CTC.

Đầu ra công khai < TFloat32 > gradient ()

Độ dốc của `loss`. 3-D, hình dạng: `(max_time x batch_size x num_classes)`.

tĩnh công khai CTCLossV2.Options bỏ quaLongerOutputsThanInputs (Boolean bypassLongerOutputsThanInputs)

Thông số
bỏ quaLongerOutputsThanInputs Vô hướng. Nếu được đặt thành true, trong quá trình tính toán CTC, các mục có chuỗi đầu ra dài hơn chuỗi đầu vào sẽ bị bỏ qua: chúng không đóng góp vào số hạng mất mát và có độ dốc bằng 0.

Đầu ra công khai < TFloat32 > loss ()

Một vectơ (đợt) chứa xác suất log.

tĩnh công khai CTCLossV2.Options preprocessCollapseRepeated (Boolean preprocessCollapseRepeated)

Thông số
tiền xử lýThu gọnLặp đi lặp lại Vô hướng, nếu đúng thì các nhãn lặp lại sẽ được thu gọn trước khi tính toán CTC.