UnicodeEncode

lớp cuối cùng công khai UnicodeEncode

Mã hóa một tensor int thành chuỗi unicode.

Trả về một vectơ chuỗi, trong đó `output[i]` được xây dựng bằng cách mã hóa các điểm mã Unicode trong `input_values[input_splits[i]:input_splits[i+1]]` bằng cách sử dụng `output_encoding`.

---

Ví dụ:

input_values = [72, 101, 108, 108, 111, 87, 111, 114, 108, 100]
 input_splits = [0, 5, 10]
 output_encoding = 'UTF-8'
 
 output = ['Hello', 'World']
 

Các lớp lồng nhau

lớp học UnicodeEncode.Options Thuộc tính tùy chọn cho UnicodeEncode

Hằng số

Sợi dây OP_NAME Tên của op này, được biết đến bởi công cụ lõi TensorFlow

Phương pháp công cộng

Đầu ra < TString >
asOutput ()
Trả về tay cầm tượng trưng của tensor.
Mã hóa Unicode tĩnh
tạo (Phạm vi phạm vi, Toán hạng < TInt32 > inputValues, Toán hạng <? mở rộng TNumber > inputSplits, Mã hóa đầu ra chuỗi, Tùy chọn... tùy chọn)
Phương thức gốc để tạo một lớp bao bọc một thao tác UnicodeEncode mới.
UnicodeEncode.Options tĩnh
lỗi (Lỗi chuỗi)
Đầu ra < TString >
đầu ra ()
Tensor 1-D của các chuỗi được mã hóa từ các điểm mã unicode được cung cấp.
UnicodeEncode.Options tĩnh
thay thếChar (Char thay thế dài)

Phương pháp kế thừa

Hằng số

Chuỗi cuối cùng tĩnh công khai OP_NAME

Tên của op này, được biết đến bởi công cụ lõi TensorFlow

Giá trị không đổi: "UnicodeEncode"

Phương pháp công cộng

Đầu ra công khai < TString > asOutput ()

Trả về tay cầm tượng trưng của tensor.

Đầu vào của các hoạt động TensorFlow là đầu ra của một hoạt động TensorFlow khác. Phương pháp này được sử dụng để thu được một thẻ điều khiển mang tính biểu tượng đại diện cho việc tính toán đầu vào.

tạo mã UnicodeEncode tĩnh công khai ( Phạm vi phạm vi, Toán hạng < TInt32 > inputValues, Toán hạng <? mở rộng TNumber > inputSplits, Mã hóa đầu ra chuỗi, Tùy chọn... tùy chọn)

Phương thức gốc để tạo một lớp bao bọc một thao tác UnicodeEncode mới.

Thông số
phạm vi phạm vi hiện tại
giá trị đầu vào Một tensor 1D chứa các điểm mã unicode cần được mã hóa.
đầu vàoSplits Một tensor 1D chỉ định cách chia các điểm mã unicode thành các chuỗi. Cụ thể, `output[i]` được xây dựng bằng cách mã hóa các điểm mã trong lát `input_values[input_splits[i]:input_splits[i+1]]`.
mã hóa đầu ra Mã hóa Unicode của chuỗi đầu ra. Các mã hóa hợp lệ là: `"UTF-8", "UTF-16-BE" và "UTF-32-BE"`.
tùy chọn mang các giá trị thuộc tính tùy chọn
Trả lại
  • một phiên bản mới của UnicodeEncode

lỗi UnicodeEncode.Options tĩnh công khai (Lỗi chuỗi)

Thông số
lỗi Chính sách xử lý lỗi khi tìm thấy định dạng không hợp lệ trong đầu vào. Giá trị 'nghiêm ngặt' sẽ khiến thao tác tạo ra lỗi InvalidArgument trên bất kỳ định dạng đầu vào không hợp lệ nào. Giá trị 'thay thế' (mặc định) sẽ khiến thao tác thay thế mọi định dạng không hợp lệ trong đầu vào bằng điểm mã `replacement_char`. Giá trị 'bỏ qua' sẽ khiến thao tác bỏ qua mọi định dạng không hợp lệ trong đầu vào và không tạo ra ký tự đầu ra tương ứng.

Đầu ra công khai < TString > đầu ra ()

Tensor 1-D của các chuỗi được mã hóa từ các điểm mã unicode được cung cấp.

UnicodeEncode.Options thay thế tĩnh công khaiChar (Char thay thế dài)

Thông số
thay thếChar Điểm mã ký tự thay thế sẽ được sử dụng thay cho bất kỳ định dạng không hợp lệ nào trong đầu vào khi `errors='replace'`. Bất kỳ điểm mã unicode hợp lệ nào cũng có thể được sử dụng. Giá trị mặc định là ký tự thay thế unicode mặc định là 0xFFFD (U+65533).