เทนเซอร์โฟลว์:: ปฏิบัติการ:: UnicodeTranscode:: คุณสมบัติ
#include <string_ops.h>
ตัวตั้งค่าแอตทริบิวต์เพิ่มเติมสำหรับ UnicodeTranscode
สรุป
คุณลักษณะสาธารณะ | |
---|---|
errors_ = "replace" | StringPiece |
replace_control_characters_ = false | bool |
replacement_char_ = 65533 | int64 |
งานสาธารณะ | |
---|---|
Errors (StringPiece x) | TF_MUST_USE_RESULT Attrs นโยบายการจัดการข้อผิดพลาดเมื่อพบการจัดรูปแบบที่ไม่ถูกต้องในอินพุต |
ReplaceControlCharacters (bool x) | TF_MUST_USE_RESULT Attrs ว่าจะแทนที่อักขระควบคุม C0 (00-1F) ด้วย replacement_char หรือไม่ |
ReplacementChar (int64 x) | TF_MUST_USE_RESULT Attrs จุดโค้ดอักขระทดแทนที่จะใช้แทนการจัดรูปแบบที่ไม่ถูกต้องในอินพุตเมื่อ errors='replace' |
คุณลักษณะสาธารณะ
ข้อผิดพลาด_
StringPiece tensorflow::ops::UnicodeTranscode::Attrs::errors_ = "replace"
แทนที่_ควบคุม_อักขระ_
bool tensorflow::ops::UnicodeTranscode::Attrs::replace_control_characters_ = false
เปลี่ยน_ถ่าน_
int64 tensorflow::ops::UnicodeTranscode::Attrs::replacement_char_ = 65533
งานสาธารณะ
ข้อผิดพลาด
TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::Errors( StringPiece x )
นโยบายการจัดการข้อผิดพลาดเมื่อพบการจัดรูปแบบที่ไม่ถูกต้องในอินพุต
ค่า 'เข้มงวด' จะทำให้การดำเนินการสร้างข้อผิดพลาด InvalidArgument ในการจัดรูปแบบอินพุตที่ไม่ถูกต้อง ค่า 'replace' (ค่าเริ่มต้น) จะทำให้การดำเนินการแทนที่การจัดรูปแบบที่ไม่ถูกต้องในอินพุตด้วย codepoint replacement_char
ค่า 'ละเว้น' จะทำให้การดำเนินการข้ามการจัดรูปแบบที่ไม่ถูกต้องในอินพุต และไม่มีอักขระเอาต์พุตที่สอดคล้องกัน
ค่าเริ่มต้นคือ "แทนที่"
แทนที่อักขระควบคุม
TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::ReplaceControlCharacters( bool x )
ว่าจะแทนที่อักขระควบคุม C0 (00-1F) ด้วย replacement_char
หรือไม่
ค่าเริ่มต้นเป็นเท็จ
ค่าเริ่มต้นเป็นเท็จ
ถ่านทดแทน
TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::ReplacementChar( int64 x )
จุดโค้ดอักขระทดแทนที่จะใช้แทนการจัดรูปแบบที่ไม่ถูกต้องในอินพุตเมื่อ errors='replace'
สามารถใช้จุดโค้ดยูนิโค้ด ที่ ถูกต้องได้ ค่าเริ่มต้นคืออักขระแทนที่ Unicode เริ่มต้นคือ 0xFFFD หรือ U+65533)
โปรดทราบว่าสำหรับ UTF-8 การส่งอักขระแทนที่ที่แสดงเป็น 1 ไบต์ เช่น ' ' จะคงการจัดแนวสตริงไว้ที่ต้นทาง เนื่องจากไบต์ที่ไม่ถูกต้องจะถูกแทนที่ด้วยการแทนที่ 1 ไบต์ สำหรับ UTF-16-BE และ UTF-16-LE อักขระแทนที่ 1 หรือ 2 ไบต์ใดๆ จะรักษาการจัดตำแหน่งของไบต์กับแหล่งที่มา
ค่าเริ่มต้นคือ 65533