تدفق التوتر:: العمليات:: يونيكودترانسكود:: أترز
#include <string_ops.h>
محددات السمات الاختيارية لـ UnicodeTranscode .
ملخص
الصفات العامة | |
---|---|
errors_ = "replace" | StringPiece |
replace_control_characters_ = false | bool |
replacement_char_ = 65533 | int64 |
الوظائف العامة | |
---|---|
Errors (StringPiece x) | TF_MUST_USE_RESULT Attrs خطأ في التعامل مع السياسة عند العثور على تنسيق غير صالح في الإدخال. |
ReplaceControlCharacters (bool x) | TF_MUST_USE_RESULT Attrs ما إذا كان سيتم استبدال أحرف التحكم C0 (00-1F) replacement_char . |
ReplacementChar (int64 x) | TF_MUST_USE_RESULT Attrs نقطة رمز الحرف البديلة التي سيتم استخدامها بدلاً من أي تنسيق غير صالح في الإدخال عندما errors='replace' . |
الصفات العامة
أخطاء_
StringPiece tensorflow::ops::UnicodeTranscode::Attrs::errors_ = "replace"
استبدال_التحكم_حرف_
bool tensorflow::ops::UnicodeTranscode::Attrs::replace_control_characters_ = false
استبدال_شار_
int64 tensorflow::ops::UnicodeTranscode::Attrs::replacement_char_ = 65533
الوظائف العامة
أخطاء
TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::Errors( StringPiece x )
خطأ في التعامل مع السياسة عند العثور على تنسيق غير صالح في الإدخال.
ستتسبب قيمة "صارم" في ظهور خطأ InvalidArgument في أي تنسيق إدخال غير صالح. ستؤدي قيمة 'replace' (القيمة الافتراضية) إلى استبدال العملية لأي تنسيق غير صالح في الإدخال بنقطة replacement_char
. ستتسبب قيمة "تجاهل" في تخطي العملية لأي تنسيق غير صالح في الإدخال وعدم إنتاج أي حرف إخراج مطابق.
الإعدادات الافتراضية لـ "استبدال"
استبدال أحرف التحكم
TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::ReplaceControlCharacters( bool x )
ما إذا كان سيتم استبدال أحرف التحكم C0 (00-1F) replacement_char
.
الافتراضي خطأ.
الافتراضيات كاذبة
استبدالChar
TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::ReplacementChar( int64 x )
نقطة رمز الحرف البديلة التي سيتم استخدامها بدلاً من أي تنسيق غير صالح في الإدخال عندما errors='replace'
.
يمكن استخدام أي نقطة ترميز Unicode صالحة. القيمة الافتراضية هي أن حرف استبدال Unicode الافتراضي هو 0xFFFD أو U+65533.)
لاحظ أنه بالنسبة إلى UTF-8، فإن تمرير حرف بديل يمكن التعبير عنه ببايت واحد، مثل ' '، سيحافظ على محاذاة السلسلة إلى المصدر حيث سيتم استبدال البايتات غير الصالحة باستبدال بايت واحد. بالنسبة إلى UTF-16-BE وUTF-16-LE، فإن أي حرف بديل مكون من 1 أو 2 بايت سيحافظ على محاذاة البايت مع المصدر.
الافتراضي هو 65533
إنّ محتوى هذه الصفحة مرخّص بموجب ترخيص Creative Commons Attribution 4.0 ما لم يُنصّ على خلاف ذلك، ونماذج الرموز مرخّصة بموجب ترخيص Apache 2.0. للاطّلاع على التفاصيل، يُرجى مراجعة سياسات موقع Google Developers. إنّ Java هي علامة تجارية مسجَّلة لشركة Oracle و/أو شركائها التابعين.
تاريخ التعديل الأخير: 2024-11-19 (حسب التوقيت العالمي المتفَّق عليه)