تدفق التوتر:: العمليات:: يونيكودترانسكود:: أترز

#include <string_ops.h>

محددات السمات الاختيارية لـ UnicodeTranscode .

ملخص

الصفات العامة

errors_ = "replace"
StringPiece
replace_control_characters_ = false
bool
replacement_char_ = 65533
int64

الوظائف العامة

Errors (StringPiece x)
TF_MUST_USE_RESULT Attrs
خطأ في التعامل مع السياسة عند العثور على تنسيق غير صالح في الإدخال.
ReplaceControlCharacters (bool x)
TF_MUST_USE_RESULT Attrs
ما إذا كان سيتم استبدال أحرف التحكم C0 (00-1F) replacement_char .
ReplacementChar (int64 x)
TF_MUST_USE_RESULT Attrs
نقطة رمز الحرف البديلة التي سيتم استخدامها بدلاً من أي تنسيق غير صالح في الإدخال عندما errors='replace' .

الصفات العامة

أخطاء_

StringPiece tensorflow::ops::UnicodeTranscode::Attrs::errors_ = "replace"

استبدال_التحكم_حرف_

bool tensorflow::ops::UnicodeTranscode::Attrs::replace_control_characters_ = false

استبدال_شار_

int64 tensorflow::ops::UnicodeTranscode::Attrs::replacement_char_ = 65533

الوظائف العامة

أخطاء

TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::Errors(
  StringPiece x
)

خطأ في التعامل مع السياسة عند العثور على تنسيق غير صالح في الإدخال.

ستتسبب قيمة "صارم" في ظهور خطأ InvalidArgument في أي تنسيق إدخال غير صالح. ستؤدي قيمة 'replace' (القيمة الافتراضية) إلى استبدال العملية لأي تنسيق غير صالح في الإدخال بنقطة replacement_char . ستتسبب قيمة "تجاهل" في تخطي العملية لأي تنسيق غير صالح في الإدخال وعدم إنتاج أي حرف إخراج مطابق.

الإعدادات الافتراضية لـ "استبدال"

استبدال أحرف التحكم

TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::ReplaceControlCharacters(
  bool x
)

ما إذا كان سيتم استبدال أحرف التحكم C0 (00-1F) replacement_char .

الافتراضي خطأ.

الافتراضيات كاذبة

استبدالChar

TF_MUST_USE_RESULT Attrs tensorflow::ops::UnicodeTranscode::Attrs::ReplacementChar(
  int64 x
)

نقطة رمز الحرف البديلة التي سيتم استخدامها بدلاً من أي تنسيق غير صالح في الإدخال عندما errors='replace' .

يمكن استخدام أي نقطة ترميز Unicode صالحة. القيمة الافتراضية هي أن حرف استبدال Unicode الافتراضي هو 0xFFFD أو U+65533.)

لاحظ أنه بالنسبة إلى UTF-8، فإن تمرير حرف بديل يمكن التعبير عنه ببايت واحد، مثل ' '، سيحافظ على محاذاة السلسلة إلى المصدر حيث سيتم استبدال البايتات غير الصالحة باستبدال بايت واحد. بالنسبة إلى UTF-16-BE وUTF-16-LE، فإن أي حرف بديل مكون من 1 أو 2 بايت سيحافظ على محاذاة البايت مع المصدر.

الافتراضي هو 65533