UnicodeDecode

الفئة النهائية العامة UnicodeDecode

يقوم بفك تشفير كل سلسلة في "الإدخال" إلى سلسلة من نقاط كود Unicode.

يتم إرجاع نقاط ترميز الأحرف لجميع السلاسل باستخدام متجه واحد `char_values`، مع توسيع السلاسل إلى أحرف بترتيب الصفوف الرئيسية.

يشير الموتر "row_splits" إلى المكان الذي تبدأ وتنتهي فيه نقاط التشفير لكل سلسلة إدخال داخل موتر "char_values". على وجه الخصوص، يتم تخزين قيم السلسلة i`th (بترتيب الصف الرئيسي) في الشريحة `[row_splits[i]:row_splits[i+1]]`. هكذا:

  • `char_values[row_splits[i]+j]` هي نقطة ترميز Unicode للحرف `j` في السلسلة `i` (بترتيب الصفوف الرئيسية).
  • `row_splits[i+1] -row_splits[i]` هو عدد الأحرف في السلسلة `i` (بترتيب الصفوف الرئيسية).

فئات متداخلة

فصل UnicodeDecode.Options السمات الاختيارية لـ UnicodeDecode

الثوابت

خيط OP_NAME اسم هذه العملية كما هو معروف بواسطة محرك TensorFlow الأساسي

الأساليب العامة

الإخراج <TInt32>
قيم شار ()
موتر int32 1D يحتوي على نقاط التشفير التي تم فك تشفيرها.
ثابت <T يمتد TNumber > UnicodeDecode <T>
إنشاء (نطاق النطاق ، المعامل < TString > الإدخال، String inputEncoding، Class <T> Tsplits، Options... options)
طريقة المصنع لإنشاء فئة تغلف عملية UnicodeDecode جديدة.
UnicodeDecode الثابت <TInt64>
إنشاء (نطاق النطاق ، المعامل < TString > الإدخال، String inputEncoding، الخيارات ... خيارات)
طريقة المصنع لإنشاء فئة تغلف عملية UnicodeDecode جديدة باستخدام أنواع الإخراج الافتراضية.
UnicodeDecode.Options ثابت
أخطاء (أخطاء السلسلة)
UnicodeDecode.Options ثابت
استبدال أحرف التحكم (استبدال أحرف التحكم المنطقية)
UnicodeDecode.Options ثابت
استبدال شار (استبدال طويل شار)
الإخراج <T>
تقسيمات الصفوف ()
موتر int32 1D يحتوي على انقسامات الصف.

الطرق الموروثة

الثوابت

السلسلة النهائية الثابتة العامة OP_NAME

اسم هذه العملية كما هو معروف بواسطة محرك TensorFlow الأساسي

القيمة الثابتة: "UnicodeDecode"

الأساليب العامة

الإخراج العام <TInt32> charValues ​​()

موتر int32 1D يحتوي على نقاط التشفير التي تم فك تشفيرها.

إنشاء UnicodeDecode <T> ثابت عام ( نطاق النطاق ، المعامل < TString > الإدخال، String inputEncoding، Class <T> Tsplits، Options... options)

طريقة المصنع لإنشاء فئة تغلف عملية UnicodeDecode جديدة.

حدود
نِطَاق النطاق الحالي
مدخل النص المراد فك شفرته. يمكن أن يكون لها أي شكل. لاحظ أن الإخراج تم تسويته إلى متجه لقيم char.
inputEncoding.inputEncoding ترميز النص لسلاسل الإدخال. هذا هو أي من الترميزات التي تدعمها محولات خوارزمية ICU ucnv. أمثلة: `"UTF-16"، "US ASCII"، "UTF-8"`.
خيارات يحمل قيم السمات الاختيارية
عائدات
  • مثيل جديد من UnicodeDecode

إنشاء UnicodeDecode ثابت عام <TInt64> ( نطاق النطاق، المعامل < TString > الإدخال، String inputEncoding، الخيارات... الخيارات)

طريقة المصنع لإنشاء فئة تغلف عملية UnicodeDecode جديدة باستخدام أنواع الإخراج الافتراضية.

حدود
نِطَاق النطاق الحالي
مدخل النص المراد فك شفرته. يمكن أن يكون لها أي شكل. لاحظ أن الإخراج تم تسويته إلى متجه لقيم char.
inputEncoding.inputEncoding ترميز النص لسلاسل الإدخال. هذا هو أي من الترميزات التي تدعمها محولات خوارزمية ICU ucnv. أمثلة: `"UTF-16"، "US ASCII"، "UTF-8"`.
خيارات يحمل قيم السمات الاختيارية
عائدات
  • مثيل جديد من UnicodeDecode

أخطاء UnicodeDecode.Options العامة الثابتة (أخطاء السلسلة)

حدود
أخطاء خطأ في التعامل مع السياسة عند العثور على تنسيق غير صالح في الإدخال. ستؤدي قيمة "صارم" إلى ظهور خطأ InvalidArgument في أي تنسيق إدخال غير صالح. ستؤدي قيمة "استبدال" (القيمة الافتراضية) إلى استبدال العملية لأي تنسيق غير صالح في الإدخال بنقطة التشفير "replacement_char". ستؤدي قيمة "تجاهل" إلى تخطي العملية لأي تنسيق غير صالح في الإدخال وعدم إنتاج أي حرف إخراج مطابق.

UnicodeDecode.Options الثابت العام ، استبدالControlCharacters (استبدال منطقي، ControlCharacters)

حدود
استبدال أحرف التحكم ما إذا كان سيتم استبدال أحرف التحكم C0 (00-1F) بـ "replacement_char". الافتراضي خطأ.

UnicodeDecode.Options الثابت العام ، استبدالChar (استبدال طويلChar)

حدود
استبدالChar نقطة رمز الحرف البديلة التي سيتم استخدامها بدلاً من أي تنسيق غير صالح في الإدخال عند `errors='replace'`. يمكن استخدام أي نقطة ترميز Unicode صالحة. القيمة الافتراضية هي أن حرف استبدال Unicode الافتراضي هو 0xFFFD أو U+65533.)

صف الإخراج العام <T> ينقسم ()

موتر int32 1D يحتوي على انقسامات الصف.