يقوم بفك تشفير كل سلسلة في "الإدخال" إلى سلسلة من نقاط كود Unicode.
يتم إرجاع نقاط ترميز الأحرف لجميع السلاسل باستخدام متجه واحد `char_values`، مع توسيع السلاسل إلى أحرف بترتيب الصفوف الرئيسية.
يشير الموتر "row_splits" إلى المكان الذي تبدأ وتنتهي فيه نقاط التشفير لكل سلسلة إدخال داخل موتر "char_values". على وجه الخصوص، يتم تخزين قيم السلسلة i`th (بترتيب الصف الرئيسي) في الشريحة `[row_splits[i]:row_splits[i+1]]`. هكذا:
- `char_values[row_splits[i]+j]` هي نقطة ترميز Unicode للحرف `j` في السلسلة `i` (بترتيب الصفوف الرئيسية).
- `row_splits[i+1] -row_splits[i]` هو عدد الأحرف في السلسلة `i` (بترتيب الصفوف الرئيسية).
فئات متداخلة
فصل | UnicodeDecode.Options | السمات الاختيارية لـ UnicodeDecode |
الثوابت
خيط | OP_NAME | اسم هذه العملية كما هو معروف بواسطة محرك TensorFlow الأساسي |
الأساليب العامة
الإخراج <TInt32> | قيم شار () موتر int32 1D يحتوي على نقاط التشفير التي تم فك تشفيرها. |
ثابت <T يمتد TNumber > UnicodeDecode <T> | إنشاء (نطاق النطاق ، المعامل < TString > الإدخال، String inputEncoding، Class <T> Tsplits، Options... options) طريقة المصنع لإنشاء فئة تغلف عملية UnicodeDecode جديدة. |
UnicodeDecode الثابت <TInt64> | إنشاء (نطاق النطاق ، المعامل < TString > الإدخال، String inputEncoding، الخيارات ... خيارات) طريقة المصنع لإنشاء فئة تغلف عملية UnicodeDecode جديدة باستخدام أنواع الإخراج الافتراضية. |
UnicodeDecode.Options ثابت | أخطاء (أخطاء السلسلة) |
UnicodeDecode.Options ثابت | استبدال أحرف التحكم (استبدال أحرف التحكم المنطقية) |
UnicodeDecode.Options ثابت | استبدال شار (استبدال طويل شار) |
الإخراج <T> | تقسيمات الصفوف () موتر int32 1D يحتوي على انقسامات الصف. |
الطرق الموروثة
الثوابت
السلسلة النهائية الثابتة العامة OP_NAME
اسم هذه العملية كما هو معروف بواسطة محرك TensorFlow الأساسي
الأساليب العامة
إنشاء UnicodeDecode <T> ثابت عام ( نطاق النطاق ، المعامل < TString > الإدخال، String inputEncoding، Class <T> Tsplits، Options... options)
طريقة المصنع لإنشاء فئة تغلف عملية UnicodeDecode جديدة.
حدود
نِطَاق | النطاق الحالي |
---|---|
مدخل | النص المراد فك شفرته. يمكن أن يكون لها أي شكل. لاحظ أن الإخراج تم تسويته إلى متجه لقيم char. |
inputEncoding.inputEncoding | ترميز النص لسلاسل الإدخال. هذا هو أي من الترميزات التي تدعمها محولات خوارزمية ICU ucnv. أمثلة: `"UTF-16"، "US ASCII"، "UTF-8"`. |
خيارات | يحمل قيم السمات الاختيارية |
عائدات
- مثيل جديد من UnicodeDecode
إنشاء UnicodeDecode ثابت عام <TInt64> ( نطاق النطاق، المعامل < TString > الإدخال، String inputEncoding، الخيارات... الخيارات)
طريقة المصنع لإنشاء فئة تغلف عملية UnicodeDecode جديدة باستخدام أنواع الإخراج الافتراضية.
حدود
نِطَاق | النطاق الحالي |
---|---|
مدخل | النص المراد فك شفرته. يمكن أن يكون لها أي شكل. لاحظ أن الإخراج تم تسويته إلى متجه لقيم char. |
inputEncoding.inputEncoding | ترميز النص لسلاسل الإدخال. هذا هو أي من الترميزات التي تدعمها محولات خوارزمية ICU ucnv. أمثلة: `"UTF-16"، "US ASCII"، "UTF-8"`. |
خيارات | يحمل قيم السمات الاختيارية |
عائدات
- مثيل جديد من UnicodeDecode
أخطاء UnicodeDecode.Options العامة الثابتة (أخطاء السلسلة)
حدود
أخطاء | خطأ في التعامل مع السياسة عند العثور على تنسيق غير صالح في الإدخال. ستؤدي قيمة "صارم" إلى ظهور خطأ InvalidArgument في أي تنسيق إدخال غير صالح. ستؤدي قيمة "استبدال" (القيمة الافتراضية) إلى استبدال العملية لأي تنسيق غير صالح في الإدخال بنقطة التشفير "replacement_char". ستؤدي قيمة "تجاهل" إلى تخطي العملية لأي تنسيق غير صالح في الإدخال وعدم إنتاج أي حرف إخراج مطابق. |
---|
UnicodeDecode.Options الثابت العام ، استبدالControlCharacters (استبدال منطقي، ControlCharacters)
حدود
استبدال أحرف التحكم | ما إذا كان سيتم استبدال أحرف التحكم C0 (00-1F) بـ "replacement_char". الافتراضي خطأ. |
---|
UnicodeDecode.Options الثابت العام ، استبدالChar (استبدال طويلChar)
حدود
استبدالChar | نقطة رمز الحرف البديلة التي سيتم استخدامها بدلاً من أي تنسيق غير صالح في الإدخال عند `errors='replace'`. يمكن استخدام أي نقطة ترميز Unicode صالحة. القيمة الافتراضية هي أن حرف استبدال Unicode الافتراضي هو 0xFFFD أو U+65533.) |
---|