ngram ها را از داده های رشته ای ایجاد می کند.
این عملیات یک تانسور ژندهدار با 1 بعد ژندهدار که فقط شامل رشتهها است را میپذیرد و یک تانسور ژندهدار با 1 بعد ژندهدار حاوی نانوگرمهای آن رشته را که در امتداد داخلیترین محور به هم وصل شدهاند، خروجی میدهد.
ثابت ها
رشته | OP_NAME | نام این عملیات، همانطور که توسط موتور هسته TensorFlow شناخته می شود |
روش های عمومی
static <T TNumber > StringNGrams <T> را گسترش می دهد | |
خروجی < TRString > | ngrams () تانسور مقادیر تانسور ngrams خروجی. |
خروجی <T> | ngramsSplits () تانسور تقسیم تانسور ngrams خروجی راگ شده. |
روش های ارثی
ثابت ها
رشته نهایی ثابت عمومی OP_NAME
نام این عملیات، همانطور که توسط موتور هسته TensorFlow شناخته می شود
روش های عمومی
StringNGrams ایستا عمومی <T> ایجاد می کند ( دامنه دامنه ، عملوند < TString > داده، عملوند <T> داده تقسیم، جداکننده رشته، List<Long> ngramWidths، String leftPad، String rightPad، Long padWidth، Boolean maintenanceShortSequences)
روش کارخانه برای ایجاد کلاسی که عملیات StringNGrams جدید را بسته بندی می کند.
مولفه های
محدوده | محدوده فعلی |
---|---|
داده ها | تانسور مقادیر تانسور رشتهای ناهموار برای ایجاد ngram از آن. باید یک تانسور رشته 1 بعدی باشد. |
داده تقسیم | تانسور تانسور رشتهای کهنه را تقسیم میکند تا از آن ngram بسازد. |
جداکننده | رشته ای که بین عناصر توکن الحاق می شود. بدون جداکننده از "" استفاده کنید. |
ngramWidths | اندازه های ngram برای ایجاد. |
چپ پد | رشته ای که برای قرار دادن صفحه سمت چپ دنباله ngram استفاده می شود. فقط در صورتی استفاده می شود که pad_width != 0 باشد. |
پد راست | رشته ای که برای قرار دادن صفحه سمت راست دنباله ngram استفاده می شود. فقط در صورتی استفاده می شود که pad_width != 0 باشد. |
پهنای پد | تعداد عناصر بالشتکی برای افزودن به هر طرف هر دنباله. توجه داشته باشید که بدون در نظر گرفتن این مقدار، padding هرگز بزرگتر از 'ngram_widths'-1 نخواهد بود. اگر «pad_width=-1»، سپس عناصر «max(ngram_widths)-1» را اضافه کنید. |
برمی گرداند
- یک نمونه جدید از StringNGrams