Substr

публичный финальный класс Substr

Возвращает подстроки из `Tensor` строк.

Для каждой строки во входных данных «Tensor» создается подстрока, начинающаяся с индекса «pos», с общей длиной «len».

Если `len` определяет подстроку, выходящую за пределы длины входной строки, или если `len` имеет отрицательное значение, то используется как можно больше символов.

Отрицательное значение `pos` указывает расстояние внутри строки назад от конца.

Если `pos` указывает индекс, который выходит за пределы диапазона для любой из входных строк, то выдается `InvalidArgumentError`.

`pos` и `len` должны иметь одинаковую форму, иначе при создании операции выдается `ValueError`.

ПРИМЕЧАНИЕ . `strings.Substr` поддерживает трансляцию до двух измерений. Подробнее о вещании [здесь](http://docs.scipy.org/doc/numpy/user/basics.broadcasting.html)

---

Примеры

Используя скалярные `pos` и `len`:

input = [b'Hello', b'World']
 position = 1
 length = 3
 
 output = [b'ell', b'orl']
 
Использование `pos` и `len` той же формы, что и `input`:
input = [[b'ten', b'eleven', b'twelve'],
          [b'thirteen', b'fourteen', b'fifteen'],
          [b'sixteen', b'seventeen', b'eighteen']]
 position = [[1, 2, 3],
             [1, 2, 3],
             [1, 2, 3]]
 length =   [[2, 3, 4],
             [4, 3, 2],
             [5, 5, 5]]
 
 output = [[b'en', b'eve', b'lve'],
           [b'hirt', b'urt', b'te'],
           [b'ixtee', b'vente', b'hteen']]
 
Трансляция `pos` и `len` на `input`:
input = [[b'ten', b'eleven', b'twelve'],
          [b'thirteen', b'fourteen', b'fifteen'],
          [b'sixteen', b'seventeen', b'eighteen'],
          [b'nineteen', b'twenty', b'twentyone']]
 position = [1, 2, 3]
 length =   [1, 2, 3]
 
 output = [[b'e', b'ev', b'lve'],
           [b'h', b'ur', b'tee'],
           [b'i', b've', b'hte'],
           [b'i', b'en', b'nty']]
 
Трансляция `input` на `pos` и `len`:
input = b'thirteen'
 position = [1, 5, 7]
 length =   [3, 2, 1]
 
 output = [b'hir', b'ee', b'n']
 
Поднимает:

* `ValueError`: если первый аргумент не может быть преобразован в тензор `dtype string`. * `InvalidArgumentError`: если индексы выходят за пределы допустимого диапазона. * `ValueError`: если `pos` и `len` имеют разную форму.

Вложенные классы

сорт Опции подстр. Необязательные атрибуты для Substr

Константы

Нить OP_NAME Название этой операции, известное основному движку TensorFlow.

Публичные методы

Вывод < TString >
какВывод ()
Возвращает символический дескриптор тензора.
статический <T расширяет TNumber > Substr
create (Область действия , Операнд < TString > ввод, Операнд <T> pos, Операнд <T> len, Параметры... параметры)
Фабричный метод для создания класса, обертывающего новую операцию Substr.
Вывод < TString >
выход ()
Тензор подстрок
статические параметры подстр.
единица (строковая единица)

Унаследованные методы

Константы

общедоступная статическая финальная строка OP_NAME

Название этой операции, известное основному движку TensorFlow.

Постоянное значение: «Substr»

Публичные методы

публичный вывод < TString > asOutput ()

Возвращает символический дескриптор тензора.

Входные данные для операций TensorFlow являются выходными данными другой операции TensorFlow. Этот метод используется для получения символического дескриптора, который представляет собой вычисление входных данных.

public static Substr create (область действия , операнд < TString > ввод, операнд <T> pos, операнд <T> len, параметры... параметры)

Фабричный метод для создания класса, обертывающего новую операцию Substr.

Параметры
объем текущий объем
вход Тензор струн
позиция Скаляр, определяющий позицию первого символа в каждой подстроке
Лен Скаляр, определяющий количество символов, включаемых в каждую подстроку
параметры содержит значения необязательных атрибутов
Возврат
  • новый экземпляр Substr

публичный вывод < TString > вывод ()

Тензор подстрок

общедоступный статический модуль Substr.Options (строковый модуль)

Параметры
единица Единица измерения, используемая для создания подстроки. Один из: `"BYTE"` (для определения положения и длины в байтах) или `"UTF8_CHAR"` (для кодовых точек Юникода в кодировке UTF-8). По умолчанию используется `"BYTE"`. Результаты не определены, если `unit=UTF8_CHAR` и строки `input` не содержат структурно допустимого UTF-8.