Руководство по обработке текста TensorFlow

Руководство по обработке текста TensorFlow документирует библиотеки и рабочие процессы для обработки естественного языка (NLP) и знакомит с важными концепциями работы с текстом.

КерасНЛП

KerasNLP — это высокоуровневая библиотека обработки естественного языка (NLP), которая включает в себя все последние модели на основе Transformer, а также утилиты токенизации более низкого уровня. Это рекомендуемое решение для большинства случаев использования НЛП.

  • Начало работы с KerasNLP : Изучите KerasNLP, выполняя анализ настроений на прогрессивных уровнях сложности, от использования предварительно обученной модели до создания собственного Transformer с нуля.

tf.strings

Модуль tf.strings предоставляет операции для работы со строковыми тензорами.

  • Строки Unicode : представляют строки Unicode в TensorFlow и манипулируют ими, используя Unicode-эквиваленты стандартных строковых операций.

Текст TensorFlow

Если вам нужен доступ к инструментам обработки текста более низкого уровня, вы можете использовать TensorFlow Text. TensorFlow Text предоставляет набор операций и библиотек, которые помогут вам работать с вводом в текстовой форме, такой как необработанные текстовые строки или документы.

Предварительная обработка

Модели TensorFlow — НЛП

Библиотека TensorFlow Models — NLP предоставляет примитивы Keras, которые можно собирать в модели на основе Transformer, и классы каркасов, которые позволяют легко экспериментировать с новыми архитектурами.