Guía de procesamiento de texto de TensorFlow

La guía de procesamiento de texto de TensorFlow documenta bibliotecas y flujos de trabajo para el procesamiento de lenguaje natural (NLP) y presenta conceptos importantes para trabajar con texto.

Keras PNL

KerasNLP es una biblioteca de procesamiento de lenguaje natural (NLP) de alto nivel que incluye todos los modelos más recientes basados ​​en Transformer, así como utilidades de tokenización de nivel inferior. Es la solución recomendada para la mayoría de los casos de uso de NLP.

  • Primeros pasos con KerasNLP : Aprenda KerasNLP realizando un análisis de sentimientos en niveles progresivos de complejidad, desde el uso de un modelo previamente entrenado hasta la construcción de su propio Transformer desde cero.

tf.strings

El módulo tf.strings proporciona operaciones para trabajar con tensores de cadenas.

  • Cadenas Unicode : represente cadenas Unicode en TensorFlow y manipúlelas usando equivalentes Unicode de operaciones de cadena estándar.

Texto de TensorFlow

Si necesita acceso a herramientas de procesamiento de texto de nivel inferior, puede usar TensorFlow Text. TensorFlow Text proporciona una colección de operaciones y bibliotecas para ayudarlo a trabajar con entradas en forma de texto, como cadenas de texto sin procesar o documentos.

Preprocesamiento

  • Preprocesamiento de BERT con texto TF : use las operaciones de preprocesamiento de texto de TensorFlow para transformar datos de texto en entradas para BERT.
  • Tokenización con TF Text : comprenda las opciones de tokenización proporcionadas por TensorFlow Text. Aprenda cuándo es posible que desee usar una opción sobre otra y cómo se llaman estos tokenizadores desde su modelo.
  • Tokenizadores de subpalabras : genere un vocabulario de subpalabras a partir de un conjunto de datos y utilícelo para crear un text.BertTokenizer a partir del vocabulario.

Modelos TensorFlow – PNL

La biblioteca TensorFlow Models - NLP proporciona primitivos de Keras que se pueden ensamblar en modelos basados ​​en Transformer y clases de andamios que permiten una fácil experimentación con arquitecturas novedosas.