Samouczki dotyczące przetwarzania tekstu TensorFlow

Samouczki dotyczące przetwarzania tekstu TensorFlow zawierają instrukcje krok po kroku dotyczące rozwiązywania typowych problemów z przetwarzaniem tekstu i języka naturalnego (NLP).

TensorFlow zapewnia dwa rozwiązania do przetwarzania tekstu i języka naturalnego: KerasNLP i TensorFlow Text. KerasNLP to biblioteka NLP wysokiego poziomu, która zawiera wszystkie najnowsze modele oparte na Transformer, jak również narzędzia do tokenizacji niższego poziomu. Jest to zalecane rozwiązanie dla większości przypadków użycia NLP.

Jeśli potrzebujesz dostępu do narzędzi do przetwarzania tekstu niższego poziomu, możesz użyć TensorFlow Text. TensorFlow Text zapewnia zbiór operacji i bibliotek, które pomogą Ci pracować z danymi wejściowymi w formie tekstowej, takiej jak nieprzetworzone ciągi tekstowe lub dokumenty.

KerasNLP

  • Pierwsze kroki z KerasNLP : Naucz się KerasNLP, przeprowadzając analizę nastrojów na kolejnych poziomach złożoności, od korzystania z wstępnie wytrenowanego modelu po zbudowanie własnego Transformera od podstaw.

Generowanie tekstu

Klasyfikacja tekstu

  • Klasyfikuj tekst za pomocą BERT : Dostosuj BERT, aby przeprowadzać analizę nastrojów na zbiorze danych recenzji filmów IMDb w postaci zwykłego tekstu.
  • Klasyfikacja tekstu za pomocą RNN : wyszkol RNN w zakresie przeprowadzania analizy nastrojów w recenzjach filmów IMDb.
  • TF.Text Metrics : Dowiedz się więcej o metrykach dostępnych za pośrednictwem TensorFlow Text. Biblioteka zawiera implementacje metryk podobieństwa tekstu, takich jak ROUGE-L, które można wykorzystać do automatycznej oceny modeli generowania tekstu.

NLP z BERT

Osadzenia