كتاب الطبخ النصي

تسرد هذه الصفحة مجموعة من الأدلة والأدوات المعروفة لحل المشكلات في مجال النص باستخدام TensorFlow Hub. إنها نقطة انطلاق لأي شخص يريد حل مشكلات تعلم الآلة النموذجية باستخدام مكونات تعلم الآلة المدربة مسبقًا بدلاً من البدء من الصفر.

تصنيف

عندما نريد التنبؤ بفئة لمثال معين، على سبيل المثال المشاعر ، أو السمية ، أو فئة المقالة ، أو أي خاصية أخرى.

رسم تصنيف النص

تعمل البرامج التعليمية أدناه على حل نفس المهمة من وجهات نظر مختلفة وباستخدام أدوات مختلفة.

كيراس

تصنيف النص باستخدام Keras - مثال لإنشاء مصنف مشاعر IMDB باستخدام Keras وTensorFlow Datasets.

مقدر

تصنيف النص - مثال لإنشاء مصنف مشاعر IMDB باستخدام Estimator. يحتوي على نصائح متعددة للتحسين وقسم لمقارنة الوحدات.

بيرت

توقع مشاعر مراجعة الفيلم باستخدام BERT على TF Hub - يوضح كيفية استخدام وحدة BERT للتصنيف. يتضمن استخدام مكتبة bert للترميز والمعالجة المسبقة.

كاجل

تصنيف IMDB على Kaggle - يوضح كيفية التفاعل بسهولة مع مسابقة Kaggle من Colab، بما في ذلك تنزيل البيانات وإرسال النتائج.

مقدر كيراس TF2 مجموعات بيانات TF بيرت واجهات برمجة التطبيقات Kaggle
تصنيف النص منتهي
تصنيف النص مع Keras منتهيمنتهيمنتهي
توقع مشاعر مراجعة الفيلم مع BERT على TF Hub منتهيمنتهي
تصنيف IMDB على موقع Kaggle منتهيمنتهي

مهمة البنغالية مع تضمينات FastText

لا يقدم TensorFlow Hub حاليًا وحدة نمطية بكل اللغات. يوضح البرنامج التعليمي التالي كيفية الاستفادة من TensorFlow Hub لإجراء التجارب السريعة وتطوير تعلم الآلة المعياري.

Bangla Article Classifier - يوضح كيفية إنشاء نص TensorFlow Hub قابل لإعادة الاستخدام، واستخدامه لتدريب مصنف Keras لمجموعة بيانات BARD Bangla Article .

التشابه الدلالي

عندما نريد معرفة الجمل التي ترتبط ببعضها البعض في إعداد الصفر (لا توجد أمثلة تدريبية).

رسم التشابه الدلالي

أساسي

التشابه الدلالي - يوضح كيفية استخدام وحدة تشفير الجملة لحساب تشابه الجملة.

متعدد اللغات

التشابه الدلالي عبر اللغات - يوضح كيفية استخدام أحد برامج تشفير الجملة عبر اللغات لحساب تشابه الجملة عبر اللغات.

الاسترجاع الدلالي

الاسترجاع الدلالي - يوضح كيفية استخدام برنامج ترميز جملة الأسئلة والأجوبة لفهرسة مجموعة من المستندات لاسترجاعها بناءً على التشابه الدلالي.

إدخال قطعة الجملة

التشابه الدلالي مع برنامج التشفير العالمي lite - يوضح كيفية استخدام وحدات تشفير الجملة التي تقبل معرفات SentencePiece عند الإدخال بدلاً من النص.

إنشاء الوحدة

بدلاً من استخدام الوحدات النمطية فقط على tfhub.dev ، هناك طرق لإنشاء وحدات نمطية خاصة. يمكن أن تكون هذه أداة مفيدة لتحسين نمطية قاعدة تعليمات ML ولمزيد من المشاركة.

التفاف التضمينات الموجودة مسبقاً المدربة

مصدر وحدة تضمين النص - أداة لتضمين عملية تضمين موجودة مسبقًا تم تدريبها في وحدة نمطية. يوضح كيفية تضمين عمليات المعالجة المسبقة للنص في الوحدة. يسمح هذا بإنشاء وحدة تضمين جملة من عمليات تضمين الرمز المميز.

وحدة تضمين النص المصدر v2 - كما هو مذكور أعلاه، ولكنها متوافقة مع TensorFlow 2 والتنفيذ المتحمس.