التوقيعات المشتركة للنص

تصف هذه الصفحة التوقيعات الشائعة التي يجب تنفيذها بواسطة الوحدات النمطية بتنسيق TF1 Hub للمهام التي تقبل إدخالات النص. (للحصول على تنسيق TF2 SavedModel ، راجع واجهة برمجة تطبيقات SavedModel المماثلة.)

ناقل ميزة النص

تقوم وحدة متجهات ميزات النص بإنشاء تمثيل متجه كثيف من ميزات النص. يقبل مجموعة من السلاسل ذات الشكل [batch_size] ويعينها إلى موتر float32 ذو الشكل [batch_size, N] . يُطلق على هذا غالبًا اسم تضمين النص في البعد N

الاستخدام الأساسي

  embed = hub.Module("path/to/module")
  representations = embed([
      "A long sentence.",
      "single-word",
      "http://example.com"])

استخدام عمود الميزة

    feature_columns = [
      hub.text_embedding_column("comment", "path/to/module", trainable=False),
    ]
    input_fn = tf.estimator.inputs.numpy_input_fn(features, labels, shuffle=True)
    estimator = tf.estimator.DNNClassifier(hidden_units, feature_columns)
    estimator.train(input_fn, max_steps=100)

ملحوظات

تم تدريب الوحدات مسبقًا على مجالات و/أو مهام مختلفة، وبالتالي لن تكون كل وحدة متجهة لميزات النص مناسبة لمشكلتك. على سبيل المثال: كان من الممكن تدريب بعض الوحدات على لغة واحدة.

لا تسمح هذه الواجهة بضبط تمثيل النص على وحدات TPU، لأنها تتطلب من الوحدة إنشاء مثيل لكل من معالجة السلسلة والمتغيرات القابلة للتدريب في نفس الوقت.