مدل های زبان Wiki40B

مشاهده در TensorFlow.org در Google Colab اجرا شود در GitHub مشاهده کنید دانلود دفترچه یادداشت مدل های TF Hub را ببینید

تولید ویکیپدیا مانند متن با استفاده از مدل های زبان Wiki40B از TensorFlow توپی !

این دفترچه یادداشت نشان می دهد که چگونه:

  • بارگذاری 41 زبانه و 2 مدل چند زبانه است که بخشی از مجموعه Wiki40b-LM در TF-توپی
  • از مدل ها برای به دست آوردن گیجی، فعال سازی در هر لایه، و جاسازی کلمه برای یک قطعه متن خاص استفاده کنید.
  • متن را به صورت نشانه به نشانه از یک تکه متن اولیه تولید کنید

مدل های زبان در تازه منتشر شده آموزش دیده، تمیز کردن Wiki40B مجموعه داده های موجود در مجموعه داده TensorFlow. راه اندازی آموزش بر روی کاغذ بر اساس ": چند زبانه زبان مدل مجموعه داده ویکی 40B" .

برپایی

نصب Dependencies

واردات

زبان را انتخاب کنید

بیایید انتخاب کنید که مدل زبانی از TF-توپی بارگذاری و طول متن به تولید می شود.

Using the https://tfhub.dev/google/wiki40b-lm-en/1 model to generate sequences of max length 20.

مدل را بسازید

خوب، حالا که ما پیکربندی کردید که قبل از آموزش دیده مدل استفاده، اجازه دهید آن را پیکربندی برای تولید متن تا max_gen_len . ما باید مدل زبان را از TF-Hub بارگیری کنیم، در یک قطعه متن آغازگر تغذیه کنیم، و سپس همزمان با تولید توکن‌ها، به صورت مکرر در توکن‌ها تغذیه کنیم.

قطعات مدل زبان را بارگذاری کنید

2021-11-05 13:33:19.950673: W tensorflow/core/common_runtime/graph_constructor.cc:1511] Importing a graph with a lower producer version 359 into an existing graph with producer version 808. Shape inference will have run different parts of the graph with different producer versions.

نمودار تولید هر توکن را بسازید

ساخت نمودار آماری نعوظ برای max_gen_len نشانه

مقداری متن تولید کنید

بیایید متنی تولید کنیم! ما یک متن را تنظیم seed به بی درنگ مدل زبانی.

شما می توانید یکی از دانه های از پیش تعریف شده استفاده کنید و یا به صورت اختیاری خود را وارد کنید. این متن به‌عنوان پایه‌ای برای مدل زبان مورد استفاده قرار می‌گیرد تا به مدل زبانی کمک کند که در ادامه چه چیزی ایجاد شود.

می توانید از نشانه های ویژه زیر قبل از بخش های ویژه مقاله تولید شده استفاده کنید. استفاده از _START_ARTICLE_ به نشان می دهد آغاز مقاله، _START_SECTION_ به نشان می دهد آغاز یک بخش، و _START_PARAGRAPH_ برای تولید متن در مقاله

دانه های از پیش تعریف شده

دانه خود را وارد کنید (اختیاری).

Generating text from seed:

_START_ARTICLE_
1882 Prince Edward Island general election
_START_PARAGRAPH_
The 1882 Prince Edward Island election was held on May 8, 1882 to elect members of the House of Assembly of the province of Prince Edward Island, Canada.

شروع جلسه

تولید متن

_START_SECTION_ Candidates _START_PARAGRAPH_ Thirteen members of the House of Assembly were all members nominations. Among

همچنین می‌توانیم به خروجی‌های دیگر مدل نگاه کنیم - گیجی، شناسه‌های نشانه، فعال‌سازی‌های میانی، و جاسازی‌ها

ppl_result
array([23.507753], dtype=float32)
token_ids_result
array([[   8,    3, 6794, 1579, 1582,  721,  489,  448,    8,    5,   26,
        6794, 1579, 1582,  721,  448,   17,  245,   22,  166, 2928, 6794,
          16, 7690,  384,   11,    7,  402,   11, 1172,   11,    7, 2115,
          11, 1579, 1582,  721,    9,  646,   10]], dtype=int32)
activations_result.shape
(12, 1, 39, 768)
embeddings_result
array([[[ 0.12262525,  5.548009  ,  1.4743135 , ...,  2.4388404 ,
         -2.2788858 ,  2.172028  ],
        [-2.3905468 , -0.97108954, -1.5513545 , ...,  8.458472  ,
         -2.8723319 ,  0.6534524 ],
        [-0.83790785,  0.41630274, -0.8740793 , ...,  1.6446769 ,
         -0.9074106 ,  0.3339265 ],
        ...,
        [-0.8054745 , -1.2495526 ,  2.6232922 , ...,  2.893288  ,
         -0.91287214, -1.1259722 ],
        [ 0.64944506,  3.3696785 ,  0.09543293, ..., -0.7839227 ,
         -1.3573489 ,  1.862214  ],
        [-1.2970612 ,  0.5961366 ,  3.3531897 , ...,  3.2853985 ,
         -1.6212384 ,  0.30257902]]], dtype=float32)