উইকি 40 বি ভাষার মডেল

TensorFlow.org এ দেখুন Google Colab-এ চালান GitHub এ দেখুন নোটবুক ডাউনলোড করুন TF হাব মডেল দেখুন

উইকিপিডিয়া মত জেনারেট করুন Wiki40B ভাষা মডেল ব্যবহার করে পাঠ্য TensorFlow হাব !

এই নোটবুকটি কীভাবে করা যায় তা ব্যাখ্যা করে:

  • লোড 41 শব্দকোষ এবং 2 বহুভাষী ভাষা মডেলের যে অংশ Wiki40b-LM সংগ্রহ মেমরি-হাব উপর
  • বিভ্রান্তি, প্রতি স্তর অ্যাক্টিভেশন এবং প্রদত্ত পাঠ্যের অংশের জন্য শব্দ এমবেডিং পেতে মডেলগুলি ব্যবহার করুন
  • বীজ পাঠের টুকরো থেকে টোকেন-বাই-টোকেন পাঠ্য তৈরি করুন

ভাষা মডেল, সদ্য প্রকাশিত উপর প্রশিক্ষণ দেওয়া হয় পরিষ্কার-আপ Wiki40B ডেটা সেটটি TensorFlow ডেটাসেটস পাওয়া যায়। প্রশিক্ষণ সেটআপ কাগজ উপর ভিত্তি করে তৈরি ": বহুভাষিক ভাষা মডেল ডেটা সেটটি উইকি 40B"

সেটআপ

নির্ভরতা ইনস্টল করা

আমদানি

ভাষা নির্বাচন করুন

এর কোন ভাষায় মডেল মেমরি-হাব থেকে লোড করতে এবং টেক্সট দৈর্ঘ্য উত্পন্ন করা করা চয়ন করা যাক।

Using the https://tfhub.dev/google/wiki40b-lm-en/1 model to generate sequences of max length 20.

মডেল তৈরি করুন

ঠিক আছে, এখন যে আমরা কনফিগার করেছেন যা প্রাক প্রশিক্ষণ ব্যবহারের মডেল, এর কনফিগার এটি টেক্সট আপ জেনারেট করতে দিন max_gen_len । আমাদের টিএফ-হাব থেকে ভাষার মডেল লোড করতে হবে, স্টার্টার পাঠ্যের একটি অংশে ফিড করতে হবে এবং তারপরে টোকেনগুলি তৈরি হওয়ার সাথে সাথে পুনরাবৃত্তভাবে ফিড করতে হবে।

ভাষা মডেল টুকরা লোড

2021-11-05 13:33:19.950673: W tensorflow/core/common_runtime/graph_constructor.cc:1511] Importing a graph with a lower producer version 359 into an existing graph with producer version 808. Shape inference will have run different parts of the graph with different producer versions.

প্রতি-টোকেন প্রজন্মের গ্রাফ তৈরি করুন

জন্য স্ট্যাটিক্যালি unrolled গ্রাফ তৈরি করুন max_gen_len টোকেন

কিছু টেক্সট তৈরি করুন

এর কিছু টেক্সট তৈরি করা যাক! আমরা একটি টেক্সট সেট করব seed ভাষা মডেল অনুরোধ জানানো।

আপনি পূর্বনির্ধারিত বীজ ব্যবহার করতে পারেন বা ঐচ্ছিকরূপে আপনার নিজের লিখুন। এই পাঠ্যটি ভাষা মডেলের বীজ হিসাবে ব্যবহার করা হবে যা পরবর্তীতে কী তৈরি করতে হবে তার জন্য ভাষা মডেলকে প্রম্পট করতে সহায়তা করবে।

আপনি উত্পন্ন নিবন্ধের বিশেষ অংশগুলির আগে নিম্নলিখিত বিশেষ টোকেনগুলি ব্যবহার করতে পারেন। ব্যবহারের _START_ARTICLE_ ইঙ্গিত প্রবন্ধের শুরুতে, _START_SECTION_ একটি অধ্যায় শুরুতে জানাতে পারেন এবং _START_PARAGRAPH_ প্রবন্ধে টেক্সট জেনারেট করতে

পূর্বনির্ধারিত বীজ

আপনার নিজের বীজ লিখুন (ঐচ্ছিক)।

Generating text from seed:

_START_ARTICLE_
1882 Prince Edward Island general election
_START_PARAGRAPH_
The 1882 Prince Edward Island election was held on May 8, 1882 to elect members of the House of Assembly of the province of Prince Edward Island, Canada.

সেশন শুরু করুন।

পাঠ্য তৈরি করুন

_START_SECTION_ Candidates _START_PARAGRAPH_ Thirteen members of the House of Assembly were all members nominations. Among

আমরা মডেলের অন্যান্য আউটপুটগুলিও দেখতে পারি - বিভ্রান্তি, টোকেন আইডি, মধ্যবর্তী সক্রিয়করণ এবং এম্বেডিংগুলি

ppl_result
array([23.507753], dtype=float32)
token_ids_result
array([[   8,    3, 6794, 1579, 1582,  721,  489,  448,    8,    5,   26,
        6794, 1579, 1582,  721,  448,   17,  245,   22,  166, 2928, 6794,
          16, 7690,  384,   11,    7,  402,   11, 1172,   11,    7, 2115,
          11, 1579, 1582,  721,    9,  646,   10]], dtype=int32)
activations_result.shape
(12, 1, 39, 768)
embeddings_result
array([[[ 0.12262525,  5.548009  ,  1.4743135 , ...,  2.4388404 ,
         -2.2788858 ,  2.172028  ],
        [-2.3905468 , -0.97108954, -1.5513545 , ...,  8.458472  ,
         -2.8723319 ,  0.6534524 ],
        [-0.83790785,  0.41630274, -0.8740793 , ...,  1.6446769 ,
         -0.9074106 ,  0.3339265 ],
        ...,
        [-0.8054745 , -1.2495526 ,  2.6232922 , ...,  2.893288  ,
         -0.91287214, -1.1259722 ],
        [ 0.64944506,  3.3696785 ,  0.09543293, ..., -0.7839227 ,
         -1.3573489 ,  1.862214  ],
        [-1.2970612 ,  0.5961366 ,  3.3531897 , ...,  3.2853985 ,
         -1.6212384 ,  0.30257902]]], dtype=float32)