FixedUnigramCandidateSampler.Options

পাবলিক স্ট্যাটিক ক্লাস FixedUnigramCandidateSampler.Options

FixedUnigramCandidateSampler এর জন্য ঐচ্ছিক বৈশিষ্ট্য

পাবলিক পদ্ধতি

FixedUnigramCandidateSampler.Options
বিকৃতি (ফ্লোট বিকৃতি)
FixedUnigramCandidateSampler.Options
numReservedIds (লং numReservedIds)
FixedUnigramCandidateSampler.Options
numShards (লং numShards)
FixedUnigramCandidateSampler.Options
বীজ (দীর্ঘ বীজ)
FixedUnigramCandidateSampler.Options
বীজ 2 (লম্বা বীজ 2)
FixedUnigramCandidateSampler.Options
শার্ড (লম্বা শার্ড)
FixedUnigramCandidateSampler.Options
ইউনিগ্রাম (লিস্ট<ফ্লোট> ইউনিগ্রাম)
FixedUnigramCandidateSampler.Options
ভোকাবফাইল (স্ট্রিং ভোকাবফাইল)

উত্তরাধিকারসূত্রে প্রাপ্ত পদ্ধতি

পাবলিক পদ্ধতি

সর্বজনীন FixedUnigramCandidateSampler.Options distortion (ফ্লোট বিকৃতি)

পরামিতি
বিকৃতি ইউনিগ্রাম সম্ভাব্যতা বন্টন তির্যক করতে বিকৃতি ব্যবহার করা হয়। অভ্যন্তরীণ ইউনিগ্রাম বিতরণে যোগ করার আগে প্রতিটি ওজন প্রথমে বিকৃতির শক্তিতে উত্থাপিত হয়। ফলস্বরূপ, বিকৃতি = 1.0 নিয়মিত ইউনিগ্রাম স্যাম্পলিং দেয় (ভোকাব ফাইল দ্বারা সংজ্ঞায়িত), এবং বিকৃতি = 0.0 একটি অভিন্ন বন্টন দেয়।

সর্বজনীন FixedUnigramCandidateSampler.Options numReservedIds (লং numReservedIds)

পরামিতি
সংরক্ষিত আইডি ঐচ্ছিকভাবে কিছু সংরক্ষিত আইডি ব্যবহারকারীদের দ্বারা [0, ..., num_reserved_ids) পরিসরে যোগ করা যেতে পারে। একটি ব্যবহারের ক্ষেত্রে একটি বিশেষ অজানা শব্দ টোকেন আইডি 0 হিসাবে ব্যবহৃত হয়। এই আইডিগুলির নমুনা সম্ভাবনা 0 হবে।

সর্বজনীন FixedUnigramCandidateSampler.Options numShards (লং numShards)

পরামিতি
numShards সমান্তরালতার মাধ্যমে সমগ্র গণনার গতি বাড়ানোর জন্য একটি নমুনাকারীকে মূল পরিসরের একটি উপসেট থেকে নমুনা করতে ব্যবহার করা যেতে পারে। এই প্যারামিটারটি (একসাথে 'শার্ড'-এর সাথে) সামগ্রিক গণনায় ব্যবহৃত পার্টিশনের সংখ্যা নির্দেশ করে।

পাবলিক FixedUnigramCandidateSampler.Options seed (দীর্ঘ বীজ)

পরামিতি
বীজ যদি বীজ বা বীজ2 অ-শূন্য হিসাবে সেট করা হয়, তাহলে প্রদত্ত বীজ দ্বারা এলোমেলো সংখ্যা জেনারেটর বীজ হয়। অন্যথায়, এটি একটি এলোমেলো বীজ দ্বারা বীজ হয়।

পাবলিক FixedUnigram CandidateSampler.Options seed2 (Long seed2)

পরামিতি
বীজ2 একটি দ্বিতীয় বীজ বীজ সংঘর্ষ এড়াতে.

Public FixedUnigramCandidateSampler.Options shard (লং শার্ড)

পরামিতি
শার্ড সমান্তরালতার মাধ্যমে সমগ্র গণনার গতি বাড়ানোর জন্য একটি নমুনাকারীকে মূল পরিসরের একটি উপসেট থেকে নমুনা করতে ব্যবহার করা যেতে পারে। এই প্যারামিটার (একসাথে 'সংখ্যা_শার্ড') একটি স্যাম্পলার অপের নির্দিষ্ট পার্টিশন নম্বর নির্দেশ করে, যখন পার্টিশন ব্যবহার করা হচ্ছে।

সর্বজনীন FixedUnigramCandidateSampler.Options unigrams (List<Float> unigrams)

পরামিতি
ইউনিগ্রাম ইউনিগ্রাম গণনা বা সম্ভাব্যতার একটি তালিকা, প্রতি আইডি ক্রমানুসারে একটি। vocab_file এবং unigrams এর মধ্যে একটি ঠিক এই অপেশানে পাস করা উচিত।

সর্বজনীন FixedUnigramCandidateSampler.Options vocabFile (স্ট্রিং vocabFile)

পরামিতি
ভোকাবফাইল এই ফাইলের প্রতিটি বৈধ লাইন (যার একটি CSV-এর মতো বিন্যাস থাকা উচিত) একটি বৈধ শব্দ ID-এর সাথে মিলে যায়৷ আইডিগুলি ক্রমানুসারে, num_reserved_ids থেকে শুরু করে। প্রতিটি লাইনের শেষ এন্ট্রিটি গণনা বা আপেক্ষিক সম্ভাব্যতার সাথে সম্পর্কিত একটি মান হবে বলে আশা করা হচ্ছে। vocab_file এবং unigrams এর মধ্যে একটি ঠিক এই অপেশানে পাস করতে হবে।