Dataset

পাবলিক বিমূর্ত ক্লাস ডেটাসেট
পরিচিত ডাইরেক্ট সাবক্লাস

স্বাধীন উপাদানগুলির (নমুনা) একটি সম্ভাব্য বড় তালিকার প্রতিনিধিত্ব করে এবং এই উপাদানগুলি জুড়ে পুনরাবৃত্তি এবং রূপান্তরগুলি সম্পাদন করার অনুমতি দেয়।

পাবলিক কনস্ট্রাক্টর

ডেটাসেট (Ops tf, Operand <?> variant, List<Class<? প্রসারিত TType >> outputTypes, List< Shape > outputShapes)

পাবলিক পদ্ধতি

চূড়ান্ত ডেটাসেট
ব্যাচ (লং ব্যাচ সাইজ, বুলিয়ান ড্রপ লাস্টব্যাচ)
এই ডেটাসেটের উপাদানগুলিকে ব্যাচে ভাগ করে।
চূড়ান্ত ডেটাসেট
ব্যাচ (লম্বা ব্যাচ সাইজ)
এই ডেটাসেটের উপাদানগুলিকে ব্যাচে ভাগ করে।
স্ট্যাটিক ডেটাসেট
fromTensorSlices (Ops tf, List< Operand <?>> tensors, List<Class<? প্রসারিত TType >> outputTypes)
একটি ইন-মেমরি `ডেটাসেট` তৈরি করে যার উপাদানগুলি প্রদত্ত টেনসরের স্লাইস।
অপ্স
তালিকা< আকৃতি >
GetOutputShapes ()
এই ডেটাসেটের প্রতিটি উপাদানের জন্য আকারের একটি তালিকা পান।
তালিকা<শ্রেণী<? TType প্রসারিত করে >>
getOutputTypes ()
এই ডেটাসেটের প্রতিটি উপাদানের জন্য আউটপুট প্রকারের একটি তালিকা পান।
অপারেন্ড <?>
getVariant ()
এই ডেটাসেটের প্রতিনিধিত্বকারী বৈকল্পিক টেনসর পান।
ইটারেটর<লিস্ট< অপারেন্ড <?>>>
পুনরাবৃত্তিকারী ()
একটি পুনরাবৃত্ত তৈরি করে যা এই ডেটাসেটের সমস্ত ব্যাচের মাধ্যমে একটি আগ্রহী ফ্যাশনে পুনরাবৃত্তি করে৷
ডেটাসেট ইটারেটর
makeInitializeableIterator ()
একটি `DatasetIterator` তৈরি করে যা এই ডেটাসেটের উপাদানগুলির উপর পুনরাবৃত্তি করতে ব্যবহার করা যেতে পারে।
ডেটাসেট ইটারেটর
makeOneShotIterator ()
একটি `DatasetIterator` তৈরি করে যা এই ডেটাসেটের উপাদানগুলির উপর পুনরাবৃত্তি করতে ব্যবহার করা যেতে পারে।
ডেটাসেট
মানচিত্র (ফাংশন<লিস্ট< অপারেন্ড <?>>, তালিকা< অপারেন্ড <?>>> ম্যাপার)
একটি নতুন ডেটাসেট প্রদান করে যা এই ডেটাসেট দ্বারা প্রত্যাবর্তিত সমস্ত উপাদানের উপর একটি ফাংশন ম্যাপ করে।
ডেটাসেট
mapAllComponents (Function< Operand <?>, Operand <?>> ম্যাপার)
একটি নতুন ডেটাসেট প্রদান করে যা প্রতিটি উপাদানের সমস্ত উপাদানের উপর এই ডেটাসেট থেকে সমস্ত উপাদান জুড়ে একটি ফাংশন ম্যাপ করে৷
ডেটাসেট
mapOneComponent (int index, Function< Operand <?>, Operand <?>> ম্যাপার)
একটি নতুন ডেটাসেট প্রদান করে যা প্রতিটি উপাদানের একটি একক উপাদানে এই ডেটাসেট থেকে সমস্ত উপাদান জুড়ে একটি ফাংশন ম্যাপ করে।
চূড়ান্ত ডেটাসেট
এড়িয়ে যান (দীর্ঘ গণনা)
একটি নতুন `ডেটাসেট` প্রদান করে যা এই ডেটাসেট থেকে `গণনা` প্রাথমিক উপাদানগুলিকে এড়িয়ে যায়
চূড়ান্ত ডেটাসেট
নিন (দীর্ঘ গণনা)
এই ডেটাসেট থেকে শুধুমাত্র প্রথম 'গণনা' উপাদান সহ একটি নতুন `ডেটাসেট` প্রদান করে।
স্ট্যাটিক ডেটাসেট
টেক্সটলাইনডেটাসেট (Ops tf, স্ট্রিং ফাইলের নাম, স্ট্রিং কম্প্রেশন টাইপ, লং বাফার সাইজ)
স্ট্যাটিক ডেটাসেট
tfRecordDataset (Ops tf, স্ট্রিং ফাইলের নাম, স্ট্রিং কম্প্রেশন টাইপ, লং বাফার সাইজ)
স্ট্রিং

উত্তরাধিকারসূত্রে প্রাপ্ত পদ্ধতি

পাবলিক কনস্ট্রাক্টর

পাবলিক ডেটাসেট (Ops tf, Operand <?> ভেরিয়েন্ট, List<Class<? প্রসারিত TType >> outputTypes, List< Shape > outputShapes)

পাবলিক পদ্ধতি

সর্বজনীন চূড়ান্ত ডেটাসেট ব্যাচ (লং ব্যাচ সাইজ, বুলিয়ান ড্রপ লাস্টব্যাচ)

এই ডেটাসেটের উপাদানগুলিকে ব্যাচে ভাগ করে।

পরামিতি
ব্যাচ সাইজ প্রতি ব্যাচে পছন্দসই উপাদানের সংখ্যা
dropLastBatch যদি `ব্যাচসাইজ` উপাদানের চেয়ে কম থাকে তাহলে চূড়ান্ত ব্যাচটি ত্যাগ করবেন কিনা।
রিটার্নস
  • একটি ব্যাচড ডেটাসেট

সর্বজনীন চূড়ান্ত ডেটাসেট ব্যাচ (লং ব্যাচ সাইজ)

এই ডেটাসেটের উপাদানগুলিকে ব্যাচে ভাগ করে। শেষ ব্যাচ অন্তর্ভুক্ত করে, এমনকি যদি এটিতে `batchSize` উপাদানের থেকে কম থাকে।

পরামিতি
ব্যাচ সাইজ প্রতি ব্যাচে পছন্দসই উপাদানের সংখ্যা
রিটার্নস
  • একটি ব্যাচড ডেটাসেট

TensorSlices থেকে পাবলিক স্ট্যাটিক ডেটাসেট (Ops tf, List< Operand <?>> tensors, List<Class<? প্রসারিত TType >> outputTypes)

একটি ইন-মেমরি `ডেটাসেট` তৈরি করে যার উপাদানগুলি প্রদত্ত টেনসরের স্লাইস। এই ডেটাসেটের প্রতিটি উপাদান একটি List<Operand<?>> হবে, প্রদত্ত টেনসরের স্লাইস (যেমন ব্যাচ) প্রতিনিধিত্ব করবে।

পরামিতি
tf অপস অ্যাকসেসর
টেনসর Operand<?> এই ডেটাসেটের উপাদানগুলির প্রতিনিধিত্ব করে (যেমন বৈশিষ্ট্য, লেবেল)
আউটপুট প্রকার এই ডেটাসেটের প্রতিটি উপাদানের ডেটা টাইপ প্রতিনিধিত্বকারী টেনসর টাইপ ক্লাসের একটি তালিকা।
রিটার্নস
  • একটি নতুন `ডেটাসেট`

পাবলিক অপস getOpsInstance ()

সর্বজনীন তালিকা< আকৃতি > getOutputShapes ()

এই ডেটাসেটের প্রতিটি উপাদানের জন্য আকারের একটি তালিকা পান।

সর্বজনীন তালিকা<শ্রেণী<? প্রসারিত TType >> getOutputTypes ()

এই ডেটাসেটের প্রতিটি উপাদানের জন্য আউটপুট প্রকারের একটি তালিকা পান।

পাবলিক অপারেন্ড <?> getVariant ()

এই ডেটাসেটের প্রতিনিধিত্বকারী বৈকল্পিক টেনসর পান।

পাবলিক ইটারেটর<লিস্ট< অপারেন্ড <?>>> পুনরাবৃত্তিকারী ()

একটি পুনরাবৃত্ত তৈরি করে যা এই ডেটাসেটের সমস্ত ব্যাচের মাধ্যমে একটি আগ্রহী ফ্যাশনে পুনরাবৃত্তি করে৷ প্রতিটি ব্যাচ হল উপাদানগুলির একটি তালিকা, যা `আউটপুট` অবজেক্ট হিসেবে ফিরে আসে।

এই পদ্ধতিটি ব্যাচের মাধ্যমে প্রতিটি পুনরাবৃত্তির জন্য সক্ষম করে যখন আগ্রহী মোডে চলছে। গ্রাফ মোড ব্যাচ পুনরাবৃত্তির জন্য, `makeOneShotIterator` দেখুন।

রিটার্নস
  • এই ডেটাসেটের ব্যাচের মাধ্যমে একটি পুনরাবৃত্তিকারী।

পাবলিক ডেটাসেট আইটারেটর মেক ইনিশিয়ালাইজেবল ইটারেটর ()

একটি `DatasetIterator` তৈরি করে যা এই ডেটাসেটের উপাদানগুলির উপর পুনরাবৃত্তি করতে ব্যবহার করা যেতে পারে।

উপাদানগুলিকে লুপে পুনরুদ্ধার করার আগে এই পুনরাবৃত্তিকারীকে `iterator.makeInitializer(Dataset)`-এ কল দিয়ে আরম্ভ করতে হবে।

রিটার্নস
  • এই ডেটাসেটের কাঠামোর উপর ভিত্তি করে একটি নতুন `DatasetIterator`।

পাবলিক ডেটাসেট আইটারেটর মেক ওয়ানশটআইটারেটর ()

একটি `DatasetIterator` তৈরি করে যা এই ডেটাসেটের উপাদানগুলির উপর পুনরাবৃত্তি করতে ব্যবহার করা যেতে পারে। `makeOneShotIterator` ব্যবহার করা নিশ্চিত করে যে এই ডেটাসেটে পুনরাবৃত্তিকারী স্বয়ংক্রিয়ভাবে আরম্ভ হয়েছে। স্কিপ গ্রাফ মোডে, ইনিশিয়ালাইজার অপটি গ্রাফের ইনটিশিয়ালাইজার তালিকায় যোগ করা হবে, যা অবশ্যই `tf.init()` এর মাধ্যমে চালাতে হবে:

যেমন:

     try (Session session = new Session(graph) {
         // Immediately run initializers
         session.run(tf.init());
     }
 

আগ্রহী মোডে, এই কলের ফলে ইনিশিয়ালাইজার স্বয়ংক্রিয়ভাবে চালানো হবে।

রিটার্নস
  • এই ডেটাসেটের কাঠামোর উপর ভিত্তি করে একটি নতুন `DatasetIterator`।

সর্বজনীন ডেটাসেট মানচিত্র (ফাংশন<লিস্ট< অপারেন্ড <?>>, তালিকা< অপারেন্ড <?>>> ম্যাপার)

একটি নতুন ডেটাসেট প্রদান করে যা এই ডেটাসেট দ্বারা প্রত্যাবর্তিত সমস্ত উপাদানের উপর একটি ফাংশন ম্যাপ করে।

উদাহরণস্বরূপ, ধরুন প্রতিটি উপাদান হল একটি List<Operand<?>> 2টি উপাদান সহ: (বৈশিষ্ট্য, লেবেল)।

কলিং

dataset.map(components -> {
      Operand<?> features = components.get(0);
      Operand<?> labels   = components.get(1);

      return Arrays.asList(
        tf.math.mul(features, tf.constant(2)),
        tf.math.mul(labels, tf.constant(5))
      );
 );
 }
ফাংশনটিকে `বৈশিষ্ট্য` এবং `লেবেল` উপাদানগুলির উপর ম্যাপ করবে, বৈশিষ্ট্যগুলিকে 2 দ্বারা গুণ করে এবং লেবেলগুলিকে 5 দ্বারা গুণ করে৷

পরামিতি
ম্যাপার এই পুনরাবৃত্তিকারীর প্রতিটি উপাদানে প্রয়োগ করার ফাংশন।
রিটার্নস
  • এই পুনরাবৃত্তিকারীর প্রতিটি উপাদানে `ম্যাপার` প্রয়োগ করে একটি নতুন ডেটাসেট।

সর্বজনীন ডেটাসেট ম্যাপঅল কম্পোনেন্টস (ফাংশন< অপারেন্ড <?>, অপারেন্ড <?>> ম্যাপার)

একটি নতুন ডেটাসেট প্রদান করে যা প্রতিটি উপাদানের সমস্ত উপাদানের উপর এই ডেটাসেট থেকে সমস্ত উপাদান জুড়ে একটি ফাংশন ম্যাপ করে৷

উদাহরণস্বরূপ, ধরুন প্রতিটি উপাদান হল একটি List<Operand<?>> 2টি উপাদান সহ: (বৈশিষ্ট্য, লেবেল)।

dataset.mapAllComponents(component -> tf.math.mul(component, tf.constant(2))) কল করা প্রতিটি উপাদানের `বৈশিষ্ট্য` এবং `লেবেল` উভয় উপাদানের উপর ফাংশনকে ম্যাপ করবে, সেগুলিকে 2 দ্বারা গুণ করে

পরামিতি
ম্যাপার প্রতিটি উপাদানে প্রয়োগ করার ফাংশন
রিটার্নস
  • একটি নতুন ডেটাসেট প্রতিটি উপাদানের সমস্ত উপাদানে `ম্যাপার` প্রয়োগ করে।

সর্বজনীন ডেটাসেট mapOneComponent (int index, Function< Operand <?>, Operand <?>> mapper)

একটি নতুন ডেটাসেট প্রদান করে যা প্রতিটি উপাদানের একটি একক উপাদানে এই ডেটাসেট থেকে সমস্ত উপাদান জুড়ে একটি ফাংশন ম্যাপ করে।

উদাহরণস্বরূপ, ধরুন প্রতিটি উপাদান হল একটি List<Operand<?>> 2টি উপাদান সহ: (বৈশিষ্ট্য, লেবেল)।

dataset.mapOneComponent(0, features -> tf.math.mul(features, tf.constant(2))) কল করা প্রতিটি উপাদানের `features` উপাদানের উপর ফাংশনকে ম্যাপ করবে, প্রতিটিকে 2 দ্বারা গুণ করে।

পরামিতি
সূচক রূপান্তর করার জন্য উপাদানের সূচক।
ম্যাপার লক্ষ্য উপাদানে প্রয়োগ করার ফাংশন।
রিটার্নস
  • একটি নতুন ডেটাসেট নির্বাচিত সূচকে উপাদানটিতে `ম্যাপার` প্রয়োগ করছে।

সর্বজনীন চূড়ান্ত ডেটাসেট স্কিপ (দীর্ঘ গণনা)

একটি নতুন `ডেটাসেট` প্রদান করে যা এই ডেটাসেট থেকে `গণনা` প্রাথমিক উপাদানগুলিকে এড়িয়ে যায়

পরামিতি
গণনা নতুন ডেটাসেট তৈরি করতে 'এড়িয়ে যাওয়া' উপাদানগুলির সংখ্যা৷
রিটার্নস
  • একটি নতুন ডেটাসেট যেখানে `গণনা` উপাদানগুলি সরানো হয়েছে।

সর্বজনীন চূড়ান্ত ডেটাসেট গ্রহণ (দীর্ঘ গণনা)

এই ডেটাসেট থেকে শুধুমাত্র প্রথম 'গণনা' উপাদান সহ একটি নতুন `ডেটাসেট` প্রদান করে।

পরামিতি
গণনা এই ডেটাসেট থেকে "নেওয়া" উপাদানের সংখ্যা৷
রিটার্নস
  • এই ডেটাসেটের প্রথম `গণনা` উপাদান সমন্বিত একটি নতুন ডেটাসেট।

পাবলিক স্ট্যাটিক ডেটাসেট টেক্সটলাইনডেটাসেট (Ops tf, স্ট্রিং ফাইলের নাম, স্ট্রিং কম্প্রেশন টাইপ, লং বাফার সাইজ)

পাবলিক স্ট্যাটিক ডেটাসেট tfRecordDataset (Ops tf, স্ট্রিং ফাইলের নাম, স্ট্রিং কম্প্রেশন টাইপ, লং বাফার সাইজ)

পাবলিক স্ট্রিং থেকে স্ট্রিং ()