কাস্টম ডেটা যাচাইকরণ

TFDV এসকিউএল ব্যবহার করে কাস্টম ডেটা বৈধতা সমর্থন করে। আপনি validate_statistics বা custom_validate_statistics ব্যবহার করে কাস্টম ডেটা যাচাইকরণ চালাতে পারেন। কাস্টম বৈধতার সাথে স্ট্যান্ডার্ড, স্কিমা-ভিত্তিক ডেটা বৈধতা চালানোর জন্য validate_statistics ব্যবহার করুন। শুধুমাত্র কাস্টম বৈধতা চালানোর জন্য custom_validate_statistics ব্যবহার করুন।

কাস্টম ডেটা যাচাইকরণ কনফিগার করা হচ্ছে

চালানোর জন্য কাস্টম বৈধতা নির্ধারণ করতে CustomValidationConfig ব্যবহার করুন। প্রতিটি যাচাইকরণের জন্য, একটি SQL এক্সপ্রেশন প্রদান করুন, যা একটি বুলিয়ান মান প্রদান করে। প্রতিটি SQL এক্সপ্রেশন নির্দিষ্ট বৈশিষ্ট্যের জন্য সারাংশ পরিসংখ্যানের বিরুদ্ধে চালানো হয়। অভিব্যক্তিটি মিথ্যা হলে, TFDV প্রদত্ত তীব্রতা এবং অসঙ্গতি বর্ণনা ব্যবহার করে একটি কাস্টম অসঙ্গতি তৈরি করে।

আপনি স্বতন্ত্র বৈশিষ্ট্য বা বৈশিষ্ট্য জোড়ার বিরুদ্ধে চালিত কাস্টম বৈধতা কনফিগার করতে পারেন। প্রতিটি বৈশিষ্ট্যের জন্য, ডেটাসেট (অর্থাৎ, স্লাইস) এবং ব্যবহার করার বৈশিষ্ট্য পাথ উভয়ই নির্দিষ্ট করুন, যদিও আপনি যদি ডিফল্ট স্লাইস (অর্থাৎ, সমস্ত উদাহরণ) যাচাই করতে চান তবে আপনি ডেটাসেটের নামটি ফাঁকা রাখতে পারেন। একক বৈশিষ্ট্য যাচাইকরণের জন্য, বৈশিষ্ট্য পরিসংখ্যান feature সাথে আবদ্ধ। বৈশিষ্ট্য জোড়া যাচাইকরণের জন্য, পরীক্ষার বৈশিষ্ট্য পরিসংখ্যান feature_test আবদ্ধ এবং মৌলিক বৈশিষ্ট্য পরিসংখ্যান feature_base সাথে আবদ্ধ। উদাহরণ প্রশ্নগুলির জন্য নীচের বিভাগটি দেখুন।

যদি একটি কাস্টম বৈধতা একটি অসংগতি ট্রিগার করে, TFDV অসঙ্গতির কারণ(গুলি) সহ একটি অসঙ্গতির প্রোটো ফিরিয়ে দেবে। প্রতিটি কারণের একটি সংক্ষিপ্ত বিবরণ থাকবে, যা ব্যবহারকারীর কনফিগার করা হয়েছে, এবং কোয়েরির সাথে একটি বিবরণ থাকবে যা অসামঞ্জস্য সৃষ্টি করেছে, ডেটাসেটের নাম যার উপর ক্যোয়ারী চালানো হয়েছে এবং বেস বৈশিষ্ট্য পাথ (যদি একটি বৈশিষ্ট্য-জোড়া বৈধতা চলছে)। কাস্টম বৈধতার উদাহরণের জন্য নীচের বিভাগটি দেখুন।

উদাহরণ কনফিগারেশনের জন্য CustomValidationConfig প্রোটোতে ডকুমেন্টেশন দেখুন।