exampleValidator पाइपलाइन घटक प्रशिक्षण और डेटा प्रस्तुत करने में विसंगतियों की पहचान करता है। यह डेटा में विभिन्न वर्गों की विसंगतियों का पता लगा सकता है। उदाहरण के लिए यह हो सकता है:
- उपयोगकर्ता की अपेक्षाओं को संहिताबद्ध करने वाली स्कीम के विरुद्ध डेटा आंकड़ों की तुलना करके वैधता जांच करें।
- प्रशिक्षण और सेवा डेटा की तुलना करके प्रशिक्षण-सेवा विसंगति का पता लगाएं।
- डेटा की एक श्रृंखला को देखकर डेटा बहाव का पता लगाएं।
- SQL-आधारित कॉन्फ़िगरेशन का उपयोग करके कस्टम सत्यापन करें।
उदाहरण वैलिडेटर पाइपलाइन घटक एक स्कीमा के विरुद्ध स्टैटिस्टिक्सजेन पाइपलाइन घटक द्वारा गणना किए गए डेटा आंकड़ों की तुलना करके उदाहरण डेटा में किसी भी विसंगति की पहचान करता है। अनुमानित स्कीमा उन गुणों को संहिताबद्ध करती है जिन्हें इनपुट डेटा संतुष्ट करने की उम्मीद करता है, और डेवलपर द्वारा संशोधित किया जा सकता है।
- उपभोग: स्कीमाजेन घटक से एक स्कीमा, और स्टैटिस्टिक्सजेन घटक से आँकड़े।
- उत्सर्जन: सत्यापन परिणाम
उदाहरण सत्यापनकर्ता और टेन्सरफ्लो डेटा सत्यापन
exampleValidator आपके इनपुट डेटा को मान्य करने के लिए TensorFlow डेटा वैलिडेशन का व्यापक उपयोग करता है।
उदाहरण सत्यापनकर्ता घटक का उपयोग करना
एक उदाहरण सत्यापनकर्ता पाइपलाइन घटक आमतौर पर तैनात करना बहुत आसान है और इसके लिए कम अनुकूलन की आवश्यकता होती है। विशिष्ट कोड इस तरह दिखता है:
validate_stats = ExampleValidator(
statistics=statistics_gen.outputs['statistics'],
schema=schema_gen.outputs['schema']
)
अधिक विवरण exampleValidator API संदर्भ में उपलब्ध हैं।