TensorFlow मॉडल उपचार क्या है?
यदि आपने अपने मशीन लर्निंग मॉडल के साथ निष्पक्षता संबंधी चिंताओं की पहचान की है, तो तीन प्राथमिक प्रकार के तकनीकी हस्तक्षेप उपलब्ध हैं:
- प्रशिक्षण डेटा पूर्व-प्रसंस्करण तकनीक: अधिक डेटा एकत्र करना, सिंथेटिक डेटा उत्पन्न करना, उदाहरणों के भार को समायोजित करना और विभिन्न स्लाइस की नमूना दरों को समायोजित करना।
- प्रशिक्षण-समय मॉडलिंग तकनीक: मॉडल के उद्देश्यों को शुरू करने या बदलने और बाधाओं को जोड़कर स्वयं मॉडल को बदलना।
- प्रशिक्षण के बाद की तकनीकें: मेट्रिक्स में प्रदर्शन को बेहतर बनाने के लिए मॉडल के आउटपुट को संशोधित करना या आउटपुट की व्याख्या करना।
प्रशिक्षण-समय मॉडलिंग
TensorFlow मॉडल रेमेडिएशन लाइब्रेरी आपके मॉडल में पूर्वाग्रह और निष्पक्षता के मुद्दों को संबोधित करने के लिए दो तकनीकें प्रदान करती है, MinDiff और काउंटरफैक्टुअल लॉगिट पेयरिंग (CLP) । उनका वर्णन नीचे दी गई तालिका में किया गया है।
मिनडिफ | सीएलपी | |
---|---|---|
आपको इस तकनीक का उपयोग कब करना चाहिए? | यह सुनिश्चित करने के लिए कि एक मॉडल संवेदनशील विशेषता के सभी मूल्यों के लिए समान रूप से पसंदीदा लेबल की भविष्यवाणी करता है। अवसर की समूह समानता प्राप्त करना। | यह सुनिश्चित करने के लिए कि एक मॉडल की भविष्यवाणी "काउंटरफैक्टुअल जोड़े" (जहां एक विशेषता में संदर्भित संवेदनशील विशेषता अलग है) के बीच नहीं बदलती है। उदाहरण के लिए, टॉक्सिसिटी क्लासिफायरियर में, "मैं एक आदमी हूं" और "मैं एक समलैंगिक हूं" जैसे उदाहरणों की अलग भविष्यवाणी नहीं होनी चाहिए। प्रतितथ्यात्मक निष्पक्षता का एक रूप प्राप्त करने के लिए। |
यह कैसे काम करता है? | दो सेटों के बीच अंकों के वितरण में अंतर के लिए प्रशिक्षण के दौरान मॉडल को दंडित करता है। | उदाहरण के प्रतितथ्यात्मक युग्मों के बीच आउटपुट अंतर के लिए प्रशिक्षण के दौरान मॉडल को दंडित करता है। |
इनपुट तौर-तरीके | हानि फ़ंक्शन आउटपुट पर काम करते हैं, इसलिए सिद्धांत रूप में, इनपुट और मॉडल आर्किटेक्चर के लिए अज्ञेयवादी हैं। | हानि फ़ंक्शन आउटपुट पर काम करते हैं, इसलिए सिद्धांत रूप में, इनपुट और मॉडल आर्किटेक्चर के लिए अज्ञेयवादी हैं। |