ما المقصود بمعالجة نموذج TensorFlow؟
إذا كنت قد حددت مخاوف تتعلق بالإنصاف في نموذج التعلم الآلي الخاص بك ، فهناك ثلاثة أنواع أساسية من التدخلات الفنية المتاحة:
- التدريب على تقنيات المعالجة المسبقة للبيانات: جمع المزيد من البيانات ، وتوليد البيانات التركيبية ، وضبط أوزان الأمثلة ومعدلات أخذ العينات من الشرائح المختلفة.
- تقنيات نمذجة وقت التدريب: تغيير النموذج نفسه عن طريق إدخال أو تعديل أهداف النموذج وإضافة قيود.
- تقنيات ما بعد التدريب: تعديل مخرجات النموذج أو تفسير المخرجات لتحسين الأداء عبر المقاييس.
نمذجة وقت التدريب
توفر مكتبة TensorFlow Model Remediation طريقتين لمعالجة مشكلات التحيز والإنصاف في النموذج الخاص بك ، وهما MinDiff وإقران Logit Counterfactual Logit (CLP) . تم وصفها في الجدول أدناه.
حد أدنى | CLP | |
---|---|---|
متى يجب استخدام هذه التقنية؟ | للتأكد من أن النموذج يتنبأ بالتسمية المفضلة بشكل متساوٍ لجميع قيم السمة الحساسة. لتحقيق تكافؤ الفرص الجماعي. | للتأكد من أن تنبؤ النموذج لا يتغير بين "الأزواج المقابلة" (حيث تختلف السمة الحساسة المشار إليها في الميزة). على سبيل المثال ، في مصنف السمية ، لا ينبغي أن تحتوي أمثلة مثل "أنا رجل" و "أنا مثلية" على تنبؤ مختلف. لتحقيق شكل من أشكال الإنصاف المضاد . |
كيف يعمل؟ | يعاقب النموذج أثناء التدريب للاختلافات في توزيع الدرجات بين المجموعتين. | يعاقب النموذج أثناء التدريب لفروق الإخراج بين أزواج من الأمثلة المضاد. |
طرائق الإدخال | تعمل وظائف الخسارة على المخرجات ، لذا فهي ، من الناحية النظرية ، محايدة لمدخلات وبنية النموذج. | تعمل وظائف الخسارة على المخرجات ، لذا فهي ، من الناحية النظرية ، محايدة لمدخلات وبنية النموذج. |