TFF सहयोगियों की 7/28/2022 बैठक के नोट्स

  • नये लोग
  • बातचीत को अंतःक्रियात्मक रूप से सुविधाजनक बनाने के लिए आइए हम सभी डिस्कॉर्ड सर्वर पर हों
    • पोस्ट करने में सक्षम होने के लिए एक योगदानकर्ता बनने के लिए पिंग क्रिज़िस
  • एसआईजी संघबद्ध
  • एक्स-साइलो में फ्री-राइडिंग और डेटा पॉइज़निंग की चर्चा, लिंक्डइन के नेतृत्व में चर्चा (लिंक्डइन द्वारा पहचाने गए उपयोग के मामलों से संदर्भ जब तक कि अन्यथा निर्दिष्ट न हो):
    • मुफ्त सवारी - कुछ किरायेदार समूह में योगदान नहीं दे रहे हैं, इसलिए लाभ कम कर रहे हैं
      • जानबूझकर या अनजाने में हो सकता है
      • इस बिंदु पर अनजाने में ध्यान केंद्रित करें - यही वह मामला है जिसमें हम मुख्य रूप से लिंक्डइन में रुचि रखते हैं
      • एक प्रतिभागी के रूप में सरल हो सकता है जिसके पास पर्याप्त डेटा नहीं है, या डेटा जो प्रशिक्षण में उपयोगी नहीं है
        • वर्तमान में इसे एक विसंगति का पता लगाने की समस्या के रूप में मॉडलिंग करने के बारे में सोच रहे हैं
        • बहुसंख्यक योगदान के खिलाफ तुलना करना काम करता है अगर यह डेटा के अल्पसंख्यक के लिए इक्का है
        • एक अन्य दृष्टिकोण: किसी दिए गए प्रतिभागी के योगदान के साथ या उसके बिना निर्मित कई फ़ेडरेटेड मॉडल; देखें कि कौन प्रगति करता है, और उसके आधार पर प्रतिभागियों को बाहर करें
      • कुछ फ्रीराइडर्स कचरा डेटा का योगदान दे सकते हैं
        • विसंगति का पता लगाने के रूप में मॉडल के लिए कठिन
        • ऊपर के समान दृष्टिकोण
    • विषाक्तता
      • इसी तरह, जानबूझकर हो सकता है या नहीं
      • अनजाने पर ध्यान दें - बड़े किरायेदार समूह को अभिभूत कर सकते हैं और मॉडल को उनके योगदान के प्रति पूर्वाग्रहित कर सकते हैं
      • रुचि के परिदृश्यों के लिए, यह फ्रीराइडर समस्या के समान है
      • वितरित बीजान्टिन प्रशिक्षण में प्रासंगिक तकनीक
        • उदाहरण के लिए, औसत के बजाय, जहर के खिलाफ कुछ मजबूती जोड़ने के लिए एक माध्यिका को अपना सकता है
    • क्या हम इन समस्याओं को कहीं और होते हुए देखते हैं, क्या यह इस तरह के तर्क को पारिस्थितिकी तंत्र में योगदान देने लायक है?
      • हाँ! प्रतिकूल सेटिंग्स में देखने के लिए सामान्य समस्याएं, जहां साइलो हितों को संरेखित नहीं किया जा सकता है (योगदान की गणना लागत और संसाधनों की आवश्यकता होती है)
    • हम फ्रीलोडिंग या विषाक्तता के प्रभाव को कैसे माप सकते हैं?
      • प्रति योगदान बनाम कुल मिलाकर - ऊपर के विचार बाद की ओर इशारा करते हैं
    • अवलोकन: टीएफएफ की विशेषताओं में से एक पैरामीटर योग्य और स्टेटफुल एग्रीगेशन है जो अपनी आंतरिक स्थिति को बनाए रख सकता है और उस स्थिति को अपडेट कर सकता है जैसे वे एकत्रित होते हैं।
    • ट्रेडऑफ़ पर थोगुट्स और अन्य लक्ष्यों के साथ तालमेल (जैसे, डीपी)
      • डीपी निश्चित रूप से विषाक्तता में मदद कर सकता है
      • फ्रीलोडिंग के संदर्भ में डीपी के बारे में प्रश्न - अभी भी एक खुला प्रश्न
    • हमने पाया कि डेटा पॉइज़निंग हमलों का नगण्य प्रभाव हो सकता है
      • उदाहरण के लिए, देखें https://arxiv.org/pdf/2108.10241.pdf
      • प्रभाव के परिमाण की परवाह किए बिना क्रॉस-साइलो FL प्लेटफॉर्म के एक भाग के रूप में ऐसी सुविधा प्रदान करना महत्वपूर्ण है
  • लिंक्डइन से आगामी TFF पारिस्थितिकी तंत्र में जोड़ने के लिए उपरोक्त पर अधिक विवरण और घटकों के प्रस्तावों के साथ विचारों के साथ लिखें
  • डिस्कॉर्ड पर और चर्चा देखें
  • 2 सप्ताह में अगली बैठक