Catatan dari pertemuan kolaborator TFF 7/28/2022

  • Orang baru
  • Mari kita semua berada di server Discord untuk memfasilitasi percakapan secara interaktif
    • Ping Krzys untuk menjadi Kontributor untuk dapat memposting
  • Federasi SIG
  • Diskusi tumpangan gratis dan keracunan data di x-silo, diskusi yang dipimpin oleh LinkedIn (konteks dari kasus penggunaan yang diidentifikasi oleh LinkedIn kecuali ditentukan lain):
    • Berkendara gratis - penyewa tertentu tidak berkontribusi pada grup, sehingga mengurangi manfaat
      • Bisa disengaja atau tidak disengaja
      • Fokus pada yang tidak disengaja pada titik ini - inilah kasus yang kami minati di LinkedIn terutama
      • Bisa sederhana seperti peserta tidak memiliki data yang cukup, atau data yang tidak berguna dalam pelatihan
        • Saat ini memikirkan pemodelan ini sebagai masalah deteksi anomali
        • Membandingkan dengan kontribusi mayoritas berfungsi jika itu untuk minoritas data
        • Pendekatan lain: beberapa model federasi, dibangun dengan atau tanpa kontribusi dari peserta tertentu; amati mana yang membuat kemajuan, dan kecualikan peserta berdasarkan itu
      • Beberapa freerider dapat menyumbangkan data sampah
        • Lebih sulit untuk dimodelkan sebagai deteksi anomali
        • Pendekatan yang sama seperti di atas
    • Peracunan
      • Demikian juga, bisa disengaja atau tidak
      • Fokus pada yang tidak disengaja - penyewa yang lebih besar dapat membanjiri grup dan membuat model bias terhadap kontribusi mereka
      • Untuk skenario yang menarik, ini memiliki kesamaan dengan masalah freerider
      • Teknik yang relevan dalam pelatihan Bizantium terdistribusi
        • Misalnya, alih-alih rata-rata, dapat mengadopsi median untuk menambah ketahanan terhadap keracunan
    • Apakah kita melihat masalah ini terjadi di tempat lain, apakah logika seperti itu layak untuk disumbangkan ke ekosistem?
      • Ya! Masalah umum untuk dilihat dalam pengaturan permusuhan, di mana kepentingan silo mungkin tidak selaras (kontribusi menimbulkan biaya komputasi dan membutuhkan sumber daya)
    • Bagaimana kita bisa mengukur dampak dari freeloading atau keracunan?
      • Per kontribusi vs. agregat - ide di atas mengarah ke yang terakhir
    • Pengamatan: salah satu fitur TFF adalah agregasi yang dapat diparameterisasi dan stateful yang dapat mempertahankan status internal mereka sendiri dan memperbarui status itu saat mereka berkumpul.
    • Pemikiran tentang pengorbanan dan sinergi dengan tujuan lain (misalnya, DP)
      • DP pasti bisa membantu keracunan
      • Pertanyaan tentang DP dalam konteks freloading - masih menjadi pertanyaan terbuka
    • Kami menemukan serangan keracunan data dapat memiliki dampak yang dapat diabaikan
  • Tulis ide dengan detail lebih lanjut di atas dan proposal untuk komponen untuk ditambahkan ke ekosistem TFF dari LinkedIn yang akan datang
  • Lihat lebih banyak diskusi tentang Discord
  • Pertemuan berikutnya dalam 2 minggu