Ghi chú từ cuộc họp ngày 28/7/2022 của các cộng tác viên TFF

  • Người mới
  • Tất cả hãy ở trên máy chủ Discord để tạo điều kiện cho các cuộc trò chuyện tương tác
    • Ping Krzys trở thành Cộng tác viên để có thể đăng bài
  • SIG được liên kết
  • Thảo luận về việc sử dụng tự do và nhiễm độc dữ liệu trong x-silo, thảo luận do LinkedIn dẫn dắt (bối cảnh từ các trường hợp sử dụng được LinkedIn xác định trừ khi được chỉ định khác):
    • Đi xe miễn phí - một số người thuê nhất định không đóng góp cho nhóm, do đó làm giảm lợi ích
      • Có thể là cố ý hoặc vô ý
      • Tập trung vào điều không chủ ý tại thời điểm này - đây là trường hợp chúng tôi quan tâm chủ yếu đến LinkedIn
      • Có thể đơn giản là người tham gia không có đủ dữ liệu hoặc dữ liệu không hữu ích trong đào tạo
        • Hiện đang nghĩ đến việc lập mô hình này như một vấn đề phát hiện bất thường
        • So sánh với mâu thuẫn đa số hoạt động nếu đó là cách dành cho thiểu số dữ liệu
        • Một cách tiếp cận khác: nhiều mô hình liên hợp, được xây dựng có hoặc không có sự đóng góp của một người tham gia nhất định; quan sát những người nào đạt được tiến bộ và loại trừ những người tham gia dựa trên điều đó
      • Một số tủ lạnh có thể đang đóng góp dữ liệu rác
        • Khó mô hình hóa hơn như là phát hiện bất thường
        • Cách tiếp cận tương tự như trên
    • Đầu độc
      • Tương tự, có thể là cố ý hoặc không
      • Tập trung vào những người không chủ ý - những người thuê lớn hơn có thể áp đảo nhóm và thiên vị mô hình đối với những đóng góp của họ
      • Đối với các tình huống quan tâm, điều này có điểm tương đồng với vấn đề người đóng băng
      • Các kỹ thuật liên quan trong đào tạo byzantine phân phối
        • Ví dụ: thay vì mức trung bình, có thể áp dụng mức trung bình để thêm một số khả năng chống ngộ độc
    • Chúng ta có thấy những vấn đề này đang xảy ra ở những nơi khác, nó có đáng đóng góp logic như vậy cho hệ sinh thái không?
      • Đúng! Các vấn đề thường gặp trong cài đặt đối đầu, nơi lợi ích của silo có thể không đồng nhất (đóng góp phát sinh chi phí tính toán và yêu cầu tài nguyên)
    • Làm thế nào chúng ta có thể đo lường tác động của việc chạy tự do hoặc nhiễm độc?
      • Mỗi đóng góp so với tổng hợp - các ý tưởng ở trên chỉ đến phần sau
    • Quan sát: một trong những tính năng của TFF là tổng hợp trạng thái và có thể tham số hóa có thể duy trì trạng thái bên trong của chính chúng và cập nhật trạng thái đó khi chúng tổng hợp lại.
    • Thoguhts về sự cân bằng và hiệp lực với các mục tiêu khác (ví dụ: DP)
      • DP chắc chắn có thể giúp giải độc
      • Câu hỏi về DP trong bối cảnh tải tự do - vẫn là một câu hỏi mở
    • Chúng tôi nhận thấy các cuộc tấn công làm nhiễm độc dữ liệu có thể có tác động không đáng kể
      • Ví dụ: xem https://arxiv.org/pdf/2108.10241.pdf
      • Điều quan trọng là cung cấp một tính năng như một phần của nền tảng cros-silo FL bất kể mức độ tác động như thế nào
  • Viết lên ý tưởng với các chi tiết ở trên và đề xuất cho các thành phần để thêm vào hệ sinh thái TFF từ LinkedIn sắp tới
  • Xem thêm thảo luận về Discord
  • Cuộc họp tiếp theo sau 2 tuần