Notas da reunião de 28/07/2022 dos colaboradores do TFF

  • Novas pessoas
  • Vamos todos estar no servidor Discord para facilitar as conversas de forma interativa
    • Ping Krzys para se tornar um Contribuidor para poder postar
  • SIG Federado
  • Discussão sobre carona e envenenamento de dados no x-silo, discussão liderada pelo LinkedIn (contexto de casos de uso identificados pelo LinkedIn, salvo especificação em contrário):
    • Freeriding - certos inquilinos não contribuem para o grupo, diluindo o benefício
      • Pode ser intencional ou não intencional
      • Concentre-se no não intencional neste momento - este é o caso em que estamos interessados ​​principalmente no LinkedIn
      • Pode ser simples como um participante não ter dados suficientes ou dados que não são úteis no treinamento
        • Atualmente pensando em modelar isso como um problema de detecção de anomalias
        • Comparar com a contribuição majoritária funciona se for a mesma coisa para a minoria dos dados
        • Outra abordagem: múltiplos modelos federados, construídos com ou sem contribuições de um determinado participante; observar quais progridem e excluir participantes com base nisso
      • Alguns freeriders podem estar contribuindo com dados de lixo
        • Mais difícil de modelar como detecção de anomalias
        • Mesma abordagem acima
    • Envenenamento
      • Da mesma forma, pode ser intencional ou não
      • Concentre-se no não intencional - inquilinos maiores podem sobrecarregar o grupo e influenciar o modelo em suas contribuições
      • Para cenários de interesse, isso tem semelhanças com o problema do freerider
      • Técnicas relevantes no treinamento bizantino distribuído
        • Por exemplo, em vez da média, poderia adotar uma mediana para adicionar alguma robustez contra envenenamento
    • Vemos esses problemas ocorrendo em outros lugares, vale a pena contribuir com essa lógica para o ecossistema?
      • Sim! Problemas comuns a serem observados em ambientes adversários, onde os interesses dos silos podem não estar alinhados (as contribuições incorrem em custos de computação e exigem recursos)
    • Como podemos medir o impacto do freeloading ou envenenamento?
      • Por contribuição vs. agregado - as ideias acima apontam para o último
    • Observação: uma das características do TFF são agregações parametrizáveis ​​e com estado que podem manter seu próprio estado interno e atualizar esse estado à medida que agregam.
    • Considerações sobre as compensações e sinergias com outros objetivos (por exemplo, DP)
      • DP pode definitivamente ajudar com envenenamento
      • Pergunta sobre DP no contetx de freloading - ainda uma pergunta em aberto
    • Descobrimos que ataques de envenenamento de dados podem ter um impacto insignificante
  • Escreva com ideias com mais detalhes sobre os itens acima e propostas de componentes para adicionar ao ecossistema TFF do LinkedIn em breve
  • Veja mais discussão no Discord
  • Próxima reunião em 2 semanas