Aprenda o que há de mais recente em aprendizado de máquina, IA generativa e muito mais no WiML Symposium 2023 Registre-se

Esta página foi traduzida pela API Cloud Translation.

Notas da reunião de 28/07/2022 dos colaboradores do TFF

Novas pessoas
Vamos todos estar no servidor Discord para facilitar as conversas de forma interativa
- Ping Krzys para se tornar um Contribuidor para poder postar
SIG Federado
Discussão sobre carona e envenenamento de dados no x-silo, discussão liderada pelo LinkedIn (contexto de casos de uso identificados pelo LinkedIn, salvo especificação em contrário):
- Freeriding - certos inquilinos não contribuem para o grupo, diluindo o benefício
  - Pode ser intencional ou não intencional
  - Concentre-se no não intencional neste momento - este é o caso em que estamos interessados principalmente no LinkedIn
  - Pode ser simples como um participante não ter dados suficientes ou dados que não são úteis no treinamento
    - Atualmente pensando em modelar isso como um problema de detecção de anomalias
    - Comparar com a contribuição majoritária funciona se for a mesma coisa para a minoria dos dados
    - Outra abordagem: múltiplos modelos federados, construídos com ou sem contribuições de um determinado participante; observar quais progridem e excluir participantes com base nisso
  - Alguns freeriders podem estar contribuindo com dados de lixo
    - Mais difícil de modelar como detecção de anomalias
    - Mesma abordagem acima
- Envenenamento
  - Da mesma forma, pode ser intencional ou não
  - Concentre-se no não intencional - inquilinos maiores podem sobrecarregar o grupo e influenciar o modelo em suas contribuições
  - Para cenários de interesse, isso tem semelhanças com o problema do freerider
  - Técnicas relevantes no treinamento bizantino distribuído
    - Por exemplo, em vez da média, poderia adotar uma mediana para adicionar alguma robustez contra envenenamento
- Vemos esses problemas ocorrendo em outros lugares, vale a pena contribuir com essa lógica para o ecossistema?
  - Sim! Problemas comuns a serem observados em ambientes adversários, onde os interesses dos silos podem não estar alinhados (as contribuições incorrem em custos de computação e exigem recursos)
- Como podemos medir o impacto do freeloading ou envenenamento?
  - Por contribuição vs. agregado - as ideias acima apontam para o último
- Observação: uma das características do TFF são agregações parametrizáveis e com estado que podem manter seu próprio estado interno e atualizar esse estado à medida que agregam.
  - Por exemplo federated_aggregate
- Considerações sobre as compensações e sinergias com outros objetivos (por exemplo, DP)
  - DP pode definitivamente ajudar com envenenamento
  - Pergunta sobre DP no contetx de freloading - ainda uma pergunta em aberto
- Descobrimos que ataques de envenenamento de dados podem ter um impacto insignificante
  - Por exemplo, consulte https://arxiv.org/pdf/2108.10241.pdf
  - Importante fornecer esse recurso como parte de uma plataforma FL entre silos, independentemente da magnitude do impacto
Escreva com ideias com mais detalhes sobre os itens acima e propostas de componentes para adicionar ao ecossistema TFF do LinkedIn em breve
Veja mais discussão no Discord
Próxima reunião em 2 semanas