Notatki ze spotkania współpracowników TFF w dniu 28.07.2022, Notatki ze spotkania współpracowników TFF w dniu 28.07.2022

  • Nowi ludzie
  • Bądźmy wszyscy na serwerze Discord, aby interaktywnie ułatwiać rozmowy
    • Poleć Krzysowi, aby został współtwórcą, aby móc publikować
  • Federacja SIG
  • Omówienie freeridingu i zatruwania danych w x-silo, dyskusja prowadzona przez LinkedIn (kontekst przypadków użycia zidentyfikowanych przez LinkedIn, o ile nie określono inaczej):
    • Free ride – niektórzy lokatorzy nie wnoszą wkładu do grupy, więc korzyść rozwadniająca
      • Może być zamierzone lub niezamierzone
      • Skup się na tym, co nieumyślne – to jest przypadek, który nas interesuje przede wszystkim na LinkedIn
      • Może to być proste, ponieważ uczestnik nie ma wystarczającej ilości danych lub dane, które nie są przydatne w szkoleniu
        • Obecnie myślimy o modelowaniu tego jako problemu z wykrywaniem anomalii
        • Porównanie z udziałem większości działa, jeśli chodzi o mniejszość danych
        • Inne podejście: wiele modeli sfederowanych, zbudowanych z udziałem lub bez wkładu danego uczestnika; obserwuj, które robią postępy i na tej podstawie wykluczaj uczestników
      • Niektórzy freeriderzy mogą dostarczać śmieciowe dane
        • Trudniej modelować jako wykrywanie anomalii
        • Takie samo podejście jak powyżej
    • Zatrucie
      • Podobnie może być zamierzone lub nie
      • Skoncentruj się na niezamierzonym działaniu — więksi najemcy mogą przytłoczyć grupę i nakierować model na swój wkład
      • W przypadku interesujących scenariuszy jest to podobne do problemu freeridera
      • Odpowiednie techniki w rozproszonym szkoleniu bizantyńskim
        • Np. zamiast średniej można przyjąć medianę, aby dodać trochę odporności na zatrucie
    • Czy widzimy, że te problemy występują gdzie indziej, czy warto wnosić taką logikę do ekosystemu?
      • TAk! Typowe problemy, które można zobaczyć w sytuacjach przeciwnych, gdzie interesy silosów mogą nie być wyrównane (wkłady wiążą się z kosztami obliczeń i wymagają zasobów)
    • Jak możemy zmierzyć wpływ wyładowania lub zatrucia?
      • Na wkład vs. łącznie – powyższe pomysły wskazują na to drugie
    • Obserwacja: jedną z funkcji TFF są parametryzowalne i stanowe agregacje, które mogą utrzymywać swój własny stan wewnętrzny i aktualizować ten stan podczas agregacji.
    • Myśli o kompromisach i synergii z innymi celami (np. DP)
      • DP zdecydowanie może pomóc w zatruciu
      • Pytanie o DP w kontekście freloadingu - wciąż otwarte pytanie
    • Odkryliśmy, że ataki zatruwania danymi mogą mieć znikomy wpływ
  • Napisz o pomysłach z bardziej szczegółowymi informacjami na temat powyższego i propozycjami komponentów do dodania do ekosystemu TFF z LinkedIn nadchodzącego
  • Zobacz więcej dyskusji na Discord
  • Następne spotkanie za 2 tygodnie