Przegląd

MinDiff to technika korygowania modelu, która ma na celu wyrównanie dwóch rozkładów. W praktyce można go wykorzystać do zrównoważenia poziomów błędów w różnych wycinkach danych poprzez karanie różnic w dystrybucji.

Zwykle stosuje się MinDiff, próbując zapewnić uczciwość grupy, na przykład minimalizując różnicę w współczynniku wyników fałszywie dodatnich (FPR) lub współczynniku fałszywie ujemnych (FNR) między wycinkiem danych należącym do wrażliwej klasy a wycinkiem o lepszej wydajności. Aby uzyskać szczegółowe omówienie wskaźników sprawiedliwości, przejrzyj literaturę na ten temat. 1 2 3

Jak działa MinDiff?

Biorąc pod uwagę dwa zestawy przykładów z naszego zbioru danych, MinDiff karze model podczas szkolenia za różnice w rozkładzie wyników pomiędzy dwoma zestawami. Im mniej można rozróżnić te dwa zestawy na podstawie wyników przewidywań, tym mniejsza kara zostanie zastosowana.

Kara jest nakładana poprzez dodanie składnika do straty, której model używa do szkolenia. Można to traktować jako miarę różnicy w rozkładzie przewidywań modelu. W miarę uczenia się modelu stara się zminimalizować karę, zbliżając do siebie rozkłady, jak pokazano na poniższych wykresach.

Wykres porównawczy MinDiff

Zastosowanie MinDiff może wiązać się z kompromisami w zakresie wydajności pierwotnego zadania. MinDiff może być skuteczny, nie pogarszając wydajności wykraczającej poza potrzeby produktu, ale decyzja o zrównoważeniu wydajności i efektywności MinDiff powinna zostać podjęta świadomie przez właściciela produktu. Przykłady pokazujące, jak wdrożyć MinDiff, można znaleźć w notesie ze studium przypadku dotyczącym korygowania modelu .

Zasoby


  1. Dwork, C., Hardt, M., Pitassi, T., Reingold, O., Zemel, R. (2011). Uczciwość poprzez świadomość.

  2. Hardt, M., Price, E., Srebro, N. (2016). Równość szans w uczeniu się pod nadzorem.

  3. Chouldechova, A. (2016). Uczciwe przewidywanie o różnym wpływie: badanie stronniczości w instrumentach przewidywania recydywy.