Obecnie piszę algorytm różnicowej prywatności za pomocą mechanizmu Laplace'a.
Niestety nie mam doświadczenia w statystyce, dlatego wiele terminów jest mi nieznanych. Więc teraz potykam się o termin: hałas Laplace'a . Aby ustawić różnicowanie zbioru danych jako prywatne, wszystkie artykuły mówią tylko o dodaniu szumu Laplace'a zgodnie z rozkładem Laplace'a do wartości funkcji.
(k jest różnicową wartością prywatną, f zwróconą wartością przez funkcję oceny, a Y hałasem Laplace'a)
Czy to oznacza, że tworzę losowe zmienne z rozkładu Laplace'a zgodnie z tą funkcją, którą mam z wikipedii https://en.wikipedia.org/wiki/Laplace_distribution ?
AKTUALIZACJA: Narysowałem do 100 losowych zmiennych narysowanych z powyższej funkcji, ale to nie daje mi rozkładu Laplace'a (nawet bliskiego). Ale myślę, że powinien modelować rozkład Laplace'a.
AKTUALIZACJA 2:
Oto moje definicje:
(Mechanizm Laplace'a). Biorąc pod uwagę dowolną funkcję , mechanizm Laplace'a jest zdefiniowany jako: gdzie Y są zmiennymi losowymi iid pochodzącymi z
Jak również:
Aby wygenerować Y (X), powszechnym wyborem jest użycie rozkładu Laplace'a ze średnią zero i parametrem skali Δ (f) / ε
Odpowiedzi:
Masz rację, dodanie szumu Laplace'a oznacza, że do zmiennej dodajesz zmienną która podąża za rozkładem Laplace'a . Istnieje wiele powodów, dla których nazywa się to hałasem . Najpierw pomyśl o przetwarzaniu sygnału, w którym wiadomość jest wysyłana przez jakiś kanał, a ze względu na niedoskonały charakter kanału odbierany sygnał jest zaszumiony, więc musisz odizolować sygnał od szumu. Po drugie, w kryptografii mówimy również o hałasie pseudolosowym, a prywatność różnicowa jest związana z kryptografią. Po trzecie, w statystyce i uczeniu maszynowym możemy również mówić o szumie statystycznym, modele statystyczne obejmują terminy hałasu lub błędów itp. (Jest nawet książka o prognozowaniu nazwX Y Sygnał i hałas Nate Silver). Używamy więc hałasu jako dokładniejszego synonimu niejednoznaczności losowości .
Jeśli chodzi o generowanie losowe, istnieje wiele sposobów rysowania wartości losowych po rozkładzie Laplace'a, na przykład:
Na poniższych wykresach widać rozkład próbek narysowanych przy użyciu każdej funkcji z towarzyszącą gęstością Laplace'a (czerwona linia).105
Aby uprościć przykłady, używam standardowego rozkładu Laplace'a ze skalą = 1, ale można łatwo zmienić wyniki, mnożąc wyniki przy użyciu innego współczynnika skalowania.
źródło
Rozkład Laplace'a lub podwójny wykładniczy spada wykładniczo w lewo i prawo wokół jakiejś średniej. Zasadniczo jest to wykładniczy odbicie w drugiej stronie.
Jeśli chcesz mieć prawdopodobieństwo, użyj prawdopodobieństwa wykładniczego i dodaj abs () do obserwowanej wartości. Prawdopodobieństwo dziennika jest po prostu abs () reszt, pomnożone przez współczynnik wykładniczy.
Aby próbkować, najłatwiej jest narysować z -1,1 i pomnożyć przez losowanie z rozkładu wykładniczego, który jest dostępny w większości języków programowania. Alternatywnie, jak wspomniano powyżej, znajdziesz także bezpośrednie implementacje Laplace'a, ale może to wymagać nieco więcej wyszukiwania.
źródło