Jakie jest najlepsze przybliżenie dla większości głosów?

18

Większość operacji głosowania pojawia się dość często w tolerancji na uszkodzenia (i bez wątpienia w innych miejscach), gdzie funkcja generuje bit równy, która zawsze pojawia się najczęściej w wartości bitów wejściowych. Dla uproszczenia załóżmy, że ilekroć wejście zawiera taką samą liczbę bitów w stanie 0 i stanie 1, wyprowadza 0.

Można to uogólnić na dits, dla których istnieją więcej niż 2 możliwości dla każdego wejścia, zwracając wartość, która występuje najczęściej na wejściu, aw przypadku remisu, zwracając najczęstszą wartość, która pojawia się najpierw leksykograficznie. Nazwijmy tę funkcję „głosowaniem pluralnym”.

Interesuje mnie wyjście takiej funkcji, gdy każde wejście ma ustalony rozkład prawdopodobieństwa (a rozkład jest taki sam dla każdego wejścia na wejściu). Szczególnie zależy mi na następującym pytaniu.

Dla danego zbioru , jeżeli ustalone jest niezależnie losowo N razy, z prawdopodobieństwem p i doboru ı t h element S każdorazowo przez ustalony wyboru V , co jest prawdopodobieństwo, że głos wiele z tych wyjść S v ?S={S1,S2,...,Sn}NpiithSvSv

Teraz łatwo jest obliczyć dokładną odpowiedź na powyższe pytanie jako sumę rozkładów wielomianowych. Jednak dla moich celów jest to mniej niż idealne, a zamknięcie dla przybliżenia byłoby lepsze. Więc moje pytanie brzmi:

Jakie przybliżone przybliżenie do powyższego prawdopodobieństwa ma największy związek z maksymalną odległością od dokładnej wartości?

Joe Fitzsimons
źródło
Nie wiem, ale sugerowałbym szukaną frazę „konsensus teorii sterowania” lub „problem konsensusu teorii sterowania”. Jest to problem inny niż problem konsensusu w zakresie przetwarzania rozproszonego i może być tym, czego potrzebujesz.
Aaron Sterling
Czy szukasz przybliżenia, które działa dobrze, gdy N jest duże w porównaniu do n? Jeśli tak, zasada rozstrzygania remisów musi być nieistotna.
Tsuyoshi Ito,
@TsuyoshiIto: Tak, i rzeczywiście ta zasada jest nieistotna, ale chciałem się upewnić, że pytanie jest dobrze postawione. Naprawdę nie dbam o to, jak zerwane są więzi, ponieważ łatwo jest powiązać tę rozbieżność.
Joe Fitzsimons,
1
Cóż, tutaj jest z tyłu szacunków koperty ... Niech jest kilka razy wybrać zestaw S ja . Jest to zmienna dwumianowa. Udawaj, że są niezależni. Teraz, dla stałej wartości Y v , możesz obliczyć prawdopodobieństwo uzyskania tej wartości Y v , a dla tej wartości obliczyć prawdopodobieństwo, że wygra ona dla wszystkich innych zmiennych. To powinno dać całkiem dobre granice prawdopodobieństwa. Oczywiście nie są one najściślejsze - im większa zależność, którą chcesz wziąć pod uwagę, tym dokładniejsze będzie twoje oszacowanie, ale im więcej będziesz musiał wykonać obliczeń. YjaS.jaYvYv
Sariel Har-Peled

Odpowiedzi:

1

Jeśli dla wszystkich i v , topv>pjajav

P.r[wynik jest inny niż v]minT.(P.r[b(N.,pv)T.]+P.r[javb(N.,pja)T.]),

gdzie jest rozkładem dwumianowym, a T jest arbitralnym progiem. Podłączanie T = N ( p v + max i vb(n,p)T. i używając granic Chernoffa, można przekroczyć to prawdopodobieństwo jako e - Ω ( N ) .T.=N.(pv+maxjavpv)/2)mi-Ω(N.)

Oczywiście, jeśli nie jest maksymalne, otrzymasz odwrotny obraz. Z ogromnym prawdopodobieństwem v nie jest wynikiem.pvv

ilyaraz
źródło
1
Dzięki za przemyślenie problemu, ale nie tego szukam. To nie jest zamknięta forma. Musiałbym zsumować ponad nieograniczoną liczbę wykładniczych. Wiem już, jak napisać dokładne rozwiązanie i znam wiele przybliżeń dla poszczególnych terminów, ale nie tego chcę. Szukam zbliżonego formularza do rozwiązania, a nie do poszczególnych warunków. Potrzebuję też przyzwoitego ograniczenia błędu.
Joe Fitzsimons,
1
Możesz uzyskać zamknięty formularz przy użyciu tej samej metody (jeśli jesteś zadowolony z dodatkowego czynnika ). Aby ograniczyć błąd, możesz użyć twierdzenia Berry'ego-Eseena zamiast ograniczenia Chernoffa. n
ilyaraz
@ilyaraz Próbuję zrozumieć twoje pierwsze zejście. Czy możesz mi wyjaśnić, dlaczego tak się dzieje? Myślę, że w jakiś sposób wykorzystaliście związki, ale nie rozumiem. Dzięki :)
AntonioFa