Czytałem tę książkę dla mojej klasy, Randomized Algorytmy. W tej książce znajduje się cała sekcja poświęcona znalezieniu mediany tablicy za pomocą losowego wyboru, co prowadzi do bardziej wydajnego algorytmu. Teraz chciałem wiedzieć, czy istnieją jakieś praktyczne zastosowania tego algorytmu w dziedzinie informatyki, oprócz teoretycznej poprawy. Czy są jakieś algorytmy lub struktury danych, które muszą znaleźć medianę tablicy?
runtime-analysis
randomized-algorithms
Sharan Duggirala
źródło
źródło
Odpowiedzi:
Zastosowanie tego algorytmu jest trywialne - używasz go, gdy chcesz obliczyć medianę zbioru danych (innymi słowy tablica). Dane te mogą pochodzić z różnych dziedzin: obserwacje astronomiczne, nauki społeczne, dane biologiczne itp.
Warto jednak wspomnieć, kiedy należy preferować medianę (lub tryb). Zasadniczo, w statystykach opisowych, gdy nasze dane są całkowicie normalnie rozłożone, wówczas średnia, tryb i mediana są równe, tzn. Pokrywają się. Z drugiej strony, gdy nasze dane są przekrzywione, tj. Rozkład częstotliwości dla naszych danych jest (skręcony w lewo / w prawo), średnia nie zapewnia najlepszej centralnej lokalizacji, ponieważ skośność odciąga ją od typowej wartości w lewo lub w prawo , podczas gdy skośne dane nie mają tak silnego wpływu na medianę, dlatego najlepiej zachować tę pozycję wskazując na typową wartość. Dlatego obliczenie mediany może być preferowane w przypadku wypaczonych danych.
Ponadto, uczenie maszynowe, gdzie są mocno wykorzystywane metody statystyczne, na przykład -medians klastrówk .
źródło
Mediana filtrowania jest powszechna w redukcji niektórych rodzajów szumów podczas przetwarzania obrazu. Szczególnie hałas solny i pieprzowy. Działa poprzez wybranie wartości mediany w każdym kanale kolorów w każdym lokalnym sąsiedztwie obrazu i zastąpienie go nią. Jak duże są te dzielnice, mogą się różnić. Popularne rozmiary filtrów (dzielnice) to na przykład 3x3 i 5x5 pikseli.
źródło
Obliczanie median jest szczególnie ważne w algorytmach losowych.
Dość często mamy algorytm aproksymacyjny, który przynajmniej z prawdopodobieństwem34 1±ϵ A 34 k A(1±ϵ) k A(1−ϵ) A(1+ϵ) k
źródło
The Mediana median ma pewne wnioski:
źródło