Dlaczego RANSAC nie jest najczęściej stosowany w statystykach?

26

Pochodząc z pola widzenia komputerowego, często stosowałem metodę RANSAC (Random Sample Consensus) do dopasowywania modeli do danych z wieloma wartościami odstającymi.

Jednak nigdy nie widziałem, aby używali go statystycy i zawsze miałem wrażenie, że nie była uważana za metodę „statystycznie solidną”. Dlaczego to jest takie? Ma charakter losowy, co utrudnia analizę, ale podobnie jak metody ładowania początkowego.

A może po prostu przypadek silosów akademickich nie rozmawia ze sobą?

Bossykena
źródło
1
Zastanawiam się nad jedną rzeczą w komputerowych metodach widzenia a metodami statystycznymi: wydajność w pierwszym jest koniecznością. Może istnieje kompromis między wydajnością a „poprawnością”, a wizja komputerowa i statystyki mają różne wagi dla tych zmiennych.
Lucas Reis,

Odpowiedzi:

10

Myślę, że kluczem jest tutaj odrzucenie dużej części danych w RANSAC.

W większości zastosowań statystycznych niektóre rozkłady mogą mieć ciężkie ogony, a zatem małe liczby próbek mogą zniekształcać estymację statystyczną. Solidne estymatory rozwiązują to poprzez inne ważenie danych. Z drugiej strony RANSAC nie podejmuje prób uwzględnienia wartości odstających, jest zbudowany dla przypadków, w których punkty danych naprawdę nie należą, a nie tylko nietypowo rozmieszczone.

nbubis
źródło
1
Świetna odpowiedź. Widziałem RANSAC najczęściej używany w CV do szacowania homografii. Jest to najczęściej stosowane, gdy wiemy, że niektóre z odpowiednich pomiarów są bardzo niewiarygodne. Również wydajność w czasie rzeczywistym i inne względy sprawiły, że technika ta stała się dość popularna, ponieważ można ją łatwo sparaliżować.
Luca,
7

Dla nas jest to tylko jeden przykład solidnej regresji - uważam, że jest ona również stosowana przez statystyków, ale może nie jest tak szeroka, ponieważ ma kilka lepiej znanych alternatyw.


źródło
1
Czy możesz podać przykłady alternatyw? Chciałbym się temu przyjrzeć.
Bossykena
5
Najbardziej znanym i najprostszym jest regresja Mediana-Mediana, dobrze znana z inteligentnych kalkulatorów (Westchnienie!). Skonsultuj się również z Wikipedią en.wikipedia.org/wiki/Robust_regression i być może Solidny widok CRAN cran.r-project.org/web/views/Robust.html
Czy istnieją alternatywy dla RANSAC, które dają nie tylko obiektywną regresję, ale także punkty danych, na podstawie których model został oszacowany? Dzięki
Valerio
2

To brzmi jak bagging, który jest często stosowaną techniką.

Zach
źródło
3
RANSAC jest zupełnie inny - w pakowaniu wszystkie próbki są w jakiś sposób brane pod uwagę. RANSAC stosuje się w przypadkach, gdy do 50% danych powinno zostać całkowicie odrzuconych.
nbubis
1

Wyrzucasz dane za pomocą RANSAC, potencjalnie bez uzasadnienia, ale w oparciu o zwiększenie dopasowania modelu. Wyrzucanie danych w celu zwiększenia dopasowania jest zwykle unikane, ponieważ możesz stracić ważne dane. Usuwanie wartości odstających bez uzasadnienia zawsze stanowi problem.

Oczywiście można to uzasadnić. Np. Jeśli wiesz, że dane powinny być zgodne z danym wzorcem, ale istnieje również odchylenie w danych od wzorca z powodu błędu w pomiarach.

NegativeFeedbackLoop
źródło