Czy istnieją różnice w bayesowskim i częstym podejściu do EDA?

14

Mówiąc najprościej: czy są jakieś różnice w podejściu Bayesa i Frequentist do analizy danych eksploracyjnych?

Nie znam żadnych nieodłącznych uprzedzeń w metodach EDA, ponieważ histogram jest histogramem, wykres rozrzutu jest wykresem rozrzutu itp., Ani nie znalazłem przykładów różnic w sposobie nauczania lub prezentacji EDA (ignorując szczególnie teoretyczny artykuł A. Gelmana) . Wreszcie spojrzałem na CRAN, arbiter wszystkich zastosowanych rzeczy: nie znalazłem pakietów dostosowanych do podejścia bayesowskiego. Pomyślałem jednak, że CV może mieć kilka osób, które mogłyby rzucić na to światło.

Dlaczego powinny istnieć różnice?

Dla początkujących:

  1. Czy podczas identyfikowania odpowiednich wcześniejszych dystrybucji nie należy tego badać wizualnie?
  2. Czy podczas podsumowywania danych i sugerowania, czy należy zastosować model częsty czy bayesowski, EDA nie powinna sugerować, w którą stronę pójść?
  3. Te dwa podejścia mają bardzo wyraźne różnice w postępowaniu z modelami mieszanin. Zidentyfikowanie, że próbka prawdopodobnie pochodzi z mieszanki populacji, stanowi wyzwanie i jest bezpośrednio związane z metodologią zastosowaną do oszacowania parametrów mieszaniny.
  4. Oba podejścia obejmują modele stochastyczne, a wybór modelu zależy od zrozumienia danych. Bardziej złożone dane lub bardziej złożone modele wymagają więcej czasu w EDA. Przy takich różnicach między modelami stochastycznymi lub procesami generowania istnieją różnice w działaniach EDA, więc czy nie powinny istnieć różnice wynikające z różnych podejść stochastycznych?

Uwaga 1: Nie interesuję się filozofią „obozu” - chcę jedynie uzupełnić wszelkie luki w moim zestawie narzędzi i metodach EDA.

Iterator
źródło

Odpowiedzi:

17

Moim zdaniem Bayes vs. częsty dotyczy formalnego wnioskowania, a analiza danych eksploracyjnych też nie.

Oczywiście, jeśli chodzi o ocenę modelu / ocenę dopasowania i analizę wrażliwości, w której klasyfikowałbym twoje punkty (1), (3) i (4), będą istniały różnice w sposobie postępowania, ale dzieje się tak dlatego, że charakter różnic między metodami analizy a metodami obliczeniowymi nie dotyczy filozofii.

Jeśli chodzi o twoje (2), generalnie nie widzę, aby wyniki EDA wskazywały na podejście bayesowskie lub frekwencyjne, ale raczej sądzę, że to cel badania miał największe znaczenie.

Dla mnie osobiście EDA (plus głęboka introspekcja) skierowałoby mnie w stronę modelu, a gdybym mógł znaleźć naturalne podejście częstokroć, które odpowiadałoby na pytanie naukowe dość dobrze, wybrałbym to, ale z natury rzeczy , żadna metoda częstokroć nie zadziałałaby dobrze, a gdyby istniał rozsądny wcześniej, wybrałbym Bayesa.

Karl
źródło
(+1) Bardzo dobrze powiedziane - zwłaszcza „EDA (plus głęboka introspekcja) skieruje mnie w stronę modelu”
suncoolsu
+1 również. EDA tak naprawdę nie polega na wyborze perspektywy, ale na zrozumieniu danych w celu podejmowania bardziej świadomych decyzji.
Fomite
+1 Za dobrą odpowiedź. Niestety myślę, że pierwotne pytanie zostało źle zrozumiane. Nie pytałem o użycie EDA do wyboru między modelami bayesowskimi a częstymi. Muszę sprawdzić, jak to sformułowałem, jeśli wydaje się, że kilka osób ma takie samo nieporozumienie.
Iterator
@Iterator Rozumiem twoje główne pytanie: czy istnieją różnice między podejściami Bayesa i częstych do EDA? Moja odpowiedź na to brzmi: nie; EDA nie jest ani częsty, ani bayesowski.
Karl
3
Myślę, że moja definicja „eksploracyjnej analizy danych” jest bardziej zawężona niż twoja. Moim zdaniem wszystkie dobre analizy danych wymagają eksploracji. Tym, co wyróżnia „analizę danych eksploracyjnych”, jest brak modelu lub jakiekolwiek wysiłki w kierunku formalnego wnioskowania.
Karl
0

Myślę, że EDA pomaga zbudować model, poczynić pewne założenia i (w razie potrzeby) zaktualizować model i jego założenia. Wybieram pragmatyczne podejście do dopasowania i oceny modelu.

hbaghishani
źródło