Mówiąc najprościej: czy są jakieś różnice w podejściu Bayesa i Frequentist do analizy danych eksploracyjnych?
Nie znam żadnych nieodłącznych uprzedzeń w metodach EDA, ponieważ histogram jest histogramem, wykres rozrzutu jest wykresem rozrzutu itp., Ani nie znalazłem przykładów różnic w sposobie nauczania lub prezentacji EDA (ignorując szczególnie teoretyczny artykuł A. Gelmana) . Wreszcie spojrzałem na CRAN, arbiter wszystkich zastosowanych rzeczy: nie znalazłem pakietów dostosowanych do podejścia bayesowskiego. Pomyślałem jednak, że CV może mieć kilka osób, które mogłyby rzucić na to światło.
Dlaczego powinny istnieć różnice?
Dla początkujących:
- Czy podczas identyfikowania odpowiednich wcześniejszych dystrybucji nie należy tego badać wizualnie?
- Czy podczas podsumowywania danych i sugerowania, czy należy zastosować model częsty czy bayesowski, EDA nie powinna sugerować, w którą stronę pójść?
- Te dwa podejścia mają bardzo wyraźne różnice w postępowaniu z modelami mieszanin. Zidentyfikowanie, że próbka prawdopodobnie pochodzi z mieszanki populacji, stanowi wyzwanie i jest bezpośrednio związane z metodologią zastosowaną do oszacowania parametrów mieszaniny.
- Oba podejścia obejmują modele stochastyczne, a wybór modelu zależy od zrozumienia danych. Bardziej złożone dane lub bardziej złożone modele wymagają więcej czasu w EDA. Przy takich różnicach między modelami stochastycznymi lub procesami generowania istnieją różnice w działaniach EDA, więc czy nie powinny istnieć różnice wynikające z różnych podejść stochastycznych?
Uwaga 1: Nie interesuję się filozofią „obozu” - chcę jedynie uzupełnić wszelkie luki w moim zestawie narzędzi i metodach EDA.
źródło
Myślę, że EDA pomaga zbudować model, poczynić pewne założenia i (w razie potrzeby) zaktualizować model i jego założenia. Wybieram pragmatyczne podejście do dopasowania i oceny modelu.
źródło