Chciałbym poznać lub mieć referencje na temat procesu analizy, który większość analityków danych statystycznych przechodzi przez każdy projekt analizy danych.
Jeśli utworzę „listę”, aby ukończyć projekt analizy danych, analityk musi:
- najpierw zbieraj wymagania dla projektu,
- wcześniej zaplanować / zaprojektować analizę danych w oparciu o te wymagania
- faktycznie wstępnie przetwarzają dane,
- przeprowadzanie analizy danych i
- napisanie raportu na podstawie wyników jego analizy.
W przypadku tego pytania interesują mnie bardziej szczegółowe informacje na temat kroku 2. Ale rozumiem, że nie jest to praktycznie jasne, ponieważ analityk może zmienić swój plan lub projekt zgodnie z wynikami analizy danych. Czy jest jakieś odniesienie na ten temat?
źródło
Uważam, że przepływ pracy z analizą danych przy użyciu Staty jest dobrą książką, szczególnie (ale nie tylko) jako użytkownik Staty. Znalazłem wiele, z którymi się nie zgadzam, ale nawet to pomogło wyjaśnić, dlaczego robię pewne rzeczy w określony sposób.
źródło
CRISP-DM , wymyślony przez firmę SPSS (obecnie należy do IBM) jest akronimem dla procesu eksploracji danych, który jest taki sam jak dla „analizy danych”. SAS ma podobny proces o nazwie SEMMA .
źródło