Zawsze mówimy, że statystyki dotyczą tylko danych. Ale wiemy również, że informatyka czerpie wiedzę z analizy danych. Na przykład ludzie bioinformatyki mogą całkowicie przejść bez biostatystyki. Chcę wiedzieć, jaka jest zasadnicza różnica między statystyką a informatyką.
bioinformatics
Honglang Wang
źródło
źródło
Odpowiedzi:
Doskonałe pytanie !!
Słyszałem kilka razy, że bioinformatycy mogą przejść bez biostatystyki, a nawet bez statystyk. To całkowicie prawda, dopóki nie stanie się fałszywe. Moim zdaniem ogólny brak wiedzy statystycznej ma katastrofalny wpływ w terenie, jak wykazał Keith Baggerly . Zauważyłem również, że brak podstawowej wiedzy statystycznej (i algebry liniowej) jest przyczyną stagnacji bioinformatyków na dłuższą metę: bez dogłębnej znajomości teorii mają tendencję do ponownego odkrywania koła i uciekania się do rozwiązań doraźnych , które rozwiązują tylko ich własny problem.
Ale teraz, aby odpowiedzieć na twoje pytanie, zgadzam się, że ogólnie rzecz biorąc, statystyki nie mogą obejść się bez komputerów w tych dniach. Jednak jednym z głównych aspektów statystyki jest wnioskowanie , które nie ma nic wspólnego z komputerami. Wnioskowanie statystyczne jest tak naprawdę tym, co sprawia, że statystyki stają się nauką, ponieważ mówią ci, czy twoje wnioski mogą się utrzymywać w innych kontekstach.
Krótko mówiąc, możesz analizować piekło na podstawie swoich danych, nadal będziesz potrzebować statystyk, aby poznać trafność prognoz lub decyzji, które podejmiesz na podstawie twoich analiz.
źródło
Moim zdaniem, chociaż pola nakładają się na siebie w znacznym stopniu, istnieją również kluczowe różnice. Ogólnie rzecz biorąc, student statystyki (w wyższych stopniach) podejmie więcej zajęć teoretycznych (matematyki i matematyki) niż student informatyki, ale student informatyki dowie się więcej o stronie obliczeniowej (szczególnie części bazy danych).
Opracowanie nowego testu statystycznego bardziej przypadłoby statystykowi niż informatykowi, ale zaprojektowanie interfejsu dla użytkownika do wprowadzania danych oraz tworzenia tabel i wykresów należałoby bardziej do informatyka niż statystyki.
Dla statystysty komputer jest narzędziem pomocnym w statystyce. Dla informatyków statystyki są narzędziem pomagającym w gromadzeniu i rozpowszechnianiu informacji (ogólnie za pośrednictwem komputera).
Edytuj poniżej tutaj -----
Aby rozwinąć, oto przykład. Pracowałem nad projektami z informatykami (jestem statystykiem), w których lekarz medycyny chce mieć system, w którym informacje o pacjentach są wykorzystywane do przewidywania ryzyka pewnego stanu (na przykład rozwoju zakrzepu krwi) i chce otrzymać jakąś formę alert, aby poinformować ich o ryzyku. Moja rola w projekcie (rola statystyczna) polega na opracowaniu modelu, który będzie przewidywał ryzyko na podstawie zmiennych predykcyjnych (jednym z takich modeli jest model regresji logistycznej). Rolą informatyka w projekcie jest opracowanie narzędzi, które zbierają zmienne predykcyjne, wykorzystują na nich mój model, a następnie wysyłają wyniki do lekarza. Dane mogą być gromadzone z elektronicznej dokumentacji medycznej lub poprzez ekran wprowadzania danych, aby pielęgniarka mogła je wypełnić lub inne.
Teraz (wraz z wieloma innymi statystykami) znam się na tyle na temat programowania, że mogłem przeszukiwać bazę danych, aby uzyskać predyktory i stworzyć pewien rodzaj alertu, ale cieszę się, że zostawiam to informatykom (i oni są w tym lepsi). Są informatycy, którzy znają statystyki wystarczające do dopasowania modelu regresji logistycznej. Tak więc prosta wersja tego projektu mogłaby być wykonana tylko przez statystykę lub tylko informatyka, ale najlepiej, gdy obie pracują razem. Jeśli spojrzysz na ten projekt i uważasz, że część modelowania jest zabawną częścią, a gromadzenie danych, alarmy i inne interfejsy są tylko narzędziami do przenoszenia informacji do i z modelu, jesteś bardziej statystyczny. Jeśli widzisz projektowanie interfejsu, optymalizację odzyskiwania danych, testowanie różnych typów alertów itp.
źródło
Statystyki wywodzą z danych; Informatyka działa na danych. Oczywiście pokrywają się, ale pytanie, które ma większy zakres, nie ma odpowiedzi.
źródło