Jaka jest różnica między statystyką a informatyką?

10

Zawsze mówimy, że statystyki dotyczą tylko danych. Ale wiemy również, że informatyka czerpie wiedzę z analizy danych. Na przykład ludzie bioinformatyki mogą całkowicie przejść bez biostatystyki. Chcę wiedzieć, jaka jest zasadnicza różnica między statystyką a informatyką.

Honglang Wang
źródło
7
Nie, to tylko dlatego, że słowo „informatyka” całkowicie straciło ostateczne znaczenie. „Bioinformatyka” została wymyślona tylko dla „biologii stworzonej na komputerze”, nie ma w tym nic głębokiego.
1
@mbq Zgoda. „Informatyka” i „Bioinformatyka” straciły jakąkolwiek sensowną definicję.
Fomite
w przejrzysty sposób bioinformatyki (zastosuj swoje odkrycia, aby obserwować swoje wyniki w sposób biologiczny)
Kamal Alblwei

Odpowiedzi:

20

Doskonałe pytanie !!

Słyszałem kilka razy, że bioinformatycy mogą przejść bez biostatystyki, a nawet bez statystyk. To całkowicie prawda, dopóki nie stanie się fałszywe. Moim zdaniem ogólny brak wiedzy statystycznej ma katastrofalny wpływ w terenie, jak wykazał Keith Baggerly . Zauważyłem również, że brak podstawowej wiedzy statystycznej (i algebry liniowej) jest przyczyną stagnacji bioinformatyków na dłuższą metę: bez dogłębnej znajomości teorii mają tendencję do ponownego odkrywania koła i uciekania się do rozwiązań doraźnych , które rozwiązują tylko ich własny problem.

Ale teraz, aby odpowiedzieć na twoje pytanie, zgadzam się, że ogólnie rzecz biorąc, statystyki nie mogą obejść się bez komputerów w tych dniach. Jednak jednym z głównych aspektów statystyki jest wnioskowanie , które nie ma nic wspólnego z komputerami. Wnioskowanie statystyczne jest tak naprawdę tym, co sprawia, że ​​statystyki stają się nauką, ponieważ mówią ci, czy twoje wnioski mogą się utrzymywać w innych kontekstach.

Krótko mówiąc, możesz analizować piekło na podstawie swoich danych, nadal będziesz potrzebować statystyk, aby poznać trafność prognoz lub decyzji, które podejmiesz na podstawie twoich analiz.

gui11aume
źródło
Dzięki. Czy możesz wyjaśnić więcej na temat ogólnej zasady bioinformatyki, aby uczynić ją dyscypliną. W przypadku statystyki, ogólnie rzecz biorąc, istnieją dwie główne części, jedna to czysta manipulacja danymi, druga to wnioskowanie statystyczne, oparte na prawdopodobieństwie, jedna z czystej matematyki. Na podstawie modeli statystycznych (modeli prawdopodobieństwa) statystycy mogą robić naukę. Co z bioinformatyką?
Honglang Wang,
4
Bioinformatyka to po prostu wykorzystanie komputerów do badania pytań biologicznych. Dyscypliny są zazwyczaj definiowane przez zadawane pytania, a nie przez ich metody, dlatego moim zdaniem bioinformatyka powinna być częścią biologii. Ma specjalną nazwę, ponieważ biolodzy bardzo źle znoszą komputery, więc ludzie, którzy mogą to zrobić, muszą mieć specjalną etykietę. Nie jestem pewien, czy za 50 lat, kiedy biolodzy będą lepsi z informatyki i matematyki, bioinformatyka nadal będzie istnieć.
gui11aume
2
Miło jest widzieć kogoś, kto docenia starania Keitha. Na pewno nie uniknął kontrowersji ani trudnych i niewygodnych sytuacji zawodowych.
kardynał
@ kardynał Saw Keith przemawia na konferencji APHA rok lub dwa lata temu. To była jedna z najlepszych rozmów, jakie kiedykolwiek widziałem.
Fomite
9

Moim zdaniem, chociaż pola nakładają się na siebie w znacznym stopniu, istnieją również kluczowe różnice. Ogólnie rzecz biorąc, student statystyki (w wyższych stopniach) podejmie więcej zajęć teoretycznych (matematyki i matematyki) niż student informatyki, ale student informatyki dowie się więcej o stronie obliczeniowej (szczególnie części bazy danych).

Opracowanie nowego testu statystycznego bardziej przypadłoby statystykowi niż informatykowi, ale zaprojektowanie interfejsu dla użytkownika do wprowadzania danych oraz tworzenia tabel i wykresów należałoby bardziej do informatyka niż statystyki.

Dla statystysty komputer jest narzędziem pomocnym w statystyce. Dla informatyków statystyki są narzędziem pomagającym w gromadzeniu i rozpowszechnianiu informacji (ogólnie za pośrednictwem komputera).

Edytuj poniżej tutaj -----

Aby rozwinąć, oto przykład. Pracowałem nad projektami z informatykami (jestem statystykiem), w których lekarz medycyny chce mieć system, w którym informacje o pacjentach są wykorzystywane do przewidywania ryzyka pewnego stanu (na przykład rozwoju zakrzepu krwi) i chce otrzymać jakąś formę alert, aby poinformować ich o ryzyku. Moja rola w projekcie (rola statystyczna) polega na opracowaniu modelu, który będzie przewidywał ryzyko na podstawie zmiennych predykcyjnych (jednym z takich modeli jest model regresji logistycznej). Rolą informatyka w projekcie jest opracowanie narzędzi, które zbierają zmienne predykcyjne, wykorzystują na nich mój model, a następnie wysyłają wyniki do lekarza. Dane mogą być gromadzone z elektronicznej dokumentacji medycznej lub poprzez ekran wprowadzania danych, aby pielęgniarka mogła je wypełnić lub inne.

Teraz (wraz z wieloma innymi statystykami) znam się na tyle na temat programowania, że ​​mogłem przeszukiwać bazę danych, aby uzyskać predyktory i stworzyć pewien rodzaj alertu, ale cieszę się, że zostawiam to informatykom (i oni są w tym lepsi). Są informatycy, którzy znają statystyki wystarczające do dopasowania modelu regresji logistycznej. Tak więc prosta wersja tego projektu mogłaby być wykonana tylko przez statystykę lub tylko informatyka, ale najlepiej, gdy obie pracują razem. Jeśli spojrzysz na ten projekt i uważasz, że część modelowania jest zabawną częścią, a gromadzenie danych, alarmy i inne interfejsy są tylko narzędziami do przenoszenia informacji do i z modelu, jesteś bardziej statystyczny. Jeśli widzisz projektowanie interfejsu, optymalizację odzyskiwania danych, testowanie różnych typów alertów itp.

Greg Snow
źródło
(+1) Podoba mi się bilans tej odpowiedzi. Nie jestem pewien, czy rozumiem, co było zamierzone w ostatnim zdaniu.
kardynał
1
Myślę, że twój przykład jest bardzo ładny i daje dobry portret podstawowego ukształtowania terenu. Chciałbym móc jeszcze raz głosować za tą częścią. Twoje zdrowie.
kardynał
Twój przykład jest naprawdę fajny. Wielkie dzięki. Teraz zastanawiam się tylko nad jednym pytaniem. Dla statystysty, czy cały model statystyczny powinien mieć część wnioskowania, taką jak przedział ufności lub testowanie hipotez, a zatem oparty na modelach prawdopodobieństwa? W przeciwnym razie manipulują zestawem danych tylko poprzez wykreślanie i podsumowywanie.
Honglang Wang
9

Statystyki wywodzą z danych; Informatyka działa na danych. Oczywiście pokrywają się, ale pytanie, które ma większy zakres, nie ma odpowiedzi.

stackovergio
źródło
„Statystyki wpływają na dane; Informatyka działa na danych”. To naprawdę chcę potwierdzić. Do wnioskowania, zawsze opartego na rozkładzie prawdopodobieństwa, powinno ono obejmować przedział ufności lub testowanie hipotez. W przeciwnym razie operujesz tylko danymi.
Honglang Wang