Często widziałem dyskretne zestawy danych wykreślane jako wykresy liniowe, ale przychodzi mi do głowy, że linia wyznacza wartość w punkcie między przedziałami pomiarowymi, co nie ma znaczenia dla dyskretnych zestawów danych. Czy w takim przypadku użycie wykresów liniowych dla danych dyskretnych jest nieprawidłowe?
Jako przykład weźmy dwa zestawy danych szeregów czasowych, jeden ciągły (moja waga mierzona codziennie rano) i jeden dyskretny (liczba pączków, które jem dziennie). Pierwszy zestaw danych ma sens jako wykres liniowy, ponieważ uzasadnione jest wnioskowanie, że moja waga w danym popołudniu będzie powiązana z moją wagą w poprzedzający i następny poranek. Jeśli jednak liczba pączków jest reprezentowana jako wykres liniowy, linie między kropkami nie mogą wynikać z tej linii.
EDYTOWAĆ
Oto inny przykład: federalna godzinna płaca minimalna od momentu jej powstania na stronie http://mste.illinois.edu/courses/ci330ms/youtsey/lineinfo.html
O ile się nie mylę, zmiany płacy minimalnej są dyskretne, a zatem nie jest możliwe wyszukiwanie dowolnego arbitralnie wybranego czasu i ustalenie płacy minimalnej w punkcie przy użyciu linii łączącej kropki.
źródło
Odpowiedzi:
Połączone wykresy liniowe okazały się zbyt przydatne, aby ograniczyć się do jednej interpretacji. Kilka znaczących zastosowań:
źródło
Cóż, pączki mogą być powiązane z wagą :-)
Chociaż widzę twój punkt, myślę, że ten przykład nie jest taki zły, ponieważ czas (na osi poziomej, do której odnoszą się linie) jest ciągły. Dla mnie znaczenie linii nie jest tak duże, że o każdej porze dnia zjadasz określoną liczbę pączków, ale że liczba pączków dziennie zmienia się w pewien regularny sposób. W związku z tym możemy dodać do linii coś w rodzaju wygładzacza lessu i miałoby to sens. Przynajmniej rozsądne jest myślenie o pączkach spożywanych o każdej godzinie, a nawet o każdej minucie (chociaż byłoby to bardziej sensowne ze zmienną, w której liczba dzienna była wyższa)
Bardziej niepokojące jest to, gdy oś pozioma jest dyskretna (a zwłaszcza gdy jest nominalna), ale rysuje się linie. To naprawdę nie ma sensu. Np. Jeśli patrzysz (powiedzmy) na% głosowania na Obamę wśród (powiedzmy) mieszkańców różnych regionów USA, nie ma sensu wyznaczać linii między Północnym Wschodem a Środkowym Zachodem; zwłaszcza, że kolejność regionów jest dowolna, ale zmiana kolejności zmieniłaby linie. Jednak widziałem takie wykresy.
źródło