Czy istnieje grafika „witaj, świecie” dla grafiki statystycznej?

26

W programowaniu komputerowym istnieje klasyczny pierwszy program do nauki / nauczania nowego języka lub systemu, zwany „witaj, świecie”. http://en.wikipedia.org/wiki/Hello_world_program

Czy istnieje klasyczna pierwsza wizualizacja danych do korzystania z pakietu graficznego? Jeśli tak, co to jest? A jeśli nie, czym byliby dobrzy kandydaci?

Abraham D. Flaxman
źródło
3
Witamy na naszej stronie! Nasze FAQ pyta, że „Należy zwrócić tylko praktyczne, odpowiada na pytania na podstawie rzeczywistych problemów, które możesz napotkać.” Czy mógłbyś rozwinąć swój rzeczywisty problem?
whuber
3
Chciałbym zidentyfikować „standardowy element testowy” dla grafiki statystycznej, jeśli taki istnieje, aby uwzględnić go w materiałach szkoleniowych, które opracowuję.
Abraham D Flaxman
2
Ponieważ aplikacje graficzne różnią się tak bardzo, trudno jest wyobrazić sobie grafikę standardową lub uniwersalną. Tam pewne standardy dla niektórych typów wykresów pakietów, takich jak historycznie znanych zające i czajniki do grafiki 3D. Aby twoje pytanie było możliwe, pomogłoby to sprecyzować, które pakiety będą obejmować twój materiał szkoleniowy.
whuber
1
Dobra uwaga, dzięki. Dołączę przynajmniej coś o grafice statystycznej w językach R, STATA, Python i JavaScript.
Abraham D Flaxman
@AbrahamDFlaxman Jestem ciekawy tego „materiału szkoleniowego” oraz kogo i do czego jest przeznaczony. Czy możesz powiedzieć więcej?
Peter Flom - Przywróć Monikę

Odpowiedzi:

9

Dwie myśli:

A. Kiedy próbuję dojść do istoty „Hello World”, jest to minimum, które należy wykonać w języku programowania, aby wygenerować prawidłowy program, który wypisuje pojedynczy wiersz tekstu. To sugeruje mi, że Twój „Hello World” powinien być jednowymiarowym zestawem danych, najbardziej podstawową rzeczą, którą możesz podłączyć do programu statystycznego lub graficznego.

B. Nie znam żadnego graficznego „Hello World”. Najbliżej mogę przyjść to typowe zestawy danych, które są zawarte w różnych pakietach statystycznych, takich jak AirPassengerery R. W R, zestawienie graficzne Hello World byłoby:

plot (AirPassengers)  # Base graphics, prints line graph

lub

qplot (AirPassengers) # ggplot2, prints a bar chart

lub

xyplot (AirPassengers) # lattice, which doesn't have a generic plot

Osobiście uważam, że najprostszym wykresem jest wykres liniowy, w którym masz N pozycji w Y, a X ma zakres od 1: N. Ale to nie jest standard.

Wayne
źródło
2
Konsensus z tej i innych odpowiedzi jest taki, że obecnie nie ma „cześć, świecie” grafiki statystycznej. Myślę, że twoja sugestia jednoznacznego zestawu danych z N elementami w Y i X w zakresie od 1: N jest przekonująca. W dalszej analogii do „cześć, świecie”, byłoby miło mieć małe N i niezapomniane Y. Co sądzisz o N = 5 i Y = (3,1,4,1,5,9) (tj. cyfry pi)? Może to zbyt math.
Abraham D Flaxman
1
@AbrahamDFlaxman: Nie sądzę, żeby to było matematycznie, myślę, że jest świetne. Niezapomniany, krótki, a wykres nie jest po prostu linią prostą lub czymkolwiek. Dane są dobrze znane i niepowiązane z żadnym konkretnym programem i mogą być dowolnie rozszerzane przez każdego, kto chce więcej punktów. Głosuję na to!
Wayne,
24

Prawdopodobnie zacznę od wykresów rozrzutu i zademonstruję cztery brzydkie korelacje .

StasK
źródło
2
+1. Ale możesz rozważyć coś bardziej ogólnego, na przykład jakąś formę wykresu liniowego. W końcu, gdy tylko narysujesz odcinek linii, możesz narysować wszystko . To odzwierciedla ideę „Witaj, świecie!”: Kiedy możesz uzyskać czytelny wynik programu, wiesz, że możesz komunikować się z komputerem, a reszta to tylko szczegóły :-). (Szczegóły mogą być trudne . Podczas nauki pisania kodu asemblera dla komputera mainframe IBM 360, najprostszym sposobem na uzyskanie danych wyjściowych było przechowanie go w pamięci RAM i wygenerowanie błędu pod koniec wykonywania, powodując, że system wydrukuje zrzut szesnastkowy rdzenia !)
whuber
Myślę kwartet anscombe'a w sumie zawiera zbyt wiele, aby być stosowane jako „Hello, World” z grafiką statystycznych, ale Rysunek 1 ze swojej pracy może być dobrym kandydatem. Inne odpowiedzi uzasadniają jednak zestaw danych jednoznacznych, do którego się skłaniam.
Abraham D Flaxman
7

Histogram próbki normalnie rozmieszczonej zmiennej losowej.

Karsten W.
źródło
Podoba mi się to, jak by to wyglądało, ale może histogramy wymagają więcej przetwarzania danych niż rozprasza, a wymyślanie próbek z rozkładu normalnego może rozpraszać uwagę.
Abraham D Flaxman
Właśnie zauważyłem, że jest to pierwszy przykład ze strony Matplotlib: matplotlib.org
Abraham D Flaxman
5

Myślę, że odpowiedź brzmi „nie”. Oznacza to, że nie ma ogólnie uzgodnionej odpowiedzi na twoje pytanie.

@StasK wskazuje na wykres rozrzutu.

Ale zastanowiłbym się, co plotrobi R: To zależy od danych!

Można argumentować, że statystyki jednowymiarowe są prostsze niż statystyki dwuwymiarowe. Więc ... być może najbardziej podstawową rzeczą jest histogram; lub może wykres słupkowy; może wykres gęstości.

Jeśli chodzi o „Witaj, świecie!” jest pokazanie, że możesz zmusić komputer do zrobienia czegoś , co powiedziałbym, że zrobiłby to każdy spisek.

Peter Flom - Przywróć Monikę
źródło
1
Być może brak standardowego elementu testowego oznacza, że ​​masz rację, i bardziej odpowiednie jest użycie dowolnego wykresu, który jest najprostszy w demonstrowanym systemie. Jednak trudno to porównać.
Abraham D Flaxman
5

Nie jestem pewien, czy dokładnie kwalifikuje się jako świat cześć, ale w R są też dema wbudowane w wiele pakietów. na przykład

library(graphics)
demo(graphics)

przeprowadzi użytkownika przez podstawowe grafiki dostępne w pakiecie. Wystarczy kliknąć myszką na każdy obraz, aby przejść przez podstawowe ilustracje graficzne. Dzięki zaledwie dwóm wierszom użytkownik zapoznaje się z niektórymi inspirującymi możliwościami grafiki R do celów statystycznych.

Odpowiedni kod do wygenerowania grafiki jest wyświetlany w konsoli R.

wprowadź opis zdjęcia tutaj

poklepać
źródło
2

Powiedziałbym, że istnieją dwa programy typu „Hello World” do wizualizacji danych:

Drukuj („Witaj świecie”): coś w rodzaju histogramu zmiennej normalnie rozłożonej lub może zwykłego wykresu rozrzutu X, Y.

W przypadku czegoś nieco bardziej złożonego, jak na przykład sekcja, w której bierze się pod uwagę zasady Hello World i zaczyna się od wprowadzania danych przez użytkownika, znaków ucieczki itp., Powiedziałbym, że bawi się z zestawem danych Iris.

Fomite
źródło