Czy ArXiv jest popularny w społeczności statystyk?

25

Wiem, że społeczności fizyki i matematyki bardzo interesują się ArXivem, ale co ze społecznością statystyk? Czy zwyczajowo jest tam pisać przed wysłaniem?

StasK
źródło
Nigdy tam nie pisałem i nie pamiętam, że szukałem tam dokumentów.
Christoph Hanck
@DeepNorth tak, to byłoby interesujące. Pytam zarówno z ciekawości, jak i dlatego, że niedawno opublikowałem wersję roboczą „jak przesłano” na ArXiv. Zastanawiałem się, czy naprawdę
1
Tak; niektórzy z nas przynajmniej przez jakiś czas patrzą na arXiv. Robię to, kiedy mogę lub kiedy ktoś mnie tam wskazuje, i często łączę ludzi z dokumentami.
Glen_b
3
Zdefiniuj „statystyki”. W obszarze, w którym pracuję, metodologii ankiet, moi prawdopodobnie naiwni poszukiwacze „kompleksowej ankiety” i „skończonej populacji” przynieśli odpowiednio 2 i 42 wyniki dla arXiv. Każdego roku sekcja metod badań ankietowych Amerykańskiego Stowarzyszenia Statystycznego ma około 40 sesji na wspólnych spotkaniach statystycznych, od 1 do 3 w każdym przedziale czasowym przez 4 dni konferencji, i odpowiednio przedstawia co najmniej sto artykułów z prac. O ile wiem, nic z tego nie daje się w arXiv.
StasK,

Odpowiedzi:

19

Tak, Arxiv jest popularny w statystykach i społeczności zajmującej się naukami o danych.

Ponieważ świat statystyk i analizy danych ewoluuje z dnia na dzień, statystycy i naukowcy powinni mieć biegłość w zakresie najnowszych wydarzeń, technik i algorytmów.

Być może nie jest tak popularny jak w społeczności fizyków, ale ma swój udział w świecie bogatym w dane.

Być może zainteresuje Cię Gitxiv , który łączy najnowocześniejsze badania z odpowiednim kodem / bibliotekami typu open source.

Dawny33
źródło
3
+1 za link do Gitxiv ... źle się przyjrzę. Czy regularnie sprawdzasz ArXiv lub subskrybujesz jedną z jego list e-mail?
2
Moja przyjemność. Gitxiv przybliżył świat badań do świata statystyk i informatyki. Uznanie dla tych facetów. Nie, nie subskrybuję list adresowych, ale ponieważ większość dokumentów dotyczących uczenia maszynowego i analiz znajduje się tam, sprawdzam je co tydzień.
Dawny33,
3
Byłoby lepiej, gdybyś podał jakieś dowody potwierdzające. Teraz jest to tylko jedno słowo „Tak”, a reszta nie ma charakteru informacyjnego (ale Gitxiv jest interesujący, dziękuję za wzmiankę).
Richard Hardy,
19

Udzielę ostatecznej, opartej na dowodach odpowiedzi. Odpowiedź brzmi tak.

Spójrz na dane Google Scholar pod kątem prawdopodobieństwa i statystyki, 10 najlepszych źródeł według indeksu h5:

    Publication                               h5-index  h5-median
1.  Journal of Econometrics                         62  93
2.  The Annals of Statistics                        58  81
3.  arXiv Statistics Theory (math.ST)               57  80
4.  Journal of Statistical Software                 53 113
5.  arXiv Probability (math.PR)                     53  65
6.  arXiv Methodology (stat.ME)                     48  69
7.  Journal of the American Statistical Association 48  66
8.  Statistics in Medicine                          42  62
9.  Computational Statistics & Data Analysis        40  51
10. Journal of Business & Economic Statistics       39  67

Uwaga: ta lista nie jest oparta na liczbie publikacji, lecz na indeksie cytowań .

Indeks cytowań Google'a staje się tak popularny jak Scopus i Reuters (ok, nie mam dowodu na to stwierdzenie), więc moja odpowiedź jest tak obiektywna, jak to tylko możliwe.

Porównaj to z listą Scimagojr.com na temat statystyk i prawdopodobieństwa:

    Title   Type    SJR H index Total Docs. (2014)  Total Docs. (3years)    Total Refs. Total Cites (3years)    Citable Docs. (3years)  Cites / Doc. (2years)   Ref. / Doc. Country
1   Annals of Mathematics   j   Q1  8,551   72  46  209 1.572   647 207 3,05    34,17   US
2   Vital and health statistics. Series 10, Data from the National Health Survey    k   Q1  7,801   30  4   7   55  125 7   16,33   13,75   US
3   Journal of the Royal Statistical Society. Series B: Statistical Methodology j   Q1  6,148   90  45  99  1.507   547 94  3,09    33,49   GB
4   Annals of Statistics    j   Q1  5,602   103 64  296 2.099   809 287 2,25    32,80   US
5   Journal of Statistical Software j   Q1  5,003   64  67  220 2.540   1.364   220 3,91    37,91   US
6   Journal of the American Statistical Association j   Q1  4,162   123 106 408 3.501   907 373 1,85    33,03   US
7   Probability Surveys j   Q1  3,645   22  1   20  84  46  19  2,73    84,00   US
8   Bioinformatics  j   Q1  3,576   248 809 2.145   18.801  11.329  2.089   4,69    23,24   GB
9   Journal of Business and Economic Statistics j   Q1  3,496   66  58  146 1.464   384 139 2,21    25,24   US
10  Biometrika  j   Q1  3,342   83  58  233 1.485   369 229 1,28    25,60   GB

Jak widać, dobrze się pokrywa z listą 10 najlepszych Google Scholar. Ta ostatnia lista jest również oparta na indeksie h, ale nie jest to cytat Google. To tylko potwierdza poprzednią tabelę i wnioski z niej: arXiv jest popularny wśród statystyk w środowisku akademickim.

SSRN to kolejne miejsce do zrzucenia wydruków wstępnych. Jest popularny wśród ekonometrów.

Aksakal
źródło
+1 - Świetna robota przy użyciu wskaźników Google! Indeks h zdecydowanie go tam stawia.
@Bey, należy pamiętać o jednym: ruchu otwartego dostępu. arXiv to miejsce, w którym ludzie wyrzucają swoje odbitki, tak to się zaczęło w fizyce. Tak więc zobaczysz ten sam artykuł w arXiv, a później na przykład w Phys Rev. Tak więc arXiv został początkowo stworzony jako środek do szybszego rozpowszechniania badań. Dobre dokumenty zwykle nie pojawiają się wyłącznie na arXiv.
Aksakal
Tak. Zazwyczaj cytuję artykuł, który znajduję w ArXiv, tylko jeśli mogę go znaleźć w czasopiśmie recenzowanym. Mój artykuł jest tam, gdy przechodzi przegląd i źle aktualizuje zaakceptowany nadruk po okresie embarga (zakładając, że nie został odrzucony).
@Bey, podczas gdy jesteśmy na nim, istnieją dwa inne miejsca, w których możesz zrzucić swoje odbitki: RePec i SSRN. Ekonometrycy mogą ich używać częściej niż arXiv
Aksakal
14

Nie jest to kwestia osobistej opinii, więc spójrzmy na niektóre liczby dotyczące terminów pojawiających się na stronach arXiv (niektóre losowe zapytania Google z kilkoma terminami specyficznymi dla domeny):

krzyżowa strona walidacyjna: arxiv.org zwraca

Około 17 800 wyników

strona Monte Carlo: arxiv.org zwraca

Około 187,000 wyników

strona pobierania próbek: arxiv.org zwraca

Około 141 000 wyników

strona prognostyczna: arxiv.org zwraca

Około 11 300 wyników

strona regresji: zwraca arxiv.org

Około 51 100 wyników

EDYTOWAĆ

Jak zauważył @Scortchi , arXiv publikuje własne statystyki. kategoria statystyki pojawia się w raportach z ostatnich trzech lat, jak poniżej:

year submissions % submissions
2014 2025        2.2% 
2013 1602        1.7%
2012 1284        1.5%

Może to jednak nie odzwierciedlać w pełni treści opublikowanych prac, ponieważ niektóre z nich mogą być wysoce powiązane ze statystykami, ale mogą być oznaczone jako inna dziedzina (np. Matematyka lub cs ).

Ponadto, Xi'an jest blog może stanowić jako studium przypadku. Dużo pisze o statystykach bayesowskich i często wspomina o otrzymanych dokumentach (mając ich własną etykietę ).

Wydaje się również, że wspominaliśmy do tej pory „arXiv” w CrossValidated w 689 postach i komentarzach (w tym tutaj).

Czy to sprawia, że ​​jest popularny czy nie? Wciąż trudno powiedzieć, ale na pewno tysiące artykułów związanych ze statystykami opublikowano na arXiv, a jego popularność rośnie.

Tim
źródło
3
A przynajmniej tysiące artykułów wykorzystujących / wspominających metodologię statystyczną
Glen_b -Reinstate Monica
@Glen_b tak, to kwestia słów kluczowych do sprawdzenia, ale nie widzę lepszego sposobu, aby sprawdzić, czy jest „popularny”.
Tim
4
„Statystyka” to obszar tematyczny dotyczący arXiv - z liczbą 7 711 zgłoszeń do końca 2014 r., Co stanowi 0,9% całości. arxiv.org/help/stats/2014_by_area/index
Scortchi - dozbrojenie Monica
@Scortchi Nigdy nie kopałem tak głęboko w tej witrynie, dzięki!
Tim
+1 :) Nie wyobrażałem sobie tego pytania jako ćwiczenia analitycznego ... ale znalazłeś sposób, aby się na to zdobyć ... to jest bardzo fajne :) Nie spodziewałbym się niczego więcej od ludzi na tej stronie! Powiedziałbym, że w oparciu o @Aksakal i twoją analizę, ArXiv jest dość dobrze subskrybowany do statystyk :-)
8

Wszystkie czasopisma publikowane przez Institute of Mathematical Statistics (IMS) - w tym The Annals of Statistics (jeden z najlepszych dzienników statystycznych), The Annals of Applied Statistics itp. - jednoznacznie zachęcają autorów do umieszczania wstępnych wydruków na arXiv i ponadto zadbaj o umieszczanie postprintów na arXiv. Tak naprawdę nie znam żadnego czasopisma z matematyki lub fizyki, które wgrywałoby dokumenty do arXiv, gdyby autorzy nie zrobili tego sami!

IMS zachęca wszystkich członków do publikowania artykułów na arXiv.

( http://www.imstat.org/publications/arxiv.html )

Wszystkie artykuły IMS 2004 i następne są bezpłatnie dostępne w formacie postprint na arXiv, a także artykuły opublikowane przez autorów.

ArXiv jest otwartym, w pełni zautomatyzowanym elektronicznym serwerem archiwizacji i dystrybucji artykułów naukowych, obecnie własnością Cornell University i częściowo finansowanym przez NSF. Główne dziedziny, które obejmuje, to fizyka, matematyka, nauka nieliniowa, informatyka i biologia ilościowa. Niedawno arXiv współpracował z IMS i Bernoulli Society, aby otworzyć nową kategorię statystyki w matematyce. Oczekujemy, że ta kategoria ostatecznie stanie się archiwum najwyższego poziomu, porównywalnym np. Z matematyką i fizyką.

( http://www.imstat.org/publications/eaccess.htm )

ameba mówi Przywróć Monikę
źródło