pandy ponownie próbkują dokumentację

184

Więc całkowicie rozumiem, jak używać resample , ale dokumentacja nie wykonuje dobrej roboty wyjaśniającej opcje.

Dlatego większość opcji w tej resamplefunkcji jest dość prosta, z wyjątkiem tych dwóch:

  • reguła: ciąg przesunięcia lub obiekt reprezentujący konwersję celu
  • jak: ciąg, metoda pobierania lub ponownego próbkowania, domyślnie „oznacza”

Patrząc na tyle przykładów, ile znalazłem w Internecie, widzę regułę, którą możesz zrobić 'D'na dzień, 'xMin'na minuty, 'xL'na milisekundy, ale to wszystko, co mogłem znaleźć.

przez jaki widziałem, co następuje: 'first', np.max, 'last', 'mean', i 'n1n2n3n4...nx'gdzie nx jest pierwsza litera każdego indeksu kolumny.

Czy jest gdzieś w dokumentacji, której brakuje mi, która wyświetla każdą opcję dla pandas.resamplereguły i jak dane wejściowe? Jeśli tak, gdzie, ponieważ nie mogłem go znaleźć. Jeśli nie, jakie są dla nich wszystkie opcje?

Ryan Saxe
źródło
8
Dla wędrowców Google, do ponownego próbkowania za pomocą how='last'i how='first': nie zapomnij dodać closed='left', label='left'. link
Nasser Al-Wohaibi
@ NasserAl-Wohaibi Jestem dość pewny, że powyższy komentarz wskazuje, że te opcje mogą pomóc w pełni odpowiedzieć na następujące pytanie. Czy napotkałeś już ten problem? stackoverflow.com/questions/26247301/…
Amelio Vazquez-Reina
how = „last” jest teraz przestarzałe na korzyśćresample(...).last()
shadi 30.09.17

Odpowiedzi:

313
B         business day frequency
C         custom business day frequency (experimental)
D         calendar day frequency
W         weekly frequency
M         month end frequency
SM        semi-month end frequency (15th and end of month)
BM        business month end frequency
CBM       custom business month end frequency
MS        month start frequency
SMS       semi-month start frequency (1st and 15th)
BMS       business month start frequency
CBMS      custom business month start frequency
Q         quarter end frequency
BQ        business quarter endfrequency
QS        quarter start frequency
BQS       business quarter start frequency
A         year end frequency
BA, BY    business year end frequency
AS, YS    year start frequency
BAS, BYS  business year start frequency
BH        business hour frequency
H         hourly frequency
T, min    minutely frequency
S         secondly frequency
L, ms     milliseconds
U, us     microseconds
N         nanoseconds

Zobacz dokumentację timeseries . Zawiera listę przesunięć (i przesunięć „zakotwiczonych” ) oraz sekcję dotyczącą ponownego próbkowania .

Zauważ, że nie ma listy wszystkich różnych howopcji, ponieważ może to być dowolna funkcja tablicowa NumPy, a dowolną funkcję dostępną poprzez wysyłanie grupowe można przekazać howwedług nazwy.

Matti John
źródło
1
„... ponieważ może to być dowolna funkcja tablicowa NumPy i ...” - tak, czytam to w dokumentacji, ale czy jest gdziekolwiek dokumentacja wyjaśniająca, co dokładnie ta funkcja powinna robić i co ma wspólnego z ponowne próbkowanie ...? Czuję się tu bardzo zagubiony.
jhin
1
Należy to powiązać ze wszystkimi odpowiednimi obszarami dokumentacji, takimi jak ponowne próbkowanie. Oto link do skrótów: pandas.pydata.org/pandas-docs/stable/…
wordsforthewise
Dodano żądanie ściągnięcia w celu ulepszenia dokumentów github.com/pandas-dev/pandas/pull/30252
Aseem Bansal,
65

Jest w tym coś więcej, ale prawdopodobnie szukasz tej listy:

B   business day frequency
C   custom business day frequency (experimental)
D   calendar day frequency
W   weekly frequency
M   month end frequency
BM  business month end frequency
MS  month start frequency
BMS business month start frequency
Q   quarter end frequency
BQ  business quarter endfrequency
QS  quarter start frequency
BQS business quarter start frequency
A   year end frequency
BA  business year end frequency
AS  year start frequency
BAS business year start frequency
H   hourly frequency
T   minutely frequency
S   secondly frequency
L   milliseconds
U   microseconds

Źródło: http://pandas.pydata.org/pandas-docs/stable/timeseries.html#offset-aliases

vonkohorn
źródło
8
Dlaczego nie ma „Min” (np. „5Min” użytych w dokumentacji)?
ziyuang
@zyuang, wyświetlane są tylko krótkie formaty: na przykład „ms” jest nieobecny na liście
Julien__