Darmowa próbka autokorelacji

11

Rozważmy jednowymiarowy wektor o wartościach rzeczywistych x, który reprezentuje obserwacje niektórych procesów mierzonych w równych odstępach czasu. Nazywamy x w szeregu czasowym .

Niech n oznacza długość x, a oznacza średnią arytmetyczną x . Próbki autokowariancji funkcja jest zdefiniowany jako

autokowariancja

dla wszystkich - n < h < n . Mierzy to zależność liniową między dwoma punktami tej samej serii obserwowanymi w różnych momentach.

Przykład autokorelacji Funkcja lub ACF, jest zdefiniowany jako

autokorelacja

Mierzy to przewidywalność liniową szeregu x w czasie t , którą oznaczamy x t , przy użyciu tylko wartości x t + h .

Należy zauważyć, że te szacunkowe próbki nie pasują do naiwnych obliczeń opartych na właściwościach teoretycznych. Oznacza to, że funkcja autokorelacji próbki nie równa się do współczynnika korelacji Pearsona z X z h -step przesunięciem x .

Zadanie

Biorąc pod uwagę tablicę x i nieujemną liczbę całkowitą h , wydrukuj lub zwróć pierwszą autokorelację opóźnienia +1 h dla x , zaczynając od opóźnienia 0. Autokorelacje opóźnienia są te odpowiadające ujemnym wejściom w powyższych wzorach.

Możesz założyć, że 0 < h < n , gdzie n jest długością x , i że 2 < n <256.

Dane wyjściowe powinny być prawidłowe z dokładnością do 1E-4. Nie ma żadnych ograniczeń dotyczących korzystania z wbudowanych funkcji ani czasu działania.

Przykłady

h, x -> output
--------------
5, [2.4, 2.4, 2.4, 2.2, 2.1, 1.5, 2.3, 2.3, 2.5, 2] -> [1.00000000,  0.07659298, -0.06007802, -0.51144343, -0.02912874, -0.10468140]
1, [2134, 1863, 1877, 1877, 1492, 1249] -> [1.0000000, 0.3343041]
2, [13067.3, 13130.5, 13198.4] -> [1.0000000000, -0.0002854906, -0.4997145094]
Alex A.
źródło

Odpowiedzi:

4

Galaretka, 26 25 24 23 20 bajtów

×L_SµḊ;0µƓС׹S€µF÷Ḣ

Wypróbuj online!

Jak to działa

×L_SµḊ;0µƓС׹S€µF÷Ḣ  Main link. Input: x (list) STDIN: h (integer)

×L                    Multiply all items in x by the length of x.
  _S                  Subtract the sum of x from all products.
                      Let's call the result X.
    µ                 Begin a new monadic chain. Argument: t (list)
     Ḋ                Remove the first element of t.
      ;0              Append a 0 to the result.
        µ             Push the previous chain and begin a new one.
                      Argument: X
         Ɠ            Read h from STDIN.
          С          Repeat the Ḋ;0 chain h times, collecting the h+1 intermediate
                      results in a list A.
            ×¹        Multiply the vectors in A by X.
              S€      Compute the sum of each vectorized product.
                µ     Begin a new, monadic chain. Argument: S (sums)
                 F    Flatten S. This does nothing except creating a deep copy.
                   Ḣ  Pop the first element of S.
                  ÷   Divide all elements of the copy by the first element.
Dennis
źródło
6

R, 3 31 25 bajtów

# changes the builtin to only return the acf
body(acf)=body(acf)[1:18]

Użycie (zwraca tablicę z autokorelacjami)

(acf(c(2.4, 2.4, 2.4, 2.2, 2.1, 1.5, 2.3, 2.3, 2.5, 2),5))
# , , 1
#
#             [,1]
# [1,]  1.00000000
# [2,]  0.07659298
# [3,] -0.06007802
# [4,] -0.51144343
# [5,] -0.02912874
# [6,] -0.10468140

Tło:

31-bajtowe rozwiązanie oparte na oryginalnym acfwbudowanym

function(n,h)c(acf(n,h,,F)$acf)

Zauważ, że 3-bajtowa opcja acfjest oryginalnie wbudowana, która wykreśla (i drukuje do 3 cyfr), zwracając jednocześnie wymaganą autokorelację jako element listy.

stosowanie

 acf(c(2.4, 2.4, 2.4, 2.2, 2.1, 1.5, 2.3, 2.3, 2.5, 2),5)

wynik:

#    Autocorrelations of series ‘c(2.4, 2.4, 2.4, 2.2, 2.1, 1.5, 2.3, 2.3, 2.5, 2)’, by lag
#
#     0      1      2      3      4      5 
# 1.000  0.077 -0.060 -0.511 -0.029 -0.105 

Jeśli chcemy, aby korelacje były wyświetlane z więcej niż 3 miejscami dziesiętnymi, zrobi to 28 bajtów (lub 31, jeśli chcemy pominąć wykres)

# will still plot (28 bytes)
function(n,h)c(acf(n,h)$acf)
# won't plot (31 bytes)
function(n,h)c(acf(n,h,,F)$acf)
mnel
źródło
To chyba najmądrzejsza sztuczka, jaką kiedykolwiek widziałem. Nie miałem pojęcia, że ​​można to zrobić. Staramy się, aby R został wybrany jako język miesiąca - możesz poprawić tę meta odpowiedź, aby tak się stało.
JayCe,
3

Python 3, 147 130 126 120 bajtów

def p(h,x):x=[t-sum(x)/len(x)for t in x];return[sum(s*t for s,t in zip(x[n:],x))/sum(b*b for b in x)for n in range(h+1)]

To rozwiązanie prawdopodobnie będzie dalej grało w golfa, to dopiero początek.

Możesz to nazwać za pomocą:

p(5,[2.4, 2.4, 2.4, 2.2, 2.1, 1.5, 2.3, 2.3, 2.5, 2])
Cameron Aavik
źródło
2

MATL , 20 bajtów

tYm-tPX+tX>/GnqiQ:+)

EDYCJA (20 maja 2016 r.): Od wersji 18.0.0 języka używaj Y+zamiast X+. Link zawiera tę zmianę.

Wypróbuj online!

Korelacja jest ściśle związana ze splotem. Normalizujemy przez odjęcie średniej, a następnie zwijamy, normalizujemy ponownie, dzieląc przez wartość maksymalną, a następnie wybieramy pożądane opóźnienia.

tYm-       % implicit input. Duplicate and subtract mean
tPX+       % duplicate, flip, convolve
tX>/       % duplicate, divide by maximum value
Gnq        % length of array, n. Subtract 1
iQ:        % input number h. Generate vector [1,2,...,h+1]
+          % add to obtain vector [n,n+1,...,n+h]
)          % use that vector as an index. Implicitly display
Luis Mendo
źródło
1

Mathematica, 27 bajtów

Dzięki LegionMammal978 za zapisanie 1 bajtu.

Moglibyśmy pokonać Jelly, gdyby nazwy funkcji nie były tak długie.

#2~CorrelationFunction~{#}&

Przypadek testowy

%[5,{2.4,2.4,2.4,2.2,2.1,1.5,2.3,2.3,2.5,2}]
(* {1.,0.076593,-0.060078,-0.511443,-0.0291287,-0.104681} *)
njpipeorgan
źródło
Właśnie miałem to opublikować, zanim mój Internet przestał działać ... Możesz zapisać bajt #2~CorrelationFunction~{#}&.
LegionMammal978
1

Oktawa, 47 37 bajtów

@(h,x)xcov(x,'coeff')(numel(x)+(0:h))
Rainer P.
źródło
@Rainer Możesz zaoszczędzić kilka bajtów za pomocą anonimowej funkcji (iw takim przypadku myślę, że możesz pominąć disp, ponieważ wracasz do wyjścia funkcji)
Luis Mendo
@LuisMendo Masz rację. Zapisano 10 bajtów, nawet nie licząc disp.
Rainer P.