Sprawdzam obecność odpowiedzi w pomiarach sygnałów komórkowych. Najpierw zastosowałem algorytm wygładzania (Hanning) do szeregów czasowych danych, a następnie wykryłem piki. Dostaję to:
Gdybym chciał, aby wykrycie odpowiedzi było nieco bardziej obiektywne niż „tak, widzisz wzrost w ciągłym spadku”, jakie byłoby najlepsze podejście? Czy ma to na celu uzyskanie odległości pików od linii podstawowej określonej przez regresję liniową?
(Jestem programistą python i prawie nie rozumiem statystyk)
Dziękuję Ci
Odpowiedzi:
Wygląda więc na to, że z komentarza z 25 października interesuje Cię algorytmiczne znalezienie i scharakteryzowanie dwóch głównych cech: początkowego zaniku odpowiedzi, a następnie cyklu zwiększonej odpowiedzi i kolejnego zaniku. Zakładam, że dane są obserwowane w dyskretnych odstępach czasu.
Oto, co bym spróbował:
W tym momencie będziesz mieć powiązane wartości czasu
za. początek początkowego rozkładu
b. początek wzrostu
do. początek drugiego rozpadu
Następnie możesz zrobić, co chcesz analitycznie, aby ocenić zmiany.
Najlepiej, jeśli dane mówią same za siebie: w wielu seriach, kiedy zastosujesz tę metodę, jaka jest typowa zmiana rozmiaru podczas wzrostu, kiedy zwykle występuje w okresie zaniku i jak długo to trwa? A jak wygląda dystrybucja tego wzrostu, jeśli chodzi o to, gdzie, jak długo i jak długo? Znając te statystyki, możesz lepiej scharakteryzować konkretny wzrost jako mieszczący się w tolerancji, w odniesieniu do miejsca, w którym występuje, jak również jego wielkość i czas trwania. Z mojego zrozumienia wynika, że łatwo jest zidentyfikować miejsce tych zmian. Reszta tego, co opisałem, jest prosta do obliczenia.
źródło
Oto kilka pomysłów, ale od razu z góry myślę, że może działać ...
Pochodne: Jeśli weźmiesz tablicę i odejmiesz elementy od siebie, aby uzyskać tablicę o jeden punkt mniej, ale to pierwsza pochodna. Jeśli wygładzisz to teraz i poszukasz zmiany znaku, może to wykryć twój guz.
Średnie kroczące: Być może użycie 2 opóźnionych (wykładniczych lub okienkowych) średnich kroczących może ujawnić duży guz, ignorując mały. Zasadniczo szerokość średniej ruchomej mniejszego okna musi być większa niż szerokość wypukłości, które chcesz zignorować. Szerszy EMA musi być szerszy, ale nie za szeroki, aby wykryć guz.
Szukasz, kiedy przecinają się i odejmują opóźnienie (okno / 2) i jest to oszacowanie, gdzie jest twój guz. http://www.stockopedia.com/content/trading-the-golden-cross-does-it-really-work-69694/
Modele liniowe: wykonaj serię modeli liniowych o wystarczającej szerokości, które mają kilka małych nierówności szerokości, powiedzmy 100 punktów. Teraz przejdź przez zestaw danych, generując regresje liniowe na zmiennej X. Wystarczy spojrzeć na współczynnik X i zobaczyć, gdzie nastąpiła zmiana dużego znaku. To duży guz.
Powyższe jest tylko przypuszczeniem z mojej strony i są prawdopodobnie lepsze sposoby na zrobienie tego.
źródło