Jaka statystyka służy do określania obecności sygnału w hałasie?

Uważam, że jest to problem z wykrywaczem:

Uderza mnie coś, co wydaje się być prostym problemem. Zasadniczo mam zespół zainteresowań. Jeśli energie sygnału istnieją w tym zakresie zainteresowania, wówczas wykonuję operację X na moim sygnale.

Mój problem polega na tym, że nie jestem pewien, jak dokładnie podjąć decyzję, czy sygnał istnieje, czy nie. Po tym, jak wykonam FFT, mogę szukać pików.

Ale co teraz?

Czy stosowana statystyka zwykle porównuje ten pik z otaczającą średnią widma? A może to jakaś inna statystyka?
Jakich miar statystycznych używam, aby po prostu ustalić, czy sygnał jest obecny, i przejść stamtąd?
Jak ustawić tę wartość? Proste progowanie?

EDYCJA Na podstawie opinii:

W tym prostym przypadku zakładam ton białego szumu gaussowskiego. To, co próbuję uzyskać, to:

Jak dokładnie wygenerowano krzywą ROC . Czy najpierw trzeba oznaczyć wszystkie dane, a następnie uzyskać prawdziwie dodatnie i fałszywie dodatnie wskaźniki dla wielu progów?
Jak malejący SNR wpływa na krzywą ROC? Czy przesunąć go w kierunku przekątnej?
Co robi adaptacyjne tworzenie podziału na daną krzywą ROC, która zostałaby wygenerowana bez adaptacyjnego progu?

3a. Jakie są niektóre typowe techniki progów adaptacyjnych, na które mogę spojrzeć, które są powszechne?

fft signal-detection Spacey
źródło

Czy chcesz algorytm wsadowy (offline), czy sekwencyjny (online)? Czy masz statystyki szumów i sygnałów (tj. Czy potrafisz scharakteryzować współczynnik wiarygodności)? Jeśli tak, czy próbowałeś użyć SPRT ?

Emre,

@Emre Może być offline. Nie jestem do końca pewien, co masz na myśli przez statystyki sygnału / szumu, mam czujnik, który mierzy sygnał (ton) w obecności szumu, a jego SNR może się różnić ...

Spacey

Ma na myśli: jakie są statystyczne właściwości hałasu i sygnału? Czy znasz rozkład hałasu? Co z rozkładem sygnału plus szumu?

Jason R

@JasonR Rozumiem. Cóż, sygnał będzie tonem, a szum będzie gaussowski. Czy coś brakuje?

Spacey,

Może. Biały gaussowski? Chodzi o to, że w celu teoretycznej analizy należy przyjąć pewien model prawdopodobieństwa dla szumu i sygnału plus szum. Na podstawie tej odpowiedzi możesz to zrobić.

Jason R

Odpowiedzi:

Jest to jeden z najstarszych problemów z przetwarzaniem sygnału, a prosta forma prawdopodobnie pojawi się we wstępie do teorii wykrywania. Istnieją teoretyczne i praktyczne podejścia do rozwiązania takiego problemu, które mogą, ale nie muszą się pokrywać, w zależności od konkretnego zastosowania.

$P_d$ $P_{fa}$

$P_d$ $P_{fa}$ $P_d = 1$ $P_{fa} = 0$ i nazwać to dniem. Jak można się spodziewać, nie jest to takie proste. Istnieje nieodłączny kompromis między tymi dwoma wskaźnikami; zazwyczaj jeśli zrobisz coś, co poprawi jedną, w drugiej zaobserwujesz pewną degradację.

Prosty przykład: jeśli szukasz obecności impulsu na tle szumu, możesz zdecydować o ustawieniu progu gdzieś powyżej „typowego” poziomu hałasu i wskazać obecność sygnału zainteresowania, jeśli twoja statystyka wykrywania się zepsuje powyżej progu. Chcesz naprawdę niskiego prawdopodobieństwa fałszywego alarmu? Ustaw wysoki próg. Ale wtedy prawdopodobieństwo wykrycia może znacznie spaść, jeśli podwyższony próg jest na poziomie lub powyżej oczekiwanego poziomu mocy sygnału!

$P_d$ $P_{fa}$

wprowadź opis zdjęcia tutaj

Idealny detektor miałby krzywą ROC, która otacza górę wykresu; oznacza to, że może zapewnić gwarantowane wykrywanie każdej częstotliwości fałszywych alarmów. W rzeczywistości detektor będzie miał charakterystykę, która wygląda jak wykreślona powyżej; zwiększenie prawdopodobieństwa wykrycia zwiększy również częstość fałszywych alarmów i odwrotnie.

Z teoretycznego punktu widzenia tego rodzaju problemy sprowadzają się zatem do wyboru równowagi między wydajnością wykrywania a prawdopodobieństwem fałszywego alarmu. To, jak opisana jest równowaga, zależy od modelu statystycznego przypadkowego procesu obserwowanego przez detektor. Model zazwyczaj będzie miał dwa stany lub hipotezy:

H_{0} : no signal is present

$H_0: \text{no signal is present}$

H_{1} : signal is present

$H_1: \text{signal is present}$

Zazwyczaj statystyka obserwowana przez detektor miałaby jeden z dwóch rozkładów, zgodnie z którymi hipoteza jest prawdziwa. Detektor stosuje następnie pewien test, który służy do ustalenia prawdziwej hipotezy, a zatem czy sygnał jest obecny, czy nie. Rozkład statystyki wykrywania jest funkcją modelu sygnału, który wybierzesz odpowiednio do swojej aplikacji.

Typowe modele sygnałów to wykrywanie sygnału modulowanego amplitudą impulsu na tle addytywnego białego szumu Gaussa (AWGN) . Chociaż opis ten jest nieco specyficzny dla komunikacji cyfrowej, wiele problemów można odwzorować na ten lub podobny model. W szczególności, jeśli szukasz tonu o stałej wartości umiejscowionego w czasie na tle AWGN, a detektor obserwuje wielkość sygnału, ta statystyka będzie miała rozkład Rayleigha, jeśli nie ma tonu, i rozkład Rica, jeśli jest obecny.

Po opracowaniu modelu statystycznego należy określić zasadę decyzji detektora. Może to być tak skomplikowane, jak chcesz, w zależności od tego, co ma sens dla twojej aplikacji. Idealnie byłoby podjąć decyzję, która jest w pewnym sensie optymalna, w oparciu o twoją wiedzę o rozkładzie statystyki wykrywania w obu hipotezach, prawdopodobieństwie, że każda hipoteza jest prawdziwa, oraz względnym koszcie błędu w każdej z hipotez ( o czym powiem za chwilę). Bayesowska teoria decyzji może być wykorzystana jako podstawa do podejścia do tego aspektu problemu z teoretycznego punktu widzenia.

$T$ $T(t)$ $t$

$T$ $T=5$ $P_d = 0.9999$ $P_{fa} = 0.01$

To, gdzie ostatecznie zdecydujesz się usiąść na krzywej wydajności, zależy od Ciebie i jest ważnym parametrem projektowym. Właściwy punkt wydajności do wyboru zależy od względnego kosztu dwóch rodzajów możliwych awarii: czy gorsze jest, że detektor przegapi wystąpienie sygnału, gdy się zdarzy, lub zarejestruje wystąpienie sygnału, gdy się nie wydarzyło? Przykład: najlepiej byłoby użyć fikcyjnego wykrywacza pocisków balistycznych z funkcją automatycznego uderzenia strajku, który miałby bardzo fałszywy alarm; rozpoczęcie wojny światowej z powodu fałszywego wykrycia byłoby niefortunne. Przykładem sytuacji odwrotnej byłby odbiornik komunikacyjny wykorzystywany do zastosowań związanych z bezpieczeństwem życia; jeśli chcesz mieć maksymalną pewność, że nie odbierze żadnych wiadomości o niebezpieczeństwie,

Jason R.
źródło

Dzięki JasonR, bardzo fajny post. Nadal analizuję twój post, jednak przychodzi mi na myśl jedno pytanie. Jak dokładnie generowana jest ta krzywa ROC? Rozumiem, że mierzę współczynnik prawdziwie dodatni i fałszywie dodatni dla dowolnego klasyfikatora, a to oznacza jeden punkt na krzywej ROC. Więc co się zmienia, aby uzyskać wiele punktów, dzięki czemu mogę wygenerować krzywą dla dowolnego klasyfikatora?

Spacey,

P_{d}

$P_d$

P_{f a}

$P_{fa}$

Statystyka jest współczynnikiem prawdopodobieństwa (LR), a testem jest porównanie LR z wartością progową. Jeśli zastosujemy się do tradycji umieszczania prawdopodobieństwa hipotezy zerowej w mianowniku, zdecydować na korzyść alternatywnej hipotezy ( w stosunku do hipotezy zerowej ) jeżeli LR jest wystarczająco wysoka. Im wyższy współczynnik, tym większa pewność siebie. Jest to test, który przeprowadziłbyś, gdybyś już zebrał dane. Jeśli chcesz zdecydować, kiedy dane dotrą na posiłek, możesz skorzystać z testu sekwencyjnego , takiego jak SPRT .

Na tym etapie możesz skorzystać z książki na temat testowania hipotez lub teorii decyzji (bardziej ogólnie).

Emre
źródło