Testuję czujniki położenia przepustnicy (TPS), które sprzedaje moja firma i drukuję wykres odpowiedzi napięcia na obrót wału przepustnicy. TPS jest czujnikiem obrotowym o zakresie 90 °, a wyjście jest jak potencjometr z pełnym otwarciem wynoszącym 5 V (lub wartością wejściową czujnika) i początkowym otwarciem o wartości między 0 a 0,5 V. Zbudowałem stanowisko testowe ze sterownikiem PIC32 do pomiaru napięcia co 0,75 °, a czarna linia łączy te pomiary.
Jeden z moich produktów ma tendencję do tworzenia lokalnych, niskich amplitud odchyleń od (i poniżej) idealnej linii. To pytanie dotyczy mojego algorytmu do kwantyfikacji tych zlokalizowanych „spadków”; Jaka jest dobra nazwa lub opis procesu pomiaru zanurzeń? (pełne wyjaśnienie poniżej) Na poniższym obrazku spadek występuje w lewej trzeciej części fabuły i jest marginalnym przypadkiem, czy zaliczę tę część, czy nie:
Zbudowałem więc detektor zanurzenia ( przepełnienie stosu qa o algorytmie ), aby zmierzyć moje przeczucie. Początkowo myślałem, że mierzę „obszar”. Ten wykres jest oparty na powyższym wydruku i mojej próbie graficznego wyjaśnienia algorytmu. Zapad jest trwały dla 13 próbek między 17 a 31:
Dane testowe idą do tablicy, a ja wykonuję kolejną tablicę do „wznoszenia” z jednego punktu danych do następnego, który nazywam . Korzystam z biblioteki, aby uzyskać średnią i standardowe odchylenie dla .
Analiza tablicy jest przedstawiona na poniższym wykresie, na którym nachylenie jest usuwane z powyższego wykresu. Początkowo myślałem o tym jako o „normalizacji” lub „ujednoliceniu” danych, ponieważ oś x to równe kroki, a teraz pracuję wyłącznie nad wzrostem między punktami danych. Badając to pytanie, przypomniałem sobie, że jest to pochodna oryginalnych danych.
Przechodzę przez aby znaleźć sekwencje, w których istnieje 5 lub więcej sąsiadujących wartości ujemnych. Niebieskie słupki to seria punktów danych, które są poniżej średniej wszystkich . Wartości niebieskich pasków to:
Sumują się do , co reprezentuje obszar (lub całkę). Moją pierwszą myślą jest „Właśnie zintegrowałem pochodną”, co powinno oznaczać, że odzyskam oryginalne dane, choć jestem pewien, że istnieje na to termin.
Zielona linia to średnia z tych „wartości poniżej średniej” znaleziona poprzez podzielenie obszaru przez długość zanurzenia:
Podczas testowania ponad 100 części doszedłem do wniosku, że dopuszczalne są spadki ze średnią zieloną linią poniżej . Odchylenie standardowe obliczone dla całego zestawu danych nie było wystarczająco ścisłym testem dla tych spadków, ponieważ bez wystarczającej całkowitej powierzchni nadal mieściły się w limicie, który ustaliłem dla dobrych części. Obserwacyjnie wybrałem odchylenie standardowe jako najwyższe, na jakie pozwalam.
Ustawienie odcięcia dla odchylenia standardowego na tyle surowego, aby zawiodło tę część, byłoby wówczas tak surowe, aby zawiodło części, które w innym przypadku wydają się mieć świetną fabułę. Mam też detektor szczytów, który zawodzi część, jeśli jakieś .
Minęło prawie 20 lat od Calc 1, więc nie przejmuj się , ale wydaje mi się, że profesor użył rachunku różniczkowego i równania przesunięcia, aby wyjaśnić, jak w wyścigach, zawodnik o mniejszym przyspieszeniu, który utrzymuje wyższą prędkość na zakręcie, może pokonać inną zawodnik mający większe przyspieszenie do następnego zakrętu: im szybsze przejście do poprzedniego zakrętu, tym wyższa prędkość początkowa oznacza, że obszar pod jego prędkością (przemieszczenie) jest większy.
Aby przełożyć to na moje pytanie, czuję, że moja zielona linia byłaby jak przyspieszenie, druga pochodna oryginalnych danych.
Odwiedziłem wikipedię, aby ponownie przeczytać podstawy rachunku różniczkowego i definicji pochodnej i całki , nauczyłem się właściwego terminu na sumowanie obszaru pod krzywą za pomocą dyskretnych pomiarów jako Całka numeryczna . Znacznie więcej googlingu całki i prowadzę do tematu nieliniowości i cyfrowego przetwarzania sygnału. Uśrednianie całki wydaje się być popularnym miernikiem do kwantyfikacji danych .
Czy istnieje termin na średnią całki? ( , zielona linia)?
... lub w procesie wykorzystywania go do oceny danych?
źródło
Odpowiedzi:
Przede wszystkim jest to świetny opis twojego projektu i problemu. A ja jestem wielkim fanem domowej ramy pomiarowej, która jest super fajna ... dlaczego więc, na litość boską, ma znaczenie to, co nazywacie „uśrednianiem całek”?
W przypadku zainteresowania szerszym pozycjonowaniem swojej pracy to, co chciałbyś zrobić, jest często nazywane wykrywaniem anomalii . W najprostszym ustawieniu polega on na porównaniu wartości w szeregu czasowym ze standardowym odchyleniem poprzednich wartości. Zasadą jest, następnie, jeśli gdzie jest wartość w szereg, to standardowe odchylenie wszystkich poprzednich wartości między wartością i , a
Jeśli dobrze zrozumiałem, szukasz sposobu na zautomatyzowanie testowania swoich urządzeń, to znaczy, zadeklaruj urządzenie jako dobre / wadliwe po przeprowadzeniu całego testu (narysowałem całą przekątną). W takim przypadku po prostu rozważ powyższe wzory jako porównanie ze standardowym odchyleniem wszystkich wartości.x[n]
Istnieją również inne reguły, które możesz rozważyć w celu sklasyfikowania urządzenia jako wadliwego:
Oczywiście możesz znaleźć więcej reguł i połączyć je za pomocą logiki boolowskiej, ale myślę, że możesz zajść bardzo daleko z trzema powyższymi.
Na koniec, po skonfigurowaniu, będziesz musiał przetestować klasyfikator (klasyfikator to system / model odwzorowujący dane wejściowe na klasę, w twoim przypadku dane każdego urządzenia, na „dobre” lub „ wadliwy"). Utwórz zestaw testowy, ręcznie oznaczając wydajność każdego urządzenia. Następnie spójrz na ROC , który w zasadzie mówi o przesunięciu między liczbą urządzeń, które Twój system prawidłowo odbiera ze zwróconego, w stosunku do liczby wadliwych urządzeń, które odbiera.
źródło