Ostatnio pracuję nad zrozumieniem danych lub metryk przechowywanych w pliku zdarzeń zdarzeń rozszerzonych dotyczących kondycji systemu.
Staramy się zaimplementować gromadzenie danych wskaźników wydajności przy użyciu kondycji systemu, jak tutaj podano
Istnieją raporty, które podają takie dane, jak UŻYTKOWANIE PROCESORA, inne wykorzystanie procesów itp., Które są zbierane z nazwanych zdarzeń kondycji systemu
scheduler_monitor_system_health_ring_buffer_recorded
Nie jestem w stanie zrozumieć dla niektórych moich zajętych serwerów, dlaczego pole „proces_utilization”, które jest wymienione w raporcie jako wykorzystanie procesora SQL, jest w większości przypadków powyżej 100. W szczycie jest ono w zakresie 120-160 i z powodu którego raport jest zawsze pokazuje procesor powyżej 100, nawet jeśli sprawdziłem z monitora aktywności serwerów, co nigdy nie jest prawdą.
Podniosłem ten problem w Github, ale wydaje się, że nie ma poprawki ani odpowiedzi.
Dlatego moje pytanie byłoby
Jak mogę uzyskać dokładną liczbę wykorzystania procesora SQL dla moich serwerów za pomocą zarejestrowanego bufora pierścienia kondycji systemu?
Raport pokazuje również licznik dla mniej niż 2 pól obliczonych na podstawie ich raportu
100-System_idle-process_utilization as OtherProcessUtil
100-system_idle jako SystemUtil
Co to są OtherProcessUtil i SystemUtil potrzebne są / potrzebne / pomocne?
- Za każdym razem widzę wykorzystanie pamięci jako 100. Nie wydaje się to również poprawne. Czy ktoś to zauważył?
Inne narzędzia, takie jak Idera i sentry [które przetestowałem], nie pokazują użycia procesora powyżej 100% dla tych samych serwerów. Zrobiłem porównanie obok siebie dla tego samego obciążenia.
źródło