Co to są statystyki baz danych i jak mogę z nich skorzystać?

18

Słyszałem o statystykach, które domyślnie przechowuje SQL Server. Co one śledzą i jak mogę wykorzystać te informacje do ulepszenia mojej bazy danych?

sql-server-2005 statistics goric
źródło

21

Statystyki są po prostu formą dynamicznych metadanych, które pomagają optymalizatorowi zapytań w podejmowaniu lepszych decyzji. Na przykład, jeśli w tabeli jest tylko tuzin wierszy, nie ma sensu chodzić do indeksu, aby wyszukać; zawsze lepiej będzie wykonać pełne skanowanie tabeli. Ale jeśli ta sama tabela wzrośnie do miliona wierszy, prawdopodobnie lepiej będzie skorzystać z indeksu. Ale jeśli zapytasz tę tabelę o kolumnę, która ma tylko bardzo niewiele unikalnych wartości (np. Może to być kolumna „płeć” zawierająca tylko „M” lub „F”), tak naprawdę FTS może być lepszy od tego przypadku, ponieważ i tak trzeba pobrać blok, aby zbudować zestaw wyników. Powiedzmy teraz, że twoja tabela ma 99% „M” i tylko 1% „F”, powinniśmy FTS w jednym przypadku lub użyć indeksu w drugim. Ta sama tabela, to samo zapytanie, potencjalnie cztery różne plany zapytań w zależności od zawartości tabeli. Tego rodzaju rzeczy są „statystykami” i są indywidualne dla każdej bazy danych - nawet dwie bazy danych o identycznej strukturze tabeli i indeksu będą miały różne statystyki.

Podsumowując, w nowoczesnym silniku bazy danych istnieją dwa rodzaje optymalizacji zapytań: przepisywanie kodu SQL (optymalizacja oparta na regułach, podobnie jak kompilator przepisuje C, aby uczynić go bardziej wydajnym) i wybór właściwej ścieżki danych (optymalizacja oparta na kosztach , jak kompilator JIT identyfikujący punkty aktywne w czasie wykonywania). Musisz się tym martwić tylko wtedy, gdy zauważysz, że optymalizator zapytań robi coś oczywiście złego (np. Wybranie FTS, gdy wiesz, że indeks byłby lepszy).

Gajusz
źródło

2

+1 Nie mogłem tego lepiej wyjaśnić. Należy pamiętać, że statystyki są przydatne tylko wtedy, gdy są aktualizowane. Można tego dokonać za pomocą automatycznych aktualizacji statystyk lub regularnie zaplanowanej (nocnej / tygodniowej) komendy aktualizacji statystyk. Ponadto odbudowy indeksu automatycznie wykonają aktualizację statystyk.

Matt M

5

Są one używane przez optymalizator zapytań (oficjalny dokument na MSDN) do śledzenia rozkładu wartości w indeksach i / lub kolumnach.

Twoim jedynym zmartwieniem powinna być regularna aktualizacja : po prostu zostaw silnik DB, aby zrobić swoje

gbn
źródło

2

Nie zawsze. Są chwile, kiedy ręczne tworzenie statystyki może pomóc w osiągnięciu wydajności zapytania.

mrdenny,

@mrdenny: Jak często robiłeś to w prawdziwym życiu? Bardzo rzadko. Nie mam IIRC. Jeśli potrzebuje statystyk, można argumentować, że potrzebuje indeksu, który i tak ma statystyki. Możesz tworzyć statystyki kolumn tylko według opcji UTWÓRZ STATYSTYKI . Biorąc pod uwagę, że OP musiał zapytać o statystyki, powiedziałbym, że to uczciwa rzecz.

gbn

1

Zrobiłem to kilka razy, ale nie często. Sprzeciwiłem się twojemu stwierdzeniu „Twoim jedynym celem powinno być regularne aktualizowanie”, ponieważ aktualizowanie statystyk to nie jedyne.

mrdenny 24.01.11

Co to są statystyki baz danych i jak mogę z nich skorzystać?

Odpowiedzi: