Indeks Szukaj kosztów operatora

9

Dla przykładowej bazy danych AdventureWorks zapytanie poniżej:

SELECT 
    P.ProductID, 
    CA.TransactionID
FROM Production.Product AS P
CROSS APPLY
(
    SELECT TOP (1)
        TH.TransactionID
    FROM Production.TransactionHistory AS TH
    WHERE
        TH.ProductID = P.ProductID
    ORDER BY 
        TH.TransactionID DESC
) AS CA;

Planu pokazuje wykonanie Szacowany koszt operatora od 0.0850383 (93%) dla indeksu Szukajcie :

plan

Koszt jest niezależny od stosowanego modelu szacowania liczności.

Nie jest to prosty dodatek do Szacowanego kosztu procesora i Szacowanego kosztu we / wy . Nie jest to również koszt jednego wykonania Wyszukiwania indeksu pomnożony przez Szacowaną liczbę wykonań .

Jak powstaje ten numer kosztu?

Paul White 9
źródło

Odpowiedzi:

10

Pełna logika wyliczania kosztów jest złożona, ale w przypadku stosunkowo prostego przypadku w pytaniu:

Wejścia

  1. Liczba operacji wykonywanych przez operatora
    Jest to Szacowana liczba wykonań : 504

  2. Liczność (całkowita liczba rzędów) w indeksie w TableCardinality własność Główna Szukajcie operatora daje to: 113443

  3. Liczba stron danych w indeksie: 201
    Liczbę tę można uzyskać na wiele sposobów, na przykład sys.allocation_units:

    SELECT 
        AU.data_pages
    FROM sys.allocation_units AS AU
    JOIN sys.partitions AS P
        ON P.hobt_id = AU.container_id
    WHERE
        AU.[type_desc] = N'IN_ROW_DATA'
        AND P.[object_id] = OBJECT_ID(N'Production.TransactionHistory', N'U')
        AND P.index_id = 
            INDEXPROPERTY(P.[object_id], N'IX_TransactionHistory_ProductID', 'IndexID');
  4. Gęstość (1 / różne wartości ) indeksu: 0,002267574
    Jest on dostępny w wektorze gęstości statystyki indeksu:

    DBCC SHOW_STATISTICS 
    (
        N'Production.TransactionHistory', 
        N'IX_TransactionHistory_ProductID'
    ) 
    WITH DENSITY_VECTOR;

    gęstość

Obliczenie

-- Input numbers
DECLARE
    @Executions float = 504,
    @Density float = 0.002267574,
    @IndexDataPages float = 201,
    @Cardinality float = 113443;

-- SQL Server cost model constants
DECLARE
    @SeqIO float = 0.000740740740741,
    @RandomIO float = 0.003125,
    @CPUbase float = 0.000157,
    @CPUrow float = 0.0000011;

-- Computation
DECLARE
    @IndexPages float = CEILING(@IndexDataPages * @Density),
    @Rows float = @Cardinality * @Density,
    @Rebinds float = @Executions - 1e0;

DECLARE
    @CPU float = @CPUbase + (@Rows * @CPUrow),
    @IO float = @RandomIO + (@SeqIO * (@IndexPages - 1e0)),
    -- sample with replacement
    @PSWR float = @IndexDataPages * (1e0 - POWER(1e0 - (1e0 / @IndexDataPages), @Rebinds));

-- Cost components (no rewinds)
DECLARE
    @InitialCost float = @RandomIO + @CPUbase + @CPUrow,
    @RebindCPU float = @Rebinds * (1e0 * @CPUbase + @CPUrow),
    @RebindIO float = (1e0 / @Rows) * ((@PSWR - 1e0) * @IO);

-- Result
SELECT 
    OpCost = @InitialCost + @RebindCPU + @RebindIO;

skrzypce db <>

Wynik

Paul White 9
źródło
Świetna robota, dobrze wiedzieć, skąd bierze się szacowany koszt, które zmienne go wpływają i w jakiej proporcji. Czy to jest mechanika wszystkich wersji SQL Server? Może kilka zmian w stałych?
EzLo,
2
O ile mi wiadomo, ten aspekt kalkulacji kosztów nie zmienił się od 2005 r.
Paul White 9