Alternatywa dla samodzielnego dołączenia

10

Zadałem tutaj pytanie: /programming/43807566/how-to-divide-two-values-from-the-same-column-but-at-different-rows

o dzieleniu wartości z tej samej tabeli, w tej samej kolumnie, ale w różnych wierszach. Teraz mam problem polegający na tym, że mam więcej liczników i mianowników (z różnymi uns). Czy nadal self joinjest dobrym sposobem na rozwiązanie tego problemu w Postgres, czy są lepsze rozwiązania?

Przykład:

| postcode | value | uns |
|----------|-------|-----|
|       AA |    40 |  53 |
|       BB |    20 |  53 |
|       AA |    10 |  54 |
|       AA |    20 |  55 |
|       AA |    10 |  56 |
|       AA |    30 |  57 |
|       AA |    50 |  58 |
|       BB |    10 |  54 |
|       BB |    10 |  55 |
|       BB |    70 |  56 |
|       BB |    80 |  57 |
|       BB |    10 |  58 |

Wynik powinien być:

| postcode | formula    |
|----------|------------|
|       AA | 18.888...  |
|       BB | 14.375     |

Gdzie wartości są pogrupowane według kodu pocztowego, a formuła jest (wartość z uns):

(V53 * V56 + V54 * V57 + V55 * V58) / (V56 + V57 + V58)

Zwracanie uwagi, aby uniknąć ewentualnego podziału przez zero. Formuła może być jeszcze bardziej złożona, ale to dobry przykład.

Randomize
źródło
czy jest jakieś pole w tabeli, które oznacza, które wiersze są licznikami i mianownikami?
McNets
nie, mianownik jest sumą wartości z uns 56, 57, 58.
Randomize
Wydaje się, że najlepszym rozwiązaniem byłoby przestawienie danych, aby unsstały się nazwami kolumn - stamtąd, niezależnie od użytej formuły, wartości powinny stać się wykonalne. Czy formuła zostanie zakodowana na stałe, czy będzie dynamicznie uzyskiwana w jakiś sposób?
RDFozz
istnieje kilka formuł (~ 30), które będą wymagały utworzenia zbyt wielu tabel
Randomize

Odpowiedzi:

3

Jest to problem związany z przestawieniem / przestawieniem , tak jak u Michaela już dokładnie zdiagnozowano .

Jeśli nie znasz tablefuncmodułu Postgres, przeczytaj podstawowe instrukcje tutaj:

Zapytanie staje się proste i bardzo szybkie (szybsze niż inne przedstawione tutaj rozwiązania):

SELECT (v53 * v56 + v54 * v57 + v55 * v58) / NULLIF(v56 + v57 + v58, 0)
FROM   crosstab(
   'SELECT postcode, uns, value FROM tbl ORDER BY 1'
 , 'SELECT generate_series(53,58)'
   ) AS ct (postcode text
          , v53 numeric, v54 numeric, v55 numeric
          , v56 numeric, v57 numeric, v58 numeric);

NULLIF aby zapobiec podziałowi przez zero.

dbfiddle tutaj

Erwin Brandstetter
źródło
6

Możesz agregować wszystkie pary uns / value w obiekt JSON, a następnie użyć go, aby uzyskać dostęp do wartości UNS według nazwy. Wymaga to rzutowania, ponieważ wartości można wyodrębnić tylko jako tekst z obiektu JSON, ale wówczas formuła wygląda bardzo podobnie do opisu:

with vals(postcode, v) as (
  select postcode, json_object_agg(uns, value)
  from x
  group by postcode
), factors (postcode, denominator, divisor) as (
  select postcode, 
         (v->>'53')::decimal * (v->>'56')::decimal + (v->>'54')::decimal * (v->>'57')::decimal + (v->>'55')::decimal * (v->>'58')::decimal,
         (v->>'56')::decimal + (v->>'57')::decimal + (v->>'58')::decimal
  from vals
)
select postcode, 
       denominator / nullif(divisor, 0)
from factors;

Agregację, ocenę mianownika i dzielnika podzieliłem na trzy etapy, aby uczynić je bardziej czytelnymi.

Przykład online: http://rextester.com/IZYT54566


Możesz uprościć formułę, tworząc funkcję:

create function val(p_vals json, p_uns text)
  returns decimal
as $$
  select (p_vals ->> p_uns)::decimal;
$$
language sql;

with vals (postcode, v) as (
  select postcode, json_object_agg(uns, value)
  from x
  group by postcode
), factors (postcode, denominator, divisor) as (
  select postcode, 
         val(v, '53') * val(v, '56') + val(v, '54') * val(v, '57') + val(v, '55') * val(v, '58'),
         val(v, '56') + val(v, '57') + val(v, '58')
  from vals
)
select postcode, 
       denominator / nullif(divisor, 0)
from factors;
koń bez imienia
źródło
4

Wzorzec PIVOT działałby w tym celu. Konwertuje wartości wierszy na kolumny w jednym rzędzie, zgodnie z ich wspólnym kluczem. Istnieje kilka sposobów na wdrożenie tego. Niektóre wymagają tylko jednego skanowania tabeli.

Po PIVOT masz tabelę z jednym wierszem na kod pocztowy i kolumną na wartość. Pozostała część zapytania byłaby zapisana tak, jakby odwoływała się do pojedynczej tabeli.

Michael Green
źródło
3

Zakładając, że (postcode, uns)UNIQUE(prawdopodobnie PK), wzorzec PIVOT, jak już skomentował @ michael-green, można zaimplementować przenośnie za pomocą następującego zapytania:

SELECT
     postcode, 
     CAST(V53 * V56 + V54 * V57 + V55 * V58 AS numeric) 
         / nullif(V56 + V57 + V58, 0) AS formula
FROM
    (SELECT
         postcode,
         sum(case when uns=53 then value end) AS v53,     
         sum(case when uns=54 then value end) AS v54,     
         sum(case when uns=55 then value end) AS v55,     
         sum(case when uns=56 then value end) AS v56,
         sum(case when uns=57 then value end) AS v57,
         sum(case when uns=58 then value end) AS v58
    FROM
         t
    GROUP BY
         postcode
    ) AS s
ORDER BY
    postcode ;

Sprawdź to na SQLFiddle .

joanolo
źródło
3

Zakładając, że (postcode, uns)są to UNIQUE(prawdopodobnie PK), prawdopodobnie najprostszy , prawdopodobnie najbardziej przenośny, choć prawdopodobnie nie optymalny: użyj tyle podselekcji, ile potrzeba :

SELECT
    postcode,
    ((SELECT value FROM t WHERE t.uns = 53 AND t.postcode = p.postcode) *
     (SELECT value FROM t WHERE t.uns = 56 AND t.postcode = p.postcode) +
     (SELECT value FROM t WHERE t.uns = 54 AND t.postcode = p.postcode) *
     (SELECT value FROM t WHERE t.uns = 57 AND t.postcode = p.postcode) +
     (SELECT value FROM t WHERE t.uns = 55 AND t.postcode = p.postcode) *
     (SELECT value FROM t WHERE t.uns = 58 AND t.postcode = p.postcode)
    )::double precision / 
     nullif( (SELECT sum(value) FROM t 
              WHERE t.uns IN (56, 57, 58) AND t.postcode = p.postcode), 0)
    AS formula
FROM
    (SELECT DISTINCT postcode FROM t) AS p
ORDER BY
    postcode ;

Sprawdź w SQLFiddle .

joanolo
źródło