każdy. Czy ktoś może mi pomóc w następujących kwestiach? Wszelkie wskazówki lub pomoc są mile widziane!
Mam podzbiór zestawu danych z +500 000 wierszy, który wygląda następująco
|— Group —|— Name —|— Value1 —|— Value2 —|
W ramach każdej grupy próbuję zidentyfikować nazwy w pierwszej piątce i górnym 10 percentylu wartości 1 , aby móc przystąpić do obliczania sumy wartości 2 dla każdego zidentyfikowanego percentyla.
Do tej pory udało mi się stworzyć tabelę przestawną, która wygląda tak.
|----------|--Sum Val1--|--Sum Val2--|
|--GroupA--|----------| Totals for GroupA
|----------|-Name A1--| Values.......
|----------|-Name A2--| Values.......
...
|----------|-Name An--| Values.......
|--GroupB--|----------| Totals for GroupB
... Values.......
|--GroupZ--|----------| Totals for GroupZ
Mógłbym ręcznie zidentyfikować percentyle, ale wyobrażam sobie, że istnieje łatwiejszy sposób. Przeprowadziłem kilka wyszukiwań dotyczących tego, jak postępować, ale spotykam tylko procedury, aby znaleźć percentyle w całym zbiorze danych.
microsoft-excel
pivot-table
HolaGonzalo
źródło
źródło
SUMIF
) i percentyla (LARGE
,SUMIFS
).Odpowiedzi:
Sposób konfiguracji tabeli przestawnej, stosując filtr 10 najlepszych, aby
Names
znaleźć góręNames
w każdym z nichGroup
. Jeśli chcesz znaleźć najlepszeNames
miejsce w klasyfikacji ogólnej, musisz umieścićNames
pole przedGroup
polem.Oto makieta, którą wykonałem:
Kiedy filtruję do Top 2
Names
:Kiedy umieszczam
Names
jako górne pole, a następnie filtruję do góry 2:Jak sugerowano w komentarzach, możesz również dodać kolumny pomocnicze do oryginalnych danych, które obliczają wpływ każdego wiersza, a następnie określają, czy jest w pierwszej dziesiątce i zwracają PRAWDA / FAŁSZ. Następnie możesz zastosować filtr do tabeli przestawnej, aby wyświetlać tylko te z PRAWDĄ w tym polu.
źródło