Chcę znaleźć maksymalne zestawy częstych przedmiotów i zamknięte zestawy częstych przedmiotów .
- Zestaw częstych elementów jest maksymalny, jeśli nie ma żadnych częstych ustawień superset.
- Zestaw częstych pozycji X ∈ F jest zamknięty, jeśli nie ma nadzbioru o tej samej częstotliwości
Więc policzyłem występowanie każdego zestawu przedmiotów.
{A} = 4 ; {B} = 2 ; {C} = 5 ; {D} = 4 ; {E} = 6
{A,B} = 1; {A,C} = 3; {A,D} = 3; {A,E} = 4; {B,C} = 2;
{B,D} = 0; {B,E} = 2; {C,D} = 3; {C,E} = 5; {D,E} = 3
{A,B,C} = 1; {A,B,D} = 0; {A,B,E} = 1; {A,C,D} = 2; {A,C,E} = 3;
{A,D,E} = 3; {B,C,D} = 0; {B,C,E} = 2; {C,D,E} = 3
{A,B,C,D} = 0; {A,B,C,E} = 1; {B,C,D,E} = 0
Min_Support ustawiony na // Bardzo ważne. Dzięki steffen za przypomnienie tego.
Czy maksymalna = ?
Czy zamknięte = ?
data-mining
dataset
association-rules
Mike John
źródło
źródło
Możesz przeczytać o algorytmie APRIORI. Pozwala uniknąć niepotrzebnych zestawów przedmiotów poprzez sprytne przycinanie.
B nie jest częste, usuń.
Stwórz i policz dwa zestawy przedmiotów (jeszcze nie ma magii, z wyjątkiem tego, że
B
już jest)Wszystkie są częste (zauważ, że wszystko, co
B
nie mogło być częste!)Teraz użyj reguły przedrostka. Łącz TYLKO przedmioty zaczynające się od tych samych przedmiotów n-1. Usuń wszystko, gdy jakikolwiek podzbiór nie jest częsty. Policz pozostałe zestawy przedmiotów.
Pamiętaj, że
{A,C,D}
nie jest to częste. Ponieważ nie ma wspólnego prefiksu, nie może istnieć częstszy zestaw przedmiotów!Zauważ, ile mniej pracy wykonałem!
Aby uzyskać maksymalne / zamknięte zestawy elementów, sprawdź podzbiory / nadzbiory.
Należy pamiętać, że na przykład
{E}=6
, i{A,E}=4
.{E}
jest podzbiorem, ale ma większe wsparcie, tzn. jest zamknięty, ale nie maksymalny.{A}
nie jest, ponieważ nie ma większego wsparcia niż{A,E}
, tzn. jest zbędny .źródło