Mam zestaw elementów które mogę opisać według cech. A zatem:
gdzie to (numeryczna) ocena dla elementu zgodnie z cechami . Moje elementy można więc oglądać jako punkty w przestrzeni n- wymiarowej.
Zgodnie z moimi odczytami istnieją algorytmy, takie jak „klasyfikator Bayesa”, które mogą zapewnić odpowiedź typu „tak” lub „nie” na dowolnym elemencie mojego zestawu, pod warunkiem, że użyłem „zestawu szkoleniowego” składającego się z elementy mojego zestawu i oczekiwany wynik algorytmu. Na podstawie tych danych algorytm powinien być w stanie przyjąć dowolny inny element, nie będący częścią zestawu treningowego, i zapewnić odpowiedź „tak” lub „nie” w oparciu o to, czego się nauczył dzięki zestawowi treningowemu. Jest to świetne, jeśli masz jakieś wyobrażenie o tym, czego się spodziewasz (zestaw treningowy), ale nie masz pewności co do konkretnych zasad, które dają taki wynik.
To, co chciałbym zrobić z moimi danymi, nie polega na odpowiedzi typu „tak” lub „nie”, ale chciałbym wprowadzić ranking w ramach elementów. Niektóre z nich są „lepsze” niż inne. Podobnie jak w przypadku filtra Bayesa, mam ogólny pogląd na to, czego oczekuję. Mógłbym zatem wygenerować „ranking treningowy” zaczerpnięty z podzbioru moich elementów, który zasiliłbym MLA. Na podstawie tego szkolenia byłby w stanie ocenić cały mój zestaw.
W tym celu widzę dwa podejścia:
- Każdy element otrzyma ocenę MLA, a następnie uszereguje elementy zgodnie z wynikiem.
- MLA byłby w stanie wziąć dwa elementy i i ustalić, który z nich jest lepszy (porównania parami). Użyj quicksort, używając tej operacji porównania.
Uwaga: na podstawie wyniku funkcja parowania jest łatwa do zaimplementowania, a na podstawie funkcji parowania generowanie wyniku jest trywialne, więc są to tylko dwa sposoby uzyskania takich samych wyników.
Czy istnieją przykłady MLA, które mogą zapewnić funkcję oceniania lub funkcję porównania parami?
EDYCJA: Aby dodać więcej kontekstu: obecnie moje elementy są uszeregowane według algorytmu, który generuje wynik (liczbę rzeczywistą) dla każdego elementu, wykonując obliczenia na . Chociaż generowany ranking jest całkiem poprawny, często muszę zmodyfikować algorytm, aby go w jakiś sposób ulepszyć, ponieważ wyraźnie widzę niektóre elementy, które nie są uszeregowane zgodnie z oczekiwaniami.
Obecnie mój proces projektowania to:
- Dowiedz się, jaki byłby idealny ranking
- Spróbuj (ręcznie) uzyskać algorytm, który uszereguje takie pozycje
- Obserwuj wyniki
- Dostosuj algorytm
Pomyślałem więc o MLA, ponieważ punktem wyjścia mojego procesu jest to, co można wykorzystać jako dane szkoleniowe. Prawdopodobnie zacznę od zajęcia obecnej rangi, zamiany przedmiotów zgodnie z moimi potrzebami i nakarmienia tego.