Rozwiązuję kostki Rubika jako hobby. Rejestruję czas, jaki zajęło mi rozwiązanie kostki za pomocą jakiegoś oprogramowania, więc teraz mam dane z tysięcy rozwiązań. Dane są w zasadzie długą listą liczb reprezentujących czas potrzebny na każde kolejne rozwiązanie (np. 22.11, 20.66, 21.00, 18.74, ...)
Czas potrzebny na rozwiązanie kostki w naturalny sposób różni się w zależności od rozwiązania, więc są dobre i złe rozwiązania.
Chcę wiedzieć, czy „robi mi się gorąco” - czy dobre rozwiązania pojawiają się w seriach. Na przykład, jeśli miałem kilka kolejnych dobrych ułożeń, czy bardziej prawdopodobne jest, że moje następne ułożenie będzie dobre?
Jaki rodzaj analizy byłby odpowiedni? Mogę wymyślić kilka konkretnych rzeczy do zrobienia, na przykład traktując rozwiązania jako proces Markowa i widząc, jak dobrze jedno rozwiązanie przewiduje następne i porównując z danymi losowymi, widząc, jak długo najdłuższe serie kolejnych rozwiązań poniżej mediany dla ostatniego 100 jest i porównuje to z oczekiwanymi danymi losowymi itp. Nie jestem pewien, jak wnikliwe byłyby te testy, i zastanawiam się, czy istnieją jakieś dobrze rozwinięte podejścia do tego rodzaju problemu.
źródło
Kilka myśli:
Narysuj rozkład czasów. Domyślam się, że zostaną one wypaczone, tak że niektóre czasy rozwiązania są naprawdę wolne. W takim przypadku możesz rozważyć log lub inną transformację czasów rozwiązania.
Utwórz wykres rozproszenia próby na osi x i czasie rozwiązania (lub rejestruj czas rozwiązania na osi y). Powinno to zapewnić intuicyjne zrozumienie danych. Może także ujawniać inne trendy oprócz „gorącej passy”.
Zastanów się, czy z czasem pojawia się efekt uczenia się. W przypadku większości łamigłówek ćwiczenie staje się szybsze. Fabuła powinna pomóc w ujawnieniu, czy tak jest. Taki efekt różni się od efektu „gorącej smugi”. Doprowadzi to do korelacji między próbami, ponieważ gdy uczysz się po raz pierwszy, powolne próby będą współwystępować z innymi powolnymi próbami, a gdy zdobędziesz więcej doświadczenia, szybsze próby będą występować jednocześnie z szybszymi próbami.
Rozważ swoją koncepcyjną definicję „gorących pasm”. Na przykład, czy dotyczy to tylko prób zbliżonych w czasie lub dotyczących bliskości zamówienia. Powiedzmy, że szybko rozwiązałeś kostkę we wtorek, a potem miałeś przerwę, aw następny piątek rozwiązałeś ją szybko. Czy to gorąca passa, czy liczy się tylko wtedy, gdy robisz to tego samego dnia?
Czy są inne efekty, które mogą różnić się od efektu gorącej serii? Np. Pora dnia, w której rozwiązujesz zagadkę (np. Zmęczenie), stopień, w jakim tak naprawdę się starasz? itp.
Po zrozumieniu alternatywnych efektów systematycznych można opracować model, który obejmuje ich jak najwięcej. Możesz wykreślić pozostałość na osi y i wypróbować na osi x. Następnie można sprawdzić, czy w resztkach w modelu występują autokorelacje. Ta autokorelacja dostarczy pewnych dowodów gorących smug. Jednak alternatywną interpretacją jest to, że istnieje jakiś inny systematyczny efekt, którego nie wykluczyłeś.
źródło
Oblicz korelogram dla swojego procesu. Jeśli proces ma charakter gaussowski (na podstawie wyglądu próbki), możesz ustalić dolne / górne granice (B) i sprawdzić, czy korelacje przy danym opóźnieniu są znaczące. Dodatnia autokorelacja z opóźnieniem 1 wskazywałaby na istnienie „pasm szczęścia”.
źródło