Teledysk PSY „Gangnam style” jest popularny, po nieco ponad 2 miesiącach ma około 540 milionów widzów. Nauczyłem się tego od moich czternastu dzieci podczas obiadu w zeszłym tygodniu i wkrótce dyskusja poszła w kierunku, czy można było przewidzieć, ilu widzów będzie za 10-12 dni i kiedy (/ jeśli) piosenka przejdzie 800 milionów widzów lub 1 miliard widzów.
Oto zdjęcie z liczby widzów, odkąd zostało opublikowane:
Oto zdjęcie wielu widzów teledysków No1 „Justin Biever-Baby” i No2 „Eminem - Love the way lying”, które są dostępne już od dłuższego czasu
Moja pierwsza próba uzasadnienia tego modelu polegała na tym, że powinna to być krzywa S, ale wydaje się, że nie pasuje to do piosenek No1 i No2, a także nie pasuje, że nie ma ograniczenia liczby wyświetleń tego teledysku może mieć tylko wolniejszy wzrost.
Więc moje pytanie brzmi: jakiego modelu powinienem użyć, aby przewidzieć liczbę widzów teledysku?
Odpowiedzi:
Aha, doskonałe pytanie !!
Naiwnie zaproponowałbym również krzywą logistyczną w kształcie litery S, ale jest to oczywiście słabe dopasowanie. O ile mi wiadomo, stały wzrost jest przybliżony, ponieważ YouTube liczy unikalne wyświetlenia (jedno na adres IP), więc nie może być więcej wyświetleń niż komputery.
Ten system rozwiązuje
i rozwiązuje
Aktualizacja: Z zebranych komentarzy wynika, że Youtube liczy wyświetlenia (w tajny sposób), a nie unikalne adresy IP, co robi dużą różnicę. Powrót do deski kreślarskiej.
Upraszczając, załóżmy, że widzowie są „zarażeni” filmem. Wracają, aby oglądać to regularnie, dopóki nie usuną infekcji. Jednym z najprostszych modeli jest SIR (Susceptible-Infected-Resistant), który jest następujący:
W tym modelu liczba wyświetleń gwałtownie rośnie po pewnym czasie od początku infekcji, czego nie ma w oryginalnych danych, być może dlatego, że filmy rozprzestrzeniają się również w sposób niezawirusowany (lub memowy). Nie jestem ekspertem w szacowaniu parametrów modelu SIR. Po prostu grając z różnymi wartościami, oto co wymyśliłem (w R).
Model nie jest oczywiście idealny i można go uzupełnić na wiele sposobów. Ten bardzo przybliżony szkic przewiduje miliard wyświetleń w okolicach marca 2013 r. Zobaczmy ...
źródło
Prawdopodobnie najczęstszym modelem prognozowania przyjęcia nowego produktu jest model dyfuzji basu , który - podobnie jak odpowiedź @ gui11aume - modeluje interakcje między obecnymi i potencjalnymi użytkownikami. Przyjęcie nowego produktu jest dość gorącym tematem w prognozowaniu, wyszukiwanie tego terminu powinno dostarczyć mnóstwo informacji (które niestety nie mam czasu na rozwinięcie tutaj ...).
źródło
Spojrzałbym na krzywą wzrostu Gompertza .
Krzywa Gompertza jest 3-parametrowym (a, b, c) wzorem podwójnie wykładniczym z czasem, T, jako zmienną niezależną.
Kod R:
Formuła wzrostu Gompertza jest znana z tego, że dobrze opisuje wiele zjawisk cyklu życia, w których początkowo wzrost przyspiesza, a następnie zwęża się, co skutkuje asymetryczną krzywą sigmoidalną, której pochodna jest bardziej stroma po lewej niż po prawej stronie piku. Na przykład łączna liczba artykułów na Wikipedii, która ma również charakter wirusowy, od wielu lat podąża za krzywą wzrostu Gompertza (z pewnymi parametrami a, b, c) od wielu lat.
Edycja: Jeśli krzywa Gompertza nie wystarcza do przybliżenia kształtu, którego szukasz, możesz dodać parametry
d
i θ zgodnie z opisem w Exponentaited Uogólniony rozkład Weibulla Gompertza . Zauważ, że ten papier używax
zamiastt
niezależnego parametru czasu. Co ciekawe, Wikipedia zmodyfikowała również swoje najlepsze przybliżenie, dodając jeden czwarty parametrd
, aby uwzględnić rozbieżność prognoz od rzeczywistej wartości po 2012 r . Zmodyfikowana 4-paramowa formuła krzywej Gompertza to:Funkcja Gompertza nosi imię Benjamina Gompertza (1779–1865) , współczesnego Gaussa (zaledwie 2 lata młodszego Gaussa), pierwszego matematyka, który to opisał.
źródło
Myślę, że trzeba oddzielić zjawiska, takie jak Gangnam Style, który wiele swoich poglądów zawdzięcza byciu memem / wirusem, od Justina Biebera i Eminema, którzy są wielkimi artystami i którzy rozprzestrzeniliby się szeroko w tradycyjnym otoczeniu - JB lub Eminem też sprzedaliby wiele singli, nie jestem pewien, czy PSY.
źródło
OK, chłopaki, potrzebujemy stylizowanych faktów na temat rozpowszechniania filmów z YouTube'a, które okazują się sugerować wzorce różniące się od zwykłej literatury dotyczącej rozpowszechniania produktów. Dobrym miejscem do rozpoczęcia jest Meeyoung Cha, Haewoon Kwak, Pablo Rodriguez, Yong-Yeol Ahn i Sue Moon, 2007, I Tube, You Tube, Everybody Tubes: Analiza największego na świecie systemu generowania treści wideo przez użytkowników, materiały z 7. ACM SIGCOMM konferencja na temat pomiaru Internetu, ISBN: 978-1-59593-908-1.
i
X Cheng, C Dale, J Liu, 2008, Statystyka i sieć społecznościowa filmów z youtube, w toku międzynarodowych warsztatów na temat jakości usług (IWQoS), Enschede, Holandia, czerwiec.
źródło
Patrząc na spowolnienie wyświetleń w ciągu ostatniego tygodnia, data 13 marca wygląda na przyzwoity zakład. Większość nowych widoków wydaje się być zainfekowanymi użytkownikami, którzy wracają wiele razy dziennie.
Jeśli chodzi o uzupełnienie modelu, jedną z metod stosowanych przez naukowców do śledzenia rozprzestrzeniania się wirusa jest monitorowanie jego mutacji genomu - kiedy i gdzie zmutowany może pokazać badaczom, jak szybko wirus jest przenoszony i rozprzestrzeniany (patrz śledzenie wirusa Zachodniego Nilu w USA) .
W sensie praktycznym filmy takie jak Gangnam Style i Party Rock Anthem (grupy LMFAO) częściej „mutują” się w parodie, flash moby, tańce weselne, remiksy i inne reakcje wideo niż powiedzmy, Baby Justina Biebera lub piosenki Eminema.
Badacze mogli przeanalizować liczbę odpowiedzi wideo (w szczególności parodie) jako dane zastępcze dla mutacji. Przydatny może być pomiar częstotliwości i popularności tych mutacji na wczesnym etapie życia filmu, modelowanie jego wyświetleń w YouTube w ciągu całego życia.
źródło