Analizuję sieci społecznościowe (nie wirtualne) i obserwuję powiązania między ludźmi. Gdyby ktoś wybrał inną osobę, z którą mógłby się połączyć losowo, liczba połączeń w grupie osób byłaby rozłożona normalnie - przynajmniej zgodnie z książką, którą obecnie czytam.
Skąd możemy wiedzieć, że rozkład jest Gaussa (normalny)? Istnieją inne rozkłady, takie jak Poisson, Rice, Rayliegh, itp. Problem z rozkładem Gaussa w teorii polega na tym, że wartości idą od do + ∞ (chociaż prawdopodobieństwa zbliżają się do zera), a liczba połączeń nie może być ujemna.
Czy ktoś wie, jakiej dystrybucji można się spodziewać w przypadku, gdy każda osoba samodzielnie (losowo) odbierze inną osobę do połączenia?
Odpowiedzi:
Gdy jest osób, a liczba połączeń wykonanych przez osobę i , 1 ≤ i ≤ n , wynosi X i , wówczas łączna liczba połączeń wynosi S n = ∑ n i = 1 X i / 2 . Teraz, jeśli weźmiemy X i za zmienne losowe, przyjmijmy, że są one niezależne, a ich wariancje nie są „zbyt nierówne”, ponieważ coraz więcej osób jest dodawanych do mieszanki, wówczas obowiązuje Twierdzenie Graniczne Centralne Lindeberga-Levy'ego . Twierdzi, że funkcja skumulowanego rozkładun i,1≤i≤n, Xi Sn=∑ni=1Xi/2 Xi z standaryzowanych rośnie.suma jest zbieżna z cdf rozkładu normalnego. Oznacza to z grubsza, że histogram sumy będzie coraz bardziej przypominał gaussowską („krzywą dzwonową”) jako n
Zobaczmy, co to nie mówi:
Nie twierdzi, że rozkład jest zawsze dokładnie normalny. Nie może być, z powodów, które wskazałeś.Sn
Nie oznacza to, że oczekiwana liczba połączeń jest zbieżna. W rzeczywistości musi się różnić (przejść do nieskończoności). Standaryzacja polega na ponownym wprowadzeniu do centrum i zmianie skali dystrybucji; ilość przeskalowań rośnie bez ograniczeń.
źródło
Odpowiedź zależy od założeń, które jesteś skłonny poczynić. Sieć społecznościowa stale ewoluuje w czasie i dlatego nie jest jednostką statyczną. Dlatego należy poczynić pewne założenia dotyczące ewolucji sieci w czasie.
Jeśli dana osoba wybierze losowo inną osobę, z którą będzie się łączyć, w końcu wszyscy zostaną połączeni.
Jednak rzeczywiste sieci nie zachowują się w ten sposób. Ludzie różnią się w kilku aspektach.
W dowolnym momencie dana osoba ma stały rozmiar sieci, a prawdopodobieństwo nawiązania innego połączenia jest funkcją jego / jej rozmiaru sieci (gdy ludzie przedstawiają inne osoby itp.).
Osoba ma własną wewnętrzną tendencję do tworzenia połączenia (ponieważ niektórzy są introwertyczni / ekstrawertyczni itp.).
Prawdopodobieństwa te zmieniają się w czasie, kontekście itp. Nie jestem pewien, czy istnieje prosta odpowiedź, chyba że przyjmiemy pewne założenia dotyczące struktury sieci (np. Gęstość sieci, zachowanie ludzi itp.).
źródło