Jak liczba połączeń może być gaussowska, jeśli nie może być ujemna?

14

Analizuję sieci społecznościowe (nie wirtualne) i obserwuję powiązania między ludźmi. Gdyby ktoś wybrał inną osobę, z którą mógłby się połączyć losowo, liczba połączeń w grupie osób byłaby rozłożona normalnie - przynajmniej zgodnie z książką, którą obecnie czytam.

Skąd możemy wiedzieć, że rozkład jest Gaussa (normalny)? Istnieją inne rozkłady, takie jak Poisson, Rice, Rayliegh, itp. Problem z rozkładem Gaussa w teorii polega na tym, że wartości idą od do + (chociaż prawdopodobieństwa zbliżają się do zera), a liczba połączeń nie może być ujemna.+

Czy ktoś wie, jakiej dystrybucji można się spodziewać w przypadku, gdy każda osoba samodzielnie (losowo) odbierze inną osobę do połączenia?

niko
źródło
1
Wyjaśnienie: Czy pytanie dotyczy „całkowitej liczby połączeń dla całej grupy” czy „całkowitej liczby połączeń dla jednej osoby”? Moja odpowiedź domyślnie zakłada to drugie.
1
Dystrybucja Riley ? To dla mnie nowe. Czy masz referencję lub link?
onestop
3
Może „Rayleigh”?
whuber

Odpowiedzi:

6

Gdy jest osób, a liczba połączeń wykonanych przez osobę i , 1 i n , wynosi X i , wówczas łączna liczba połączeń wynosi S n = n i = 1 X i / 2 . Teraz, jeśli weźmiemy X i za zmienne losowe, przyjmijmy, że są one niezależne, a ich wariancje nie są „zbyt nierówne”, ponieważ coraz więcej osób jest dodawanych do mieszanki, wówczas obowiązuje Twierdzenie Graniczne Centralne Lindeberga-Levy'ego . Twierdzi, że funkcja skumulowanego rozkładuni,1in,XiSn=i=1nXi/2Xiz standaryzowanych rośnie.suma jest zbieżna z cdf rozkładu normalnego. Oznacza to z grubsza, że ​​histogram sumy będzie coraz bardziej przypominał gaussowską („krzywą dzwonową”) jako n

Zobaczmy, co to nie mówi:

  • Nie twierdzi, że rozkład jest zawsze dokładnie normalny. Nie może być, z powodów, które wskazałeś.Sn

  • Nie oznacza to, że oczekiwana liczba połączeń jest zbieżna. W rzeczywistości musi się różnić (przejść do nieskończoności). Standaryzacja polega na ponownym wprowadzeniu do centrum i zmianie skali dystrybucji; ilość przeskalowań rośnie bez ograniczeń.

  • Xjan

Whuber
źródło
Zauważ, że nie interpretuję tego pytania, aby stwierdzić, że wszyscy wybierają dokładnie jedną osobę, z którą należy się połączyć - prowadziłoby to do sterylnej teorii, ponieważ liczba połączeń byłaby określona, ​​a nie losowa. Zamiast tego zinterpretowałem to, aby stwierdzić, że każdy, gdy wejdzie do sieci, wybiera losowo spośród n innych połączeń, kończąc się od 0 do n wszystkich połączeń ogółem. Założenie dotyczące wariancji jest zapewnione, gdy istnieje ograniczenie liczby połączeń, które nawiąże każdy nowicjusz, a liczba ta ma pewną „minimalną” losowość.
whuber
Xi
1
@Andy Not people: liczba nawiązanych połączeń. Ważną rzeczą jest to, że powinna istnieć spora szansa, że ​​liczba połączeń wykonywanych przez jednostki jest różna i nie ustala się na stałym poziomie. Kiedy tak się dzieje, rozkład graniczny (liczby połączeń) jest określony przez skończoną liczbę początkowych połączeń, które się różnią, więc nie można podejść do rozkładu normalnego asymptotycznie.
whuber
1

Odpowiedź zależy od założeń, które jesteś skłonny poczynić. Sieć społecznościowa stale ewoluuje w czasie i dlatego nie jest jednostką statyczną. Dlatego należy poczynić pewne założenia dotyczące ewolucji sieci w czasie.

n

Prob(No of connections for any individual=n1)=1 .

Jeśli dana osoba wybierze losowo inną osobę, z którą będzie się łączyć, w końcu wszyscy zostaną połączeni.

Jednak rzeczywiste sieci nie zachowują się w ten sposób. Ludzie różnią się w kilku aspektach.

  1. W dowolnym momencie dana osoba ma stały rozmiar sieci, a prawdopodobieństwo nawiązania innego połączenia jest funkcją jego / jej rozmiaru sieci (gdy ludzie przedstawiają inne osoby itp.).

  2. Osoba ma własną wewnętrzną tendencję do tworzenia połączenia (ponieważ niektórzy są introwertyczni / ekstrawertyczni itp.).

Prawdopodobieństwa te zmieniają się w czasie, kontekście itp. Nie jestem pewien, czy istnieje prosta odpowiedź, chyba że przyjmiemy pewne założenia dotyczące struktury sieci (np. Gęstość sieci, zachowanie ludzi itp.).


źródło
@Sikikant Czy możesz wyjaśnić, jak wyciągnąć „trywialną odpowiedź”? (Musi za tym kryć się kilka niepotwierdzonych założeń.) I do jakiego twierdzenia odwołujesz się, gdy dochodzisz do wniosku, że „w końcu wszyscy zostaną połączeni”? To wcale nie jest oczywiste!
whuber
@ whuber Zakładam, że rozmiar sieci jest stały. Pytanie brzmi: osoba wybiera losowo inną osobę, aby nawiązać połączenie i prawdopodobnie jest to ciągły proces. Tak więc, w miarę upływu czasu, wszyscy powinni być połączeni. Bez twierdzenia, tylko intuicja. Być może używam nieprecyzyjnego języka.
@Sikikant Nadal jestem zdezorientowany, ponieważ po długim czasie „Prob (liczba połączeń = n)” równa się 1, gdy n = 3, a poza tym zawsze wynosi zero. W końcu, gdy „wszyscy powinni być połączeni”, liczba połączeń jest równa n (n-1) / 2. Podejrzewam, że możesz mieć na myśli kilka różnych przypadkowych procesów jednocześnie. Może to pomóc w ujawnieniu przyjętych założeń i być nieco bardziej precyzyjnym.
whuber