Modele losowych wykresów dla rzeczywistych sieci komputerowych

19

Interesują mnie modele losowych wykresów, które są podobne do wykresów rzeczywistych sieci komputerowych. Nie jestem pewien, czy wspólny dobrze zbadany model ( wierzchołków, każda możliwa krawędź jest wybierana z prawdopodobieństwem ) nadaje się do badania rzeczywistych sieci komputerowych (prawda?).n psol(n,p)np

jakie modele losowych wykresów są przydatne do zrozumienia sieci komputerowych powstających w praktyce?

Mówiąc bardziej ogólnie, jakie inne modele skończonych losowych wykresów (inne niż równoważne modelowi ) zostały zbadane w literaturze? (Idealną odpowiedzią byłby wskaźnik do ankiety dla badanych modeli skończonych losowych wykresów.)sol(n,p)

Kaveh
źródło
2
Gdzie potrzebujesz takich modeli - czy wystarczy wygenerować jakieś testowe dane wejściowe dla algorytmów, czy chcesz przeanalizować modele, aby dowiedzieć się czegoś o sieciach komputerowych? Jakimi sieciami komputerowymi jesteś zainteresowany; jaka jest twoja waga (LAN vs. Internet)? Dlaczego zakładasz, że rzeczywiste sieci komputerowe są generowane przez losowy proces - zaskakująco często sieci z prawdziwego świata są projektowane przez inżyniera, przy niewielkim rzucie monetą?
Jukka Suomela
@Jukka, próbuję sprawdzić, czy mogę zastosować techniki opracowane dla do takich losowych modeli w celu uzyskania informacji o prawdziwych sieciach, nie chcę teraz być bardziej szczegółowy, ponieważ może to dać problem, o którym myślę :). Interesuje mnie głównie warstwa IP Internetu. Widziałem, jak ludzie używają losowych wykresów do analizy wykresów pochodzących z sieci społecznościowych. Nie jestem pewien, dlaczego te prawdziwe sieci dzielą właściwości z losowymi wykresami, może być ukryty losowy proces za powierzchnią w pracy (wydaje się interesujące pytanie :). sol(n,p)
Kaveh
Wydaje mi się, że część zainteresowania wykorzystaniem losowych modeli polega na tym, że ich analiza jest łatwiejsza niż analiza rzeczywistych sieci, więc rozsądne jest rozważenie ich, jeśli są wystarczająco dobre w przybliżeniu do rzeczywistej.
Kaveh
Dziękuję wszystkim za miłe odpowiedzi. (Teraz muszę poświęcić trochę czasu na czytanie tych dokumentów. :)
Kaveh

Odpowiedzi:

10

W ciągu ostatnich kilku lat badania losowych wykresów z „naturalnymi” ograniczeniami strukturalnymi zyskały na popularności. Można na przykład rozważyć płaski wykres narysowany z klasy wszystkich płaskich wykresów z wierzchołkami i zbadać, jak zachowuje się jak n . W przeciwieństwie do losowych wykresów Erdősa-Rényi lub innych podobnych modeli, krawędzie na tych wykresach są wysoce zależne, więc jednym z pseudo-motywacji do badania takich rozkładów jest analiza modeli sieciowych z bardzo ograniczoną niezależnością między krawędziami.nn

Być może jednak obecnie cel ten wydaje się dość odległy, ponieważ ograniczona niezależność znacznie utrudnia analizę właściwości takich wykresów. W rzeczywistości kilka podstawowych pytań, na które bardzo łatwo jest odpowiedzieć dla , takich jak rozkład sekwencji stopni, zostały rozwiązane dopiero niedawno dla losowych wykresów płaskich.G(n,p)

Ostateczne odniesienie można znaleźć w artykułach Konstantinosa Panagiotou i zawartych w nich cytatach. Dla wygody oto mała próbka niektórych istotnych dokumentów:

  • O rozkładzie stopni losowych wykresów płaskich . Konstantinos Panagiotou i Angelika Steger . Wystąpić w toku 22. dorocznego sympozjum ACM-SIAM na temat algorytmów dyskretnych (SODA '11).
  • O właściwościach przypadkowych przekrojów i triangulacji . Nicla Bernasconi, Konstantinos Panagiotou i Angelika Steger . W materiałach z 19. dorocznego sympozjum ACM-SIAM na temat algorytmów dyskretnych (SODA '08), str. 132–141. [http://www.mpi-inf.mpg.de/~kpanagio/Dissections.pdf]
  • O stopniach losowych wykresów zewnętrznych i szeregowo-równoległych . Nicla Bernasconi, Konstantinos Panagiotou i Angelika Steger . W materiałach z 12. Międzynarodowego warsztatu na temat technik losowych w obliczeniach (RANDOM'08), s. 1. 303–316. [http://www.mpi-inf.mpg.de/~kpanagio/OPSP.pdf]
Max
źródło
1
Dodatkowy komentarz: ta linia badań faktycznie sięga około 15 lat, przynajmniej do pracy Denise, Vasconcellos i Welsh (1996), a jednym z powodów, dla których „zyskała przyczepność”, jest obecnie wielki sukces zastosowania kombinatoryka analityczna i asymptotyczne wyliczanie tutaj, np. Gimenez i Noy (2009).
RJK
10

Badanie to, Struktura i funkcja złożonych sieci Newmana, dokonuje przeglądu technik i modeli dla rzeczywistych złożonych sieci, w tym takich pojęć, jak efekt małego świata, rozkłady stopni i modele wykresów losowych. Również ten sam autor ma niezły artykuł, Losowe wykresy jako modele sieci , o adaptacjach losowych wykresów do modelowania rzeczywistych sieci.

Bibliografia:

1) Losowe wykresy jako modele sieci, MEJ Newman, w Handbook of Graphs and Networks, S. Bornholdt i HG Schuster (red.), Wiley-VCH, Berlin (2003)

2) Struktura i funkcja złożonych sieci, MEJ Newman, SIAM Review 45, 167-256 (2003)

Mohammad Al-Turkistany
źródło
1
po prostu ciekawe: czy to dotyczy sieci „społecznościowych” a Internetu?
Suresh Venkat
Po drugie: podejścia do sieci społecznościowych powinny być bardzo przydatne, biorąc pod uwagę, że wiele badań dotyczących tych sieci pierwotnie koncentrowało się na „uniwersalnych” właściwościach sieci i obejmowało topologię neuronową, sieć energetyczną i sieci drogowe. Również sieci Barabasi-Albert i Watts-Strogatz, każda o właściwościach, które mają prawdziwe sieci i zaniedbywane przez Erdosa-renyi, są bardzo, bardzo dobrze zbadane
Elliot JJ,
1
@Suresh, te złożone sieci uwzględnione w obu odnośnikach obejmują sieci komputerowe, takie jak Internet i sieci społecznościowe.
Mohammad Al-Turkistany
8

Prawdziwe sieci komputerowe na jakiej warstwie? Internet jest, na poziomie AS (prawdopodobnie najwyższym), siecią małego świata z kilkoma węzłami o bardzo wysokim stopniu zaawansowania. Gdy warstwy zbliżają się do rzeczywistych drutów, wykres staje się bardziej związany z geografią, a mniej związany z warstwą społeczną (społeczność to rodzaj złego słowa - czy to naprawdę sieć społecznościowa, gdy podmioty będące „przyjaciółmi” są korporacjami wielonarodowymi?) . W skrajnym przypadku lokalna sieć Ethernet jest logicznym drzewem, które jest (prawdopodobnie) podgrafem fizycznego wzorca połączeń przewodów, a ten wzór połączeń przewodów prawdopodobnie nie jest zbyt wiele przewodów więcej niż drzewa.

„Prawdziwe sieci komputerowe” mają wiele smaków i warstw. Niektóre z nich wyglądają jak sieci społecznościowe, niektóre nie. Aby uzyskać więcej informacji na ten temat, nieskromnie odsyłam do rozdziału 2 mojej rozprawy - http://home.manhattan.edu/~peter.boothe/thesis.pdf

Peter Boothe
źródło
Interesują mnie głównie sieci fizyczne (powiedzmy warstwa IP). Dzięki za link, sprawdzę go.
Kaveh
2
Warstwa IP nie jest warstwą fizyczną. MPLS i inne technologie przełączania obwodów łamią to założenie. Fizyczną warstwą są druty. Mamy nawet łącza wieloprzewodowe, które wydają się być pojedynczymi przeskokami ethernetowymi! To pytanie „jaka warstwa” jest głębsza niż pierwsza inspekcja może sugerować i wymaga starannego przemyślenia. Sugeruję, abyś pomyślał o właściwościach, które powinna mieć sieć, aby znaleźć warstwę, w której analiza topologii najlepiej pomoże ci przeanalizować tę właściwość, i mam nadzieję, że dane będą dostępne.
Peter Boothe
7

nuvβmi-re/(L.α)reL.

Waxman, Routing połączeń wielopunktowych , IEEE J. Select. Obszary Commun. 6 (9), 1617-1622, 1988. Zegura, Calvert, Bhattacharjee, Jak modelować sieć , Proc. IEEE INFOCOM '96, 1996.

Marcus Ritt
źródło
5

Walter Willinger zbudował swoją karierę dzięki wykorzystaniu grafów bez skali do modelowania sieci. Jest za dużo do cytowania, więc wskażę ci jego wpis DBLP . Kluczową kwestią w tych modelach jest to, że mają właściwości podobne do „rzeczywistych” sieci, które nie są przechwytywane przez G (n, p).

Suresh Venkat
źródło
5

Możesz zajrzeć do książki Durretta . Wierzę, że masz dużo do zrobienia.

RJK
źródło
5

Zamiast żmudnego wyszukiwania, uzasadniania i analizowania konkretnego modelu, możesz chcieć wykorzystać posiadane dane z prawdziwego życia (jeśli takie posiadasz). Oznacza to zdefiniowanie ogólnego modelu probabilistycznego i szkolenie jego parametrów na podstawie danych (np. Poprzez oszacowanie maksymalnego prawdopodobieństwa).

Sp1:(S)Sp2:εp1,p2)

Oczywiście, konkretna gramatyka może (i powinna!) Wykorzystywać wiedzę domenową. Rozważ np. Różne gramatyki wykorzystywane do przewidywania struktury drugorzędowej RNA w Dowell, Eddy (2004) dla smaku.

Znajdź szczegółowe informacje na temat tej techniki w Weinberg, Nebel (2010) . Nie wiem jednak, jak (dobrze) można go zastosować do ogólnych wykresów.

Jeśli potrzebujesz więcej mocy, możesz przejść do wielowymiarowych (S) CFG (np. Seki, Kato (2008) ) lub SCFG zależnych od długości / pozycji ( Weinberg, Nebel (2010) ).

Raphael
źródło
1
to jest fajne, ale czy bezkontekstowa natura SCFG nie zmusza twojego ucznia do zaniedbania pewnej globalnej struktury, jaką mogą mieć sieci w twoim zestawie treningowym?
Artem Kaznatcheev
Tak, zgubiły się funkcje bez kontekstu. Należy jednak pamiętać, że można uchwycić właściwości takie jak (średni) stopień węzła. Aby uzyskać więcej, zobacz moją edycję.
Raphael
Dzięki! Przyjrzę się bliżej. Czy ukryte MDP nie mogą również uchwycić właściwości takich jak średni stopień? Wygląda na to, że zwykły język powinien być w stanie uchwycić, czy też jestem zdezorientowany? (Również drobna uwaga: link Weinberga, Nebela ma końcowy znak, który zabija link, oczywiste jest, jaki link zamierzałeś, ale jeśli wprowadzisz więcej zmian, warto je naprawić).
Artem Kaznatcheev
Jasne, chciałem tylko wskazać, że za pomocą tego modelu można uwzględnić niektóre cechy globalne. REG może również obejmować niektóre, ale nie będzie w stanie modelować z natury nieregularnych struktur. (dzięki, naprawiono)
Raphael
3

sol(n,p)sol(n,m)

Jak zapewne wiesz, wydaje się, że istnieje różnica między wykresem połączeń dla sieci WWW a sprzeciwianiem się wykreśleniu wykresu połączeń dla infrastruktury internetowej. Z pewnością nie twierdzę, że jestem ekspertem, ale widziałem artykuł Li, Aldersona, Tanaki, Doyle'a i Willingera „W kierunku teorii wykresów bez skali: definicja, właściwości i implikacje”, który wprowadza „metrykę” „do zmierzenia„ płynności skali ”wykresu (z definicją wykresów bezskalowych będących nadal przedmiotem dyskusji, o ile mi wiadomo), które twierdzą, że mają model wykresu, który tworzy wykresy podobne do połączenia internetowego na routerze poziom.

Oto kilka bardziej generatywnych modeli, które mogą być interesujące:

Artykuł Bergera, Borgsa, Chayesa, D'Souzy i Kleinberga „Preferencyjne przywiązanie do konkurencji”

Wysoce zoptymalizowana tolerancja Carlsona i Doyle'a : mechanizm praw mocy w projektowanych systemach

Molloy i Reed's Krytyczny punkt dla losowych wykresów o podanej sekwencji stopni, który wprowadza „Model wymazanej konfiguracji”

Klaster Newmana i przywiązanie preferencyjne w rozwijających się sieciach (o czym już wspomniano)

Można również jawnie wygenerować rozkład stopni i utworzyć wykres w ten sposób, ale nie jest dla mnie jasne, jak blisko modeluje wykres internetowy na poziomie routera.

Jest oczywiście znacznie więcej literatury na ten temat i podałem tylko kilka (jak uważam) najważniejszych wydarzeń.

sol(n,p)sol(n,m)) nie działają dokładnie, ponieważ stopień wolny od skali lub prawa mocy rozkładał losowe wykresy rozchodząc się drugi moment w rozkładzie stopni. Nie twierdzę, że wiem wystarczająco dużo na ten temat, aby kategorycznie twierdzić o „większości” dowodów, ale z tego, co widziałem, jeden z pierwszych kilku wierszy dowodów właściwości na losowych wykresach Erdos-Renyi wyraźnie zakłada skończoność drugi moment w rozkładzie stopni. Z mojego punktu widzenia ma to sens, ponieważ skończona druga chwila sprawia, że ​​wykresy Erdosa-Renyi są bardziej lokalnie drzewiaste (patrz Informacje Mertensa i Montanariego , fizyka i obliczenia), co skutecznie zapewnia niezależność właściwości / ścieżek / struktur. Ponieważ dystrybuowane losowe wykresy stopnia mocy mają rozbieżny drugi moment, ta lokalna drzewiasta struktura jest zniszczona (a zatem wymaga różnych technik dowodowych?). Byłbym szczęśliwy, gdyby ta intuicja została unieważniona, gdyby ktoś z większą wiedzą lub wglądem miał pokazać, dlaczego tak nie jest.

Mam nadzieję, że to pomaga.

użytkownik834
źródło
3

Chociaż to stary temat, odpowiadam, ponieważ wiele osób wciąż odwiedza takie posty. Motywuje mnie komentarz z innej odpowiedzi.

Zaproponowano model Barabasi-Albert i inne modele, które wytwarzają wykresy bez skali, do modelowania Internetu na poziomie routera i na poziomie systemu autonomicznego. Chociaż początkowo takie modele były uważane za dokładne, okazało się, że nie mamy pełnego obrazu topologii Internetu z powodu trudności w wykryciu wszystkich łączy. Chociaż uważa się, że jest to ciężki ogon, jest w toku.

W celach informacyjnych możesz przeczytać: RG Clegg, C Di Cairano-Gilfedder, S Zhou, Krytyczne spojrzenie na modelowanie prawa energetycznego w Internecie

Vasilis
źródło
2

Istnieje kilka książek o grafów losowych, jak Bollobás' Księdze i istnieje kilka modeli grafów losowych, takich jak małe świat Wikipedii Link lub preferencyjny przywiązanie Link Wikipedii , do sieci model z małych odległości pomiędzy komputerami lub tych z rozkładu stopni następujących prawa energetycznego odpowiednio.

Myślę, że nie ma łatwego sposobu modelowania prawdziwej sieci komputerowej, ale jestem całkiem pewien, że G (n, p) nie modelowałby jej zbyt dobrze. Chyba że pracujesz z bardzo określoną zorganizowaną siecią.

dpufrj
źródło