Jak dochodzi do „przepełnienia stosu” i jak temu zapobiegasz?

98

W jaki sposób dochodzi do przepełnienia stosu i jakie są najlepsze sposoby, aby temu zapobiec, lub sposoby, aby temu zapobiec, szczególnie na serwerach internetowych, ale inne przykłady również byłyby interesujące?

JasonMichael
źródło
ha ha, masz przepełnienie stosu i
zadajesz

Odpowiedzi:

127

Stos

W tym kontekście stos jest ostatnim wchodzącym, pierwszym wyjściowym buforem, w którym umieszczane są dane podczas działania programu. Last in, first out (LIFO) oznacza, że ​​ostatnią rzeczą, którą włożysz, jest zawsze pierwsza rzecz, którą otrzymujesz - jeśli włożysz 2 elementy na stos, „A”, a następnie „B”, to pierwsza rzecz, którą wyskoczysz ze stosu będzie „B”, a następną rzeczą będzie „A”.

Kiedy wywołujesz funkcję w swoim kodzie, następna instrukcja po wywołaniu funkcji jest przechowywana na stosie oraz przestrzeń pamięci, która może zostać nadpisana przez wywołanie funkcji. Funkcja, którą wywołujesz, może zużywać więcej stosu dla swoich własnych zmiennych lokalnych. Po zakończeniu zwalnia używane miejsce na stosie zmiennych lokalnych, a następnie powraca do poprzedniej funkcji.

Przepełnienie stosu

Przepełnienie stosu ma miejsce, gdy zużyjesz więcej pamięci na stos, niż powinien zużywać Twój program. W systemach osadzonych możesz mieć tylko 256 bajtów na stos, a jeśli każda funkcja zajmuje 32 bajty, możesz mieć tylko wywołania funkcji 8 głęboko - funkcja 1 wywołuje funkcję 2, która wywołuje funkcję 3, która wywołuje funkcję 4 ... kto wywołuje funkcja 8, która wywołuje funkcję 9, ale funkcja 9 nadpisuje pamięć poza stosem. Może to spowodować nadpisanie pamięci, kodu itp.

Wielu programistów popełnia ten błąd, wywołując funkcję A, która następnie wywołuje funkcję B, która następnie wywołuje funkcję C, a następnie wywołuje funkcję A. Może to działać przez większość czasu, ale tylko raz błędne dane wejściowe spowodują, że będzie krążyć w tym kręgu na zawsze dopóki komputer nie wykryje przepełnienia stosu.

Przyczyną tego są również funkcje rekurencyjne, ale jeśli piszesz rekurencyjnie (tj. Twoja funkcja wywołuje samą siebie), musisz być tego świadomy i używać zmiennych statycznych / globalnych, aby zapobiec nieskończonej rekurencji.

Ogólnie system operacyjny i język programowania, którego używasz, zarządzają stosem i nie masz tego w rękach. Powinieneś spojrzeć na swój wykres wywołań (strukturę drzewa, która pokazuje z twojego głównego, co wywołuje każda funkcja), aby zobaczyć, jak głęboko sięgają wywołania funkcji i wykryć cykle i rekursję, które nie są zamierzone. Celowe cykle i rekurencja muszą być sztucznie sprawdzane, aby uzyskać błąd, jeśli wywołują się zbyt wiele razy.

Poza dobrymi praktykami programistycznymi, testami statycznymi i dynamicznymi, niewiele można zrobić na tych wysokopoziomowych systemach.

Systemy wbudowane

W świecie systemów wbudowanych, zwłaszcza w kodach o wysokiej niezawodności (motoryzacja, samoloty, przestrzeń kosmiczna) wykonujesz obszerne przeglądy i sprawdzanie kodu, ale również wykonujesz następujące czynności:

  • Nie zezwalaj na rekursję i cykle - wymuszane przez zasady i testy
  • Przechowuj kod i stos daleko od siebie (kod w pamięci flash, stos w pamięci RAM i nigdy nie spotkają się te dwa razy)
  • Umieść opaski ochronne wokół stosu - pusty obszar pamięci, który wypełniasz magiczną liczbą (zwykle jest to instrukcja przerwania oprogramowania, ale jest tu wiele opcji) i setki lub tysiące razy na sekundę patrzysz na paski ochronne, aby się upewnić nie zostały nadpisane.
  • Używaj ochrony pamięci (tj. Bez wykonywania na stosie, bez odczytu lub zapisu poza stosem)
  • Przerwania nie wywołują funkcji drugorzędnych - ustawiają flagi, kopiują dane i pozwalają aplikacji zająć się ich przetwarzaniem (w przeciwnym razie możesz uzyskać 8 głęboko w drzewie wywołań funkcji, mieć przerwanie, a następnie wyjść kilka innych funkcji wewnątrz przerywać, powodując wybuch). Masz kilka drzew wywołań - jedno dla procesów głównych i jedno dla każdego przerwania. Jeśli twoje przerwania mogą sobie nawzajem przerywać ... cóż, są smoki ...

Języki i systemy wysokiego poziomu

Ale w językach wysokiego poziomu uruchamianych w systemach operacyjnych:

  • Zredukuj lokalną pamięć zmiennych (zmienne lokalne są przechowywane na stosie - chociaż kompilatory są dość sprytne w tej kwestii i czasami umieszczają duże lokalizacje lokalne na stercie, jeśli drzewo wywołań jest płytkie)
  • Unikaj lub ściśle ogranicz rekursję
  • Nie dziel swoich programów zbyt daleko na mniejsze i mniejsze funkcje - nawet bez liczenia zmiennych lokalnych każde wywołanie funkcji zużywa aż 64 bajty na stosie (procesor 32-bitowy, oszczędzając połowę rejestrów procesora, flag itp.)
  • Zachowaj płytkie drzewo wywołań (podobne do powyższego stwierdzenia)

Serwery WWW

To zależy od posiadanej „piaskownicy”, czy możesz kontrolować, czy nawet widzieć stos. Jest duża szansa, że ​​możesz traktować serwery internetowe tak, jak każdy inny język wysokiego poziomu i system operacyjny - to w dużej mierze poza twoimi rękami, ale sprawdź język i stos serwerów, których używasz. Możliwe jest na przykład wysadzenie stosu na serwerze SQL.

-Adam

Adam Davis
źródło
8

Przepełnienie stosu w rzeczywistym kodzie występuje bardzo rzadko. Większość sytuacji, w których występuje, to rekurencje, w których zapomniano o zakończeniu. Może jednak rzadko występować w silnie zagnieżdżonych strukturach, np. Szczególnie dużych dokumentach XML. Jedyną prawdziwą pomocą jest tutaj refaktoryzacja kodu w celu użycia jawnego obiektu stosu zamiast stosu wywołań.

Konrad Rudolph
źródło
7

Większość ludzi powie ci, że przepełnienie stosu występuje z rekurencją bez ścieżki wyjścia - chociaż w większości jest to prawda, jeśli pracujesz z wystarczająco dużymi strukturami danych, nawet właściwa ścieżka wyjścia rekursji nie pomoże.

Niektóre opcje w tym przypadku:

Greg Hurlman
źródło
7

Do przepełnienia stosu dochodzi, gdy Jeff i Joel chcą dać światu lepsze miejsce do uzyskiwania odpowiedzi na pytania techniczne. Jest już za późno, aby zapobiec przepełnieniu tego stosu. Ta „inna witryna” mogła temu zapobiec, nie będąc lichym. ;)

Haacked
źródło
6

Nieskończona rekurencja jest powszechnym sposobem uzyskania błędu przepełnienia stosu. Aby zapobiec - zawsze upewnij się, że istnieje ścieżka wyjścia, która zostanie trafiona. :-)

Innym sposobem na przepełnienie stosu (przynajmniej w C / C ++) jest zadeklarowanie jakiejś ogromnej zmiennej na stosie.

char hugeArray[100000000];

To wystarczy.

Matt Dillard
źródło
Jakiego języka używasz? W C prawie na pewno spowoduje to przepełnienie stosu. W C # tak się nie stanie, ponieważ tablica jest przydzielona na stercie, a nie na stosie. Zobacz to pytanie, aby zobaczyć przykład trafienia w praktyce: stackoverflow.com/questions/571945/ ...
Matt Dillard
4

Zwykle przepełnienie stosu jest wynikiem nieskończonego wywołania rekurencyjnego (biorąc pod uwagę zwykłą ilość pamięci w dzisiejszych standardowych komputerach).

Kiedy wywołujesz metodę, funkcję lub procedurę „standardowy” sposób lub wykonanie wywołania polega na:

  1. Przesuwanie kierunku powrotu wywołania do stosu (to następne zdanie po wywołaniu)
  2. Zwykle miejsce na wartość zwracaną jest rezerwowane na stosie
  3. Wsunięcie każdego parametru do stosu (kolejność różni się i zależy od każdego kompilatora, również niektóre z nich są czasami przechowywane w rejestrach procesora w celu poprawy wydajności)
  4. Wykonywanie właściwego połączenia.

Zwykle zajmuje to kilka bajtów, w zależności od liczby i typu parametrów, a także architektury maszyny.

Zobaczysz wtedy, że jeśli zaczniesz wykonywać wywołania rekurencyjne, stos zacznie rosnąć. Obecnie stos jest zwykle rezerwowany w pamięci w taki sposób, że rośnie w kierunku przeciwnym do stosu, więc przy dużej liczbie wywołań bez „powrotu” stos zaczyna się zapełniać.

Teraz, w starszych czasach przepełnienie stosu mogło wystąpić po prostu dlatego, że wyczerpałeś całą dostępną pamięć, tak po prostu. W przypadku modelu pamięci wirtualnej (do 4 GB w systemie X86), który był poza zakresem, więc zwykle, jeśli pojawi się błąd przepełnienia stosu, szukaj nieskończonego wywołania rekurencyjnego.

Jorge Córdoba
źródło
4

Co? Nikt nie kocha tych objętych nieskończoną pętlą?

do
{
  JeffAtwood.WritesCode();
} while(StackOverflow.MakingMadBank.Equals(false));
Ian Patrick Hughes
źródło
2
To jest nieskończona pętla, a nie przepełnienie stosu
Eddie Curtis
3

Oprócz formy przepełnienia stosu, którą otrzymujesz z bezpośredniej rekursji (np. Fibonacci(1000000)), Bardziej subtelną jego formą, której doświadczyłem wiele razy, jest rekurencja pośrednia, w której funkcja wywołuje inną funkcję, która wywołuje inną, a następnie jedną z funkcje te ponownie wywołują pierwszą.

Może się to często zdarzyć w funkcjach wywoływanych w odpowiedzi na zdarzenia, ale które same mogą generować nowe zdarzenia, na przykład:

void WindowSizeChanged(Size& newsize) {
  // override window size to constrain width
    newSize.width=200;
    ResizeWindow(newSize);
}

W tym przypadku wywołanie to ResizeWindowmoże spowodować WindowSizeChanged()ponowne wyzwolenie wywołania zwrotnego, które wywołuje ResizeWindowponownie, aż do wyczerpania stosu. W takich sytuacjach często trzeba odłożyć odpowiedź na zdarzenie do momentu powrotu ramki stosu, np. Poprzez wysłanie wiadomości.

the_mandrill
źródło
2

Biorąc pod uwagę, że zostało to oznaczone jako „hacking”, podejrzewam, że „przepełnienie stosu”, do którego się odnosi, to przepełnienie stosu wywołań, a nie przepełnienie stosu wyższego poziomu, takie jak te, do których odwołuje się większość innych odpowiedzi tutaj. Tak naprawdę nie ma zastosowania do żadnych zarządzanych lub interpretowanych środowisk, takich jak .NET, Java, Python, Perl, PHP itp., W których aplikacje internetowe są zazwyczaj napisane, więc jedynym ryzykiem jest sam serwer sieciowy, który prawdopodobnie jest napisany w języku C lub C ++.

Sprawdź ten wątek:

/programming/7308/what-is-a-good-starting-point-for-learning-buffer-overflow

Steve M.
źródło
1

Odtworzyłem problem przepełnienia stosu podczas uzyskiwania najczęściej spotykanej liczby Fibonacciego, tj. 1, 1, 2, 3, 5 ..... więc obliczenia dla fib (1) = 1 lub fib (3) = 2 .. fib (n ) = ??.

dla n, powiedzmy, że będziemy zainteresowani - a co jeśli n = 100 000 to jaka będzie odpowiadająca mu liczba Fibonacciego?

Podejście z jedną pętlą jest jak poniżej -

package com.company.dynamicProgramming;

import java.math.BigInteger;

public class FibonacciByBigDecimal {

    public static void main(String ...args) {

        int n = 100000;
        BigInteger[] fibOfnS = new BigInteger[n + 1];

        System.out.println("fibonacci of "+ n + " is : " + fibByLoop(n));
    }


    static BigInteger fibByLoop(int n){

        if(n==1 || n==2 ){
            return BigInteger.ONE;
        }

        BigInteger fib = BigInteger.ONE;
        BigInteger fip = BigInteger.ONE;


        for (int i = 3; i <= n; i++){

            BigInteger p = fib;
            fib = fib.add(fip);
            fip = p;
        }

        return fib;
    }

}

to całkiem proste, a wynik jest -

fibonacci of 100000 is : 

Teraz innym podejściem, które zastosowałem, jest dzielenie i współbieżność za pomocą rekurencji

tj. Fib (n) = fib (n-1) + Fib (n-2), a następnie dalsza rekurencja dla n-1 i n-2 ..... do 2 i 1, która jest zaprogramowana jako -

package com.company.dynamicProgramming;

import java.math.BigInteger;

public class FibonacciByBigDecimal {

    public static void main(String ...args) {

        int n = 100000;
        BigInteger[] fibOfnS = new BigInteger[n + 1];

        System.out.println("fibonacci of "+ n + " is : " + fibByDivCon(n, fibOfnS));

    }


    static BigInteger fibByDivCon(int n, BigInteger[] fibOfnS){

        if(fibOfnS[n]!=null){
            return fibOfnS[n];
        }

        if (n == 1 || n== 2){
            fibOfnS[n] = BigInteger.ONE;
            return BigInteger.ONE;
        }

        // creates 2 further entries in stack
        BigInteger fibOfn = fibByDivCon(n-1, fibOfnS).add( fibByDivCon(n-2, fibOfnS)) ;

        fibOfnS[n] = fibOfn;

        return fibOfn;

    }

}

Kiedy uruchomiłem kod dla n = 100 000, wynik jest następujący -

Exception in thread "main" java.lang.StackOverflowError
    at com.company.dynamicProgramming.FibonacciByBigDecimal.fibByDivCon(FibonacciByBigDecimal.java:29)
    at com.company.dynamicProgramming.FibonacciByBigDecimal.fibByDivCon(FibonacciByBigDecimal.java:29)
    at com.company.dynamicProgramming.FibonacciByBigDecimal.fibByDivCon(FibonacciByBigDecimal.java:29)

Powyżej widać, że tworzony jest StackOverflowError. Powodem tego jest zbyt wiele rekurencji, ponieważ -

        // creates 2 further entries in stack
        BigInteger fibOfn = fibByDivCon(n-1, fibOfnS).add( fibByDivCon(n-2, fibOfnS)) ;

Więc każdy wpis w stosie tworzy 2 kolejne wpisy i tak dalej ... co jest reprezentowane jako -

wprowadź opis obrazu tutaj

Ostatecznie zostanie utworzonych tak wiele wpisów, że system nie będzie w stanie obsłużyć stosu i wyrzucony zostanie StackOverflowError.

Dla Zapobiegania: Dla powyższej perspektywy przykładu - 1. Unikaj stosowania podejścia rekurencyjnego lub zmniejsz / ogranicz rekursję o jeden poziom, tak jak gdyby n jest zbyt duże, a następnie podziel n tak, aby system mógł obsłużyć jego limit. 2. Użyj innego podejścia, na przykład pętli, której użyłem w pierwszym przykładzie kodu. (Wcale nie zamierzam degradować Divide & Concur lub Recursion, ponieważ są to legendarne podejścia w wielu najbardziej znanych algorytmach .. moim zamiarem jest ograniczenie rekurencji lub trzymanie się z dala od niej, jeśli podejrzewam problemy z przepełnieniem stosu)

atul sachan
źródło