Czy ktoś może podać dobre wyjaśnienie niestabilnego słowa kluczowego w języku C #? Które problemy rozwiązuje, a które nie? W jakich przypadkach zaoszczędzi mi to korzystania z blokowania?
c#
multithreading
Doron Yaacoby
źródło
źródło
Odpowiedzi:
Nie sądzę, że jest lepsza osoba, aby odpowiedzieć na to pytanie niż Eric Lippert (podkreślenie w oryginale):
Więcej informacji można znaleźć w:
źródło
volatile
będą istniały dzięki zamkowiJeśli chcesz uzyskać nieco więcej informacji technicznych na temat tego, co robi zmienne słowo kluczowe, rozważ następujący program (używam DevStudio 2005):
Korzystając ze standardowych zoptymalizowanych (kompilacyjnych) ustawień kompilatora, kompilator tworzy następujący asembler (IA32):
Patrząc na dane wyjściowe, kompilator zdecydował się użyć rejestru ecx do przechowywania wartości zmiennej j. W przypadku pętli nieulotnej (pierwsza) kompilator przypisał i do rejestru eax. Dość bezpośredni. Jest jednak kilka interesujących bitów - instrukcja lea ebx, [ebx] jest w rzeczywistości instrukcją wielobajtową nop, więc pętla przeskakuje do 16-bajtowego wyrównanego adresu pamięci. Drugim jest użycie edx do zwiększenia licznika pętli zamiast użycia instrukcji inc eax. Instrukcja add reg, reg ma mniejsze opóźnienie na kilku rdzeniach IA32 w porównaniu z instrukcją inc reg, ale nigdy nie ma większego opóźnienia.
Teraz dla pętli z lotnym licznikiem pętli. Licznik jest przechowywany w [esp], a słowo niestabilne mówi kompilatorowi, że wartość należy zawsze odczytywać / zapisywać w pamięci i nigdy nie przypisywać do rejestru. Kompilator posuwa się nawet tak daleko, że nie wykonuje ładowania / przyrostu / przechowywania jako trzy odrębne kroki (load eax, inc eax, save eax) podczas aktualizacji wartości licznika, zamiast tego pamięć jest modyfikowana bezpośrednio w jednej instrukcji (add mem , reg). Sposób utworzenia kodu zapewnia, że wartość licznika pętli jest zawsze aktualna w kontekście pojedynczego rdzenia procesora. Żadna operacja na danych nie może spowodować uszkodzenia lub utraty danych (stąd nieużywanie load / inc / store, ponieważ wartość może się zmienić podczas inc, a zatem zostanie utracona w sklepie). Ponieważ przerwania można obsłużyć dopiero po zakończeniu bieżącej instrukcji,
Po wprowadzeniu drugiego procesora do systemu zmienne słowo kluczowe nie chroni przed aktualizacją danych przez inny procesor w tym samym czasie. W powyższym przykładzie trzeba by wyrównać dane, aby uzyskać potencjalne uszkodzenie. Zmienne słowo kluczowe nie zapobiegnie potencjalnemu uszkodzeniu, jeśli dane nie będą mogły być przetwarzane atomowo, na przykład, jeśli licznik pętli był typu długiego (64 bity), wymagałoby to dwóch 32-bitowych operacji, aby zaktualizować wartość, w środku w którym może wystąpić przerwanie i zmiana danych.
Zatem niestabilne słowo kluczowe jest dobre tylko dla wyrównanych danych, które są mniejsze lub równe rozmiarowi rodzimych rejestrów, tak że operacje są zawsze atomowe.
Zmienne słowo kluczowe zostało opracowane z myślą o operacjach IO, w których IO ciągle się zmienia, ale ma stały adres, taki jak urządzenie UART zamapowane w pamięci, a kompilator nie powinien ponownie wykorzystywać pierwszej wartości odczytanej z adresu.
Jeśli masz do czynienia z dużymi danymi lub masz wiele procesorów, będziesz potrzebować systemu blokującego na wyższym poziomie (OS), aby poprawnie obsługiwać dostęp do danych.
źródło
Jeśli używasz .NET 1.1, zmienne słowo kluczowe jest potrzebne podczas podwójnego sprawdzania blokady. Dlaczego? Ponieważ przed wersją .NET 2.0 następujący scenariusz mógł spowodować, że drugi wątek uzyska dostęp do obiektu niepustego, ale jeszcze nie w pełni zbudowanego:
Przed wersją .NET 2.0, this.foo można było przypisać nową instancję Foo, zanim konstruktor przestanie działać. W takim przypadku może wejść drugi wątek (podczas wywołania wątku 1 do konstruktora Foo) i doświadczyć:
Przed wersją .NET 2.0 można było zadeklarować this.foo jako niestabilny, aby obejść ten problem. Od wersji .NET 2.0 nie trzeba już używać niestabilnego słowa kluczowego, aby uzyskać podwójne sprawdzanie blokady.
Wikipedia rzeczywiście ma dobry artykuł na temat podwójnego sprawdzania blokady i krótko porusza ten temat: http://en.wikipedia.org/wiki/Double-checked_locking
źródło
foo
? Czy wątek 1 nie jest blokowanythis.bar
i dlatego tylko wątek 1 będzie w stanie zainicjować foo w danym momencie? To znaczy, sprawdzasz wartość po ponownym zwolnieniu blokady, kiedy i tak powinna ona mieć nową wartość z wątku 1.Czasami kompilator zoptymalizuje pole i użyje rejestru, aby go zapisać. Jeśli wątek 1 dokonuje zapisu w polu, a inny wątek uzyskuje do niego dostęp, ponieważ aktualizacja została zapisana w rejestrze (a nie w pamięci), drugi wątek otrzymałby nieaktualne dane.
Możesz pomyśleć o niestabilnym słowie kluczowym, które mówi kompilatorowi: „Chcę, abyś zapisał tę wartość w pamięci”. Gwarantuje to, że drugi wątek pobierze najnowszą wartość.
źródło
Z MSDN : Zmienny modyfikator jest zwykle używany w polu, do którego dostęp ma wiele wątków, bez użycia instrukcji lock do szeregowania dostępu. Użycie zmiennego modyfikatora zapewnia, że jeden wątek pobiera najbardziej aktualną wartość zapisaną przez inny wątek.
źródło
CLR lubi optymalizować instrukcje, więc kiedy uzyskujesz dostęp do pola w kodzie, nie zawsze może on uzyskać dostęp do bieżącej wartości pola (może pochodzić ze stosu itp.). Oznaczenie pola jako
volatile
gwarantuje, że instrukcja uzyska dostęp do bieżącej wartości pola. Jest to przydatne, gdy wartość można zmodyfikować (w scenariuszu nieblokującym) za pomocą współbieżnego wątku w programie lub innego kodu działającego w systemie operacyjnym.Oczywiście tracisz trochę optymalizacji, ale dzięki temu kod jest prostszy.
źródło
Uważam ten artykuł Joydipa Kanjilala za bardzo pomocny!
When you mark an object or a variable as volatile, it becomes a candidate for volatile reads and writes. It should be noted that in C# all memory writes are volatile irrespective of whether you are writing data to a volatile or a non-volatile object. However, the ambiguity happens when you are reading data. When you are reading data that is non-volatile, the executing thread may or may not always get the latest value. If the object is volatile, the thread always gets the most up-to-date value
Zostawię to tutaj w celach informacyjnych
źródło
Kompilator czasami zmienia kolejność instrukcji w kodzie, aby go zoptymalizować. Zwykle nie jest to problem w środowisku jednowątkowym, ale może to być problem w środowisku wielowątkowym. Zobacz następujący przykład:
Jeśli uruchomisz t1 i t2, nie spodziewałbyś się żadnego wyniku lub „Value: 10” jako wyniku. Możliwe, że kompilator przełącza linię wewnątrz funkcji t1. Jeśli t2 zostanie następnie wykonane, może to oznaczać, że _flag ma wartość 5, ale _value ma 0. Tak więc oczekiwana logika może zostać zerwana.
Aby to naprawić, możesz użyć niestabilnego słowa kluczowego, które możesz zastosować w polu. Ta instrukcja wyłącza optymalizacje kompilatora, dzięki czemu można wymusić poprawną kolejność w kodzie.
Powinieneś używać volatile tylko wtedy, gdy naprawdę go potrzebujesz, ponieważ wyłącza on pewne optymalizacje kompilatora, obniża wydajność. Nie jest również obsługiwany przez wszystkie języki .NET (Visual Basic go nie obsługuje), więc utrudnia interoperacyjność języka.
źródło
Podsumowując, prawidłowa odpowiedź na pytanie brzmi: jeśli kod działa w środowisku wykonawczym 2.0 lub nowszym, zmienne słowo kluczowe prawie nigdy nie jest potrzebne i niepotrzebnie powoduje więcej szkody niż pożytku. IE Nigdy go nie używaj. ALE we wcześniejszych wersjach środowiska wykonawczego, jest on potrzebny do prawidłowego podwójnego sprawdzania blokowania pól statycznych. W szczególności pola statyczne, których klasa ma kod inicjalizacji klasy statycznej.
źródło
wiele wątków może uzyskać dostęp do zmiennej. Najnowsza aktualizacja będzie dotyczyła zmiennej
źródło