Dlaczego identyfikatory UUID są prezentowane w formacie „8-4-4-4-12” (cyfry)? Rozejrzałem się za przyczyną, ale nie mogę znaleźć decyzji, która tego wymaga.
Przykład UUID sformatowanego jako ciąg szesnastkowy: 58D5E212-165B-4CA0-909B-C86B9CEE0111
W rzeczywistości ten przykład ciągu szesnastkowego jest niepoprawny. UUID Spec wymaga , że ciąg szesnastkowy reprezentujący wartość UUID musi być małymi literami . Specyfikacja wymaga również, aby implementacja była w stanie przeanalizować ciąg z dużymi lub mieszanymi literami, ale można wygenerować tylko małe litery. Niestety, powszechne implementacje naruszają tę zasadę, w tym firmy Apple, Microsoft i inne.
Basil Bourque
1
Ciekawe Bazyli, dzięki
Fidel
Odpowiedzi:
65
Jest oddzielony time, version, clock_seq_hi, clock_seq_lo, node, jak wskazano w poniższym rfc.
4.1.2. Layout and Byte Order
To minimize confusion about bit assignments within octets, the UUID
record definition is defined only in terms of fields that are
integral numbers of octets. The fields are presented with the most
significant one first.
Field Data Type Octet Note
#
time_low unsigned 32 0-3 The low field of the
bit integer timestamp
time_mid unsigned 16 4-5 The middle field of the
bit integer timestamp
time_hi_and_version unsigned 16 6-7 The high field of the
bit integer timestamp multiplexed
with the version number
clock_seq_hi_and_rese unsigned 8 8 The high field of the
rved bit integer clock sequence
multiplexed with the
variant
clock_seq_low unsigned 8 9 The low field of the
bit integer clock sequence
node unsigned 48 10-15 The spatially unique
bit integer node identifier
In the absence of explicit application or presentation protocol
specification to the contrary, a UUID is encoded as a 128-bit object,
as follows:
The fields are encoded as 16 octets, with the sizes and order of the
fields defined above, and with each field encoded with the Most
Significant Byte first (known as network byte order). Note that the
field names, particularly for multiplexed fields, follow historical
practice.
0 1 2 3
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| time_low |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| time_mid | time_hi_and_version |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|clk_seq_hi_res | clk_seq_low | node (0-1) |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| node (2-5) |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
Dlaczego znacznik czasu został podzielony na trzy części?
user253751
4
Sposób generowania pól zależy od wersji UUID. Preferowana metoda nie wykorzystuje czasu, ponieważ ujawnia czas wygenerowania identyfikatora (potencjalne zagrożenie bezpieczeństwa). en.wikipedia.org/wiki/…
pmont
1
@pmont „Preferowane”?
Basil Bourque
2
@brocoli Muszę się nie zgodzić. V4 opiera się na silnym kryptograficznie generatorze liczb losowych, który jest znacznie trudniejszy do zbudowania niż zwykłe pobranie adresu MAC , aktualnego momentu i rosnącej dowolnej liczby, jak widać w UUID V1. Co więcej, implementacje V1 są generalnie open-source i zbudowane wiele lat temu z dużym użyciem w całej branży, teraz dobrze zużyte. Twierdzenie, że wersja 1 jest „podatna na częściowe niepowodzenia”, jest po prostu głupie. UUID V1 to ostatni element systemu, w którym musisz się martwić o awarię.
Basil Bourque
2
@BasilBourque Jednym z problemów, które można teraz dostrzec w związku z rozprzestrzenianiem się kontenerów i sieciami kontenerów, są kolidujące adresy MAC. Zazwyczaj kontenery i maszyny wirtualne pobierają z ograniczonego zakresu możliwych adresów MAC. IIRC Hyper-V domyślnie pobiera tylko z puli 256 możliwych adresów MAC.
Nathan Clayton
12
Format jest zdefiniowany w IETF RFC4122 w sekcji 3. Format wyjściowy jest zdefiniowany w miejscu, w którym jest napisane „UUID = ...”
3.- Szablon rejestracji przestrzeni nazw
Identyfikator przestrzeni nazw: UUID Informacje rejestracyjne: Data rejestracji: 2003-10-01
Deklaracja struktury składniowej: UUID to identyfikator, który jest niepowtarzalny zarówno w przestrzeni, jak i w czasie, w odniesieniu do przestrzeni wszystkich UUID. Ponieważ identyfikator UUID ma stałą wielkość i zawiera pole czasu, możliwe jest przerzucanie wartości (około 3400 AD, w zależności od używanego algorytmu). Identyfikator UUID może być używany do wielu celów, od oznaczania obiektów o niezwykle krótkim okresie istnienia, po niezawodne identyfikowanie bardzo trwałych obiektów w sieci.
The internal representation of a UUID is a specific sequence of
bits in memory, as described in Section 4. To accurately
represent a UUID as a URN, it is necessary to convert the bit
sequence to a string representation.
Each field is treated as an integer and has its value printed as a
zero-filled hexadecimal digit string with the most significant
digit first. The hexadecimal values "a" through "f" are output as
lower case characters and are case insensitive on input.
The formal definition of the UUID string representation is
provided by the following ABNF [7]:
UUID = time-low "-" time-mid "-"
time-high-and-version "-"
clock-seq-and-reserved
clock-seq-low "-" node
time-low = 4hexOctet
time-mid = 2hexOctet
time-high-and-version = 2hexOctet
clock-seq-and-reserved = hexOctet
clock-seq-low = hexOctet
node = 6hexOctet
hexOctet = hexDigit hexDigit
hexDigit =
"0" / "1" / "2" / "3" / "4" / "5" / "6" / "7" / "8" / "9" /
"a" / "b" / "c" / "d" / "e" / "f" /
"A" / "B" / "C" / "D" / "E" / "F"
Format „8-4-4-4-12” jest przeznaczony tylko do czytania przez ludzi. UUID jest naprawdę 128-bitowy numer.
Weź pod uwagę, że format ciągu wymaga podwojenia liczby bajtów niż 128-bitowa liczba podczas przechowywania lub w pamięci. Sugerowałbym użycie numeru wewnętrznie, a gdy ma być wyświetlony w interfejsie użytkownika lub wyeksportowany do pliku, użyj formatu ciągu.
Odpowiedzi:
Jest oddzielony
time, version, clock_seq_hi, clock_seq_lo, node
, jak wskazano w poniższym rfc.Z dokumentu IETF RFC4122:
źródło
Format jest zdefiniowany w IETF RFC4122 w sekcji 3. Format wyjściowy jest zdefiniowany w miejscu, w którym jest napisane „UUID = ...”
źródło
128 bitów
Format „8-4-4-4-12” jest przeznaczony tylko do czytania przez ludzi. UUID jest naprawdę 128-bitowy numer.
Weź pod uwagę, że format ciągu wymaga podwojenia liczby bajtów niż 128-bitowa liczba podczas przechowywania lub w pamięci. Sugerowałbym użycie numeru wewnętrznie, a gdy ma być wyświetlony w interfejsie użytkownika lub wyeksportowany do pliku, użyj formatu ciągu.
źródło