Co oznaczają STX, SOH i GS w danych wyjściowych Notepad ++?

20

Po przejrzeniu źródła MIME wiadomości e-mail (prawdopodobnie zawierającej znaki międzynarodowe) widzę takie rzeczy w Notepad ++

wprowadź opis zdjęcia tutaj

Rozumiem, że CRLFto jest linia powrotu karetki, ale co z pozostałymi? Co robi SOH, GSi STXśrednią?

Mike B.
źródło

Odpowiedzi:

19

Notepad ++ używa tych symboli do reprezentowania znaków kontrolnych lub znaków niedrukowalnych.

Postać sterująca - Wikipedia

Znak kontrolny lub znak niedrukowalny to punkt kodowy (liczba) w zestawie znaków, który nie reprezentuje zapisanego symbolu.

Kody kontrolne C0 i C1 - Wikipedia

STX - Początek tekstu - Pierwszy znak tekstu wiadomości i można go użyć do zakończenia nagłówka wiadomości.

SOH - Początek nagłówka - Pierwszy znak nagłówka wiadomości.

GS - Separator grup - Może być używany jako ograniczniki do oznaczania pól struktur danych. Jeśli jest używany dla poziomów hierarchicznych, US jest najniższym poziomem (dzielącym elementy danych w postaci zwykłego tekstu), podczas gdy RS, GS i FS mają coraz wyższy poziom, aby podzielić grupy złożone z elementów poziomu poniżej.

Steven
źródło
Hmm ... Nie wiem, dlaczego nagłówki wiadomości e-mail mogą zawierać znak, który nie jest drukowany. Czy właściwe byłoby zinterpretowanie tego wcześniejszego opisu w ten sposób, że „znak kontrolny lub znak niedrukowalny to punkt kodowy (liczba) w zestawie znaków, który nie reprezentuje zapisanego symbolu ASCII”.
Mike B,
Nie znam specyfikacji nagłówków poczty ani powodów, dla których mogą one zawierać znaki niedrukowalne. Jednak Notepad ++ używa własnych symboli (jak pokazano) do wyświetlania tych znaków kontrolnych.
Steven
Wszystkie niedrukowalne znaki pojawiają się w nagłówku X-Przykład, w cudzysłowie. Ten nagłówek nie jest częścią żadnego standardu poczty elektronicznej (patrz stackoverflow.com/questions/14469110/… ). Zostanie on ustawiony przez klienta, który utworzył wiadomość e-mail, lub może przez jeden z transportów po drodze. Tak czy inaczej, jeśli chodzi o przetwarzanie wiadomości e-mail, jest to skutecznie komentarz i może być czymkolwiek. To tak, jakby ktoś narysował małe serce na kopercie - nie jest to część standardu pocztowego i w ogóle nie wpływa na doręczenie.
Randy Orrison
... no cóż, oczywiście, o ile tak naprawdę nie psuje rzeczy. Nagłówek X z naprawdę długimi łańcuchami UNICODE może wywołać błąd przepełnienia bufora w programie transportowym, a serce zapisane nad adresem może pomylić listonosza. Ale w granicach rozsądku jest to po prostu ignorowane.
Randy Orrison
6

SOH jest Start Of Header

STX jest Start of teXt

GS jest Group Seperator

td512
źródło