Pytania oznaczone «unicode»

88
Jak mogę zamienić niedrukowalne znaki Unicode w Javie?

Następujące znaki zastąpią znaki sterujące ASCII (skrót [\x00-\x1F\x7F]): my_string.replaceAll("\\p{Cntrl}", "?"); Poniższe zastąpi wszystkie niedrukowalne znaki ASCII (skrót [\p{Graph}\x20]), w tym znaki akcentowane: my_string.replaceAll("[^\\p{Print}]", "?"); Jednak żaden z nich nie...

87
Czy TCHAR jest nadal aktualny?

Jestem nowy w programowaniu Windows i po przeczytaniu książki Petzolda zastanawiam się: czy nadal dobrą praktyką jest używanie TCHARtypu i _T()funkcji do deklarowania ciągów, czy też powinienem używać po prostu ciągów wchar_ti L""w nowym kodzie? Skoncentruję się tylko na systemie Windows 2000...

86
Regex: co to jest InCombiningDiacriticalMarks?

Poniższy kod jest dobrze znany z konwertowania znaków akcentowanych na zwykły tekst: Normalizer.normalize(text, Normalizer.Form.NFD).replaceAll("\\p{InCombiningDiacriticalMarks}+", ""); Zastąpiłem moją metodę „ręcznie tworzoną” tą, ale muszę zrozumieć część „wyrażenia regularnego” metody...

86
Użycie „use utf8;” daje mi „szeroki charakter w druku”

Jeśli uruchomię następujący program w Perlu: perl -e 'use utf8; print "鸡\n";' Otrzymuję to ostrzeżenie: Wide character in print at -e line 1. Jeśli uruchomię ten program w Perlu: perl -e 'print "鸡\n";' Nie dostaję ostrzeżenia. Pomyślałem, że use utf8konieczne jest użycie znaków UTF-8 w...

83
Ile znaków można odwzorować za pomocą Unicode?

Proszę o policzenie wszystkich możliwych prawidłowych kombinacji w Unicode z wyjaśnieniem. Wiem, że znak można zakodować jako 1, 2, 3 lub 4 bajty. Nie rozumiem też, dlaczego bajty kontynuacji mają ograniczenia, mimo że początkowy bajt tego znaku określa, jak długo powinien być....