Pytania oznaczone «unicode»

88

Naprawdę dobre, złe przykładowe dane testowe UTF-8 [zamknięte]

Zamknięte. To pytanie nie spełnia wytycznych dotyczących przepełnienia stosu . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było na temat przepełnienia stosu. Zamknięte 3 lata temu . Popraw to pytanie...

unicode utf-8

88

Jak mogę zamienić niedrukowalne znaki Unicode w Javie?

Następujące znaki zastąpią znaki sterujące ASCII (skrót [\x00-\x1F\x7F]): my_string.replaceAll("\\p{Cntrl}", "?"); Poniższe zastąpi wszystkie niedrukowalne znaki ASCII (skrót [\p{Graph}\x20]), w tym znaki akcentowane: my_string.replaceAll("[^\\p{Print}]", "?"); Jednak żaden z nich nie...

java string unicode

87

Czy TCHAR jest nadal aktualny?

Jestem nowy w programowaniu Windows i po przeczytaniu książki Petzolda zastanawiam się: czy nadal dobrą praktyką jest używanie TCHARtypu i _T()funkcji do deklarowania ciągów, czy też powinienem używać po prostu ciągów wchar_ti L""w nowym kodzie? Skoncentruję się tylko na systemie Windows 2000...

c++ c windows unicode wchar-t

86

Regex: co to jest InCombiningDiacriticalMarks?

Poniższy kod jest dobrze znany z konwertowania znaków akcentowanych na zwykły tekst: Normalizer.normalize(text, Normalizer.Form.NFD).replaceAll("\\p{InCombiningDiacriticalMarks}+", ""); Zastąpiłem moją metodę „ręcznie tworzoną” tą, ale muszę zrozumieć część „wyrażenia regularnego” metody...

java regex unicode

86

W plikach pojawia się znak <0xEF, 0xBB, 0xBF>. Jak je usunąć?

Kompresuję pliki JavaScript, a kompresor narzeka, że moje pliki mają ï»¿charakter. Jak mogę wyszukać te znaki i je usunąć?

file unicode utf-8 utf

86

Co jest „nie tak” z C ++ wchar_t i wstrings? Jakie są alternatywy dla szerokich znaków?

Widziałem wiele osób w społeczności C ++ (szczególnie ## c ++ na freenode) niechętnie używają wstringsi wchar_toraz ich używania w api systemu Windows. Co jest dokładnie „nie tak” w przypadku wchar_ti wstringi jeśli chcę wspierać internacjonalizację, jakie są alternatywy dla szerokich znaków?...

c++ winapi unicode internationalization wstring

86

Użycie „use utf8;” daje mi „szeroki charakter w druku”

Jeśli uruchomię następujący program w Perlu: perl -e 'use utf8; print "鸡\n";' Otrzymuję to ostrzeżenie: Wide character in print at -e line 1. Jeśli uruchomię ten program w Perlu: perl -e 'print "鸡\n";' Nie dostaję ostrzeżenia. Pomyślałem, że use utf8konieczne jest użycie znaków UTF-8 w...

perl unicode utf-8

85

Gdzie jest „najlepszy ASCII dla tej bazy danych Unicode” w Pythonie?

Mam trochę tekstu, który używa interpunkcji Unicode, jak lewy podwójny cudzysłów, prawy pojedynczy cudzysłów jako apostrof i tak dalej, i potrzebuję go w ASCII. Czy Python ma bazę danych tych znaków z oczywistymi substytutami ASCII, więc mogę zrobić coś lepszego niż zamienianie ich wszystkich na...

python unicode ascii

85

Kodowanie Unicode dla literałów ciągów w C ++ 11

Po pokrewnym pytaniu chciałbym zapytać o nowe typy literałów znakowych i łańcuchowych w C ++ 11. Wygląda na to, że mamy teraz cztery rodzaje znaków i pięć rodzajów literałów tekstowych. Typy postaci: char a = '\x30'; // character, no semantics wchar_t b = L'\xFFEF'; // wide character, no...

c++ unicode c++11 utf string-literals

85

WebClient.DownloadString powoduje zniekształcone znaki z powodu problemów z kodowaniem, ale przeglądarka działa poprawnie

Poniższy kod: var text = (new WebClient()).DownloadString("http://export.arxiv.org/api/query?search_query=au:Freidel_L*&start=0&max_results=20")); daje w wyniku zmienną, textktóra zawiera między innymi ciąg „$ Îº $ -Przestrzeń Minkowskiego, pole skalarne i kwestia niezmienności...

.net unicode utf-8 webclient

84

Długości MySQL VARCHAR i UTF-8

W MySQL, jeśli utworzę nowe VARCHAR(32)pole w tabeli UTF-8, czy oznacza to, że mogę przechowywać 32 bajty danych w tym polu lub 32 znaki (wielobajtowe)?

mysql unicode utf-8 varchar

84

Jak przekonwertować ciąg z kodowaniem Unicode na ciąg liter

Mam ciąg znaków ze znakami ucieczki Unicode\uXXXX i chcę go przekonwertować na zwykłe litery Unicode. Na przykład: "\u0048\u0065\u006C\u006C\u006F World" powinno stać się "Hello World" Wiem, że kiedy drukuję pierwszy napis, to już się wyświetla Hello world. Mój problem polega na tym, że...

java unicode encoding

83

Programowanie w C: Jak programować dla Unicode?

Jakie wymagania wstępne są potrzebne do ścisłego programowania w standardzie Unicode? Czy to oznacza, że mój kod nie powinien charnigdzie używać typów i że muszą być używane funkcje, które mogą obsługiwać wint_ti wchar_t? A jaka jest rola wielobajtowych sekwencji znaków w tym scenariuszu?...

c unicode utf-8 character-encoding locale

83

Ile znaków można odwzorować za pomocą Unicode?

Proszę o policzenie wszystkich możliwych prawidłowych kombinacji w Unicode z wyjaśnieniem. Wiem, że znak można zakodować jako 1, 2, 3 lub 4 bajty. Nie rozumiem też, dlaczego bajty kontynuacji mają ograniczenia, mimo że początkowy bajt tego znaku określa, jak długo powinien być....

unicode utf-8 utf

83

Wykorzystanie funkcji unicode () i encode () w Pythonie

Mam problem z zakodowaniem zmiennej ścieżki i wstawieniem jej do bazy SQLite . Próbowałem to rozwiązać za pomocą funkcji kodowania („utf-8”), która nie pomogła. Następnie użyłem funkcji unicode (), która daje mi typ unicode . print type(path) # <type 'unicode'> path = path.replace("one",...

python string sqlite unicode encoding

82

Jak zmienić kodowanie znaków w bazie danych postgres?

Mam bazę danych skonfigurowaną z domyślnym zestawem znaków SQL_ASCII. Chcę zmienić to na UNICODE. Czy jest na to łatwy sposób?

postgresql unicode

82

Zapisać plik w UTF-8 za pomocą FileWriter (Java)?

Mam jednak następujący kod, ale chcę, aby był zapisywany jako plik UTF-8 do obsługi znaków obcych. Czy jest na to sposób, czy istnieje potrzeba posiadania parametru? Byłbym naprawdę wdzięczny za twoją pomoc w tym. Dzięki. try { BufferedReader reader = new BufferedReader(new...

java file-io unicode utf-8 file-format

81

Jak umiędzynarodowić aplikację internetową Java?

Dowiedziałem się od Google, że internacjonalizacja to proces, dzięki któremu mogę dostosować moją aplikację internetową do obsługi wszystkich języków. Chcę zrozumieć Unicode dla procesu internacjonalizacji, więc dowiedziałem się o Unicode z tu i tam . Jestem w stanie zrozumieć, że Unicode, w...

java jsp unicode internationalization

81

Czy Python zabrania dwóch podobnie wyglądających identyfikatorów Unicode?

Bawiłem się identyfikatorami Unicode i natknąłem się na to: >>> 𝑓, x = 1, 2 >>> 𝑓, x (1, 2) >>> 𝑓, f = 1, 2 >>> 𝑓, f (2, 2) Co tu się dzieje? Dlaczego Python zastępuje obiekt, do którego się odwołuje 𝑓, ale tylko czasami? Gdzie opisano to zachowanie?...

python unicode

81

Jaki jest znak Unicode dla symbolu zamknięcia używanego przez bootstrap Twittera?

Po prostu ciekawy, ponieważ właśnie zdałem sobie sprawę, że to nie był prawdziwy „x” (denerwujące, ile czasu zajęło zrozumienie).

unicode twitter-bootstrap