Pytania oznaczone «utf-8»

UTF-8 to kodowanie znaków, które opisuje każdy punkt kodowy Unicode przy użyciu sekwencji bajtów o długości od jednego do czterech bajtów. Jest wstecznie kompatybilny z ASCII, a jednocześnie obsługuje reprezentację wszystkich punktów kodowych Unicode.

1191
UTF-8 przez całą drogę

Konfiguruję nowy serwer i chcę w pełni obsługiwać UTF-8 w mojej aplikacji internetowej. Próbowałem tego w przeszłości na istniejących serwerach i zawsze wydaje mi się, że muszę wrócić do ISO-8859-1. Gdzie dokładnie muszę ustawić kodowanie / zestawy znaków? Zdaję sobie sprawę, że muszę...

607
Excel do CSV z kodowaniem UTF8 [zamknięte]

Zamknięte. To pytanie nie jest zgodne z wytycznymi dotyczącymi przepełnienia stosu . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było na temat przepełnienia stosu. Zamknięte 4 miesiące temu . Mam plik Excel...

557
Dlaczego współczesny Perl domyślnie unika UTF-8?

Zastanawiam się, dlaczego większość nowoczesnych rozwiązań zbudowanych przy użyciu Perla domyślnie nie włącza UTF-8 . Rozumiem, że istnieje wiele starszych problemów dla podstawowych skryptów Perla, w których może to popsuć. Jednak z mojego punktu widzenia w XXI wieku duże nowe projekty (lub...

486
UTF-8, UTF-16 i UTF-32

Jakie są różnice między UTF-8, UTF-16 i UTF-32? Rozumiem, że wszystkie będą przechowywać Unicode i że każdy używa innej liczby bajtów do przedstawienia znaku. Czy istnieje korzyść z wyboru jednego nad

395
Co to jest Unicode, UTF-8, UTF-16?

Jaka jest podstawa Unicode i dlaczego potrzeba UTF-8 lub UTF-16? Sprawdziłem to w Google i szukałem tutaj, ale nie jest to dla mnie jasne. W VSS podczas porównywania plików czasami pojawia się komunikat informujący, że oba pliki mają różne UTF. Dlaczego miałoby tak być? Proszę wyjaśnić w prosty...

367
Jak uruchomić UTF-8 w aplikacjach Java?

Potrzebuję, aby UTF-8 działał w mojej aplikacji Java (serwlety + JSP, bez frameworka) do obsługi äöåitp. Dla zwykłego fińskiego tekstu i cyrylicy, jak ЦжФw szczególnych przypadkach. Moja konfiguracja jest następująca: Środowisko programistyczne: Windows XP Środowisko produkcyjne: Debian Użyta...

362
Ustawienie domyślnego kodowania znaków Java

Jak poprawnie ustawić domyślnie kodowanie znaków używane przez JVM (1.5.x) programowo? Przeczytałem, że -Dfile.encoding=whateverkiedyś była to droga do starszych JVM. Nie mam tego luksusu z powodów, dla których nie chcę. Próbowałem: System.setProperty("file.encoding", "UTF-8"); I właściwość...

304
Wykryj kodowanie i uczyń wszystko UTF-8

Odczytywanie wielu tekstów z różnych kanałów RSS i wstawianie ich do mojej bazy danych. Oczywiście istnieje kilka różnych kodowań znaków używanych w kanałach, np. UTF-8 i ISO 8859-1. Niestety czasami występują problemy z kodowaniem tekstów. Przykład: „Ss” w „Fußball” powinien wyglądać...

279
UTF-8: Ogólne? Kosz? Unicode?

Próbuję dowiedzieć się, jakiego sortowania powinienem używać dla różnych typów danych. 100% treści, które będę przechowywać, jest przesłane przez użytkownika. Rozumiem, że powinienem używać UTF-8 General CI (bez rozróżniania wielkości liter) zamiast UTF-8 Binary. Nie mogę jednak znaleźć wyraźnego...