Pytania oznaczone «utf-8»

245
Url dekoduje UTF-8 w Pythonie

Sporo czasu spędziłem w Pythonie. Jak mogę kiedykolwiek zdekodować taki adres URL: example.com?title=%D0%BF%D1%80%D0%B0%D0%B2%D0%BE%D0%B2%D0%B0%D1%8F+%D0%B7%D0%B0%D1%89%D0%B8%D1%82%D0%B0 do tego w Pythonie 2.7: example.com?title==правовая+защита url=urllib.unquote(url.encode("utf8")) zwraca...

243
UTF-8 bajt [] na String

Załóżmy, że właśnie użyłem a BufferedInputStreamdo odczytania bajtów pliku tekstowego zakodowanego w UTF-8 do tablicy bajtów. Wiem, że mogę użyć poniższej procedury do konwersji bajtów na ciąg, ale czy istnieje bardziej wydajny / mądrzejszy sposób na zrobienie tego niż tylko iteracja po bajtach i...

204
Zapisz do pliku UTF-8 w Pythonie

Jestem naprawdę mylony z codecs.open function. Kiedy robię: file = codecs.open("temp", "w", "utf-8") file.write(codecs.BOM_UTF8) file.close() Daje mi to błąd UnicodeDecodeError: Kodek „ascii” nie może dekodować bajtu 0xef w pozycji 0: porządek poza zakresem (128) Jeśli zrobię: file =...

190
Zakoduj ciąg znaków do UTF-8

Mam ciąg znaków „ñ” i mam z tym pewne problemy. Muszę zakodować ten ciąg do kodowania UTF-8. Próbowałem w ten sposób, ale to nie działa: byte ptext[] = myString.getBytes(); String value = new String(ptext, "UTF-8"); Jak zakodować ten ciąg do

180
Jak napisać plik UTF-8 za pomocą Java?

Mam aktualny kod, a problemem jest utworzenie pliku strony kodowej 1252, chcę go zmusić do utworzenia pliku UTF-8 Czy ktoś może mi pomóc z tym kodem, ponieważ mówię, że obecnie działa ... ale muszę wymusić zapisanie na utf .. czy mogę przekazać parametr lub coś? to jest to, co naprawdę...

170
Jak określić kodowanie plików w systemie OS X?

Próbuję wprowadzić kilka znaków UTF-8 do pliku LaTeX w TextMate (który mówi, że jego domyślne kodowanie to UTF-8), ale LaTeX ich nie rozumie. Uruchomienie cat my_file.texpokazuje poprawnie znaki w Terminalu. Running ls -alpokazuje coś, czego nigdy wcześniej nie widziałem: znak „@” przy liście...

153
u '\ ufeff' w ciągu znaków Pythona

Otrzymuję błąd z następującym wzorcem: UnicodeEncodeError: 'ascii' codec can't encode character u'\ufeff' in position 155: ordinal not in range(128) Nie wiem, co to u'\ufeff'jest, pojawia się, gdy przeglądam sieć. Jak mogę zaradzić tej sytuacji? Metoda .replace()string na tym nie...