Dużo szukałem, ale nigdzie nie jest napisane, jak usunąć znaki spoza ASCII z Notepad ++.
Muszę wiedzieć, jakie polecenie wpisać w znajdź i zamień (ze zdjęciem byłoby świetnie).
Jeśli chcę zrobić białą listę i dodać do zakładek wszystkie słowa / linie ASCII, aby linie inne niż ASCII były odznaczone
Jeśli plik jest dość duży i nie można wybrać wszystkich linii ASCII, a po prostu chcesz wybrać wiersze zawierające znaki spoza ASCII ...
Encoding->Encode in ANSI
. Nie mogłem znaleźć niczego innego.W Notepad ++, jeśli przejdziesz do menu Wyszukaj → Znajdź znaki w zakresie → Znaki spoza ASCII (128-255) , możesz przejść przez dokument do każdego znaku spoza ASCII.
Pamiętaj, aby zaznaczyć opcję „ Zawijaj ”, jeśli chcesz zapętlić dokument dla wszystkich znaków spoza zestawu ASCII.
źródło
Oprócz odpowiedzi udzielonej przez ProGM, w przypadku, gdy widzisz znaki w polach typu NUL lub ACK i chcesz się ich pozbyć, są to znaki kontrolne ASCII (od 0 do 31), możesz je znaleźć za pomocą następującego wyrażenia i usunąć:
Aby usunąć wszystkie znaki sterujące spoza ASCII ORAZ ASCII, należy usunąć wszystkie znaki pasujące do tego wyrażenia regularnego:
źródło
\x00
i\x1F
są już dopasowane w odpowiedzi przez ProGM.mgsub("[^\x1F-\x7F]+", "", text_vector, fixed = FALSE)
Aby usunąć wszystkie znaki spoza zestawu ASCII, możesz użyć następującego zamiennika:
[^\x00-\x7F]+
Aby podświetlić znaki, polecam użycie funkcji Mark w oknie wyszukiwania: powoduje to podświetlenie znaków spoza zestawu ASCII i umieszczenie zakładki w wierszach zawierających jeden z nich
Jeśli zamiast tego chcesz podświetlić i umieścić zakładkę na znakach ASCII, możesz użyć do tego wyrażenia regularnego
[\x00-\x7F]
.Twoje zdrowie
źródło
Aby zachować nowe wiersze:
Kolejny:
Teraz wybierz opcję Zamień Rozszerzony i Zamień # na \ n
:) teraz masz czysty plik ASCII;)
źródło
Kolejną dobrą sztuczką jest przejście do trybu UTF8 w edytorze, abyś mógł zobaczyć te zabawne postacie i samodzielnie je usunąć.
źródło
Inny sposób...
Jest to miłe, jeśli nie pamiętasz wyrażenia regularnego lub nie chcesz go sprawdzać. Ale wyrażenie regularne wspomniane przez innych jest również dobrym rozwiązaniem.
źródło