Jak usunąć wszystkie znaki interpunkcyjne z ciągu znaków w JavaScript za pomocą wyrażenia regularnego?

152

Jeśli mam ciąg znaków zawierający dowolny typ znaku niealfanumerycznego:

"This., -/ is #! an $ % ^ & * example ;: {} of a = -_ string with `~)() punctuation"

Jak uzyskać wersję bez interpunkcji w JavaScript:

"This is an example of a string with punctuation"
Quentin Fisk
źródło

Odpowiedzi:

211

Jeśli chcesz usunąć określoną interpunkcję z ciągu, prawdopodobnie najlepiej będzie jawnie usunąć dokładnie to, co chcesz

replace(/[.,\/#!$%\^&\*;:{}=\-_`~()]/g,"")

Wykonanie powyższego nadal nie zwraca ciągu określonego przez Ciebie. Jeśli chcesz usunąć wszelkie dodatkowe spacje, które zostały po usunięciu zwariowanej interpunkcji, będziesz chciał zrobić coś takiego

replace(/\s{2,}/g," ");

Mój pełny przykład:

var s = "This., -/ is #! an $ % ^ & * example ;: {} of a = -_ string with `~)() punctuation";
var punctuationless = s.replace(/[.,\/#!$%\^&\*;:{}=\-_`~()]/g,"");
var finalString = punctuationless.replace(/\s{2,}/g," ");

Wyniki uruchomienia kodu w konsoli firebug:

tekst alternatywny

Mike Grace
źródło
4
Nawiasy klamrowe w wyrażeniu regularnym stosują kwantyfikator do poprzedniego, więc w tym przypadku zastępuje od 2 do 100 białych znaków ( \s) pojedynczą spacją. Jeśli chcesz, aby zwinąć dowolną liczbę białych znaków w dół do jednego, należy pozostawić poza górną granicę tak: replace(/\s{2,}/g, ' ').
Mike Partridge
13
Dodałem jeszcze kilka znaków do listy znaków interpunkcyjnych wymienić ( @+?><[]+) replace(/[\.,-\/#!$%\^&\*;:{}=\-_`~()@\+\?><\[\]\+]/g, ''). Jeśli ktoś szuka jeszcze nieco bardziej kompletnego zestawu.
timmfin
9
Python's string.punctuation definiuje interpunkcję jako: !"#$%&'()*+,-./:;<=>?@[\]^_`{|}~Która działa lepiej dla mnie, więc inną alternatywą byłoby:replace(/['!"#$%&\\'()\*+,\-\.\/:;<=>?@\[\\\]\^_`{|}~']/g,"");
01AutoMonkey
1
@ AntoineLizée Zgadzam się, że jest to mylące. Zaktualizowałem odpowiedź. Dzięki.
Mike Grace,
2
Próbowałem z "to?" - nie działa dla mnie ( regex101.com/r/F4j5Qc/1 ), właściwe rozwiązanie to: /[.,\/#!$%\^&*;:{}=\-_ `~ () \?] / g
Maxim Firsoff
129
str = str.replace(/[^\w\s]|_/g, "")
         .replace(/\s+/g, " ");

Usuwa wszystko oprócz znaków alfanumerycznych i spacji, a następnie zwija wiele przylegających znaków do pojedynczych spacji.

Szczegółowe wyjaśnienie:

  1. \w to dowolna cyfra, litera lub podkreślenie.
  2. \s to dowolna spacja.
  3. [^\w\s] to wszystko, co nie jest cyfrą, literą, białą spacją ani podkreśleniem.
  4. [^\w\s]|_ jest taki sam jak # 3, z wyjątkiem tego, że podkreślenia zostały ponownie dodane.
John Kugelman
źródło
72
Spowoduje to również usunięcie znaków nieanglojęzycznych, ale poza tym doskonale alfanumerycznych, takich jak à, é, ö, a także całego alfabetu cyrylicy.
Dan Abramov
5
@quemeful Nie zgadzam się, pierwotne pytanie nie określa „tylko dla języka angielskiego”. SO jest dość międzynarodowy, używany na całym świecie. Może z niego korzystać każdy, kto mówi po angielsku i ma dostęp do internetu. Jeśli język nie jest określony w pytaniu, nie powinniśmy przyjmować żadnych założeń. Mamy 2017 rok, cholera!
Rolf
1
Ponadto, nawet jeśli wspierasz tylko angielski, masz zapożyczone słowa, takie jak życiorys i nazwy miejsc lub osób, więc nie chcesz łamać komuś zdolności do powiedzenia, że ​​pracuje w San José (pisownia oficjalna) w boksie między Ramónem Chloé.
Chris Adams,
Będzie to bałagan ze słowami takimi jak wouldn'tidon't
Charlie
71

Oto standardowe znaki interpunkcyjne dla US-ASCII: !"#$%&'()*+,-./:;<=>?@[\]^_`{|}~

W przypadku znaków interpunkcyjnych Unicode (takich jak cudzysłowy, myślniki pauzy itp.) Można łatwo dopasować określone zakresy bloków. Blok Ogólna interpunkcja to \u2000-\u206F, a blok Dodatkowa interpunkcja to \u2E00-\u2E7F.

Po złożeniu i poprawnej ucieczce otrzymasz następujące wyrażenie RegExp:

/[\u2000-\u206F\u2E00-\u2E7F\\'!"#$%&()*+,\-.\/:;<=>?@\[\]^_`{|}~]/

To powinno pasować prawie do każdej napotkanej interpunkcji. Tak więc, odpowiadając na pierwotne pytanie:

var punctRE = /[\u2000-\u206F\u2E00-\u2E7F\\'!"#$%&()*+,\-.\/:;<=>?@\[\]^_`{|}~]/g;
var spaceRE = /\s+/g;
var str = "This, -/ is #! an $ % ^ & * example ;: {} of a = -_ string with `~)() punctuation";
str.replace(punctRE, '').replace(spaceRE, ' ');

>> "This is an example of a string with punctuation"

Źródło US-ASCII: http://docs.oracle.com/javase/7/docs/api/java/util/regex/Pattern.html#posix

Źródło Unicode: http://kourge.net/projects/regexp-unicode-block

Józefa
źródło
3
W przypadku interpunkcji Unicode bloki nie wystarczą. Musisz spojrzeć na ogólną kategorię Interpunkcja, a zobaczysz, że nie wszystkie znaki interpunkcyjne są ładnie umieszczone w tych blokach. Na przykład w blokach łacińskich znajduje się wiele znanych znaków interpunkcyjnych.
nhahtdh
15

/ [^ A-Za-z0-9 \ s] / g powinno pasować do wszystkich znaków interpunkcyjnych, ale zachować spacje. Możesz więc użyć .replace(/\s{2,}/g, " ")do zastąpienia dodatkowych spacji, jeśli musisz to zrobić. Możesz przetestować wyrażenie regularne na http://rubular.com/

.replace(/[^A-Za-z0-9\s]/g,"").replace(/\s{2,}/g, " ")

Aktualizacja : działa tylko wtedy, gdy dane wejściowe są w języku angielskim ANSI.

adnan2nd
źródło
6
Zakładasz, że ciąg to ANSI English. Ani francuskiego z akcentowanymi literami (ééô), ani niemieckiego, tureckiego. Zniknie również Unicode arabski, chiński itp.
Rolf
2
Dzięki, nie myślałem o tym do końca.
adnan2nd
10

Natknąłem się na ten sam problem, to rozwiązanie załatwiło sprawę i było bardzo czytelne:

var sentence = "This., -/ is #! an $ % ^ & * example ;: {} of a = -_ string with `~)() punctuation";
var newSen = sentence.match(/[^_\W]+/g).join(' ');
console.log(newSen);

Wynik:

"This is an example of a string with punctuation"

Sztuczka polegała na stworzeniu zanegowanego zestawu . Oznacza to, że pasuje do wszystkiego, co nie znajduje się w zestawie, tj. [^abc]- nie a, b lub c

\Wnie jest słowem, więc [^\W]+zaprzeczy wszystko, co nie jest słowem char .

Dodając _ (podkreślenie), możesz również temu zaprzeczyć.

Spraw, aby obowiązywała globalnie /g, a następnie możesz przeciągnąć przez niego dowolny ciąg i usunąć znaki interpunkcyjne:

/[^_\W]+/g

Ładnie i czysto;)

jacobedawson
źródło
1
Za pomocą tej metody możesz również zamienić wszystkie nowe linie w przestrzeń.
nhahtdh
5
Ta metoda działa tylko w języku angielskim, wszystkie znaki akcentowane są usuwane.
NicolasBernier,
@NicolasBernier tak, to w 100% poprawne - silnik regex JavaScript jest właściwie dość kiepski (patrz: stackoverflow.com/questions/4043307/ ... ) - niestety w przypadku bardziej złożonych zadań (i tworzenia wzorców dla słów innych niż angielskie) zajmuje to trochę czasu więcej kodu. Mimo to, dla szybkiego i zwięzłego regex do strip interpunkcji to działa :)
jacobedawson
To było najprostsze i dobrze służyło mojemu celowi.
James Shrum,
9

Po prostu wstawię to dla innych.

Dopasuj wszystkie znaki interpunkcyjne dla wszystkich języków:

Utworzono z kategorii znaków interpunkcyjnych Unicode i dodano kilka popularnych symboli klawiatury, takich jak $nawiasy i\-=_

http://www.fileformat.info/info/unicode/category/Po/list.htm

podstawowa wymiana:

".test'da, te\"xt".replace(/[\-=_!"#%&'*{},.\/:;?\(\)\[\]@\\$\^*+<>~`\u00a1\u00a7\u00b6\u00b7\u00bf\u037e\u0387\u055a-\u055f\u0589\u05c0\u05c3\u05c6\u05f3\u05f4\u0609\u060a\u060c\u060d\u061b\u061e\u061f\u066a-\u066d\u06d4\u0700-\u070d\u07f7-\u07f9\u0830-\u083e\u085e\u0964\u0965\u0970\u0af0\u0df4\u0e4f\u0e5a\u0e5b\u0f04-\u0f12\u0f14\u0f85\u0fd0-\u0fd4\u0fd9\u0fda\u104a-\u104f\u10fb\u1360-\u1368\u166d\u166e\u16eb-\u16ed\u1735\u1736\u17d4-\u17d6\u17d8-\u17da\u1800-\u1805\u1807-\u180a\u1944\u1945\u1a1e\u1a1f\u1aa0-\u1aa6\u1aa8-\u1aad\u1b5a-\u1b60\u1bfc-\u1bff\u1c3b-\u1c3f\u1c7e\u1c7f\u1cc0-\u1cc7\u1cd3\u2016\u2017\u2020-\u2027\u2030-\u2038\u203b-\u203e\u2041-\u2043\u2047-\u2051\u2053\u2055-\u205e\u2cf9-\u2cfc\u2cfe\u2cff\u2d70\u2e00\u2e01\u2e06-\u2e08\u2e0b\u2e0e-\u2e16\u2e18\u2e19\u2e1b\u2e1e\u2e1f\u2e2a-\u2e2e\u2e30-\u2e39\u3001-\u3003\u303d\u30fb\ua4fe\ua4ff\ua60d-\ua60f\ua673\ua67e\ua6f2-\ua6f7\ua874-\ua877\ua8ce\ua8cf\ua8f8-\ua8fa\ua92e\ua92f\ua95f\ua9c1-\ua9cd\ua9de\ua9df\uaa5c-\uaa5f\uaade\uaadf\uaaf0\uaaf1\uabeb\ufe10-\ufe16\ufe19\ufe30\ufe45\ufe46\ufe49-\ufe4c\ufe50-\ufe52\ufe54-\ufe57\ufe5f-\ufe61\ufe68\ufe6a\ufe6b\uff01-\uff03\uff05-\uff07\uff0a\uff0c\uff0e\uff0f\uff1a\uff1b\uff1f\uff20\uff3c\uff61\uff64\uff65]+/g,"")
"testda text"

dodano \ s jako spację

".da'fla, te\"te".split(/[\s\-=_!"#%&'*{},.\/:;?\(\)\[\]@\\$\^*+<>~`\u00a1\u00a7\u00b6\u00b7\u00bf\u037e\u0387\u055a-\u055f\u0589\u05c0\u05c3\u05c6\u05f3\u05f4\u0609\u060a\u060c\u060d\u061b\u061e\u061f\u066a-\u066d\u06d4\u0700-\u070d\u07f7-\u07f9\u0830-\u083e\u085e\u0964\u0965\u0970\u0af0\u0df4\u0e4f\u0e5a\u0e5b\u0f04-\u0f12\u0f14\u0f85\u0fd0-\u0fd4\u0fd9\u0fda\u104a-\u104f\u10fb\u1360-\u1368\u166d\u166e\u16eb-\u16ed\u1735\u1736\u17d4-\u17d6\u17d8-\u17da\u1800-\u1805\u1807-\u180a\u1944\u1945\u1a1e\u1a1f\u1aa0-\u1aa6\u1aa8-\u1aad\u1b5a-\u1b60\u1bfc-\u1bff\u1c3b-\u1c3f\u1c7e\u1c7f\u1cc0-\u1cc7\u1cd3\u2016\u2017\u2020-\u2027\u2030-\u2038\u203b-\u203e\u2041-\u2043\u2047-\u2051\u2053\u2055-\u205e\u2cf9-\u2cfc\u2cfe\u2cff\u2d70\u2e00\u2e01\u2e06-\u2e08\u2e0b\u2e0e-\u2e16\u2e18\u2e19\u2e1b\u2e1e\u2e1f\u2e2a-\u2e2e\u2e30-\u2e39\u3001-\u3003\u303d\u30fb\ua4fe\ua4ff\ua60d-\ua60f\ua673\ua67e\ua6f2-\ua6f7\ua874-\ua877\ua8ce\ua8cf\ua8f8-\ua8fa\ua92e\ua92f\ua95f\ua9c1-\ua9cd\ua9de\ua9df\uaa5c-\uaa5f\uaade\uaadf\uaaf0\uaaf1\uabeb\ufe10-\ufe16\ufe19\ufe30\ufe45\ufe46\ufe49-\ufe4c\ufe50-\ufe52\ufe54-\ufe57\ufe5f-\ufe61\ufe68\ufe6a\ufe6b\uff01-\uff03\uff05-\uff07\uff0a\uff0c\uff0e\uff0f\uff1a\uff1b\uff1f\uff20\uff3c\uff61\uff64\uff65]+/g)

dodano ^ do odwrócenia wzoru, aby dopasować nie interpunkcję, ale same słowa

".test';the, te\"xt".match(/[^\s\-=_!"#%&'*{},.\/:;?\(\)\[\]@\\$\^*+<>~`\u00a1\u00a7\u00b6\u00b7\u00bf\u037e\u0387\u055a-\u055f\u0589\u05c0\u05c3\u05c6\u05f3\u05f4\u0609\u060a\u060c\u060d\u061b\u061e\u061f\u066a-\u066d\u06d4\u0700-\u070d\u07f7-\u07f9\u0830-\u083e\u085e\u0964\u0965\u0970\u0af0\u0df4\u0e4f\u0e5a\u0e5b\u0f04-\u0f12\u0f14\u0f85\u0fd0-\u0fd4\u0fd9\u0fda\u104a-\u104f\u10fb\u1360-\u1368\u166d\u166e\u16eb-\u16ed\u1735\u1736\u17d4-\u17d6\u17d8-\u17da\u1800-\u1805\u1807-\u180a\u1944\u1945\u1a1e\u1a1f\u1aa0-\u1aa6\u1aa8-\u1aad\u1b5a-\u1b60\u1bfc-\u1bff\u1c3b-\u1c3f\u1c7e\u1c7f\u1cc0-\u1cc7\u1cd3\u2016\u2017\u2020-\u2027\u2030-\u2038\u203b-\u203e\u2041-\u2043\u2047-\u2051\u2053\u2055-\u205e\u2cf9-\u2cfc\u2cfe\u2cff\u2d70\u2e00\u2e01\u2e06-\u2e08\u2e0b\u2e0e-\u2e16\u2e18\u2e19\u2e1b\u2e1e\u2e1f\u2e2a-\u2e2e\u2e30-\u2e39\u3001-\u3003\u303d\u30fb\ua4fe\ua4ff\ua60d-\ua60f\ua673\ua67e\ua6f2-\ua6f7\ua874-\ua877\ua8ce\ua8cf\ua8f8-\ua8fa\ua92e\ua92f\ua95f\ua9c1-\ua9cd\ua9de\ua9df\uaa5c-\uaa5f\uaade\uaadf\uaaf0\uaaf1\uabeb\ufe10-\ufe16\ufe19\ufe30\ufe45\ufe46\ufe49-\ufe4c\ufe50-\ufe52\ufe54-\ufe57\ufe5f-\ufe61\ufe68\ufe6a\ufe6b\uff01-\uff03\uff05-\uff07\uff0a\uff0c\uff0e\uff0f\uff1a\uff1b\uff1f\uff20\uff3c\uff61\uff64\uff65]+/g)

w przypadku języka takiego jak hebrajski może usunąć „” pojedynczy i podwójny cudzysłów i zastanowić się nad tym.

używając tego skryptu:

Krok 1: wybierz w Firefoksie trzymając kontrolkę kolumnę liczb U + 1234 i skopiuj ją, nie kopiuj U + 12456 zastępują angielski

krok 2 (zrobiłem w chrome) znajdź obszar tekstowy i wklej go do niego, a następnie kliknij prawym przyciskiem myszy i kliknij sprawdź. wtedy możesz uzyskać dostęp do wybranego elementu za pomocą $ 0.

var x=$0.value
var z=x.replace(/U\+/g,"").split(/[\r\n]+/).map(function(a){return parseInt(a,16)})
var ret=[];z.forEach(function(a,k){if(z[k-1]===a-1 && z[k+1]===a+1) { if(ret[ret.length-1]!="-")ret.push("-");} else {  var c=a.toString(16); var prefix=c.length<3?"\\u0000":c.length<5?"\\u0000":"\\u000000"; var uu=prefix.substring(0,prefix.length-c.length)+c; ret.push(c.length<3?String.fromCharCode(a):uu)}});ret.join("")

krok 3 skopiował pierwsze litery ascii jako oddzielne znaki, a nie zakresy, ponieważ ktoś mógłby dodać lub usunąć poszczególne znaki

Shimon Doodkin
źródło
7

W języku obsługującym Unicode właściwość znaku interpunkcji Unicode to \p{P}- którą zwykle można skrócić, \pPa czasem rozszerzyć, aby zwiększyć \p{Punctuation}czytelność.

Czy używasz biblioteki wyrażeń regularnych zgodnej z Perl?

tchrist
źródło
8
Niestety JS nie jest kompatybilny z Perlem. Innym problemem jest to, że kiedy to przetestowałem, nie uchwyciłem całej interpunkcji w ciągu testowym @ Quentin => mikegrace.s3.amazonaws.com/forums/stack-overflow/ ...
Mike Grace
4
Możesz użyć biblioteki XRegExp, aby uzyskać tę rozszerzoną składnię.
Eirik Birkeland
7

Jeśli chcesz usunąć znaki interpunkcyjne z dowolnego ciągu, powinieneś użyć Pklasy Unicode.

Ale ponieważ klasy nie są akceptowane w JavaScript RegEx, możesz wypróbować to wyrażenie regularne, które powinno pasować do wszystkich znaków interpunkcyjnych. Pasuje do następujących kategorii: Pc Pd Pe Pf Pi Po Ps Sc Sk Sm So GeneralPunctuation SupplementalPunctuation CJKSymboleAndPunctuation Pismo klinowe Numery i interpunkcja.

Stworzyłem go za pomocą tego narzędzia online, które generuje wyrażenia regularne specjalnie dla JavaScript. Oto kod do osiągnięcia celu:

var punctuationRegEx = /[!-/:-@[-`{-~¡-©«-¬®-±´¶-¸»¿×÷˂-˅˒-˟˥-˫˭˯-˿͵;΄-΅·϶҂՚-՟։-֊־׀׃׆׳-״؆-؏؛؞-؟٪-٭۔۩۽-۾܀-܍߶-߹।-॥॰৲-৳৺૱୰௳-௺౿ೱ-ೲ൹෴฿๏๚-๛༁-༗༚-༟༴༶༸༺-༽྅྾-࿅࿇-࿌࿎-࿔၊-၏႞-႟჻፠-፨᎐-᎙᙭-᙮᚛-᚜᛫-᛭᜵-᜶។-៖៘-៛᠀-᠊᥀᥄-᥅᧞-᧿᨞-᨟᭚-᭪᭴-᭼᰻-᰿᱾-᱿᾽᾿-῁῍-῏῝-῟῭-`´-῾\u2000-\u206e⁺-⁾₊-₎₠-₵℀-℁℃-℆℈-℉℔№-℘℞-℣℥℧℩℮℺-℻⅀-⅄⅊-⅍⅏←-⏧␀-␦⑀-⑊⒜-ⓩ─-⚝⚠-⚼⛀-⛃✁-✄✆-✉✌-✧✩-❋❍❏-❒❖❘-❞❡-❵➔➘-➯➱-➾⟀-⟊⟌⟐-⭌⭐-⭔⳥-⳪⳹-⳼⳾-⳿⸀-\u2e7e⺀-⺙⺛-⻳⼀-⿕⿰-⿻\u3000-〿゛-゜゠・㆐-㆑㆖-㆟㇀-㇣㈀-㈞㈪-㉃㉐㉠-㉿㊊-㊰㋀-㋾㌀-㏿䷀-䷿꒐-꓆꘍-꘏꙳꙾꜀-꜖꜠-꜡꞉-꞊꠨-꠫꡴-꡷꣎-꣏꤮-꤯꥟꩜-꩟﬩﴾-﴿﷼-﷽︐-︙︰-﹒﹔-﹦﹨-﹫!-/:-@[-`{-・¢-₩│-○-�]|\ud800[\udd00-\udd02\udd37-\udd3f\udd79-\udd89\udd90-\udd9b\uddd0-\uddfc\udf9f\udfd0]|\ud802[\udd1f\udd3f\ude50-\ude58]|\ud809[\udc00-\udc7e]|\ud834[\udc00-\udcf5\udd00-\udd26\udd29-\udd64\udd6a-\udd6c\udd83-\udd84\udd8c-\udda9\uddae-\udddd\ude00-\ude41\ude45\udf00-\udf56]|\ud835[\udec1\udedb\udefb\udf15\udf35\udf4f\udf6f\udf89\udfa9\udfc3]|\ud83c[\udc00-\udc2b\udc30-\udc93]/g;
var string = "This., -/ is #! an $ % ^ & * example ;: {} of a = -_ string with `~)() punctuation";
var newString = string.replace(punctuationRegEx, '').replace(/(\s){2,}/g, '$1');
console.log(newString)

Salvatore
źródło
5

W przypadku ciągów en-US (amerykański angielski) powinno to wystarczyć:

"This., -/ is #! an $ % ^ & * example ;: {} of a = -_ string with `~)() punctuation".replace( /[^a-zA-Z ]/g, '').replace( /\s\s+/g, ' ' )

Pamiętaj, że jeśli obsługujesz UTF-8 i znaki takie jak chiński / rosyjski i inne, to również je zastąpi, więc naprawdę musisz określić, czego chcesz.

meder omuraliev
źródło
3

jeśli używasz lodash

_.words('This, is : my - test,line:').join(' ')

Ten przykład

_.words('"This., -/ is #! an $ % ^ & * example ;: {} of a = -_ string with `~)() punctuation"').join(' ')
Pankaj Avhad
źródło
2

Zgodnie z listą znaków interpunkcyjnych Wikipedii musiałem zbudować następujące wyrażenie regularne, które wykrywa znaki interpunkcyjne:

[\.’'\[\](){}⟨⟩:,،、‒–—―…!.‹›«»‐\-?‘’“”'";/⁄·\&*@\•^†‡°”¡¿※#№÷׺ª%‰+−=‱¶′″‴§~_|‖¦©℗®℠™¤₳฿₵¢₡₢$₫₯֏₠€ƒ₣₲₴₭₺₾ℳ₥₦₧₱₰£៛₽₹₨₪৳₸₮₩¥]

Tushar Goswami
źródło
2
Jeśli używasz tego wyrażenia regularnego, powinieneś także zmienić jego separator. Na przykład, jeśli używasz /(najczęściej), to należy uciec się wewnątrz klasy postaci powyżej dodając back-slash, zanim coś takiego: \/. Jest to jak byś go używać: "String!! With, Punctuation.".replace(/[\.’'\[\](){}⟨⟩:,،、‒–—―…!.‹›«»‐\-?‘’“”'";\/⁄·\&*@\•^†‡°”¡¿※#№÷׺ª%‰+−=‱¶′″‴§~_|‖¦©℗®℠™¤₳฿₵¢₡₢$₫₯֏₠€ƒ₣₲₴₭₺₾ℳ₥₦₧₱₰£៛₽₹₨₪৳₸₮₩¥]+/g,""). Nawiasem mówiąc, nigdzie tam nie widzę znaku odwrotnego znaku (`), dlaczego?
Rolf
brakuje. Wydaje się, że trudno jest znaleźć listę wszystkich znaków interpunkcyjnych.
Alex
1

Jeśli chcesz zachować tylko alfabety i spacje, możesz zrobić:

str.replace(/[^a-zA-Z ]+/g, '').replace('/ {2,}/',' ')
codaddict
źródło
8
Czy to nie wyciągnie czegoś więcej niż tylko interpunkcja? Unicode i tym podobne?
Alex
3
Masz na myśli „tylko angielskie alfabety i spacje”
Rolf
0

To zależy od tego, co próbujesz zwrócić. Użyłem tego ostatnio:

return text.match(/[a-z]/i);
Amanda Koster
źródło