Jak obsługiwać znaki nowej linii w JSON?

289

Wygenerowałem trochę JSON i próbuję wciągnąć go do obiektu w JavaScript. Wciąż pojawiają się błędy. Oto co mam:

var data = '{"count" : 1, "stack" : "sometext\n\n"}';
var dataObj = eval('('+data+')');

To daje mi błąd:

unterminated string literal

Dzięki JSON.parse(data), widzę podobne komunikaty o błędach: „ Unexpected token ↵” w Chrome i „ unterminated string literal” w Firefoksie i IE.

Kiedy Wyciągam \npo sometextbłędzie odchodzi w obu przypadkach. Nie mogę się domyślić, dlaczego to się \ndzieje, evala co JSON.parsenie.

javascript json newline Niedźwiedź polarny
źródło

19

Spróbuj użyć prawdziwego parsera json zamiast eval.

Eric

368

Chyba właśnie tego chcesz:

var data = '{"count" : 1, "stack" : "sometext\\n\\n"}';

(Musisz uciec z „\” w swoim ciągu (zamieniając go w podwójne - „\”), w przeciwnym razie stanie się nową linią w źródle JSON, a nie w danych JSON.)

BlaM
źródło

101

Jest to oczywiście poprawne, ale chciałbym dodać powód, aby to zrobić: specyfikacja JSON pod adresem ietf.org/rfc/rfc4627.txt zawiera to zdanie w sekcji 2.5: „Wszystkie znaki Unicode mogą być umieszczone w znaki cudzysłowu, z wyjątkiem znaków, które muszą być poprzedzone znakami cudzysłowu: znak cudzysłowu, odwrotny znak solidus i znaki kontrolne (od U + 0000 do U + 001F). ” Ponieważ nowy wiersz jest znakiem kontrolnym, należy go uciec.

Daniel Kullmann

1

Według www.json.org JSON akceptuje sekwencję kontrolną „\ n” w ciągach znaków - a jeśli spróbujesz JSON.parse (['"a \\ na"']] [1] .charCodeAt (); pokaże 10 - czyli „Linefeed” przy ostatnim sprawdzeniu. --- BTW: Przestań krzyczeć!

BlaM

+ 1. Miałem problem ze zrozumieniem kodowania JSON, ale „stanie się nowym wierszem w źródle JSON, a nie danych JSON”, wyjaśniło mi to.

amucunguzi

44

Trzeba będzie mieć funkcję, która zamienia \nsię \\nw przypadek datanie jest ciągiem znaków.

function jsonEscape(str)  {
    return str.replace(/\n/g, "\\\\n").replace(/\r/g, "\\\\r").replace(/\t/g, "\\\\t");
}

var data = '{"count" : 1, "stack" : "sometext\n\n"}';
var dataObj = JSON.parse(jsonEscape(data));

Wynik dataObjbędzie

Object {count: 1, stack: "sometext\n\n"}

manish_s
źródło

3

musisz uciec od znaków ucieczki (tj. .replace("\\n", "\\\\n")), a także sugerowałbym użycie wyrażenia regularnego, aby umożliwić zastąpienie wielu instancji (tj. .replace(/\n/g, "\\\\n"))

musefan

2

dlaczego musisz uciec od znaków ucieczki? Mam na myśli, że coś takiego .replace("\n", "\\n")powinno dobrze wykonywać pracę !! Na przykład

var test = [{"description":"Some description about the product. This can be multi-line text."}];  console.log(JSON.parse(test.replace(/\n/g, "\\n")));

wyśle obiekt idealnie do konsoli przeglądarki jako[{"description":"Some description about the product.\nThis can be multi-line text."}]

Fr0zenFyr

BTW, w powyższym komentarzu, oryginalny ciąg JSON ma nową linię, która jest usuwana przez formatator komentarzy stackoverflow. Możesz zobaczyć, że końcowe wyjście po zamianie powinno wstawić znak nowej linii \ndo wartości.

Fr0zenFyr

1

-1 Ta odpowiedź najpierw konstruuje ciąg niepoprawnego JSON (ponieważ nowa linia jest znakiem kontrolnym), a następnie próbuje naprawić go za pomocą szeregu niepełnych zamian (są więcej niż 3 znaki kontrolne). Następnie, na dodatek, udaje się również użyć evalfunkcji. 17 głosów pozytywnych ???

Phil

1

A co ze znakami cudzysłowu, które również należy uciec?

samodzielny

8

Zgodnie ze specyfikacją http://www.ecma-international.org/publications/files/ECMA-ST/ECMA-404.pdf :

Ciąg jest sekwencją punktów kodowych Unicode owiniętych znakami cudzysłowu ( U+0022). Wszystkie znaki mogą być umieszczone w cudzysłowie, z wyjątkiem znaków, które muszą być poprzedzone znakami: cudzysłów ( U+0022), reverse solidus ( U+005C) i znaki sterujące U+0000do U+001F. Istnieją dwuznakowe reprezentacje sekwencji ucieczki niektórych znaków.

Więc nie możesz przekazać 0x0Aani 0x0Ckodów bezpośrednio. To jest zabronione! Specyfikacja sugeruje użycie sekwencji specjalnych dla niektórych dobrze zdefiniowanych kodów od U+0000do U+001F:

\freprezentuje znak kanału informacyjnego ( U+000C).
\nreprezentuje znak przesunięcia wiersza ( U+000A).

Jak większość języków programowania używa \do cytowania, powinieneś uciec od składni escape (podwójne wyjście - raz dla języka / platformy, raz dla samego JSON):

jsonStr = "{ \"name\": \"Multi\\nline.\" }";

gavenkoa
źródło

3

Możesz po prostu uciec od łańcucha znaków na serwerze podczas zapisywania wartości pola JSON i usunąć jego krajobraz przy pobieraniu wartości w przeglądarce klienta, na przykład.

Implementacja JavaScript wszystkich głównych przeglądarek ma polecenie unescape.

Przykład:

Na serwerze:

response.write "{""field1"":""" & escape(RS_Temp("textField")) & """}"

W przeglądarce:

document.getElementById("text1").value = unescape(jsonObject.field1)

Victor_Magalhaes
źródło

2

Możesz zajrzeć do tej funkcji C #, aby uciec od ciągu:

http://www.aspcode.net/C-encode-a-string-for-JSON-JavaScript.aspx

public static string Enquote(string s)  
{ 
    if (s == null || s.Length == 0)  
    { 
        return "\"\""; 
    } 
    char         c; 
    int          i; 
    int          len = s.Length; 
    StringBuilder sb = new StringBuilder(len + 4); 
    string       t; 

    sb.Append('"'); 
    for (i = 0; i < len; i += 1)  
    { 
        c = s[i]; 
        if ((c == '\\') || (c == '"') || (c == '>')) 
        { 
            sb.Append('\\'); 
            sb.Append(c); 
        } 
        else if (c == '\b') 
            sb.Append("\\b"); 
        else if (c == '\t') 
            sb.Append("\\t"); 
        else if (c == '\n') 
            sb.Append("\\n"); 
        else if (c == '\f') 
            sb.Append("\\f"); 
        else if (c == '\r') 
            sb.Append("\\r"); 
        else 
        { 
            if (c < ' ')  
            { 
                //t = "000" + Integer.toHexString(c); 
                string t = new string(c,1); 
                t = "000" + int.Parse(tmp,System.Globalization.NumberStyles.HexNumber); 
                sb.Append("\\u" + t.Substring(t.Length - 4)); 
            }  
            else  
            { 
                sb.Append(c); 
            } 
        } 
    } 
    sb.Append('"'); 
    return sb.ToString(); 
}

Ron
źródło

3

Dlaczego to ucieka >?

nic nie jest potrzebne

0

Użyłem tej funkcji, aby usunąć znak nowej linii lub inne znaki w danych, aby przeanalizować dane JSON:

function normalize_str($str) {

    $invalid = array(
        'Š'=>'S', 'š'=>'s',  'Đ'=>'Dj', 'đ'=>'dj', 'Ž'=>'Z', 'ž'=>'z',
        'Č'=>'C', 'č'=>'c',  'Ć'=>'C',  'ć'=>'c',  'À'=>'A', 'Á'=>'A', 'Â'=>'A', 'Ã'=>'A',
        'Ä'=>'A', 'Å'=>'A',  'Æ'=>'A',  'Ç'=>'C',  'È'=>'E', 'É'=>'E', 'Ê'=>'E', 'Ë'=>'E',
        'Ì'=>'I', 'Í'=>'I',  'Î'=>'I',  'Ï'=>'I',  'Ñ'=>'N', 'Ò'=>'O', 'Ó'=>'O', 'Ô'=>'O',
        'Õ'=>'O', 'Ö'=>'O',  'Ø'=>'O',  'Ù'=>'U',  'Ú'=>'U', 'Û'=>'U', 'Ü'=>'U', 'Ý'=>'Y',
        'Þ'=>'B', 'ß'=>'Ss', 'à'=>'a',  'á'=>'a',  'â'=>'a', 'ã'=>'a', 'ä'=>'a', 'å'=>'a',
        'æ'=>'a', 'ç'=>'c',  'è'=>'e',  'é'=>'e',  'ê'=>'e', 'ë'=>'e', 'ì'=>'i', 'í'=>'i',
        'î'=>'i', 'ï'=>'i',  'ð'=>'o',  'ñ'=>'n',  'ò'=>'o', 'ó'=>'o', 'ô'=>'o', 'õ'=>'o',
        'ö'=>'o', 'ø'=>'o',  'ù'=>'u',  'ú'=>'u',  'û'=>'u', 'ý'=>'y', 'ý'=>'y', 'þ'=>'b',
        'ÿ'=>'y', 'Ŕ'=>'R',  'ŕ'=>'r',
        "`" => "'", "´" => "'",  '"' => ',',  '`' => "'",
        '´' => "'", '"' => '\"', '"' => "\"", '´' => "'",
        "&acirc;€™" => "'",
        "{" => "",
        "~" => "",  "–" => "-",  "'" => "'",  "     " => " ");

    $str = str_replace(array_keys($invalid), array_values($invalid), $str);

    $remove = array("\n", "\r\n", "\r");
    $str = str_replace($remove, "\\n", trim($str));

    //$str = htmlentities($str, ENT_QUOTES);

    return htmlspecialchars($str);
}

echo normalize_str($lst['address']);

ShivarajRH
źródło

9

W większości języków masz lepsze sposoby usuwania akcentów z ciągów znaków Unicode niż zapisywanie własnej funkcji mapowania. Zobacz to pytanie na przykład w pythonie: stackoverflow.com/questions/517923/…

MiniQuark

Tak, mamy wiele sposobów kontrolowania specjalnych znaków w różnych językach.

ShivarajRH,

2

To bardzo źle, aby je rozebrać. Lepiej zakoduj je jako odwołanie do znaków numerycznych XML, a następnie dekoduj po otrzymaniu.

Annarfych

0

JSON.stringify

JSON.stringify(`{ 
  a:"a"
}`)

zamieniłby powyższy ciąg na

"{ \n      a:\"a\"\n    }"

jak wspomniano tutaj

json stringify

Ta funkcja dodaje podwójne cudzysłowy na początku i na końcu łańcucha wejściowego i unika specjalnych znaków JSON. W szczególności nowa linia jest zastępowana znakiem \ n, tabulacja jest zastępowana znakiem \ t, odwrotny ukośnik jest zastępowany dwoma odwrotnymi ukośnikami \, a odwrotny ukośnik jest umieszczany przed każdym znakiem cudzysłowu.

Mz A.
źródło

4

To jest tylko kodowa odpowiedź na jedenastoletnie pytanie z ośmioma innymi istniejącymi odpowiedziami. Przydatne jest wyjaśnienie kodu, a także wyjaśnienie, jaki nowy aspekt pytania dotyczy odpowiedzi i czy upływ czasu i wydanie nowych wersji wpływa na twoją odpowiedź.

Jason Aller

-1

Napotkałem ten problem podczas tworzenia klasy w PHP 4 do emulacji json_encode (dostępnej w PHP 5). Oto, co wymyśliłem:

class jsonResponse {
    var $response;

    function jsonResponse() {
        $this->response = array('isOK'=>'KO', 'msg'=>'Undefined');
    }

    function set($isOK, $msg) {
        $this->response['isOK'] = ($isOK) ? 'OK' : 'KO';
        $this->response['msg'] = htmlentities($msg);
    }

    function setData($data=null) {
        if(!is_null($data))
            $this->response['data'] = $data;
        elseif(isset($this->response['data']))
            unset($this->response['data']);
    }

    function send() {
        header('Content-type: application/json');
        echo '{"isOK":"' . $this->response['isOK'] . '","msg":' . $this->parseString($this->response['msg']);
        if(isset($this->response['data']))
            echo ',"data":' . $this->parseData($this->response['data']);
        echo '}';
    }

    function parseData($data) {
        if(is_array($data)) {
            $parsed = array();
            foreach ($data as $key=>$value)
                array_push($parsed, $this->parseString($key) . ':' . $this->parseData($value));
            return '{' . implode(',', $parsed) . '}';
        }
        else
            return $this->parseString($data);
    }

    function parseString($string) {
            $string = str_replace("\\", "\\\\", $string);
            $string = str_replace('/', "\\/", $string);
            $string = str_replace('"', "\\".'"', $string);
            $string = str_replace("\b", "\\b", $string);
            $string = str_replace("\t", "\\t", $string);
            $string = str_replace("\n", "\\n", $string);
            $string = str_replace("\f", "\\f", $string);
            $string = str_replace("\r", "\\r", $string);
            $string = str_replace("\u", "\\u", $string);
            return '"'.$string.'"';
    }
}

Przestrzegałem wymienionych tutaj zasad . Użyłem tylko tego, czego potrzebowałem, ale sądzę, że możesz dostosować to do swoich potrzeb w języku, którego używasz. Problem w moim przypadku nie dotyczył nowych linii, jak pierwotnie myślałem, ale tego, że nie uciekłem. Mam nadzieję, że zapobiegnie to komuś innemu z powodu małego bólu głowy, który wymyśliłem, co zrobiłem źle.

Gabriel P.
źródło

2

6 skrótów dla znaków kontrolnych określonych na json.org nie jest wyczerpującą listą wszystkich znaków kontrolnych. W rezultacie ta funkcja może wygenerować niepoprawny JSON.

Phil

-5

Jak rozumiem Cię pytanie, to nie chodzi o parsowania JSON, ponieważ można skopiować i wkleić do kodu JSON bezpośrednio - tak, czy jest to przypadek a potem po prostu skopiować JSON bezpośrednio do dataObjzmiennej bez zawijania z apostrofami (wskazówka: eval==evil)

var dataObj = {"count" : 1, "stack" : "sometext\n\n"};

console.log(dataObj);

Kamil Kiełczewski
źródło

Jak obsługiwać znaki nowej linii w JSON?

Odpowiedzi: