Jak obsługiwać znaki nowej linii w JSON?

289

Wygenerowałem trochę JSON i próbuję wciągnąć go do obiektu w JavaScript. Wciąż pojawiają się błędy. Oto co mam:

var data = '{"count" : 1, "stack" : "sometext\n\n"}';
var dataObj = eval('('+data+')');

To daje mi błąd:

unterminated string literal

Dzięki JSON.parse(data), widzę podobne komunikaty o błędach: „ Unexpected token ↵” w Chrome i „ unterminated string literal” w Firefoksie i IE.

Kiedy Wyciągam \npo sometextbłędzie odchodzi w obu przypadkach. Nie mogę się domyślić, dlaczego to się \ndzieje, evala co JSON.parsenie.

Niedźwiedź polarny
źródło
19
Spróbuj użyć prawdziwego parsera json zamiast eval.
Eric

Odpowiedzi:

368

Chyba właśnie tego chcesz:

var data = '{"count" : 1, "stack" : "sometext\\n\\n"}';

(Musisz uciec z „\” w swoim ciągu (zamieniając go w podwójne - „\”), w przeciwnym razie stanie się nową linią w źródle JSON, a nie w danych JSON.)

BlaM
źródło
101
Jest to oczywiście poprawne, ale chciałbym dodać powód, aby to zrobić: specyfikacja JSON pod adresem ietf.org/rfc/rfc4627.txt zawiera to zdanie w sekcji 2.5: „Wszystkie znaki Unicode mogą być umieszczone w znaki cudzysłowu, z wyjątkiem znaków, które muszą być poprzedzone znakami cudzysłowu: znak cudzysłowu, odwrotny znak solidus i znaki kontrolne (od U ​​+ 0000 do U + 001F). ” Ponieważ nowy wiersz jest znakiem kontrolnym, należy go uciec.
Daniel Kullmann
1
Według www.json.org JSON akceptuje sekwencję kontrolną „\ n” w ciągach znaków - a jeśli spróbujesz JSON.parse (['"a \\ na"']] [1] .charCodeAt (); pokaże 10 - czyli „Linefeed” przy ostatnim sprawdzeniu. --- BTW: Przestań krzyczeć!
BlaM
+ 1. Miałem problem ze zrozumieniem kodowania JSON, ale „stanie się nowym wierszem w źródle JSON, a nie danych JSON”, wyjaśniło mi to.
amucunguzi
44

Trzeba będzie mieć funkcję, która zamienia \nsię \\nw przypadek datanie jest ciągiem znaków.

function jsonEscape(str)  {
    return str.replace(/\n/g, "\\\\n").replace(/\r/g, "\\\\r").replace(/\t/g, "\\\\t");
}

var data = '{"count" : 1, "stack" : "sometext\n\n"}';
var dataObj = JSON.parse(jsonEscape(data));

Wynik dataObjbędzie

Object {count: 1, stack: "sometext\n\n"}
manish_s
źródło
3
musisz uciec od znaków ucieczki (tj. .replace("\\n", "\\\\n")), a także sugerowałbym użycie wyrażenia regularnego, aby umożliwić zastąpienie wielu instancji (tj. .replace(/\n/g, "\\\\n"))
musefan
2
dlaczego musisz uciec od znaków ucieczki? Mam na myśli, że coś takiego .replace("\n", "\\n")powinno dobrze wykonywać pracę !! Na przykład var test = [{"description":"Some description about the product. This can be multi-line text."}]; console.log(JSON.parse(test.replace(/\n/g, "\\n")));wyśle ​​obiekt idealnie do konsoli przeglądarki jako[{"description":"Some description about the product.\nThis can be multi-line text."}]
Fr0zenFyr
BTW, w powyższym komentarzu, oryginalny ciąg JSON ma nową linię, która jest usuwana przez formatator komentarzy stackoverflow. Możesz zobaczyć, że końcowe wyjście po zamianie powinno wstawić znak nowej linii \ndo wartości.
Fr0zenFyr
1
-1 Ta odpowiedź najpierw konstruuje ciąg niepoprawnego JSON (ponieważ nowa linia jest znakiem kontrolnym), a następnie próbuje naprawić go za pomocą szeregu niepełnych zamian (są więcej niż 3 znaki kontrolne). Następnie, na dodatek, udaje się również użyć evalfunkcji. 17 głosów pozytywnych ???
Phil
1
A co ze znakami cudzysłowu, które również należy uciec?
samodzielny
8

Zgodnie ze specyfikacją http://www.ecma-international.org/publications/files/ECMA-ST/ECMA-404.pdf :

Ciąg jest sekwencją punktów kodowych Unicode owiniętych znakami cudzysłowu ( U+0022). Wszystkie znaki mogą być umieszczone w cudzysłowie, z wyjątkiem znaków, które muszą być poprzedzone znakami: cudzysłów ( U+0022), reverse solidus ( U+005C) i znaki sterujące U+0000do U+001F. Istnieją dwuznakowe reprezentacje sekwencji ucieczki niektórych znaków.

Więc nie możesz przekazać 0x0Aani 0x0Ckodów bezpośrednio. To jest zabronione! Specyfikacja sugeruje użycie sekwencji specjalnych dla niektórych dobrze zdefiniowanych kodów od U+0000do U+001F:

  • \freprezentuje znak kanału informacyjnego ( U+000C).
  • \nreprezentuje znak przesunięcia wiersza ( U+000A).

Jak większość języków programowania używa \do cytowania, powinieneś uciec od składni escape (podwójne wyjście - raz dla języka / platformy, raz dla samego JSON):

jsonStr = "{ \"name\": \"Multi\\nline.\" }";
gavenkoa
źródło
3

Możesz po prostu uciec od łańcucha znaków na serwerze podczas zapisywania wartości pola JSON i usunąć jego krajobraz przy pobieraniu wartości w przeglądarce klienta, na przykład.

Implementacja JavaScript wszystkich głównych przeglądarek ma polecenie unescape.

Przykład:

Na serwerze:

response.write "{""field1"":""" & escape(RS_Temp("textField")) & """}"

W przeglądarce:

document.getElementById("text1").value = unescape(jsonObject.field1)
Victor_Magalhaes
źródło
2

Możesz zajrzeć do tej funkcji C #, aby uciec od ciągu:

http://www.aspcode.net/C-encode-a-string-for-JSON-JavaScript.aspx

public static string Enquote(string s)  
{ 
    if (s == null || s.Length == 0)  
    { 
        return "\"\""; 
    } 
    char         c; 
    int          i; 
    int          len = s.Length; 
    StringBuilder sb = new StringBuilder(len + 4); 
    string       t; 

    sb.Append('"'); 
    for (i = 0; i < len; i += 1)  
    { 
        c = s[i]; 
        if ((c == '\\') || (c == '"') || (c == '>')) 
        { 
            sb.Append('\\'); 
            sb.Append(c); 
        } 
        else if (c == '\b') 
            sb.Append("\\b"); 
        else if (c == '\t') 
            sb.Append("\\t"); 
        else if (c == '\n') 
            sb.Append("\\n"); 
        else if (c == '\f') 
            sb.Append("\\f"); 
        else if (c == '\r') 
            sb.Append("\\r"); 
        else 
        { 
            if (c < ' ')  
            { 
                //t = "000" + Integer.toHexString(c); 
                string t = new string(c,1); 
                t = "000" + int.Parse(tmp,System.Globalization.NumberStyles.HexNumber); 
                sb.Append("\\u" + t.Substring(t.Length - 4)); 
            }  
            else  
            { 
                sb.Append(c); 
            } 
        } 
    } 
    sb.Append('"'); 
    return sb.ToString(); 
} 
Ron
źródło
3
Dlaczego to ucieka >?
nic nie jest potrzebne
0

Użyłem tej funkcji, aby usunąć znak nowej linii lub inne znaki w danych, aby przeanalizować dane JSON:

function normalize_str($str) {

    $invalid = array(
        'Š'=>'S', 'š'=>'s',  'Đ'=>'Dj', 'đ'=>'dj', 'Ž'=>'Z', 'ž'=>'z',
        'Č'=>'C', 'č'=>'c',  'Ć'=>'C',  'ć'=>'c',  'À'=>'A', 'Á'=>'A', 'Â'=>'A', 'Ã'=>'A',
        'Ä'=>'A', 'Å'=>'A',  'Æ'=>'A',  'Ç'=>'C',  'È'=>'E', 'É'=>'E', 'Ê'=>'E', 'Ë'=>'E',
        'Ì'=>'I', 'Í'=>'I',  'Î'=>'I',  'Ï'=>'I',  'Ñ'=>'N', 'Ò'=>'O', 'Ó'=>'O', 'Ô'=>'O',
        'Õ'=>'O', 'Ö'=>'O',  'Ø'=>'O',  'Ù'=>'U',  'Ú'=>'U', 'Û'=>'U', 'Ü'=>'U', 'Ý'=>'Y',
        'Þ'=>'B', 'ß'=>'Ss', 'à'=>'a',  'á'=>'a',  'â'=>'a', 'ã'=>'a', 'ä'=>'a', 'å'=>'a',
        'æ'=>'a', 'ç'=>'c',  'è'=>'e',  'é'=>'e',  'ê'=>'e', 'ë'=>'e', 'ì'=>'i', 'í'=>'i',
        'î'=>'i', 'ï'=>'i',  'ð'=>'o',  'ñ'=>'n',  'ò'=>'o', 'ó'=>'o', 'ô'=>'o', 'õ'=>'o',
        'ö'=>'o', 'ø'=>'o',  'ù'=>'u',  'ú'=>'u',  'û'=>'u', 'ý'=>'y', 'ý'=>'y', 'þ'=>'b',
        'ÿ'=>'y', 'Ŕ'=>'R',  'ŕ'=>'r',
        "`" => "'", "´" => "'",  '"' => ',',  '`' => "'",
        '´' => "'", '"' => '\"', '"' => "\"", '´' => "'",
        "&acirc;€™" => "'",
        "{" => "",
        "~" => "",  "–" => "-",  "'" => "'",  "     " => " ");

    $str = str_replace(array_keys($invalid), array_values($invalid), $str);

    $remove = array("\n", "\r\n", "\r");
    $str = str_replace($remove, "\\n", trim($str));

    //$str = htmlentities($str, ENT_QUOTES);

    return htmlspecialchars($str);
}

echo normalize_str($lst['address']);
ShivarajRH
źródło
9
W większości języków masz lepsze sposoby usuwania akcentów z ciągów znaków Unicode niż zapisywanie własnej funkcji mapowania. Zobacz to pytanie na przykład w pythonie: stackoverflow.com/questions/517923/…
MiniQuark
Tak, mamy wiele sposobów kontrolowania specjalnych znaków w różnych językach.
ShivarajRH,
2
To bardzo źle, aby je rozebrać. Lepiej zakoduj je jako odwołanie do znaków numerycznych XML, a następnie dekoduj po otrzymaniu.
Annarfych
0

JSON.stringify

JSON.stringify(`{ 
  a:"a"
}`)

zamieniłby powyższy ciąg na

"{ \n      a:\"a\"\n    }"

jak wspomniano tutaj

json stringify

Ta funkcja dodaje podwójne cudzysłowy na początku i na końcu łańcucha wejściowego i unika specjalnych znaków JSON. W szczególności nowa linia jest zastępowana znakiem \ n, tabulacja jest zastępowana znakiem \ t, odwrotny ukośnik jest zastępowany dwoma odwrotnymi ukośnikami \, a odwrotny ukośnik jest umieszczany przed każdym znakiem cudzysłowu.

Mz A.
źródło
4
To jest tylko kodowa odpowiedź na jedenastoletnie pytanie z ośmioma innymi istniejącymi odpowiedziami. Przydatne jest wyjaśnienie kodu, a także wyjaśnienie, jaki nowy aspekt pytania dotyczy odpowiedzi i czy upływ czasu i wydanie nowych wersji wpływa na twoją odpowiedź.
Jason Aller
-1

Napotkałem ten problem podczas tworzenia klasy w PHP 4 do emulacji json_encode (dostępnej w PHP 5). Oto, co wymyśliłem:

class jsonResponse {
    var $response;

    function jsonResponse() {
        $this->response = array('isOK'=>'KO', 'msg'=>'Undefined');
    }

    function set($isOK, $msg) {
        $this->response['isOK'] = ($isOK) ? 'OK' : 'KO';
        $this->response['msg'] = htmlentities($msg);
    }

    function setData($data=null) {
        if(!is_null($data))
            $this->response['data'] = $data;
        elseif(isset($this->response['data']))
            unset($this->response['data']);
    }

    function send() {
        header('Content-type: application/json');
        echo '{"isOK":"' . $this->response['isOK'] . '","msg":' . $this->parseString($this->response['msg']);
        if(isset($this->response['data']))
            echo ',"data":' . $this->parseData($this->response['data']);
        echo '}';
    }

    function parseData($data) {
        if(is_array($data)) {
            $parsed = array();
            foreach ($data as $key=>$value)
                array_push($parsed, $this->parseString($key) . ':' . $this->parseData($value));
            return '{' . implode(',', $parsed) . '}';
        }
        else
            return $this->parseString($data);
    }

    function parseString($string) {
            $string = str_replace("\\", "\\\\", $string);
            $string = str_replace('/', "\\/", $string);
            $string = str_replace('"', "\\".'"', $string);
            $string = str_replace("\b", "\\b", $string);
            $string = str_replace("\t", "\\t", $string);
            $string = str_replace("\n", "\\n", $string);
            $string = str_replace("\f", "\\f", $string);
            $string = str_replace("\r", "\\r", $string);
            $string = str_replace("\u", "\\u", $string);
            return '"'.$string.'"';
    }
}

Przestrzegałem wymienionych tutaj zasad . Użyłem tylko tego, czego potrzebowałem, ale sądzę, że możesz dostosować to do swoich potrzeb w języku, którego używasz. Problem w moim przypadku nie dotyczył nowych linii, jak pierwotnie myślałem, ale tego, że nie uciekłem. Mam nadzieję, że zapobiegnie to komuś innemu z powodu małego bólu głowy, który wymyśliłem, co zrobiłem źle.

Gabriel P.
źródło
2
6 skrótów dla znaków kontrolnych określonych na json.org nie jest wyczerpującą listą wszystkich znaków kontrolnych. W rezultacie ta funkcja może wygenerować niepoprawny JSON.
Phil
-5

Jak rozumiem Cię pytanie, to nie chodzi o parsowania JSON, ponieważ można skopiować i wkleić do kodu JSON bezpośrednio - tak, czy jest to przypadek a potem po prostu skopiować JSON bezpośrednio do dataObjzmiennej bez zawijania z apostrofami (wskazówka: eval==evil)

var dataObj = {"count" : 1, "stack" : "sometext\n\n"};

console.log(dataObj);

Kamil Kiełczewski
źródło