Jak czytać ze standardowego wejścia, linia po linii w Node

177

Chcę przetworzyć plik tekstowy z węzłem za pomocą wywołania wiersza poleceń, takiego jak:

node app.js < input.txt

Każda linia pliku musi być przetwarzana indywidualnie, ale po przetworzeniu linii wejściowej można zapomnieć.

Korzystając z nasłuchiwania danych standardowego wejścia, otrzymuję porcję pary wejściowej o rozmiar bajtu, więc ustawiłem to.

process.stdin.resume();
process.stdin.setEncoding('utf8');

var lingeringLine = "";

process.stdin.on('data', function(chunk) {
    lines = chunk.split("\n");

    lines[0] = lingeringLine + lines[0];
    lingeringLine = lines.pop();

    lines.forEach(processLine);
});

process.stdin.on('end', function() {
    processLine(lingeringLine);
});

Ale to wydaje się takie niechlujne. Konieczność masowania wokół pierwszego i ostatniego elementu linii. Czy nie ma na to bardziej eleganckiego sposobu?

Matt R. Wilson
źródło

Odpowiedzi:

207

Możesz użyć modułu readline , aby czytać ze stdin linia po linii:

var readline = require('readline');
var rl = readline.createInterface({
  input: process.stdin,
  output: process.stdout,
  terminal: false
});

rl.on('line', function(line){
    console.log(line);
})
levi
źródło
3
Wydaje się, że działa to dobrze przy ręcznym wprowadzaniu danych wejściowych w konsoli, jednak kiedy przekazuję plik do polecenia, plik jest wysyłany na standardowe wyjście. Błąd? Na tym etapie readline jest uważane za niestabilne.
Matt R. Wilson,
1
Myślę, że możesz po prostu zmienić process.stdoutna inny strumień do zapisu - może to być tak proste, jakoutput: new require('stream').Writable()
Jeff Sisson,
3
Niestety potrzebuję standardowego wyjścia. Pominąłem to, ale próbuję sprawić, by aplikacja działała jako node app.js < input.txt > output.txt.
Matt R. Wilson,
Najwyraźniej jest to „ zgodne z projektem” github.com/joyent/node/issues/4243#issuecomment-10133900 . Skończyło się na tym, że zrobiłem tak, jak powiedziałeś i dostarczyłem opcji wyjściowej fałszywy zapisywalny strumień, a następnie napisałem bezpośrednio do strumienia standardowego. Nie podoba mi się to, ale działa.
Matt R. Wilson,
13
Wygląda na to, że przekazanie argumentu terminal: falsedo createInterface rozwiązuje ten problem.
jasoncrawford
61
// Work on POSIX and Windows
var fs = require("fs");
var stdinBuffer = fs.readFileSync(0); // STDIN_FILENO = 0
console.log(stdinBuffer.toString());
Gorliwość
źródło
3
Czy mógłbyś dołączyć jakieś szczegóły? Istnieje już wysoko oceniona zaakceptowana odpowiedź
jhhoff02
2
To nie działa dla mnie (węzeł v9.2.0, Windows). Error: EISDIR: illegal operation on a directory, fstat at tryStatSync (fs.js: 534: 13) `
AlexChaffee,
2
Pracował dla mnie na węźle v6.11.2, OSX.
tiffon
3
@AlexChaffee: Wygląda na to, że w systemie Windows jest błąd (nadal obecny od wersji 9.10.1), jeśli nie ma wejścia stdin lub jeśli stdin jest zamknięte - zobacz ten problem na GitHub . Niezależnie od tego jednak, że rozwiązanie czyni pracę w systemie Windows.
mklement0
3
działa bardzo dobrze i jest zdecydowanie najkrótszy, można by go skrócić, robiącfs.readFileSync(0).toString()
localhostdotdev
56

readlinejest specjalnie zaprojektowany do współpracy z terminalem (to znaczy process.stdin.isTTY === true). Istnieje wiele modułów, które zapewniają funkcję podziału dla strumieni ogólnych, takich jak split . To sprawia, że ​​wszystko jest bardzo łatwe:

process.stdin.pipe(require('split')()).on('data', processLine)

function processLine (line) {
  console.log(line + '!')
}
vkurchatkin
źródło
6
nie, nie jest. Jeśli nie chcesz czytać wiersz po wierszu, wcale go nie potrzebujesz
vkurchatkin
6
Wskazówka: jeśli chcesz uruchomić kod po przetworzeniu wszystkich linii, dodaj .on('end', doMoreStuff)po pierwszym .on(). Pamiętaj, że jeśli po prostu napiszesz kod normalnie po instrukcji z .on(), ten kod zostanie uruchomiony przed odczytaniem jakichkolwiek danych wejściowych, ponieważ JavaScript nie jest synchroniczny.
Rory O'Kane
14
#!/usr/bin/env node

const EventEmitter = require('events');

function stdinLineByLine() {
  const stdin = new EventEmitter();
  let buff = "";

  process.stdin
    .on('data', data => {
      buff += data;
      lines = buff.split(/[\r\n|\n]/);
      buff = lines.pop();
      lines.forEach(line => stdin.emit('line', line));
    })
    .on('end', () => {
      if (buff.length > 0) stdin.emit('line', buff);
    });

  return stdin;
}

const stdin = stdinLineByLine();
stdin.on('line', console.log);
simonepri
źródło
0

udostępnianie innym:

czytaj strumień wiersz po wierszu, powinno być dobre dla dużych plików przesyłanych potokiem do stdin, moja wersja:

var n=0;
function on_line(line,cb)
{
    ////one each line
    console.log(n++,"line ",line);
    return cb();
    ////end of one each line
}

var fs = require('fs');
var readStream = fs.createReadStream('all_titles.txt');
//var readStream = process.stdin;
readStream.pause();
readStream.setEncoding('utf8');

var buffer=[];
readStream.on('data', (chunk) => {
    const newlines=/[\r\n]+/;
    var lines=chunk.split(newlines)
    if(lines.length==1)
    {
        buffer.push(lines[0]);
        return;
    }   

    buffer.push(lines[0]);
    var str=buffer.join('');
    buffer.length=0;
    readStream.pause();

    on_line(str,()=>{
        var i=1,l=lines.length-1;
        i--;
        function while_next()
        {
            i++;
            if(i<l)
            {
                return on_line(lines[i],while_next);
            }
            else
            {
                buffer.push(lines.pop());
                lines.length=0;
                return readStream.resume();
            }
        }
        while_next();
    });
  }).on('end', ()=>{
      if(buffer.length)
          var str=buffer.join('');
          buffer.length=0;
        on_line(str,()=>{
            ////after end
            console.error('done')
            ////end after end
        });
  });
readStream.resume();
Shimon Doodkin
źródło
-1

W moim przypadku program (elinks) zwrócił wiersze, które wyglądały na puste, ale w rzeczywistości miały specjalne znaki terminala, kody kontrolne koloru i cofnięcie, więc grepopcje przedstawione w innych odpowiedziach nie działały dla mnie. Więc napisałem ten mały skrypt w Node.js. Zadzwoniłem do pliku tight, ale to tylko przypadkowa nazwa.

#!/usr/bin/env node

function visible(a) {
    var R  =  ''
    for (var i = 0; i < a.length; i++) {
        if (a[i] == '\b') {  R -= 1; continue; }  
        if (a[i] == '\u001b') {
            while (a[i] != 'm' && i < a.length) i++
            if (a[i] == undefined) break
        }
        else R += a[i]
    }
    return  R
}

function empty(a) {
    a = visible(a)
    for (var i = 0; i < a.length; i++) {
        if (a[i] != ' ') return false
    }
    return  true
}

var readline = require('readline')
var rl = readline.createInterface({ input: process.stdin, output: process.stdout, terminal: false })

rl.on('line', function(line) {
    if (!empty(line)) console.log(line) 
})
exebook
źródło