node.js fs.readdir rekurencyjne wyszukiwanie katalogów

267

Wszelkie pomysły na wyszukiwanie w katalogu asynchronicznym przy użyciu fs.readdir? Zdaję sobie sprawę, że moglibyśmy wprowadzić rekurencję i wywołać funkcję odczytu katalogu z następnym katalogiem do przeczytania, ale trochę martwię się, że nie będzie asynchroniczna ...

Jakieś pomysły? Patrzyłem na chodzenie po węzłach, co jest świetne, ale nie daje mi tylko plików w tablicy, jak robi to readdir. Mimo że

Szukasz wyników takich jak ...

['file1.txt', 'file2.txt', 'dir/file3.txt']
czołgać się
źródło

Odpowiedzi:

379

Istnieją w zasadzie dwa sposoby osiągnięcia tego. W środowisku asynchronicznym zauważysz, że istnieją dwa rodzaje pętli: szeregowa i równoległa. Pętla szeregowa czeka na zakończenie jednej iteracji, zanim przejdzie do następnej iteracji - gwarantuje to, że każda iteracja pętli zakończy się w kolejności. W pętli równoległej wszystkie iteracje rozpoczynają się w tym samym czasie i można je wykonać przed drugą, jednak jest to znacznie szybsze niż pętla szeregowa. Tak więc w tym przypadku prawdopodobnie lepiej jest użyć pętli równoległej, ponieważ nie ma znaczenia, w jakiej kolejności kończy się spacer, pod warunkiem, że zakończy się i zwróci wyniki (chyba że chcesz je w kolejności).

Pętla równoległa wyglądałaby tak:

var fs = require('fs');
var path = require('path');
var walk = function(dir, done) {
  var results = [];
  fs.readdir(dir, function(err, list) {
    if (err) return done(err);
    var pending = list.length;
    if (!pending) return done(null, results);
    list.forEach(function(file) {
      file = path.resolve(dir, file);
      fs.stat(file, function(err, stat) {
        if (stat && stat.isDirectory()) {
          walk(file, function(err, res) {
            results = results.concat(res);
            if (!--pending) done(null, results);
          });
        } else {
          results.push(file);
          if (!--pending) done(null, results);
        }
      });
    });
  });
};

Pętla szeregowa wyglądałaby tak:

var fs = require('fs');
var path = require('path');
var walk = function(dir, done) {
  var results = [];
  fs.readdir(dir, function(err, list) {
    if (err) return done(err);
    var i = 0;
    (function next() {
      var file = list[i++];
      if (!file) return done(null, results);
      file = path.resolve(dir, file);
      fs.stat(file, function(err, stat) {
        if (stat && stat.isDirectory()) {
          walk(file, function(err, res) {
            results = results.concat(res);
            next();
          });
        } else {
          results.push(file);
          next();
        }
      });
    })();
  });
};

I aby przetestować go w swoim katalogu domowym (UWAGA: lista wyników będzie ogromna, jeśli masz wiele rzeczy w katalogu domowym):

walk(process.env.HOME, function(err, results) {
  if (err) throw err;
  console.log(results);
});

EDYCJA: Ulepszone przykłady.

chjj
źródło
10
Uwaga: odpowiedź „równoległa pętla” z powyższego chjj zawiera błąd w przypadkach, gdy chodzi pusty folder. Poprawka polega na: var pending = list.length; if (! oczekuje) zrobione (null, wyniki); // dodaj tę linię! list.forEach (funkcja (plik) {...
Vasil Daskalopoulos
27
file = dir + '/' + file;Nie jest to zalecane. Powinieneś użyć: var path = require('path'); file = path.resolve(dir, file);
Leiko
7
@onetrickpony, ponieważ jeśli użyjesz path.resolve(...), uzyskasz właściwą ścieżkę, niezależnie od tego, czy korzystasz z systemu Windows, czy Unix :) Oznacza to, że dostaniesz coś takiego jak C:\\some\\foo\\pathw systemie Windows i /some/foo/pathna systemach Unix
Leiko
19
Odrzuciłem głos, ponieważ twoja odpowiedź była świetna, kiedy napisałeś ją po raz pierwszy w 2011 roku, ale w 2014 roku ludzie używają modułów open source i sami piszą mniej kodu i przyczyniają się do modułów, od których zależą oni i wiele innych osób. Na przykład spróbuj node-dir, aby uzyskać dokładnie dane wyjściowe wymagane przez @crawf przy użyciu następującego wiersza kodu:require('node-dir').files(__dirname, function(err, files) { console.log(files); });
Christiaan Westerbeek
5
Dla każdego, kto pomylił się co do !--składni, zadano pytanie
Tas
145

Ta wykorzystuje maksymalną liczbę nowych, modnych funkcji dostępnych w węźle 8, w tym Obietnice, wykorzystanie / obiecanie, destrukcję, asynchroniczne oczekiwanie, mapę + redukcję i inne, co powoduje, że współpracownicy drapią się po głowie, gdy próbują dowiedzieć się, co trwa.

Węzeł 8+

Brak zależności zewnętrznych.

const { promisify } = require('util');
const { resolve } = require('path');
const fs = require('fs');
const readdir = promisify(fs.readdir);
const stat = promisify(fs.stat);

async function getFiles(dir) {
  const subdirs = await readdir(dir);
  const files = await Promise.all(subdirs.map(async (subdir) => {
    const res = resolve(dir, subdir);
    return (await stat(res)).isDirectory() ? getFiles(res) : res;
  }));
  return files.reduce((a, f) => a.concat(f), []);
}

Stosowanie

getFiles(__dirname)
  .then(files => console.log(files))
  .catch(e => console.error(e));

Węzeł 10.10+

Zaktualizowany dla węzła 10+ z jeszcze większym whizbangiem:

const { resolve } = require('path');
const { readdir } = require('fs').promises;

async function getFiles(dir) {
  const dirents = await readdir(dir, { withFileTypes: true });
  const files = await Promise.all(dirents.map((dirent) => {
    const res = resolve(dir, dirent.name);
    return dirent.isDirectory() ? getFiles(res) : res;
  }));
  return Array.prototype.concat(...files);
}

Zauważ, że zaczynając od węzła 11.15.0, możesz użyć files.flat()zamiast Array.prototype.concat(...files)spłaszczenia tablicy plików.

Węzeł 11+

Jeśli chcesz całkowicie wysadzić wszystkich w powietrze, możesz użyć następującej wersji przy użyciu iteratorów asynchronicznych . Oprócz tego, że jest naprawdę fajny, pozwala również konsumentom wyciągać wyniki pojedynczo, dzięki czemu lepiej nadaje się do naprawdę dużych katalogów.

const { resolve } = require('path');
const { readdir } = require('fs').promises;

async function* getFiles(dir) {
  const dirents = await readdir(dir, { withFileTypes: true });
  for (const dirent of dirents) {
    const res = resolve(dir, dirent.name);
    if (dirent.isDirectory()) {
      yield* getFiles(res);
    } else {
      yield res;
    }
  }
}

Użycie uległo zmianie, ponieważ typ zwracany jest teraz iteratorem asynchronicznym zamiast obietnicy

(async () => {
  for await (const f of getFiles('.')) {
    console.log(f);
  }
})()

Jeśli ktoś jest zainteresowany, pisałem więcej o iteratorach asynchronicznych tutaj: https://qwtel.com/posts/software/async-generators-in-the-wild/

qwtel
źródło
5
Nazewnictwo subdiri subdirswprowadza w błąd, gdyż może to być rzeczywiście plików (proponuję coś podobnego itemInDirlub item_in_dirnawet po prostu itemzamiast.), Ale rozwiązanie to czuje się czystsze niż akceptowanego jeden i jest znacznie mniej kodu. Nie uważam też, że jest to o wiele bardziej skomplikowane niż kod w zaakceptowanej odpowiedzi. +1
Zelphir Kaltstahl
1
Możesz zrobić to jeszcze bardziej, używając require(fs).promisesi po prostu util.promisifycałkowicie upuszczając . Osobiście pseudonim od fs do fs.promises.
MushinNoShin
2
Możemy to przyspieszyć za pomocą jednej małej zmiany: przekazanie drugiego argumentu do readdirobiektu opcji AKA tak, aby readdir(dir, {withFileTypes: true})zwrócił wszystkie elementy z informacjami o ich typie, więc nie będziemy musieli statw ogóle dzwonić, aby uzyskać informacje, które readdirteraz dają nam plecy. To oszczędza nam konieczności wykonywania dodatkowych połączeń sys. Szczegóły tutaj
cacoder
1
@cacoder Zaktualizowano, aby uwzględnić withFileTypes. Dzięki za wskazówkę.
qwtel
w węźle 10.10 lub nowszych, jeśli zastąpić return Array.prototype.concat(...files);z let result = Array.prototype.concat(...files); return result.map(file => file.split('\\').join('/'));was może mieć pewność, że katalogi zwróci „/”, a nie „\”. Jeśli nie masz nic przeciwko wyrażeniom regularnym, możesz to zrobićreturn result.map(file => file.replace(/\\/g, '/'));
SwiftNinjaPro
106

Na wypadek, gdyby ktoś uznał to za przydatne, stworzyłem również wersję synchroniczną .

var walk = function(dir) {
    var results = [];
    var list = fs.readdirSync(dir);
    list.forEach(function(file) {
        file = dir + '/' + file;
        var stat = fs.statSync(file);
        if (stat && stat.isDirectory()) { 
            /* Recurse into a subdirectory */
            results = results.concat(walk(file));
        } else { 
            /* Is a file */
            results.push(file);
        }
    });
    return results;
}

Wskazówka: Aby zużywać mniej zasobów podczas filtrowania. Filtruj w obrębie tej funkcji. Np. Zamień na results.push(file);poniższy kod. Dostosuj zgodnie z wymaganiami:

    file_type = file.split(".").pop();
    file_name = file.split(/(\\|\/)/g).pop();
    if (file_type == "json") results.push(file);
Victor Powell
źródło
60
Podoba mi się to rozwiązanie, z wyjątkiem twojego braku średników!
mpen
To jest proste. Ale także trochę naiwny. Może powodować przepełnienie stosu, jeśli katalog zawiera łącze do katalogu nadrzędnego. Może lstatzamiast tego użyć ? Albo dodaj kontrolę rekurencyjności, aby ograniczyć poziom rekurencyjności.
conradkleinespel 18.04.2014
14
Zastanów się nad użyciem file =
requ
16
@mpen Średniki dwukropki są zbędne
Ally
To też działa najlepiej dla mnie. Chociaż dodałem również filtr do filtrowania dla określonego rozszerzenia pliku.
Brian
87

A. Spójrz na moduł plików . Ma funkcję o nazwie spacer:

file.walk (start, oddzwanianie)

Porusza się po drzewie plików, wywołując wywołanie zwrotne dla każdego katalogu, przekazując (null, dirPath, dirs, files).

To może być dla ciebie! I tak, to asynchronizacja. Myślę jednak, że gdybyś potrzebował, musiałbyś sam zagregować całą ścieżkę.

B. Alternatywa, a nawet jedna z moich ulubionych: użyj do tego unixa find. Po co robić coś, co zostało już zaprogramowane? Może nie dokładnie to, czego potrzebujesz, ale nadal warto sprawdzić:

var execFile = require('child_process').execFile;
execFile('find', [ 'somepath/' ], function(err, stdout, stderr) {
  var file_list = stdout.split('\n');
  /* now you've got a list with full path file names */
});

Find ma ładny wbudowany mechanizm buforowania, który sprawia, że ​​kolejne wyszukiwania są bardzo szybkie, o ile zmieniło się tylko kilka folderów.

Johann Philipp Strathausen
źródło
9
Czy to tylko UNIX?
Mohsen
Miałem pytanie dotyczące przykładu B: Dla execFile () (i exec ()) stderr i stdout są buforami .. więc czy nie musisz robić stdout.toString.split ("\ n"), ponieważ bufory nie są łańcuchami?
Cheruvim,
8
ładne, ale nie na różnych platformach.
f0ster,
Nawiasem mówiąc: Nie, A to nie tylko Uniks! Tylko B jest tylko Uniksem. Jednak system Windows 10 jest teraz wyposażony w podsystem Linux. Więc nawet B działałby teraz w systemie Windows.
Johann Philipp Strathausen
czy WSL nie musi być włączony na komputerze użytkownika końcowego, aby działał w systemie Windows?
oldboy
38

Kolejnym ładnym pakietem npm jest glob .

npm install glob

Jest bardzo potężny i powinien pokryć wszystkie Twoje rekurencyjne potrzeby.

Edytować:

Tak naprawdę nie byłem całkowicie zadowolony z glob, więc stworzyłem readdirp .

Jestem przekonany, że jego interfejs API ułatwia rekurencyjne wyszukiwanie plików i katalogów oraz stosowanie określonych filtrów.

Przeczytaj dokumentację, aby uzyskać lepszy obraz tego, co robi, i zainstaluj:

npm install readdirp

Thorsten Lorenz
źródło
Najlepszy moduł moim zdaniem. I jest podobny do wielu innych projektów, takich jak Grunt, Mocha itp. I innych ponad 80 000 innych projektów. Tylko mówię.
Yanick Rochon
29

Polecam użycie node-glob do wykonania tego zadania.

var glob = require( 'glob' );  

glob( 'dirname/**/*.js', function( err, files ) {
  console.log( files );
});
Diogo Cardoso
źródło
14

Jeśli chcesz użyć pakietu npm, klucz jest całkiem niezły.

var wrench = require("wrench");

var files = wrench.readdirSyncRecursive("directory");

wrench.readdirRecursive("directory", function (error, files) {
    // live your dreams
});

EDYCJA (2018):
Każdy, kto czytał w ostatnim czasie: Autor wycofał ten pakiet w 2015 roku:

Plik wrench.js jest przestarzały i nie był aktualizowany od dłuższego czasu. Zdecydowanie polecam użycie fs-extra do wykonania jakichkolwiek dodatkowych operacji na systemie plików.

Domenic
źródło
@Domenic, jak się masz denodify? Oddzwanianie jest uruchamiane wiele razy (rekurencyjnie). Zatem użycie Q.denodify(wrench.readdirRecursive)zwraca tylko pierwszy wynik.
Onur Yıldırım
1
@ OnurYıldırım tak, to nie jest dobre dopasowanie do obietnic w obecnej formie. Musisz napisać coś, co zwróci wiele obietnic lub coś, co czeka, aż wszystkie podkatalogi zostaną wyliczone przed zwróceniem obietnicy. Aby zapoznać się z tym ostatnim, zobacz github.com/kriskowal/q-io#listdirectorytreepath
Domenic
9

Podobało mi się powyższe pytanie od chjj i bez tego początku nie byłbym w stanie stworzyć mojej wersji równoległej pętli.

var fs = require("fs");

var tree = function(dir, done) {
  var results = {
        "path": dir
        ,"children": []
      };
  fs.readdir(dir, function(err, list) {
    if (err) { return done(err); }
    var pending = list.length;
    if (!pending) { return done(null, results); }
    list.forEach(function(file) {
      fs.stat(dir + '/' + file, function(err, stat) {
        if (stat && stat.isDirectory()) {
          tree(dir + '/' + file, function(err, res) {
            results.children.push(res);
            if (!--pending){ done(null, results); }
          });
        } else {
          results.children.push({"path": dir + "/" + file});
          if (!--pending) { done(null, results); }
        }
      });
    });
  });
};

module.exports = tree;

Stworzyłem również Gist . Komentarze mile widziane. Wciąż zaczynam w dziedzinie NodeJS, więc mam nadzieję, że dowiem się więcej.

kalisjoshua
źródło
9

Z rekurencją

var fs = require('fs')
var path = process.cwd()
var files = []

var getFiles = function(path, files){
    fs.readdirSync(path).forEach(function(file){
        var subpath = path + '/' + file;
        if(fs.lstatSync(subpath).isDirectory()){
            getFiles(subpath, files);
        } else {
            files.push(path + '/' + file);
        }
    });     
}

Powołanie

getFiles(path, files)
console.log(files) // will log all files in directory
Loourr
źródło
3
Sugeruję nie łączenia ciągów ścieżki z /ale przy użyciu pathmodułu: path.join(searchPath, file). W ten sposób uzyskasz prawidłowe ścieżki niezależnie od systemu operacyjnego.
Moritz Friedrich,
8

Użyj node-dir, aby uzyskać dokładnie taki wynik, jaki ci się podoba

var dir = require('node-dir');

dir.files(__dirname, function(err, files) {
  if (err) throw err;
  console.log(files);
  //we have an array of files now, so now we can iterate that array
  files.forEach(function(path) {
    action(null, path);
  })
});
Christiaan Westerbeek
źródło
node-dir działał dobrze, ale kiedy użyłem go z webpackiem, mam dziwne problemy. W funkcji readFiles wstawiono  jak w „if (err)  {” powodując „nieprzechwycony błąd składni: nieoczekiwany błąd {”. Problem ten mnie zaskoczył i moją natychmiastową reakcją jest zastąpienie node-dir czymś podobnym
Parth
1
@Parth Ten komentarz nie da ci odpowiedzi. Napisz nowe pełne pytanie na SO lub stwórz problem w repozytorium GitHub. Kiedy dobrze rozwiniesz swoje pytanie, być może będziesz w stanie rozwiązać problem bez konieczności jego publikowania
Christiaan Westerbeek
1
Komentarz @ Parth może być nadal użytecznym ostrzeżeniem dla innych, którzy rozważają Twoją sugestię jako rozwiązanie swojego problemu. Być może nie szukali odpowiedzi w tej sekcji komentarzy :)
4

Napisałem to niedawno i pomyślałem, że warto udostępnić to tutaj. Kod korzysta z biblioteki asynchronicznej .

var fs = require('fs');
var async = require('async');

var scan = function(dir, suffix, callback) {
  fs.readdir(dir, function(err, files) {
    var returnFiles = [];
    async.each(files, function(file, next) {
      var filePath = dir + '/' + file;
      fs.stat(filePath, function(err, stat) {
        if (err) {
          return next(err);
        }
        if (stat.isDirectory()) {
          scan(filePath, suffix, function(err, results) {
            if (err) {
              return next(err);
            }
            returnFiles = returnFiles.concat(results);
            next();
          })
        }
        else if (stat.isFile()) {
          if (file.indexOf(suffix, file.length - suffix.length) !== -1) {
            returnFiles.push(filePath);
          }
          next();
        }
      });
    }, function(err) {
      callback(err, returnFiles);
    });
  });
};

Możesz użyć tego w następujący sposób:

scan('/some/dir', '.ext', function(err, files) {
  // Do something with files that ends in '.ext'.
  console.log(files);
});
recidive
źródło
2
To. Jest to tak uporządkowane i proste w użyciu. Wypompowałem go do modułu, wymagałem go i działa jak kanapka mcdream.
Jay
4

Inną opcją jest biblioteka o nazwie Filehound . Rekurencyjnie przeszuka dany katalog (domyślnie katalog roboczy). Obsługuje różne filtry, połączenia zwrotne, obietnice i wyszukiwania synchronizacji.

Na przykład wyszukaj w bieżącym katalogu roboczym wszystkie pliki (używając wywołań zwrotnych):

const Filehound = require('filehound');

Filehound.create()
.find((err, files) => {
    if (err) {
        return console.error(`error: ${err}`);
    }
    console.log(files); // array of files
});

Lub obietnice i określenie konkretnego katalogu:

const Filehound = require('filehound');

Filehound.create()
.paths("/tmp")
.find()
.each(console.log);

Zapoznaj się z dokumentacją w celu uzyskania dalszych przykładów użycia i przykładów użycia: https://github.com/nspragg/filehound

Oświadczenie: Jestem autorem.

nickool
źródło
4

Przy użyciu async / await powinno to działać:

const FS = require('fs');
const readDir = promisify(FS.readdir);
const fileStat = promisify(FS.stat);

async function getFiles(dir) {
    let files = await readDir(dir);

    let result = files.map(file => {
        let path = Path.join(dir,file);
        return fileStat(path).then(stat => stat.isDirectory() ? getFiles(path) : path);
    });

    return flatten(await Promise.all(result));
}

function flatten(arr) {
    return Array.prototype.concat(...arr);
}

Możesz użyć bluebird.Promisify lub tego:

/**
 * Returns a function that will wrap the given `nodeFunction`. Instead of taking a callback, the returned function will return a promise whose fate is decided by the callback behavior of the given node function. The node function should conform to node.js convention of accepting a callback as last argument and calling that callback with error as the first argument and success value on the second argument.
 *
 * @param {Function} nodeFunction
 * @returns {Function}
 */
module.exports = function promisify(nodeFunction) {
    return function(...args) {
        return new Promise((resolve, reject) => {
            nodeFunction.call(this, ...args, (err, data) => {
                if(err) {
                    reject(err);
                } else {
                    resolve(data);
                }
            })
        });
    };
};

Węzeł 8+ ma wbudowaną funkcję Promisify

Zobacz moją drugą odpowiedź na podejście generatora, które może dać wyniki jeszcze szybciej.

mpen
źródło
4

Asynchronizacja

const fs = require('fs')
const path = require('path')

const readdir = (p, done, a = [], i = 0) => fs.readdir(p, (e, d = []) =>
  d.map(f => readdir(a[a.push(path.join(p, f)) - 1], () =>
    ++i == d.length && done(a), a)).length || done(a))

readdir(__dirname, console.log)

Synchronizacja

const fs = require('fs')
const path = require('path')

const readdirSync = (p, a = []) => {
  if (fs.statSync(p).isDirectory())
    fs.readdirSync(p).map(f => readdirSync(a[a.push(path.join(p, f)) - 1], a))
  return a
}

console.log(readdirSync(__dirname))

Czytelne asynchronicznie

function readdir (currentPath, done, allFiles = [], i = 0) {
  fs.readdir(currentPath, function (e, directoryFiles = []) {
    if (!directoryFiles.length)
      return done(allFiles)
    directoryFiles.map(function (file) {
      var joinedPath = path.join(currentPath, file)
      allFiles.push(joinedPath)
      readdir(joinedPath, function () {
        i = i + 1
        if (i == directoryFiles.length)
          done(allFiles)}
      , allFiles)
    })
  })
}

readdir(__dirname, console.log)

Uwaga: obie wersje będą podążać za dowiązaniami symbolicznymi (tak samo jak oryginał fs.readdir)

Afanasii Kurakin
źródło
3

Sprawdź bibliotekę final-fs . Zapewnia readdirRecursivefunkcję:

ffs.readdirRecursive(dirPath, true, 'my/initial/path')
    .then(function (files) {
        // in the `files` variable you've got all the files
    })
    .otherwise(function (err) {
        // something went wrong
    });
Szymon Wygnański
źródło
2

Samodzielna realizacja obietnicy

Korzystam z biblioteki obietnicy when.js w tym przykładzie.

var fs = require('fs')
, path = require('path')
, when = require('when')
, nodefn = require('when/node/function');

function walk (directory, includeDir) {
    var results = [];
    return when.map(nodefn.call(fs.readdir, directory), function(file) {
        file = path.join(directory, file);
        return nodefn.call(fs.stat, file).then(function(stat) {
            if (stat.isFile()) { return results.push(file); }
            if (includeDir) { results.push(file + path.sep); }
            return walk(file, includeDir).then(function(filesInDir) {
                results = results.concat(filesInDir);
            });
        });
    }).then(function() {
        return results;
    });
};

walk(__dirname).then(function(files) {
    console.log(files);
}).otherwise(function(error) {
    console.error(error.stack || error);
});

Podałem opcjonalny parametr, includeDirktóry będzie zawierał katalogi na liście plików, jeśli jest ustawiony na true.

JayQuerie.com
źródło
1

Oto kolejna implementacja. Żadne z powyższych rozwiązań nie ma żadnych ograniczeń, więc jeśli twoja struktura katalogów jest duża, wszystkie będą druzgocić i ostatecznie zabraknie zasobów.

var async = require('async');
var fs = require('fs');
var resolve = require('path').resolve;

var scan = function(path, concurrency, callback) {
    var list = [];

    var walker = async.queue(function(path, callback) {
        fs.stat(path, function(err, stats) {
            if (err) {
                return callback(err);
            } else {
                if (stats.isDirectory()) {
                    fs.readdir(path, function(err, files) {
                        if (err) {
                            callback(err);
                        } else {
                            for (var i = 0; i < files.length; i++) {
                                walker.push(resolve(path, files[i]));
                            }
                            callback();
                        }
                    });
                } else {
                    list.push(path);
                    callback();
                }
            }
        });
    }, concurrency);

    walker.push(path);

    walker.drain = function() {
        callback(list);
    }
};

Korzystanie z współbieżności 50 działa całkiem dobrze i jest prawie tak szybkie, jak prostsze implementacje dla małych struktur katalogów.

Monkey Boson
źródło
1

Zmodyfikowałem odpowiedź Trevor Senior Promise na współpracę z Bluebird

var fs = require('fs'),
    path = require('path'),
    Promise = require('bluebird');

var readdirAsync = Promise.promisify(fs.readdir);
var statAsync = Promise.promisify(fs.stat);
function walkFiles (directory) {
    var results = [];
    return readdirAsync(directory).map(function(file) {
        file = path.join(directory, file);
        return statAsync(file).then(function(stat) {
            if (stat.isFile()) {
                return results.push(file);
            }
            return walkFiles(file).then(function(filesInDir) {
                results = results.concat(filesInDir);
            });
        });
    }).then(function() {
        return results;
    });
}

//use
walkDir(__dirname).then(function(files) {
    console.log(files);
}).catch(function(e) {
    console.error(e); {
});
Phil Mander
źródło
1

Dla zabawy, oto wersja oparta na przepływach, która współpracuje z biblioteką strumieni highland.js. Współautorem jest Victor Vu.

###
  directory >---m------> dirFilesStream >---------o----> out
                |                                 |
                |                                 |
                +--------< returnPipe <-----------+

  legend: (m)erge  (o)bserve

 + directory         has the initial file
 + dirListStream     does a directory listing
 + out               prints out the full path of the file
 + returnPipe        runs stat and filters on directories

###

_ = require('highland')
fs = require('fs')
fsPath = require('path')

directory = _(['someDirectory'])
mergePoint = _()
dirFilesStream = mergePoint.merge().flatMap((parentPath) ->
  _.wrapCallback(fs.readdir)(parentPath).sequence().map (path) ->
    fsPath.join parentPath, path
)
out = dirFilesStream
# Create the return pipe
returnPipe = dirFilesStream.observe().flatFilter((path) ->
  _.wrapCallback(fs.stat)(path).map (v) ->
    v.isDirectory()
)
# Connect up the merge point now that we have all of our streams.
mergePoint.write directory
mergePoint.write returnPipe
mergePoint.end()
# Release backpressure.  This will print files as they are discovered
out.each H.log
# Another way would be to queue them all up and then print them all out at once.
# out.toArray((files)-> console.log(files))
Michael Connor
źródło
1

Używanie obietnic ( Q ) do rozwiązania tego w funkcjonalnym stylu:

var fs = require('fs'),
    fsPath = require('path'),
    Q = require('q');

var walk = function (dir) {
  return Q.ninvoke(fs, 'readdir', dir).then(function (files) {

    return Q.all(files.map(function (file) {

      file = fsPath.join(dir, file);
      return Q.ninvoke(fs, 'lstat', file).then(function (stat) {

        if (stat.isDirectory()) {
          return walk(file);
        } else {
          return [file];
        }
      });
    }));
  }).then(function (files) {
    return files.reduce(function (pre, cur) {
      return pre.concat(cur);
    });
  });
};

Zwraca obietnicę tablicy, dzięki czemu można jej użyć jako:

walk('/home/mypath').then(function (files) { console.log(files); });
Gunar Gessner
źródło
1

Muszę dodać bibliotekę szlifierki opartą na obietnicy do listy.

 var sander = require('sander');
 sander.lsr(directory).then( filenames => { console.log(filenames) } );
IvanSanchez
źródło
1

Za pomocą bluebird promise.coroutine:

let promise = require('bluebird'),
    PC = promise.coroutine,
    fs = promise.promisifyAll(require('fs'));
let getFiles = PC(function*(dir){
    let files = [];
    let contents = yield fs.readdirAsync(dir);
    for (let i = 0, l = contents.length; i < l; i ++) {
        //to remove dot(hidden) files on MAC
        if (/^\..*/.test(contents[i])) contents.splice(i, 1);
    }
    for (let i = 0, l = contents.length; i < l; i ++) {
        let content = path.resolve(dir, contents[i]);
        let contentStat = yield fs.statAsync(content);
        if (contentStat && contentStat.isDirectory()) {
            let subFiles = yield getFiles(content);
            files = files.concat(subFiles);
        } else {
            files.push(content);
        }
    }
    return files;
});
//how to use
//easy error handling in one place
getFiles(your_dir).then(console.log).catch(err => console.log(err));
alexcres
źródło
0

Ponieważ każdy powinien pisać własne, stworzyłem jeden.

walk (dir, cb, endCb) cb (plik) endCb (err | null)

BRUDNY

module.exports = walk;

function walk(dir, cb, endCb) {
  var fs = require('fs');
  var path = require('path');

  fs.readdir(dir, function(err, files) {
    if (err) {
      return endCb(err);
    }

    var pending = files.length;
    if (pending === 0) {
      endCb(null);
    }
    files.forEach(function(file) {
      fs.stat(path.join(dir, file), function(err, stats) {
        if (err) {
          return endCb(err)
        }

        if (stats.isDirectory()) {
          walk(path.join(dir, file), cb, function() {
            pending--;
            if (pending === 0) {
              endCb(null);
            }
          });
        } else {
          cb(path.join(dir, file));
          pending--;
          if (pending === 0) {
            endCb(null);
          }
        }
      })
    });

  });
}
vvo
źródło
0

sprawdź loaddir https://npmjs.org/package/loaddir

npm install loaddir

  loaddir = require('loaddir')

  allJavascripts = []
  loaddir({
    path: __dirname + '/public/javascripts',
    callback: function(){  allJavascripts.push(this.relativePath + this.baseName); }
  })

Możesz użyć fileNamezamiast, baseNamejeśli potrzebujesz również rozszerzenia.

Dodatkową zaletą jest to, że będzie także oglądać pliki i ponownie wywoływać oddzwonienie. Istnieje mnóstwo opcji konfiguracji, dzięki którym jest niezwykle elastyczny.

Właśnie przerobiłem guardklejnot z rubinu za pomocą loaddir w krótkim czasie

Funkodebat
źródło
0

To jest moja odpowiedź. Mam nadzieję, że to może komuś pomóc.

Skupiam się na tym, aby procedura wyszukiwania mogła zatrzymać się w dowolnym miejscu, a dla znalezionego pliku określa względną głębokość oryginalnej ścieżki.

var _fs = require('fs');
var _path = require('path');
var _defer = process.nextTick;

// next() will pop the first element from an array and return it, together with
// the recursive depth and the container array of the element. i.e. If the first
// element is an array, it'll be dug into recursively. But if the first element is
// an empty array, it'll be simply popped and ignored.
// e.g. If the original array is [1,[2],3], next() will return [1,0,[[2],3]], and
// the array becomes [[2],3]. If the array is [[[],[1,2],3],4], next() will return
// [1,2,[2]], and the array becomes [[[2],3],4].
// There is an infinity loop `while(true) {...}`, because I optimized the code to
// make it a non-recursive version.
var next = function(c) {
    var a = c;
    var n = 0;
    while (true) {
        if (a.length == 0) return null;
        var x = a[0];
        if (x.constructor == Array) {
            if (x.length > 0) {
                a = x;
                ++n;
            } else {
                a.shift();
                a = c;
                n = 0;
            }
        } else {
            a.shift();
            return [x, n, a];
        }
    }
}

// cb is the callback function, it have four arguments:
//    1) an error object if any exception happens;
//    2) a path name, may be a directory or a file;
//    3) a flag, `true` means directory, and `false` means file;
//    4) a zero-based number indicates the depth relative to the original path.
// cb should return a state value to tell whether the searching routine should
// continue: `true` means it should continue; `false` means it should stop here;
// but for a directory, there is a third state `null`, means it should do not
// dig into the directory and continue searching the next file.
var ls = function(path, cb) {
    // use `_path.resolve()` to correctly handle '.' and '..'.
    var c = [ _path.resolve(path) ];
    var f = function() {
        var p = next(c);
        p && s(p);
    };
    var s = function(p) {
        _fs.stat(p[0], function(err, ss) {
            if (err) {
                // use `_defer()` to turn a recursive call into a non-recursive call.
                cb(err, p[0], null, p[1]) && _defer(f);
            } else if (ss.isDirectory()) {
                var y = cb(null, p[0], true, p[1]);
                if (y) r(p);
                else if (y == null) _defer(f);
            } else {
                cb(null, p[0], false, p[1]) && _defer(f);
            }
        });
    };
    var r = function(p) {
        _fs.readdir(p[0], function(err, files) {
            if (err) {
                cb(err, p[0], true, p[1]) && _defer(f);
            } else {
                // not use `Array.prototype.map()` because we can make each change on site.
                for (var i = 0; i < files.length; i++) {
                    files[i] = _path.join(p[0], files[i]);
                }
                p[2].unshift(files);
                _defer(f);
            }
        });
    }
    _defer(f);
};

var printfile = function(err, file, isdir, n) {
    if (err) {
        console.log('-->   ' + ('[' + n + '] ') + file + ': ' + err);
        return true;
    } else {
        console.log('... ' + ('[' + n + '] ') + (isdir ? 'D' : 'F') + ' ' + file);
        return true;
    }
};

var path = process.argv[2];
ls(path, printfile);
manbaum
źródło
0

Oto rekurencyjna metoda uzyskiwania wszystkich plików, w tym podkatalogów.

const FileSystem = require("fs");
const Path = require("path");

//...

function getFiles(directory) {
    directory = Path.normalize(directory);
    let files = FileSystem.readdirSync(directory).map((file) => directory + Path.sep + file);

    files.forEach((file, index) => {
        if (FileSystem.statSync(file).isDirectory()) {
            Array.prototype.splice.apply(files, [index, 1].concat(getFiles(file)));
        }
    });

    return files;
}
Daniel
źródło
0

Kolejny prosty i pomocny

function walkDir(root) {
    const stat = fs.statSync(root);

    if (stat.isDirectory()) {
        const dirs = fs.readdirSync(root).filter(item => !item.startsWith('.'));
        let results = dirs.map(sub => walkDir(`${root}/${sub}`));
        return [].concat(...results);
    } else {
        return root;
    }
}
Clinyong
źródło
Zakładasz, że każdy plik w katalogu głównym jest tutaj folderem.
xechelonx
0

W ten sposób używam funkcji fs.readdir nodejs do rekurencyjnego przeszukiwania katalogu.

const fs = require('fs');
const mime = require('mime-types');
const readdirRecursivePromise = path => {
    return new Promise((resolve, reject) => {
        fs.readdir(path, (err, directoriesPaths) => {
            if (err) {
                reject(err);
            } else {
                if (directoriesPaths.indexOf('.DS_Store') != -1) {
                    directoriesPaths.splice(directoriesPaths.indexOf('.DS_Store'), 1);
                }
                directoriesPaths.forEach((e, i) => {
                    directoriesPaths[i] = statPromise(`${path}/${e}`);
                });
                Promise.all(directoriesPaths).then(out => {
                    resolve(out);
                }).catch(err => {
                    reject(err);
                });
            }
        });
    });
};
const statPromise = path => {
    return new Promise((resolve, reject) => {
        fs.stat(path, (err, stats) => {
            if (err) {
                reject(err);
            } else {
                if (stats.isDirectory()) {
                    readdirRecursivePromise(path).then(out => {
                        resolve(out);
                    }).catch(err => {
                        reject(err);
                    });
                } else if (stats.isFile()) {
                    resolve({
                        'path': path,
                        'type': mime.lookup(path)
                    });
                } else {
                    reject(`Error parsing path: ${path}`);
                }
            }
        });
    });
};
const flatten = (arr, result = []) => {
    for (let i = 0, length = arr.length; i < length; i++) {
        const value = arr[i];
        if (Array.isArray(value)) {
            flatten(value, result);
        } else {
            result.push(value);
        }
    }
    return result;
};

Załóżmy, że masz ścieżkę o nazwie „/ database” w katalogu głównym projektów węzłów. Po rozwiązaniu tej obietnicy powinien wypluć tablicę każdego pliku w „/ database”.

readdirRecursivePromise('database').then(out => {
    console.log(flatten(out));
}).catch(err => {
    console.log(err);
});
Jason Clay
źródło