Czasami otrzymuję pliki od moich klientów, które mają nieprawidłowe rozszerzenie. Na przykład nazwa to, image.jpg
ale plik jest w rzeczywistości obrazem TIFF. W wielu przypadkach mogę to wyjaśnić, otwierając plik w edytorze tekstu, patrząc na kilka pierwszych bajtów, a następnie dedukując, który to typ pliku.
Działa to dla mnie z plikami JPEG, TIFF, GIF i PDF. Istnieje jednak wiele innych typów plików.
Czy można zautomatyzować identyfikację prawidłowego typu pliku poprzez analizę zawartych danych?
windows
file-management
file-extension
Jaskółka oknówka
źródło
źródło
file
polecenie to robi na maszynach * nix.windows
, ale komentarz sugeruje: „Nie możesz tego zrobić w systemie Windows, zamiast tego musisz użyć * nix”. Więc? Komentarz jest skierowany „dla zainteresowanych”. W czym? Zmienić komputer?:(
Odpowiedzi:
Możesz użyć narzędzia TrID , które ma rosnącą bibliotekę definicji typów plików do identyfikacji plików.
Symbole wieloznaczne są obsługiwane, więc w twoim przykładzie możesz po prostu umieścić wszystkie obrazy do zbadania w folderze, np. C: \ Verimages - wtedy możesz użyć polecenia:
Spowoduje to sprawdzenie wszystkich plików w
verifyimages
folderze.Dostępna jest również wersja GUI, TrIDNet :
Dostępna jest dokumentacja, w jaki sposób możesz łatwo zintegrować TrID lub TrIDNet z Windows Explorerem i Total Commander:
Eksplorator Windows
Total Commander
źródło
plik
źródło
file
jest standardem, ale na starszych systemach (szczególnie nie Linux) nie ma dużej wiedzy. W przypadku Ubuntu itp. Powinien być dość szanowany, a nawet zainstalowany jako standard.file
systemu Windows. Jeśli inne polecenia * nix są dla ciebie interesujące jako użytkownik systemu Windows, poszukaj tej witryny, aby znaleźć wszelkiego rodzaju klejnoty.file
jest ekspertem od plików tworzonych przez aplikacje Windows.file
w ogóle użyłeś , a jednak prawie zdecydowałeś się na jego skuteczność.Pracowałem dla Francuskiej Biblioteki Narodowej, aby zbudować system archiwum cyfrowego, który zawiera nie tylko zdigitalizowane książki, ale także miliony cyfrowych artefaktów z różnego rodzaju dziwnymi typami plików. Użyliśmy JHOVE do rozpoznania formatów plików.
JHOVE jest oprogramowaniem typu open source, jest utrzymywany przez JSTOR i bibliotekę uniwersytecką Harvarda. Jest raczej prosty w użyciu .
źródło
Korzystam z bibliotek OutsideIn Oracle w swoich programach. Nie za darmo, ale działają dobrze, szczególnie w przypadku zdjęć. Mówi rynek mówi, że obsługuje ponad 500 typów plików.
źródło
Możesz sprawdzić typ pliku na dowolnym komputerze, w tym na Windowsie
http://www.checkfiletype.com
źródło