Mam dużo plików, które muszę posortować; i niestety jest wiele plików o tej samej nazwie, ale o innej zawartości, i jest taka sama treść o różnych nazwach plików.
Zastanawiam się nad użyciem md5sum
do generowania sum kontrolnych dla plików, ale muszę wiedzieć - czy możliwe jest, że dwa różne pliki (tj. Inna zawartość) wygenerują tę samą sumę kontrolną?
Jeśli tak, to jak prawdopodobne jest?
Czy byłoby możliwe użycie dwóch różnych niepowiązanych (tj. Nie należących do tej samej „rodziny”) programów sum kontrolnych do wygenerowania dwóch sum kontrolnych - przy założeniu, że chociaż dwa różne pliki mogą generować tę samą sumę kontrolną dla jednego z programów sum kontrolnych, nigdy nie zdarzy się to obu naraz?
Odpowiedzi:
Dwa pliki o tej samej zawartości, ale różnych nazwach plików: ( plik1 i plik2 ):
Dwa pliki o różnej zawartości, ale o tych samych nazwach plików: ( plik1 i plik1 )
Z wiki wpisu,
Ale algorytm MD5 ma swoje wady.
Poleciłbym użycie sha1 do obliczenia sumy kontrolnej, ponieważ tworzenie kolizji nie jest takie łatwe przy użyciu algorytmów sha1 . Generowanie sumy kontrolnej sha1 jest dość łatwe, jak widać tutaj .
źródło
sha1
nie jest istotne dla tego zadania; ma to znaczenie tylko w przypadku obaw o bezpieczeństwo .