Czym jest Hash Collision?

Hash Collision to sytuacja, gdy dwa różne wejścia dają dokładnie ten sam wynik haszowania. Wyobraź sobie dwa różne klucze, które w jakiś sposób otwierają ten sam cyfrowy zamek. Rzadkie, ale jeśli zdarzy się przy niewłaściwym algorytmie, może być problematyczne.

Mit

„Jeśli istnieje jedna kolizja, wszystko jest zepsute.” Nie do końca prawda. Silne algorytmy są tak zaprojektowane, by praktyczna kolizja była skrajnie mało prawdopodobna, a nowoczesne systemy dodają warstwy ochronne, żeby jedna anomalia nie zrujnowała całego rozwiązania.

Jak działa Hash Collision

Pomyśl o haszu jak o małej etykiecie dla dużych danych. Oto krótka trasa od wejścia do wpadki.

Wejście: Zaczynasz od dowolnej wiadomości, pliku lub transakcji.
Hasz: Funkcja z rodziny kryptograficznych funkcji skrótu zamienia to wejście w ciąg o stałej długości.
Kolizja: Ponieważ wyjścia są ograniczone, a wejść bez końca, dwa różne wejścia mogą mapować się na ten sam wynik.
Atak: Poważne zagrożenie pojawia się, gdy ktoś potrafi celowo stworzyć dwa różne wejścia, które kolidują, i potem zamienić jedno na drugie.
Obrona: Dobre algorytmy sprawiają, że takie poszukiwania są astronomicznie kosztowne, więc losowe zgadywanie pochłania czas i pieniądze.

Tak mniej więcej to wygląda.

Dlaczego Hash Collision ma znaczenie

Dlaczego warto zwrócić uwagę na ten cichy zakątek matematyki i kodu?

Zaleta: Silna odporność utrzymuje unikalność etykiet danych, co zmniejsza pole dla podstępnych działań.
Perspektywa: Kolizje zagrażają integralności w przypadku technologii blockchain, aktualizacji oprogramowania i weryfikacji plików.
Znaczenie: Spotkasz to w portfelach, na giełdach, w dowodach i narzędziach audytowych, które polegają na równości haszy.

Wskazówka

Gdy to możliwe, wybieraj schematy, które łączą warstwy ochronne jak Double Hashing, i trzymaj się algorytmów szeroko sprawdzonych i dających długie wyjścia.

Kluczowe cechy Hash Collision

Co sprawia, że to zjawisko jest warte zapamiętania:

Niezależne wystąpienie: Przy skończonych wyjściach i nieskończonych wejściach pewne pary muszą kolidować zgodnie z zasadą gołębnika.
Trudne do znalezienia: W przypadku nowoczesnych funkcji haszujących celowe odnalezienie kolizji ma być obliczeniowo bardzo kosztowne.
Podpisy: Wiele podpisów cyfrowych podpisuje hasz, więc odporność na kolizje chroni podpisujących przed zamianą treści.

Jak oblicza się Hash Collision?

Możesz oszacować wysiłek za pomocą idei urodzinowej. Dla haszu o k bitach liczba losowych prób potrzebnych dla około pięćdziesięcioprocentowego prawdopodobieństwa dowolnej kolizji to w przybliżeniu pierwiastek z 2^k pomnożony przez około 1.1777.

n_fifty_percent ≈ 1.1774 * sqrt(2^k)

Przykład: dla k równego 256 potrzebna liczba prób jest niewyobrażalnie duża, dlatego brutalne łamanie w celu znalezienia kolizji to nie jest projekt na weekend.

Warianty

Różne odmiany pojawiają się w badaniach i atakach:

Kolizja: Dwa różne wejścia mają ten sam hasz.
Druga kolizja: Mając jedno wejście, znaleźć inne, które daje ten sam hasz.
Preobraz: Mając hasz, znaleźć dowolne wejście, które do niego prowadzi.
Prefiks: Wybrana kolizja prefiksowa tworzy dwie wiadomości z różnymi wybranymi początkiem, które kończą się tym samym haszem.

Przypomnienie

SHA two five six nie ma publicznej, praktycznej kolizji. Jeśli ktoś twierdzi, że ją znalazł, spodziewaj się głośnego przeglądu ze strony środowiska i wyników testów, zanim zaczniesz panikować lub świętować.

Przykład

Gdyby atakujący mógł stworzyć dwie różne transakcje o tym samym txid, mógłby spróbować sztuczki Double Spending przez zamianę bliźniaka po twoim podpisie.

Ciekawostka

Kolizje MD5 wykazano dekady temu, a projekt SHAttered pokazał publiczną kolizję SHA one z dwoma różnymi plikami PDF, co zmusiło branżę do wycofania tego algorytmu.

Podsumowanie

W skrócie, Hash Collision to rzadki przypadek, gdy dwa różne wejścia mają ten sam cyfrowy odcisk palca, a współczesna kryptografia robi wiele, by to pozostało tylko ciekawostką.

Hash Collision