Hash Collision 是指两个不同的输入产生完全相同的哈希输出。想象两把不同的钥匙却能打开同一个数字锁。很少见，但如果在不安全的算法上发生，会引发严重问题。

误解

“如果存在一次碰撞，一切都被破坏。”并非如此。强健的算法设计让任何实际发生的 Hash Collision 极为不可能，现代系统还设有多重防护，单个问题不会导致整个系统崩溃。

可以把哈希看作大数据的小标签。下面是从输入到出错的简要流程。

是的，就是这个意思。

为什么你要关心数学与代码中这个不常被注意的角落？

提示

如果有这样的选择，优先采用像双重哈希这类叠加防护的方案，并坚持使用经过广泛审查且输出较长的算法。

是什么让这一现象特殊并值得记住：

可以用生日悖论的思路来估算所需工作量。对于 k 位哈希，达到大约 50% 碰撞概率所需的随机尝试次数约等于 2^k 的平方根乘以约 1.177。

n_fifty_percent ≈ 1.1774 * sqrt(2^k)

示例：当 k 等于 256 时，所需尝试次数极其巨大，这就是为什么用暴力破解去寻找碰撞不可能在短时间内完成。

在研究和攻击中会出现不同的变种：

提醒

SHA256 目前没有公开的、可行的碰撞。如果有人声称找到碰撞，应在惊慌或庆祝之前等待广泛的同行评审和检测结果。

如果攻击者能够制造两个具有相同 txid 的不同交易，他们可能在你签名后通过替换其一来尝试双重支付的把戏。

几十年前就已展示出 MD5 碰撞，SHAttered 项目公开展示了一个 SHA1 碰撞，使用两个不同的 PDF 文件，这一事件促使业界弃用它。

简而言之，Hash Collision 是两个不同输入共享同一个数字指纹的罕见情况，现代密码学在努力防止这类情况超出轶事层面。

Hash Collision

我们是否遗漏了什么？?