hash函数 | Mikez Namespace

Hash 函数（散列函数）是一种将输入数据（通常是字符串、文件、或其他数据）映射为固定长度的值（通常是一个整数）的函数。这个映射值通常称为“散列值”或“哈希值”。Hash 函数广泛应用于计算机科学的多个领域，如数据存储、密码学、数据检索等。

数据存储与检索：
- 哈希表（Hash Table）：哈希表通过 Hash 函数将键映射到数组的索引位置，从而实现快速的数据存储与检索。哈希表的查找时间复杂度接近 O(1)，是实现字典、集合等数据结构的基础。
密码学：
- 消息摘要：在密码学中，Hash 函数用于生成消息摘要（如 MD5、SHA-256），这些摘要用于验证数据的完整性。例如，传输一个文件时，可以生成文件的散列值，并在接收端进行比对，以确保文件没有被篡改。
- 数字签名：在数字签名中，Hash 函数用于生成待签名数据的散列值，然后使用私钥对该散列值进行加密生成签名。
数据完整性验证：
- 校验和：在网络传输和存储过程中，Hash 函数可以用于生成数据的校验和，确保数据在传输或存储过程中未被损坏。
负载均衡：
- 一致性哈希（Consistent Hashing）：在分布式系统中，一致性哈希用于将请求均匀分布到不同的服务器上，保证负载均衡，同时在新增或删除节点时对系统影响最小。
文件比较：
- 去重：通过对文件内容计算哈希值，可以快速比较两个文件是否相同，广泛用于文件去重、数据备份等场景。

MD5（Message-Digest Algorithm 5）：生成 128 位（16 字节）的散列值，已被认为不安全，但仍在某些场景中使用。
SHA-1（Secure Hash Algorithm 1）：生成 160 位（20 字节）的散列值，也被认为不够安全。
SHA-2（包括 SHA-224、SHA-256、SHA-384、SHA-512）：目前广泛使用的安全哈希算法，其中 SHA-256 是最常用的，生成 256 位（32 字节）的散列值。
SHA-3：是 SHA-2 的后继算法，设计上与前者有很大不同，提供更高的安全性。

由于 Hash 函数将无限多的输入映射到有限的输出范围内，理论上总是存在不同输入映射到相同散列值的可能性，这称为碰撞。

Hash 函数是计算机科学中的基础工具，其快速、确定性和不可逆性使其成为众多领域的关键技术。从简单的数据存储到复杂的密码学应用，Hash 函数在不同场景下扮演着重要角色。