关于加密,我们通常理解就是把正常的可读可写的数据进行处理,有的只是简单的隐藏显示属性,有的对文件头部进行了修改,但是加密并不是认证。

这一概念本身并不困难,但在表面之下,还有更多丰富的细节和玄妙之处有待发现。本文就是讲述开发者对于加密和认证二者的混淆与误用,并附上了优秀的解决方案。

0x01 加密与认证之间有哪些区别?

加密是呈现信息,使其在没有正确的密钥情况下,变得难以卒读的过程。在简单的对称加密中,同一个密钥被用于加密和解密。在非对称加密中,可以使用用户的公钥对信息加密,使得只有对应私钥的拥有者才能读取它。

认证是呈现信息,使其抗篡改(通常在某一非常低的概率之内,小于1除以已知宇宙中粒子的数量),同时也证明它起源于预期发送者的过程。

注意:当本文提及真实性时,是专门指的信息真实性,而不是身份真实性。这是一个PKI和密钥管理问题,我们可能在未来的博客中详细说明。

就CIA triad而言:加密提供机密性,认证提供完整性。

加密不提供完整性;被篡改的信息(通常)还能解密,但结果通常会是垃圾。单独加密也不抑制恶意第三方发送加密信息。

认证不提供机密性;可以为明文信息提供抗篡改。

在程序员中,常见的错误是混淆这两个概念。你能很容易找到这样的一个库或者框架:加密cookie数据,然后在仅仅解密它之后就无条件地信任与使用之。

0x02 加密

我们之前定义了加密,并且详细说明了它是提供机密性,但不提供完整性和真实性的。你可以篡改加密信息,并将产生的垃圾给予接收者。而且你甚至可以利用这种垃圾产生机制,来绕过安全控制。

考虑在加密cookie的情况下,有如下代码:

  1. function setUnsafeCookie($name, $cookieData, $key)
  2. {
  3.     $iv = mcrypt_create_iv(16, MCRYPT_DEV_URANDOM);
  4.     return setcookie(
  5.         $name,
  6.         base64_encode(
  7.             $iv.
  8.             mcrypt_encrypt(
  9.                 MCRYPT_RIJNDAEL_128,
  10.                 $key,
  11.                 json_encode($cookieData),
  12.                 MCRYPT_MODE_CBC,
  13.                 $iv
  14.             )
  15.         )
  16.     );
  17. }
  18. function getUnsafeCookie($name, $key)
  19. {
  20.     if (!isset($_COOKIE[$name])) {
  21.         return null;
  22.     }
  23.     $decoded = base64_decode($_COOKIE[$name]);
  24.     $iv = mb_substr($decoded, 0, 16, '8bit');
  25.     $ciphertext = mb_substr($decoded, 16, null, '8bit');
  26.     $decrypted = rtrim(
  27.         mcrypt_decrypt(
  28.             MCRYPT_RIJNDAEL_128,
  29.             $key,
  30.             $ciphertext,
  31.             MCRYPT_MODE_CBC,
  32.             $iv
  33.         ),
  34.         "\0"
  35.     );
  36.     return json_decode($decrypted, true);
  37. }

上面的代码提供了在密码段链接模块的AES加密,如果你传入32字节的字符串作为$key,你甚至可以声称,为你的cookie提供了256位的AES加密,然后人们可能被误导相信它是安全的。

0x03 如何攻击未经认证的加密

比方说,在登录到这个应用程序之后,你会发现你收到一个会话cookie,看起来就像

kHv9PAlStPZaZJHIYXzyCnuAhWdRRK7H0cNVUCwzCZ4M8fxH79xIIIbznxmiOxGQ7td8LwTzHFgwBmbqWuB+sQ==

让我们改变一个字节的第一块(初始化向量),并反复发送我们的新的cookie,直到出现一些变化。应该采取共4096次HTTP请求,以尝试变量IV所有可能的单字节变化。在上面的例子中,经过2405次请求后,我们得到一个看起来像这样的字符串:

kHv9PAlStPZaZZHIYXzyCnuAhWdRRK7H0cNVUCwzCZ4M8fxH79xIIIbznxmiOxGQ7td8LwTzHFgwBmbqWuB+sQ==

相比之下,在base64编码的cookie中只有一个字符不同(kHv9PAlStPZaZ J vs kHv9PAlStPZaZ Z):

- kHv9PAlStPZaZJHIYXzyCnuAhWdRRK7H0cNVUCwzCZ4M8fxH79xIIIbznxmiOxGQ7td8LwTzHFgwBmbqWuB+sQ==

+ kHv9PAlStPZaZZHIYXzyCnuAhWdRRK7H0cNVUCwzCZ4M8fxH79xIIIbznxmiOxGQ7td8LwTzHFgwBmbqWuB+sQ==

我们存储在这个cookie里的原始数据,是看起来像这样的数组:

  1. array(2) {
  2.   ["admin"]=>
  3.   int(0)
  4.   ["user"]=>
  5.   "aaaaaaaaaaaaa"
  6.  }

但在仅仅改变初始化向量的一个字节之后,我们就能够改写我们的阅读信息:

  1. array(2) {
  2.   ["admin"]=>
  3.   int(1)
  4.   ["user"]=>
  5.   "aaaaaaaaaaaaa"
  6. }

根据底层应用程序的设置方法,你或许可以翻转一位进而提升成为一名管理员。即使你的cookie是加密的。 如果你想再现我们的结果,我们的加密密钥是十六进制下的:000102030405060708090a0b0c0d0e0f

0x04 认证

如上所述,认证旨在提供信息的完整性(我们指显著抗篡改能力),而这证明它来自预期的源(真实性)。这样做的典型方法是,为信息计算一个密钥散列消息认证码(HMAC的简称),并将信息与它连结。

  1. function hmac_sign($message, $key)
  2. {
  3.     return hash_hmac('sha256', $message, $key) . $message;
  4. }
  5. function hmac_verify($bundle, $key)
  6. {
  7.     $msgMAC = mb_substr($bundle, 0, 64, '8bit');
  8.     $message = mb_substr($bundle, 64, null, '8bit');
  9.     return hash_equals(
  10.         hash_hmac('sha256', $message, $key),
  11.         $msgMAC
  12.     );
  13. }

重要的是,这里使用一个适当的哈希工具,如HMAC,而不仅仅是一个简单的散列函数。

  1. function unsafe_hash_sign($message, $key)
  2. {
  3.     return md5($key.$message) . $message;
  4. }
  5. function unsafe_hash_verify($bundle, $key)
  6. {
  7.     $msgHash = mb_substr($bundle, 0, 64, '8bit');
  8.     $message = mb_substr($bundle, 64, null, '8bit');
  9.     return md5($key.$message) == $msgHash;
  10. }

我在这两个函数名前面加了unsafe,是因为它们还是易受到一些缺点的危害:

Timing Attacks

Chosen Prefix Attacks on MD5 (PDF)

Non-strict equality operator bugs (largely specific to PHP)

现在,我们有点接近我们强大的对称加密认证的目标。目前仍有几个问题,如:

如果我们的原始信息以空字节结尾会发生什么?

有没有一个比mcrypt扩展库默认使用的更好的填充策略?

由于使用AES,有哪些通信方面是易受攻击的?

幸运的是,这些问题在现有的加密函数库中已有了解答。我们强烈推荐你使用现有的库,而不是写自己的加密功能。对于PHP开发人员来说,你应该使用defuse/php-encryption(或者libsodium)。

0x05 用Libsodium安全加密Cookies

  1. /*
  2. // At some point, we run this command:
  3. $key = Sodium::randombytes_buf(Sodium::CRYPTO_AEAD_CHACHA20POLY1305_KEYBYTES);
  4. */
  5. /**
  6.  * Store ciphertext in a cookie
  7.  *
  8.  * @param string $name - cookie name
  9.  * @param mixed $cookieData - cookie data
  10.  * @param string $key - crypto key
  11.  */
  12. function setSafeCookie($name, $cookieData, $key)
  13. {
  14.     $nonce = Sodium::randombytes_buf(Sodium::CRYPTO_SECRETBOX_NONCEBYTES);
  15.     return setcookie(
  16.         $name,
  17.         base64_encode(
  18.             $nonce.
  19.             Sodium::crypto_secretbox(
  20.                 json_encode($cookieData),
  21.                 $nonce,
  22.                 $key
  23.             )
  24.         )
  25.     );
  26. }
  27. /**
  28.  * Decrypt a cookie, expand to array
  29.  *
  30.  * @param string $name - cookie name
  31.  * @param string $key - crypto key
  32.  */
  33. function getSafeCookie($name, $key)
  34. {
  35.     $hexSize = 2 * Sodium::Sodium::CRYPTO_SECRETBOX_NONCEBYTES;
  36.     if (!isset($_COOKIE[$name])) {
  37.         return array();
  38.     }
  39.     $decoded = base64_decode($_COOKIE[$name]);
  40.     $nonce = mb_substr($decoded, 0, $hexSize, '8bit');
  41.     $ciphertext = mb_substr($decoded, $hexSize, null, '8bit');
  42.     $decrypted = Sodium::crypto_secretbox_open(
  43.         $ciphertext,
  44.         $nonce,
  45.         $key
  46.     );
  47.     if (empty($decrypted)) {
  48.         return array();
  49.     }
  50.     return json_decode($decrypted, true);
  51. }

对于没有libsodium库的开发人员,我们的一个博客读者,提供了一个安全cookie实现的例子,其使用了defuse/php-encryption(我们推荐的PHP库)。

0x06 使用关联数据的认证加密

在我们前面的示例中,我们集中精力于,同时使用加密和认证,使其作为必须小心使用的单独组件,以避免加密的悲剧。具体而言,我们专注于密码段链接模块的AES加密。

然而,密码学家已经开发出更新,更具有弹性的加密模型,其加密和认证信息在同一操作。这些模型被称为AEAD模型(Authenticated Encryption with Associated Data)。关联数据意味着,无论你的应用程序需要什么进行认证,都不加密。

AEAD模型通常用于有状态的目的,如网络通信中,其中一个随机数可以很容易地管理。

AEAD两个可靠的实现是AES-GCM和ChaCha20-Poly1305。

AES-GCM是Galois/Counter模式中的高级加密标准(又名Rijndael算法加密)。这种模式在OpenSSL的最新版本中加入,但它目前在PHP中还不被支持。

ChaCha20-Poly1305结合了ChaCha20流密码与Poly1305消息认证码。这种模式在libsodium PHP扩展可用。Sodium::crypto_aead_chacha20poly1305_encrypt() Sodium::crypto_aead_chacha20poly1305_decrypt()

总结一下,你该记住的

加密不是认证

加密提供机密性

认证提供完整性

将两者混为一谈你就得自担风险

为了完成CIA triad,你需要单独解决可用性。这通常不是一个加密问题。

更重要的是:在密码学专家的监督下,使用具有韧性被证实记录的库,而不是自己在那里闭门造车,你会好得多。