格密码学进阶04：更高效率的IBE（ABB10）

Posted on Sep 5, 2020

上期回顾

上期文章中，我们了解了Lattice Trapdoor的第一个实践用处——即身份加密IBE。同时，我们也看到了最简单的CHKP10 IBE身份加密系统。

粗略的概括一下CHKP10做了什么：我们把代表Identity（身份）的$ ID $拆分成二进制的bits，然后每一位都对应选择一个LWE的矩阵$ \mathbf{A}_i^b $。我们最终把这些选好的矩阵全部拼接起来，再通过实现预留的Trapdoor找到对应这个大矩阵的密钥，就可以进行Dual Regev的加解密了。

像这种根据Identity的每一个bit选择矩阵组合起来变成一个新矩阵的构造在密码学中非常常见，这里先留作一个悬念，如果后面有机会写到基于GGH15的Multilinear Map而实现的Indistinguishability Obfuscation（iO）的话，我们会发现非常相似的构造。

在上期的最后，我们同样也发现了CHKP10构造的一个缺陷：公钥的大小和ID的长度是等比线性增长的，这会大大影响这个IBE体系的存储空间和计算效率。

其实呢，CHKP10只是我们了解完Lattice Trapdoor之后入门的第一种IBE构造。同样是在2010年，整个密码学圈子里还诞生出了另一种IBE的构造——ABB10。

【ABB10】IBE加密系统

ABB10，顾名思义，是由Agrawal，Boneh与Boyan三位在2010年提出的。ABB10不同于CHKP10的是：它的加密矩阵$ \mathbf{F}_{ID} $是恒定大小的，并不会随着$ ID $的长度变长而变大。我们来看看ABB10的具体构造吧。

公共参数生成

ABB10的公共参数生成较为简单。首先，我们需要指定两个随机的问题矩阵$ \mathbf{A}_0, \mathbf{A}_1 $，以及SIS问题的结果向量$ \mathbf{u} $。最后，我们还需要借助之前讨论过的工具矩阵$ \mathbf{G} $。

我们生成$ \mathbf{A}_0 $的时候，需要通过之前的Trapdoor生成方法来生成。$ \mathbf{A}_0 $的Trapdoor $ \mathbf{R} $就是我们的MSK了。

乍一看，参数生成的部分和CHKP10基本相似。真正有区别的地方在于ID矩阵的生成。

生成ID矩阵

首先，我们设定用户的身份$ ID $为一个正整数。

计算ID矩阵$ \mathbf{F}{ID} $的方法很简单，我们只需要把$ ID $的值乘以$ \mathbf{G} $矩阵，然后叠加在$ \mathbf{A}1 $上即可： $$ \mathbf{F}{ID} = [\mathbf{A}0 \vert \mathbf{A}1 + ID \times \mathbf{G}] $$ 对应某个$ ID $的密钥$ \mathbf{e}{ID} $和之前一样，就是基于$ \mathbf{F}{ID} $的SIS问题的短向量解： $$ \mathbf{F}{ID} \cdot \mathbf{e}_{ID} = \mathbf{u} \text{ mod }q $$ 找到这个密钥的方法也和CHKP10是一样的，因为我们知道了$ \mathbf{A}_0 $的Trapdoor $ \mathbf{R} $，所以不管我们怎么变换$ \mathbf{A}1 $位置上的值，永远都可以找到整个$ \mathbf{F}{ID} $的SIS解。

IBE加密

为了完整性与正确性，我们来快速的看一下ABB10下是如何实现加密算法的。

和CHKP10一样，我们使用Dual Regev的加密算法来加密$ \mu $。首先我们选择一个随机的向量$ \mathbf{s} $和对应的噪音$ \mathbf{x}, x $，随后输出： $$ Enc(\mu \in {0,1}, ID) \rightarrow \ (c_0 = \mathbf{F}_{ID}^t \mathbf{s} + \mathbf{x}, c_1 = \mathbf{u}^t \mathbf{s} + x + \lfloor q/2 \rfloor \mu) $$

IBE解密

解密的过程也非常相似，我们只需要计算$ c_1 - \mathbf{e}^t c_0 $即可： $$ c_1 - \mathbf{e}^t c_0 = \lfloor q/2 \rfloor \mu + x - \mathbf{e}^t \mathbf{x} \approx \lfloor q/2 \rfloor \mu $$

ABB10的安全论证

了解完ABB10的构造之后，接下来最重要的部分就是安全性的论证了。再上一篇文章研究CHKP10的时候，我们已经学习了关于Simulation的这一概念。这也就是说，只要我们能够在不知道MSK的情况下“模拟”出整个IBE体系，并且与Adversary成功进行交互，那么就代表这个体系是安全的。

具体来说的话，这个论证需要以下的要求：

Adversary任意选择一个自己的身份$ ID^* $。
我们作为Challenger并不知道$ ID^* $对应的密钥，所以也不能知道MSK。
Challenger需要能够提供给Adversary任何其他的$ ID_i \ne ID^* $所对应的IBE密钥。
最后，Challenger需要根据Adversary的身份以及提供的$ m_0, m_1 $构造出一个IBE密文。如果Adversary可以破解这个密文的语义安全（即可以分辨密文中到底是哪条消息），那么我们可以利用这个Adversary来解决格中的难题。

我们逐步讨论每一个环节。

IBE身份矩阵的生成

在上文中，我们已经知道了ABB10 IBE的身份矩阵的构造： $$ \mathbf{F}_{ID} = [\mathbf{A}_0 \vert \mathbf{A}_1 + ID \times \mathbf{G}] $$ 接下来，我们需要巧妙的利用这个结构，构造出我们想要的$ \mathbf{A}_0, \mathbf{A}_1 $，进而能满足前三个要求。

首先，因为我们不能知道MSK，所以我们需要诚实的构造$ \mathbf{A}_0 $矩阵，即随机的选择一个没有Trapdoor的平均分布矩阵。

接下来，我们需要想办法把$ ID^* $这一特殊的身份嵌入在我们的$ \mathbf{F} $矩阵当中。为什么呢？因为上述的要求表示，我们需要恰好在$ ID^* $这个身份上失去生成密钥的能力，然而对于其他的身份，我们仍然可以生成有效的IBE密钥。

因为我们实现就知道了Adversary的身份$ ID^* $，所以我们可以随机选择一个矩阵$ \mathbf{R} $，然后设定$ \mathbf{A}_1 $的值为： $$ \mathbf{A}_1 = [\mathbf{A}_0 \mathbf{R} - ID^* \times \mathbf{G}] $$ 这样一来，如果我们把$ \mathbf{A}1 $代入回原本的$ \mathbf{F} $矩阵的话，那么就会变成这样： $$ \mathbf{F}{ID} = [\mathbf{A}_0 \vert \mathbf{A}0 \mathbf{R} + (ID - ID^*) \times \mathbf{G}] $$ 一旦出现了这样的结构，这个身份矩阵$ \mathbf{F}{ID} $就变得非常特殊了。首先，如果$ ID \ne ID^* $的话，那么我们就会得到一个类似于MP12给出的Lattice Trapdoor一样的构造： $$ \mathbf{A} = [\mathbf{B} \vert \mathbf{G} - \mathbf{BR}] $$ 这里的$ \mathbf{A}0 $对应了$ \mathbf{B} $，唯一的区别只是$ \mathbf{G} $和$ \mathbf{BR} $的符号发生了变化而已，然而这并不会影响我们生成Trapdoor的能力。因为$ \mathbf{R} $是我们自己选取的，这个$ \mathbf{R} $就可以被当作Trapdoor来使用，从而生成任何$ \mathbf{F}{ID \ne ID^*} $对应的IBE密钥。

最后，我们再来看如果$ ID = ID^* $的情况下，我们会发现带有$ \mathbf{G} $的这一项彻底的消失了（vanished）！这样以来，整个矩阵就变成了： $$ \mathbf{F}{ID} = [\mathbf{A}0 \vert \mathbf{A}0 \mathbf{R}] $$ 因为$ \mathbf{A}0, \mathbf{R} $都是随机选择的平均分布矩阵，所以整个$ \mathbf{F}{ID} $也是一个平均分布的没有Trapdoor的矩阵了。一旦失去了$ \mathbf{G} $之后，就没有办法把基于$ \mathbf{F}{ID} $的SIS或者LWE问题规约到之前讨论过的$ f\mathbf{G}^{-1}, g\mathbf{G}^{-1} $上，我们也就不能轻松求解SIS或者LWE了。

如果Adversary仍然可以分辨出基于$ \mathbf{F}_{ID} $下的密文的话，那么这代表Adversary可以不借助任何Trapdoor还原SIS问题的解。这一能力超出了我们对于SIS问题困难度的假设，所以是不存在的。如果存在的话，我们就可以拿这个Adversary出去任意的破解其他的SIS问题。

Simulation与实际的比较

最后，我们再来比较一下上述描述的Simulation与实际的IBE加密算法。

在实际的版本中，我们所生成的MSK就是$ \mathbf{A}_0 $的Trapdoor，如果是通过我们之前描述的MP12构造的话，那么就是$ \mathbf{R} $矩阵。因为我们知道了$ \mathbf{A}_0 $的Trapdoor，我们就可以随机的选择$ \mathbf{A}_1 $。

在Simulation中，我们使用了$ \mathbf{A}_0 \mathbf{R} - ID^* \times \mathbf{G} $来构造$ \mathbf{A}_1 $矩阵。因为$ \mathbf{R} $是随机选择的，根据Leftover Hash Lemma，我们可以推测出$ \mathbf{A}_1 $的分布对于不知道$ \mathbf{R} $的人来说也是随机平均分布的！这里的MSK就是我们选择的$ \mathbf{R} $。

我们相比两种情况下的MSK与$ \mathbf{A}_0, \mathbf{A}_1 $之后，会发现其实不管是实际版本还是Simulation，我们选择的参数的概率分布都是一样的。这也就是说，如果我们把某个体系中Challenger与Adversary沟通的Transcript（通讯记录）存下来，给另一个人看，那么那个人并不能分辨这个Transcript所对应的是实际的还是Simulation。这就是密码学中统称的Indistinguishability（不可分辨性）。

一旦我们证明了实际版本与Simulation的不可分辨性之后，我们的安全论证也就基本完成了。如果快速的回顾一下核心的话，那就是我们可以把$ ID^* $这个身份嵌入在$ \mathbf{F}_{ID} $矩阵当中，从而导致当$ ID = ID^* $的时候，Trapdoor就自然消失了。这一巧妙的构造让我们可以在不知道$ ID^* $的密钥的情况下，正确的生成其他的$ ID \ne ID^* $的密钥。