DNA密码是伴随着DNA计算的研究而出现的密码学前沿领域,为此我们结合现代基因工程技术和密码学技术设计了一个对称加密系统。
一、加密流程
现在,我们具体描述DNADSE。首先扩展密码系统的定义如下:
假设发送者为Alice,她拥有加密钥KA.指定的接收者为Bob,他拥有解密钥KB(KA=KB或者KA:# KB),Alice使用KA通过一个变换E把明文P装换成密文C,除非拥有KB,从C得到P是困难的。我们称变换E为加密过程,C是密文,Bob收到密文C后,利用解密钥KB和密文C进行一个变换D得到明文P。这里,KA和KB以及C并不限于数字,还可以是量子或者DNA等任意的材料、方法等等,E和D也不仅仅限于数学计算,而可以是任意的物理、化学、生物等过程。
系统的总体步骤如下:
步骤A密钥生成
加密钥是一个特定探针的集合,解密钥是一个对应的互补探针的集合,杂交条件也可以作为解密钥的组成部分.发送者Alice从已有的实验中挑选探针作为加密钥解密钥通过安全的途径传送给指定的接收者Bob。
步骤B加密
Alice首先把明文转换成二进制矩阵,然后根据这个矩阵用加密钥制作DNA芯片,在没有解密钥的情况下,从芯片上读出明文是困难的,这类似于量子密码。量子密码是由于测不准原理难以测定量子状态,而在DNASC中是由于DNA技术的局限性无法读取芯片上的特殊探针。在DNASC的加密步骤中引入了随机化的过程,这使得加密过程在一定程度上类似于一次一密。
步骤C解密
Bob使用解密钥和DNA芯片(密文)杂交从而得到杂交信号,这是一个生物过程而非数学计算,然后Bob利用电子计算机进行一个信号处理过程得到明文。
下面借助一个例子详细解释这个系统的细节:
步骤1密钥生成,首先,我们要做一个DNA杂交实验或者从一个已知的实验中挑选探针作为密钥(这个实验应该保密)。这里,我们使用一个已知的实验,这个实验并不是为了加密而设计的,我们只是利用这个实验演示一下加密系统。在实际中,应该如本文所述重新设计实验表达数据反映了酵母从无氧呼吸(发酵)到有氧呼吸的代谢转变的过程中基因转录谱的变化。代表已知的所有酵母基因的6400个cDNA探针被事先点样在基因芯片上,而从上述两种代谢条件下的酵母体内提取的RNA则用不同的荧光探针标记作为被检测探针和该芯片上的探针杂交,杂交的结果可以用来分析整个基因组的基因转录水平的变化。具体地说就是从接种9小时后的酵母细胞(发酵状态)中抽取的RNA反转录获得的cDNA探针用绿色荧光分子Cy3标记,在杂交实验中作为参照系;而从接种后19小时的酵母细胞(有氧呼吸状态)制备的cDNA分子用红色荧光分子Cy5标记。杂交的结果可以用扫描荧光共聚焦显微镜观察并记录不同波长的荧光信号(红色和绿色荧光)。两种荧光的扫描图像可以经由软件进行整合分析来推断特定基因在两种呼吸模式转换时表达量的变化,如图1中原始芯片图所示,在由发酵到有氧呼吸的代谢状态转换的过程中,被诱导转录(转录水平提高)的基因的对应的点显示为红色,反之为绿色,而基因表达水平几乎不变的基因则显示为黄色。
第二,我们从这个实验中分别挑选探针作为加密钥和解密钥使用,我们把芯片上的所有候选探针(未标记)作为集合屈DNA汤中所有目标探针(已标记)作为集合α。根据杂交结果和杂交条件,分别选择合理的标准U和S用以挑选探针对,当然,集合β中的探针并不需要分离出来.满足标准S的探针对用于表示二进制数字1,满足标准U的探针对用于表示数字0。集合β由表示0的子集β0和表示1的子集βl组成,注意到β0∩β1=φ。这里,表示1的点满足标准(G6.Bkg≥10000)∧(R6.Ratio≤0.3 3)或(G6.Bkg≥10000)∧(R6.Ratio≥3)或(G6.Bkg≥8000)∧(R6.Bkg≥8000)∧(R6.Ratio≥0.8)∧(R6.Ratlo<1.3),表示O的点满足(G6.Bkg≤
1000)∧(R6.Bkg≤1000),其余的点抛弃不用,其中G6和R6代表Cy3和Cy5标记的cDNA探针在芯片上杂交信号强度,而R6.Ratio就代表某个芯片上点的红色荧光信号强度相对于绿色荧光信号的比值,而Bkg则代表背景信号的强度值,文中引用的实验数据作为附属材料列在表中。探针集合β0、β1作为加密钥,Ek=β0∪β1探针集合口以及解密时的实验条件共同作为解密钥Dk。
步骤2 数据预处理,我们挑选爱因斯坦的名言“hnagination is more important than knowl-edge (Albert Einstein)”作为加密的明文。首先要把这句话按照ASCII码的编码规则转换成二进制比特串,并用“00000000"填充,得到一个21x24的矩阵(具体见图1中的二进制虚拟芯片)。
步骤3加密,根据图l中的二进制虚拟芯片,从芯片上提取点制作新的芯,.集合β0、β1中的点被放置在玻璃或者硅芯片的对应位置上,爱因斯坦的名言就加密在芯片上了。图1中的密文芯片就是加密后得到的密文。加密芯片可以通过公开的途径发送而不用担心安全问题,只有指定的接收者拥有解密钥并且知道杂交条件从而能够解密。
步骤4解密,解密的过程首先是杂交的过程。指定的接收者用解密钥和DNA芯片(密文芯片)进行杂交。杂交的结果是可重复的,当同样的目的cDNA样本退火到芯片上的时候,将会得到类似于杂交信号,解密芯片的杂交结果见图1中的解密芯片图。
步骤5数据后处理,得到所有的杂交信号后,可以看到解密芯片上包含亮度较高的彩色点以及亮度极低的黑色点,这些信号可以通过一个简单的信号处理过程转化成二进制矩阵。转换的规则是,解密芯片上亮度比较高的彩色点都对应二进制矩阵中的1,亮度低的黑色点都对应二进制矩阵中的0,然后,根据ASCII码的编码规则,把二进制矩阵转换成对应的英文字母,爱因斯坦的名言就恢复出来。
二、安全性和并行性
DNASC具有两层安全性:第一层安全性是生物技术的局限性提供的,是该系统主要的安全依据。第二层安全性是计算问题,即使攻击者突破了第一层安全性,在没有解密钥的情形下,他还必须具有强大的计算能力和数据存储能力才能破译DNASC。
1、第一层安全性(生物学安全性)
指定的接收者用解密钥中的探针和加密芯片(密文)杂交,然后根据杂交信号恢复出明文。因为可能的密钥组成数量非常大,攻击者不可能碰巧猜出。在没有解密钥的情形下,攻击者要想得到芯片上的明文信息,他或者是随便找些探针和芯片进行杂交,根据杂交结果尝试找出解密钥,或者尝试得到芯片上的探针组成并分析出相应点的含义。
如果一个攻击者随便选取一些DNA汤和加密芯片(密文)进行杂交,由于他选取的DNA和解密钥大不相同,得到的杂交信号将会和利用解密钥得到的杂交信号有极大的不同,通常,他选择的DNA汤很难和芯片上的探针有效杂交上,因而只能得到一些很微弱并且杂乱的杂交信号,这样的信号对于解密几乎没有任何帮助,事实上,即使攻击者得到了解密钥中的探针如果不知道解密时的杂交条件,也会因为所得到的杂交结果有巨大的误差而难以正常解密。
2、第二层安全性(计算安全性)
如果很多年以后可以在没有解密钥的情形下精确并且高效的识别出芯片上每个点的所有探针,DNASC的第一层安全性就被突破了,但这并不意味着DNASC就不安全了,编码技术提供了系统的第二层安全性。
3、存储能力和计算能力
虽然Adleman等人证明DNA计算具有惊人的并行计算潜力和数据存储潜力,但在实际应用中不易得到体现。DNASC从一个方面展现了DNA计算在超大规模并行计算和超高容量的数据存储方面的巨大潜力。
小知识之DNA技术
DNA技术(recombinantDNAtechnique)又称遗传工程,在体外重新组合脱氧核糖核酸(DNA)分子,并使它们在适当的细胞中增殖的遗传操作。