DNA 计算具有高存储密度,高度的并行性以及当前电子计算机的十亿分之一的能耗。细胞也是良好的信息处理单元,时刻监控自身的内外环境并做出反应。
?
纯粹的DNA 计算尽管在穷举方面的并行计算量很大,但是在筛选过程很慢;细菌计算机尽管在结果表达上比DNA 计算机要方便检测很多,但是结果复杂,重复克隆的情况下会出现新的不确定表型。此外,现阶段所有的路径规划实验方案均针对完全图等非常理想的图论问题设计,不具有普适性,无法应对现实中出现的复杂情况,如需要设定途径节点等。现结合合成生物学中的模块化、标准化理念,来研究解决地图导航中的路径规划这一图论问题。
?
1 基于DNA 计算和生物砖的最短路径计算模型
?
1.1 最短路径规划问题
?
规划是图论问题中经典的最短路径求解问题的应用, 目的是在符合实际路况和具体规划要求的前提下,检索在图(由抽象的节点和路径组成)中从起点到目的地的最短路径方案。
?
1.2 计算原理
?
1.2.1 DNA 计算的原理
?
DNA 链可以通过碱基互补配对作用形成双链, 所以DNA链可以作为信息的载体, 按照一定规则将原始问题的数据运算高度并行地映射成DAN 分子链的分子生物操作,并利用生物分子技术检测运算结果。
?
1.2.2 生物逻辑装置的模块化
?
完整的基因一般由启动子,核糖体结合位点,蛋白质编码区域和终止子构成。合成生物学家通过提出生物砖(BioBricks)的概念,建立了DNA 元件库iGEM Registry。所有在库中注册的生物砖都经过了标准化处理,具有统一标准的酶切位点,可以自由组合与互换,并进行表达使用。每块生物砖前端含EcoRI、XbaI 两个酶切位点,后端含SpeI、PstI 两个酶切位点,利用XbaI 和SpeI是同尾酶这一性质可将生物砖拼装在一起,同时,新生成的片段两端依然包含着4 个酶切位点,可用于下一步拼装。
?
1.2.3 检测筛选模块的生物原理
?
LacI 蛋白和TetR 蛋白,可以和特定序列编码组成的LacO及TetO 位点结合,阻遏含有这两类位点的生物装置转录;工程化的启动子包含LacO 及TetO 位点,只要在此荧光蛋白的表达体系中有LacI 蛋白或TetR 蛋白的外源基因之一, 就会抑制GFP 绿色荧光蛋白的表达。两种小分子诱导剂IPTG(异丙基硫代半乳糖苷)和aTc(脱水四环素)分别可以和LacI 蛋白和TetR蛋白进行中和反应,加入上述两种小分子抑制剂,可以阻止结合,荧光蛋白可以表达。
?
1.3 材料
?
1.3.1 大肠杆菌
?
大肠杆菌E.Coli 是许多动物体内最主要的细菌, 其遗传背景清楚、技术操作简便、培养容易,在基因工程中常用作外源基因表达的宿主细胞。本次验证实验中所用的大肠杆菌是DH5α。
?
1.3.2 质粒
?
质粒是细菌细胞内的一种环状DNA 分子,通过利用人工改造后的具备筛选标记和酶切位点的质粒作为外源基因的载体,可以通过转化操作,将外源基因转入宿主细胞大肠杆菌。本文通过DNA 计算得到所有代表可行解的DNA 序列,将此借助质粒转导入大肠杆菌,再通过插入具有逻辑判断功能的生物砖,共同解决显示问题中的路径规划问题。
?
1.4 模型设计
?
案例设定:从酒店所在的2 号节点的,到达会展中心所在的8 号节点,并且需要途径博物馆所在的5 号节点,求历经节点最少的走法。
?
1.4.1 路径数据库的设计
?
地图中所有的道路抽象成路径线,而所有道路的交叉点,将会抽象成点集;所有的点集合元素将会被赋予特定的编号,将会表示从A 点到B 点的有向路径。
?
1.4.2 标准生物导航信息数据库
?
将设计40bp 长度为标准的随机DNA 链用作点元素的生化反应模块, 为了适应可以拓展的表达层次的逻辑运算模块的插入升级, 也可以在DNA 单链中预先设计不同于BIOBRICKS标准的酶切位点。
?
在特定元素运算模块中需要包含特定的酶切位点, 也在DNA 链的首尾段根据生化反应做了特定考量, 排除需要指定的碱基数量,在包含同一种酶切位点的序列依然可以排出至少425种不同的序列组合,可以确信这样的标准DNA 链数量是可观的。生成路径DNA 数据库, 表示这一路径元素的生化反应模块将由点A 模块所代表的DNA 单链后半段互补链和B模块所代表的DNA 单链的互补链所连接而成的DNA 单链所连接成的单链DNA 代表
?
所要进行的生化操作将可以限定为8 个节点,12条路径的容量内。由于在本例中,2 号节点是起始点,8 号节点是终止点,5 号节点是用户指定的途径节点,所以为了在后续实验中通过生物模块测试可能的路径规划方案是否包含了这三个必要节点,在设计这三个节点及其对用的路径的序列中,分别包含了BamH I、Nco I、AFLIII 对应的酶切位点序列
?
1.4.3 生成所有可能路径
?
将所有设计好的节点编码和路径编码汇合起来通过DNA连接酶进行随机连接并大量扩增,得到所有可能的路径组合[3]。经电泳获得大致区间可能的合适长度的DNA 序列,再通过胶回收进行扩增可获得第一步目的DNA 序列。
?
1.4.4 可能路径序列的封装
?
通过凝胶电泳,不同长度(所有可以连通的路径因为包含的节点数量不同会反映在对应的DNA 序列长度上)的通路序列会被区别出来,DNA 序列长度越短, 所代表的解法历经的节点数越少, 但是仍然无法断定所连接的序列是否是同时包含2、5、8三个必须节点的。将所有待测定的DNA 序列分别连接入质粒中,通过下列按序插入外源基因(测试模块),可以最终筛选出符合条件的方案。
?
1.4.5 测试步骤
?
将本例中所需要使用的三种酶切位点序列作为普通DNA序列类型按照生物砖形式进行封装。下述判断步骤中,若任何一种生物砖需要按对应的酶切位点插入对应位置, 则将该生物砖两端按BioBrick 连接标准连接上对应的酶切位点序列。
?
通过AFLIII 酶切位点, 尝试将绿色荧光蛋白装置插入到测试质粒中,由于代表5 号节点的序列含有AFLIII 酶切位点,若测试路径中也含有5 号节点,含有该种质粒的大肠杆菌经过培养,会检测到绿色荧光的输出。
?
通过Nco I 酶切位点,尝试将LacI 蛋白装置插入到第一步筛选出来的含有5 号节点序列的测试质粒中, 由于代表8 号节点的序列含有Nco I 酶切位点,若测试路径中也含有8 号节点,LacI 蛋白的序列会被插入到质粒中, 含有该种质粒的大肠杆菌经过培养,绿色荧光的表达会被LacI 蛋白与LacO 位点结合而阻遏,无法表达。
?
通过BamH I 酶切位点,尝试将TetR 蛋白装置插入到第一步筛选出来的含有5 号和8 号节点序列的测试质粒中, 由于代表2 号节点的序列含有BamH I 酶切位点, 若测试路径中也含有2 号节点,含有该种质粒的大肠杆菌经过培养,绿色荧光的表达会被LacI 蛋白与LacO 位点结合而阻遏,无法表达,此时,仅被LacI 蛋白抑制以及同时被LacI 蛋白以及TetR 蛋白抑制的质粒均存在, 此时筛选出来的序列无法通过荧光表达断定是仅仅经过5 号与8 号节点的路径,还是同时也经过了2 号节点。
?
根据相关实验研究,在质粒同时转录TetR 蛋白,LacI 蛋白, 以及以工程化启动子作为其启动子的绿色荧光蛋白装置同时转录后, 其表达的绿色荧光水平在加入小分子抑制剂IPTG和aTc 的先后顺序不同时,有着较为明显的差异。首先加入aTc进行检测,不论被检查测的大肠杆菌是否是同时也被LacI 蛋白抑制的那一种,其绿色荧光的表达水平都会出现显著的上升,而如果先加入IPTG, 同时包含2、5、8 三个节点序列信息的质粒,依然需要继续添加aTc 试剂阻止TetR 蛋白抑制绿色荧光蛋白转录后,才能检测到输出信号。通过顺序加入IPTG、aTc 两种小分子抑制剂可以将含有两种不同序列信息的质粒的大肠杆菌区分出来。
?
先加入IPTG,保留下依然无法转录出绿色荧光蛋白(GFP)的菌落,接着加入aTc,如果最终留下的菌落能够通过转录出绿色荧光蛋白(GFP),说明此时筛选剩下的菌落包含的质粒中,所插入的路径DNA 序列就是符合路径规划要求的结果。
?
通过测序, 并与开始所使用的各节点所用的序列信息进行比对,可以确定最优的路径规划方案为2-4-5-7-8。这和计算机算法的实现结果是一致的。
?
2 生物实现过程
?
2.1 路径与节点DNA 序列的设计
?
节点与路径序列为按模型规定生成的40bp 长度的DNA链,其中,2、5、8 三个节点分别包含了BamH I、Nco I、AFLIII 对应的酶切位点序列。
?
案例图中所用特定DNA 单链序列编码如下:
?
2 号节点(含BamHⅠ位点)
?
GTAATGATCTCCTAGGAGATACATTCGATCGATCATGCTA
?
5 号节点(含Bgl Ⅱ位点)
?
GTACAGTCTTCTAGAAGGGACGGAATGAAACGTACAGTAA
?
8 号节点(含Nco Ⅰ位点)
?
GTACAGTACGGTACCGTACCCGTGACGTACGTGATGACTG
?
2.2 生物砖
?
所有生物逻辑装置与酶切位点序列均按照生物砖标准进行了封装,可以按统一标准组合使用。研究所用生物砖在http: / /parts.igem.org/Main_Page 均可查询详细信息和具体DNA 序列。LacI(BBa_K1341002):
?
BBa_K1341002=BBa_j23100+BBa_B0034+BBa_C0012+BBa_B0010+BBa_B0012
?
TetR(BBa_K1341003):
?
BBa_K1341003=BBa_j23100+BBa_B0034+BBa_C0040+BBa_B0010+BBa_B0012
?
具绿色荧光蛋白作为输出信号的筛选装置(BBa_K1341000):
?
BBa_K1341000 =BBa_K1341022 +BBa_E0040 +BBa_B0010 +BBa_B0012
?
2.3 转化
?
将含有目标基因的PUC57 质粒导入到TOP10 型号大肠杆菌(E.coli)中,由于质粒具有AmpR 氨苄青霉素抗性,可以借此筛选出所需要的细胞。
?
3 结束语
?
由DNA 计算求得所有可行解,再通过生物逻辑模块进一步筛选可能结果的方法充分保留了生物计算并行性质的优势,同时结合了生物本身的逻辑判断功能, 每一步筛选都只有单荧光信号需要判断,易于检测,可以针对实际导航任务中出现的需要途径某地等复杂情况进行复杂度更高的生物程序设计。
?
生物计算机的发展尚处于萌芽阶段。随着生物技术和网络技术的进步,大量的数据计算无需在各终端设备上完成,仅仅通过终端上传规划任务, 由云端主服务器利用精确快速的生物计算处理器同时完成所有的计算并将结果回馈给各个终端。