主,也是你的粉丝。”
鹅厂帮他安排的是在莱维特入住酒店的会议室见面,除了他们两还有郭伟陪同,莱维特笑着和陈元光握手道:“你好,我也很喜欢你的作品,它很有意思。
里面很多对未来的推演都很有意思。”
陈元光说:“这大概是因为我对科学比较关注,对前沿技术很关注,所以能做出一些有意思的成绩来吧。
先生,这次我见你,主要是有一篇论文想请你指正,我构建了一种计算机模拟的方法,来对蛋白质的定向进化进行模拟。
这种方法仅需要利用蛋白质物理化学的特征和序列信息,就能够实现蛋白质定向进化的模拟。
我选择的研究对象是蛋白质dhr8,通过计算机模拟,让它进化出有结合dna或者rna的能力。
在模拟进化之前,我先对序列多样性与结合核酸的情况,去构建了一个包含30个五肽重复蛋白的评估库。
五肽重复蛋白是经过证实的rna结合蛋白,它的结合位点很清晰,已经被系统表征。
这样一来我评估库中的每一个ppr都会具备两个明确的结合位点,我们以每个结合位点为中心,将长度为13个氨基酸的短序列作为一个评估窗口,这样的话它一共会有60个评估窗口。
对于每一个评估窗口的短序列,我们利用现成数据库中的544个描述氨基酸的物理化学性质的指标来表示氨基酸,因此,每一个位点的氨基酸就会是一个544x1的矩阵,十三个这样的矩阵合并用以表示一个长度为13的肽段序列。
对于一个评估窗口的544x13矩阵,我对k-means++算法进行了优化,然后用优化后的算法进行聚类,将544个行向量聚类为50类,在可视化方面,每一类则代表一个波形,对于每一类,我们可以利用该类所包含矩阵子集的每
本章未完,请点击下一页继续阅读! 第2页 / 共3页