一、怎么利用bioedit做序列的比较
1、网络搜索下载并安装BioEdit软件。
2、将你所要比对的序列以fasta格式粘贴在文本文档里。
3、BioEdit软件打开文本文档,选中所有的序列,按下图方法选择要打开的标签。
4、在新的窗口中,按下图所示勾选Note下面的方框(勾选之后可以在比对的结果中用星星表示,方便你看出哪些地方不一致)和运行“RunClustalW”。
5、然后你就可以看到序列比对的结果了,红色箭头标示的地方就是序列不一致的地方。
二、用bioedit怎么 预测蛋白质二级结构
结构预测是有意义的,因为通过实验来确定结构仍然要比通过实验确定序列慢得多。结构预测帮助我们理解蛋白质的功能和作用机制,对合理的药物设计也是很有意义的。
(理论基础)蛋白质结构在进化中要比蛋白质序列保守得多。蛋白质可以自发地折叠成它们的天然结构,因此蛋白质的折叠在某种程度上就编码在氨基酸序列中。并且寻找蛋白正确结构的过程不能是随机搜索所有的可能性,探究蛋白质如何编码三级结构以及理解该结构如何折叠式个很有科学价值的问题。
结构预测是指仅依据蛋白序列的信息来预测蛋白质每个原子在三维空间中的相对位置。
(理论基础)可以是从零开始的,尝试计算并最小化自由能,或得出一个合适的近似最小值的方法
也可以是基于一些已有知识的,尝试使用已知结构数据库中的信息来预测蛋白质结构。
结构预测方法比较建模法,折叠识别法,二级结构预测法,从头预测法以及跨膜片段预测法
比较建模预测结构过程【掌握大概过程,复习课有讲】书P161
保守核心残基的定位——可变回环的模型化——侧链的定位和优化——模型的提炼
保守残基和一些侧链的位置可以直接从模板结构信息中推导出,可变回环的建模常利用备件算法,对于侧链的定位也有精密的算法来获得优化包裹的疏水核心。
多序列信息:使用相关序列的多序列比对结果可以揭示某些特定二级结构的保守模式,从而显著地提高了二级结构预测的精确度,使得目前这方面预测的精确度达到了66%左右
二级结构预测:
当某一特定目标序列没有合适的相关模板结构时,可以考虑采用二级结构预测法。与比较建模法不同的是,该方法并不产生一个全原子三级结构模型,而是对每个残基二级结构状态进行预测,即预测该二级结构是否是螺旋、链或延伸以及圈。二级结构预测方法有Chou-Fasman法则和基于信息论的GOR方法
跨膜片段的预测:内在膜蛋白中的跨膜片段可以通过搜索跨越脂质膜的连续疏水残基来进行预测。有些方法还预测跨膜片段的方向(进—出)或拓扑结构,但是这通常都不太准确。
跨膜片段往往含有较高比例的疏水残基,长度常常在20个残基以上,对应于6-7个跨膜螺旋的螺旋圈。这种相对较长的强烈疏水残基系列在可溶性球蛋自中很少见。这意味着可以基于疏水残基系列来进行预测。预测工具:TMPred, TMHMM and TopPred可在ExPASy的站点上找到
高级蛋白质结构预测折叠识别(线程):致力于检测非常疏远的结构和进化关系,能确定二级结构是如何包裹成三级折叠的从头预测
预测策略【详细看看】PPT10 91,92页书P174
鉴定出该查询序列中的任何特征——采取一个适当的预测方法(首选比较建模,不行就二级结构预测,二级结构预测之后要进行折叠识别)
Step 1:鉴定出该查询序列中的任何特征。E.g.潜在跨膜片段;低组成复杂度;卷曲螺旋;已知结构域或序列的整体结构域(通过Interpro);其他相关序列和亚序列(通过PSI-BLAST)。如果蛋白质是多结构域的,而且序列中结构域的位置可以找出,那么分别预测每个结构域将会很有用。
Step 2:采取一个适当的预测方法。
首选比较建模方法,如果不成功,则进行二级结构预测(可应用到对任何序列的结构预测,但对球蛋白的结构域预测更为精确),二级结构预测之后要进行fold recognition,该方法能确定二级结构是如何包裹成三级折叠的,但是应该谨慎使用这类方法。
1.通过核酸数据库GenBank进行搜索,找到与该序列片段同源性较高的基因和基因组序列,获得这些序列的序列接受号
2.根据获得的序列接受号,通过使用如Entrez信息查询系统获得这些序列的详细序列信息,从而推测未知序列的相应功能信息
3.利用BioEdit软件对上述未知功能序列进行分析,如mRNA外显子调控区等序列,通过ORF框查看,对上述序列进行新基因发现
4.利用2、3步的相关信息,进一步利用Clustalx软件对已知序列做多序列比对,使用phylip软件构建系统发育树等方法,分析推测该未知序列的蛋白质编码序列和相关蛋白的功能
5.利用BioEdit软件对未知蛋白质序列进行分子质量、氨基酸组成和疏水性等基本性质分析,利用PredictProtein server对未知蛋白质进行二级结构预测,利用比较建模软件swiss-model对未知蛋白进行三维结构预测
6.通过上述结构预测的结果进行推测该未知蛋白的功能
三、用bioedit怎么导出想要的序列
首先要把所有的序列复制到windows自带的记事本中,全部以fasta格式存到同一个文件中,保存成*.txt,序列内部最好不要有空格或者换行。序列格式举例如下:“>序列1ATCG.ATCG>序列2ATCG.ATCG>序列3ATCG.ATCG>序列4ATCG.ATCG”然后用Bioedit打开刚才保存的文件*.txt,点击窗口上方的Accessoryapplication菜单,再点击clustelWmultiplealignment,这时候会弹出一个窗口,直接选择RunclustalW,又弹出一个窗口,选择ok,等待结果就行了。最后的比对结果可以保存成*.fas格式,适用于各种分析。