技术简介

一、BLAST 法

BLAST (Basic Local Alignment Search Tool) 是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。

BLAST 采用一种局部的算法获得两个序列中具有相似性的序列。如果您想进一步了解BLAST算法,您可以参考NCBI的BLAST Course ,该页有BLAST算法的介绍。

BLAST对一条或多条序列(可以是任何形式的序列)在一个或多个核酸或蛋白序列库中进行比对。BLAST还能发现具有缺口的能比对上的序列。

BLAST是基于Altschul等人在J.Mol.Biol上发表的方法(J.Mol.Biol.215:403-410(1990)),在序列数据库中对查询序列进行同源性比对工作。从BLAST发展到NCBI提供的BLAST2.0,已将有缺口的比对 序列也考虑在内了。 BLAST可处理任何数量的序列,包括蛋白序列和核酸序列;也可选择多个数据库但数据库必须是同一类型的,即要么都是蛋白数据库要么都是核酸数据库。所查询的序列和调用的数据库则可 以是任何形式的组合, 既可以是核酸序列到蛋白库中作查询,也可以是蛋白序列到蛋白库中作查询,反之亦然。

二、遗传距离法

衡量品种间若干性状综合遗传差异大小的指标。育种目标所要求的性状不止一个,为了能够更全面地反映亲本品种间的遗传差异,需要对多个性状综合考虑,从而引伸出遗传距离的概念。 按多元统计分析方法计算品种间多个性状基因型值构成的多维空间的几何距离,就叫作品种间的遗传距离。

1910年,Morgen TH提出假设:假定沿染色体长度上交换的发生具有同等的几率,那么两个基因位点间的距离可以决定减数分裂过程中发生重组染色体的发生率,即重组分数。重组分数的数值将随着两位点间距离的增大而增大。 它是构建物理遗传图谱的基础,也是利用连锁分析将基因序列从染色体上搜寻出来的位置克隆法的基础。人们规定同一染色体上两个位点间在一百次减数分裂发生一次重组的机会时,即Q=1/100时定义两位点间的相对距离为一个cM(centimorgan)。 人类基因组平均遗传长度为3300cM,而DNA的平均的物理长度为30亿对。 染色体上各基因之间的交换率,即发生交换的百分比,是不同的。基因之间的距离不同,两个基因靠的越近,其间染色体交叉的机会就越少,因而基因的交换率越小, 反之,交换率就越大。基因的交换率反映了两基因之间的相对距离。根据基因在染色体上有直线排列的规律,把每条染色体上的基因排列顺序(连锁群)制成图称为遗传学图(genetic map),亦称基因连锁图(gene-linkage map)。

本法通过计算样品DNA序列与数据库序列之间的遗传距离,样品为具有最小遗传距离的物种;

三、系统发育树法

在距离法的基础上,筛选出一定规模的序列,利用这些序列与检索序列构建系统发育树,检验未知样品的DNA序列与数据库中序列聚类在一起的物种,根据聚类情况进一步确定物种。

系统发育树又名分子进化树,是生物信息学中描述不同生物之间的相关关系的方法。通过系统学分类分析可以帮助人们了解所有生物的进化历史过程。这一过程并不能够直接看到,人们只能通过相关线索了解历史上曾经发生了什么, 而科学家就是用这些线索建立各种假说、模型,甚至是生命发生的历史。在系统学分类的研究中,最常用的可视化表示进化关系的方法就是绘制系统发育进化树(Phylogenetic trees),用一种类似树状分支的图形来概括各种(类) 生物之间的亲缘关系。通过比较生物大分子序列差异的数值构建的系统树称为分子系统树(molecular phylogenetic tree)。