GTC Asia:在GPU集群实施MrBayes

  【IT168 资讯】 2011 年亚洲 GPU 技术大会 (GTC Asia2011)于2011年12月14号在中国北京的国家会议中心如期举行。 GPU 技术大会让全世界的人们不仅能够更加深入地了解 GPU 计算与可视化,而且可以认识到它们在未来科学以及技术创新等方面的重要性。

  在大会第一天关于生命科学,基因组领域的专题演讲中,南开大学的刘晓光博士为听众介绍了MrBayes软件基于GPU集群环境的应用。刘博士是南开大学计算机科学教授和博士生导师。他的兴趣包括并行计算和存储系统。

  近年来,随着生命科学的不断发展,人类可获得的基因数据已呈爆炸性增长,与此同时,如何分析和处理基因数据成为一项新的挑战。刘博士首先介绍到人们为了研究生物核酸序列、蛋白质序列以及形态特征数据之间的进化使用不同的分析方法对序列数据进行分析。MrBayes就是一个基于ML算法和贝叶斯推理法的系统发生分析程序,其突出的优点是可以对数据进行分隔,能同时将核酸序列、蛋白质序列以及形态学观察结果整合到数据文件中,以得到较为综合的分析结果。贝叶斯推理法是从贝叶斯定理衍生而来的,贝叶斯定理用于估算某一事件在另一相关联的事件发生以后将发生的概率,即后验概率。在系统发生分析中,贝叶斯推理法通过对一定数量进化树的后验概率分布情况进行分析,从而对系统发生事件做出判断。分析时需要加上马尔可夫链蒙特卡洛(MC)算法来估算后验概率。

  但由于人类可获得的基因数据已呈爆炸性增长,与此同时,如何分析和处理基因数据成为一项新的挑战。我们对与GPU的并行实施的MrBayes MC给出一个评估。与序列MrBayes MC3相比,使用单一GPU加速,我们可以在足够大的数据集上达到20倍以上的提速,而且在GPU集群上加速接近线性。

  南开大学信息技术科学学院计算机科学与信息安全系2009级硕士研究生周剑夫采用最新的GPU加速技术,优化了生物种系发生学领域最流行的软件工具MrBayes,得到了最高40多倍的加速效果。日前这一研究论文已被生物信息学领域的顶级学术期刊《生物信息学》录用。

  有关2011 年亚洲GPU 技术大会 (GTC Asia2011)的更多报道,请点击:

http://cuda.it168.com/topic/2011/12-13/gtc/index.html

来源:http://cuda.it168.com/a2011/1214/1288/000001288406.shtml