日前,中国科学院青岛生物能源与过程研究所单细胞研究中心正式发布首个微生物组大数据搜索引擎——MSE(Microbiome Search Engine; http://mse.single-cell.cn),使得以整个微生物组为分析单元的智能搜索和大数据挖掘成为现实。
微生物组,又称“菌群”。人体微生物组也被称为每个人的“第二基因组”。一个“第二基因组”可由数百万个微生物基因组成,其数据量是一个人类基因组的成百上千倍。根据人类已经积累的海量微生物组数据,寻找“结构”或“功能”类似的菌群样本,从而实现对未知功能菌群的解读和挖掘,以及对整个已知微生物组数据空间的全局性思考,一直是微生物组业界的关键瓶颈之一。对海量微生物组“大数据”的搜索、挖掘与机器学习,能够帮助人们了解微生物组与相关疾病之间的关系,从而利用人体各个部位的共生菌群实现个体化的精准健康、精准护理与精准营养。
MSE通过建立针对微生物群落的超高速比对算法和数字索引机制,为海量的样本列出基于菌群结构或功能相似性的“目录”。当输入未知样本时,引擎能够根据这一带有菌群相似性信息的“目录”从浩瀚的微生物组大数据海洋中迅速自动选取与该样本最为相似的匹配。
配合该搜索引擎,单细胞研究中心还发布了分析软件Parallel-META 3 ,可以将数量庞大的未知微生物组样本进行结构与功能解析,可以与其数据库搜索匹配结果进行更深入的比对分析。(来源:科技日报)