生物信息学研究中心 c enter o f b io i nformatics ( cobi )
DESCRIPTION
生物信息学研究中心 C enter o f B io i nformatics ( COBI ). 主任 章祥荪 副主任 方伟武 朱力行 周勇 石坚 学术委员会主任 王志新. 学科介绍 - PowerPoint PPT PresentationTRANSCRIPT
生物信息学研究中心生物信息学研究中心CCenter enter oof f BBioioiinformatics (nformatics (COBICOBI))
http://www.bioinfoamss.org
主任 章祥荪副主任 方伟武 朱力行 周勇 石坚学术委员会主任 王志新
学科介绍 随着人类基因组计划( HGP )等大型国际项目的实施与迅速发展 , 分子生物信息的研究已经成为了当前一个研究热点和前沿领域。一门新兴的边缘学科——生物信息学应运而生。它是以核酸、蛋白质等生物大分子数据为主要对象,以数学、生物学、信息科学为主要手段,以计算机硬件、软件和网络为主要工具,从浩如烟海的原始数据中获取基因编码、基因调控、核酸和蛋白质结构与功能等知识,从而探索生命起源、生物进化,以及细胞、器官和个体的发生、发育、衰亡等生命科学中的重大问题。它对进入后基因组时代的 21 世纪生命科学,具有不可估量的推动作用。
陈润生 研究员 中科院生物物理所方伟武 研究员 数学与系统科学研究院李国英 研究员 数学与系统科学研究院欧阳钟灿 院士 中科院理论物理所钱敏平 教授 北京大学沈世缢 教授 南开大学唐焕文 教授 大连理工大学薛勇彪 研究员 中科院遗传发育所王志新 院士 中科院生物物理所章祥荪 研究员 数学与系统科学研究院朱力行 研究员 数学与系统科学研究院
学术委员会委员学术委员会委员
新兴的边缘学科新兴的边缘学科————生物信息学生物信息学
以核酸、蛋白质等生物大分子数据为主要对象,以数学、生物学、信息科学为主要手段,以计算机硬件、软件和网络为主要工具,从浩如烟海的原始数据中获取基因编码、基因调控、核酸和蛋白质结构与功能等知识,从而探索生命起源、生物进化,以及细胞、器官和个体的发生、发育、衰亡等生命科学中的重大问题。
生物信息学与数学生物信息学与数学 生命科学因研究对象的极端重要性和复杂性,人类生存发展的需求的紧迫性,完全有可能在不久的将来出现革命性的变化,以致可能发展成为科学革命的中心。在这种进程中,它对数学提出了新的挑战,也给数学带来了新的发展机遇。国内外许多物理、数学家纷纷介入这个领域,恰如其分的说明了这一点。
生物信息学对数学的挑战——生物信息学对数学的挑战——海量数据海量数据数据量极大
特小 102 小 104
中等 106 大 108
特大 1010 巨大 1012
海量 1015
早期 基因数 101
数据量 103
现在 基因数 103 - 104
到 2000 年碱基总量 1010
数据量每年翻番
极端复杂 生物数据的复杂性表现在:
维数高,高达数千、上万维;结构复杂,具有高度的非线性性和非一致性;噪声强而信号弱;“ 污染” 严重;在时间和空间上变化范围极大。
分析处理这样的数据,现有的数学和统计学工具远不能胜任,需要探索新的思路和概念,发展新的方法、理论和算法。
生物信息学对数学的挑战——生物信息学对数学的挑战——复杂性复杂性
挑战之一:数学建模挑战之一:数学建模
分析数据的第一步是描述数据,即建立数学模型。例如,为了得到人类的疾病基因图谱,局限在最多百余人的同一家系中,无法观测到重组率不到 1% 的等位基因对,而需在整个群体中进行研究。这就需要有合理的群体进化模型,才能把不同家系的整个群体的数据联系起来分析。类似的问题,在大分子序列分析、生物演化和变异等生物数据的分析研究中普遍存在。
挑战之二:分析方法挑战之二:分析方法
绝大多数传统的数据分析方法仅能处理几个到几十个变量和 10到 104 的数据量,而且数据结构也相对简单。而生物数据则往往包括成千上万个变量和 101
0~ 1015 的数据量,而且数据结构十分复杂。这就需要改进那些有用的原有方法,特别需要探索新的思路和新的分析方法。
挑战之三:评价标准和理论支持挑战之三:评价标准和理论支持
如何评价数据分析方法的可靠性和可信性,对于庞大而复杂的生物数据而言,许多原有的评价标准不再适用,甚至没有意义。因此,需要有针对性地提出新概念和新标准来衡量现有的和将要出现的数据分析方法。实际上现有的许多方法都缺乏可靠性、可信性等方面的理论支持,其中缺少合理的评价标准是原因之一。另一个原因是数学上非常困难。
挑战之四:计算方法挑战之四:计算方法
首先数据的庞大和复杂直接带来了计算上的困难。更重要的是,就现有分析方法而言,已经有许多 NP 问题,需要研究高效快速的计算方法。可以想象,面对越来越庞大、越复杂的数据,计算方法所面临的挑战将会更严峻。
交叉目标交叉目标促进我们进一步综合利用各种数学
方法探讨生物信息学中的关键及基础性问题。
争取在某些数学分支上有所创新和发展。
我们的榜样我们的榜样 R. A. Fisher (1890-1962) 英国人
遗传学家,统计学奠基人 为生物学、遗传学而研究统计学 1919-1933 罗瑟姆特农业室验站 最辉煌的时期 贡献遍及统计学各领域 5 卷文集, 294 篇论文 一半稍多是遗传学,近一半是统计学
用统计方法发现生物学、遗传学规律 在研究生物、遗传问题中发展统计方法
主要研究方向主要研究方向1. 生物大分子折叠、相互作用和自组织机理
的研究2. 药物设计中的数学、物理学问题3. 复杂疾病的基因机理分析 4. 生物演化及群体遗传研究5. 应用于生物信息学的数学方法研究
初步成果初步成果
信息论与生物信息学 基因信息 生物统计 生物与医药系统分析
交流合作交流合作
中国科学院数学与系统科学研究院与华大基因研究中心共同进一步探索合作项目,组成学科交叉的联合研究小组,进行基因组学的前瞻性和前沿性探索研究。
欢迎访问我们的网站欢迎访问我们的网站
http://www.bioinfoamss.org
交流 +合作 + 学习 建议 +意见