1、一个交叉学科的胜利简介生物信息学08300240054 黄晓靖简介简介 生物信息学一个交叉一个交叉学科的胜利学科的胜利 1 2 3 现代医学的挑战现代医学的挑战一个交叉学科的胜利一个交叉学科的胜利1 过去 个人 经验学科 现在 极小 极大 实验学科现代医学的挑战挑战 大规模数据的采集 大规模数据的处理 经验型处理常常会出错Wal-Mart现代医学的挑战挑战 CS to the rescue现代医学的挑战挑战 2生物信息学生物信息学一个交叉学科的胜利一个交叉学科的胜利当生物遇上了计算机生物信息学!生物信息学!BiologyInformaticsBioinformatics网络预测流感网络预测流感
2、网络预测流感网络预测流感(2)数据挖掘数据挖掘 关联 Associating 分类 Classifying 建模与模拟 Modeling & Simulating 预测与检验 Predicting & Testing 主要应用领域主要应用领域基因测序基因测序 Sequence analysis基因注解基因注解 Genome annotation同源性计算同源性计算 Computational evolutionary biology基因表达分析基因表达分析 Analysis of gene expression拮抗拮抗/协同分析协同分析 Analysis of regulation蛋白质表达分
3、析蛋白质表达分析 Analysis of protein expression蛋白质结构预测蛋白质结构预测 Prediction of protein structure生物系统模型生物系统模型 Modeling biological systems大信息量图像分析大信息量图像分析 High-throughput image analysis 3分子同源性计算分子同源性计算一个交叉学科的胜利一个交叉学科的胜利分子系统发育分析的主要方法分子系统发育分析的主要方法 距离距离矩阵法矩阵法 (Distance Matrix) 最大最大简约法简约法 (Maximum Parsimony) 最大似然法最大
4、似然法 (Maximum Likelihood) 贝叶斯法贝叶斯法 (Bayesian Inference)距离聚类距离聚类主要有UPGMA法 (类平均法) 和NJ法 (邻接法 ) 。使用这两种方法前都必须获得一个对称距离矩阵 (m阶方阵) D = dijmm, 其中m为OUT(分类群数目。距离系数的公式很多。例如,Nei (1972)的遗传距离系数适用于限制性内切酶和同功酶数据,Jukes-Cantor 单参数距离系数和Kimura两参数模型距离系数则广泛用于各种序列数据。1.将最近的物种聚合在一起2.开始用于聚合的单元是独立的3.在每次迭代中,将 两个”最近”单元(距离最小)聚在一起形成一
5、个新的聚合单元分子系统发育分析的主要方法分子系统发育分析的主要方法ABCDEAB1.43C2.654.24D5.244.332.52E3.081.572.193.021. 找到距离矩阵中最小的距离,在这个例子中最小距离是物种A 和 B. 2. 将 A 和 B 用树枝相连并给每一个分枝赋予一半的遗传距离3. 从现在起,将(A+B) 作为一个单元考虑AB0.7150.715ABCDEAB1.43C2.654.24D5.244.332.52E3.081.572.193.024. 根据A和B的距离来重新计算遗传距离 例如, (A+B) 和 C 的距离是 (2.65+4.24)/2= 3.445依次计算所有影响到的距离A+BCDEA+BC3.445D4.7852.52E2.3252.193.025. 重复上述步骤,找到下一个最小的距离。在这个例子中是C 和 E之间的距离.AB0.7150.715CE1.0951.095D1.3851.3851.921.92HIV从何而来从何而来Freeman & Herron, 2001. Evolutionary Analysis. Prentice Hall结语结语END