计算生物学讲解 下载本文

内容发布更新时间 : 2024/5/2 0:08:36星期一 下面是文章的全部内容请认真阅读。

第一讲:学科间的关联

? 首先锁定研究对象:分子 + 环境,或者更大的体系 – 分子:单个或几个分子 ,千万个分子 – 环境:多个分子,连续介质 ? 计算途径:原理 + 算法

– 原理:物理学,化学,生物学 – 算法:数学、统计学

同样的几个问题 1. 包含什么? tRNA, mRNA, protein, water 2. 有何关联? tRNA-mRNA; mRNA-protein 3. 可否调控? tRNA的移动过程; protein的形成 4. 计算模型? 水分子;离子;药物小分子等 不同体系,不同方法 Multiple proteins 蛋白质内部,buried molecule, loop flipping 蛋白质之间:binding sites Rotation H-bonding Electrostatic interaction Van der Waals interaction 精确的计算方法,快速的近似方法 物理学 经典力学 量子力学 相对论处理 热力学 统计力学 电动力学 凝聚态理论 数学、统计学 ? 数字拟合,分类与回归,贝叶斯推断,蒙特 卡罗方法,马尔可夫链 ? 微分方程解析解与数值解,矩阵与数值计算 ? 集合,拓扑学,图论,群伦,排列组合 计算机科学 ? Linux操作系统: – Serial computing, – Distributed or parallel computing (并行计算), MPI – Linux scripts, sed, awk – Perl, Python, Fortran, C++, Java ? MySQL, PHP, Apache ? Windows视窗:MATLAB, R, Java, 机器Computers ? 微机类: Pymol, Rasmol, R, Matlab, Mathmatica ? 工作站: Gaussian, CHARMM, DOCK CPU计算,GPU图形 ? 集群计算机Cluster: MPI 硬盘阵列RAID (redundant array of independent disks)

应用: 1. 理解: 实验数据,光谱峰位置 探究反应机理 2. 预测: 分子和材料的结构与性能 辅助化学合成 药物设计、催化剂设计 结构-性质关系QSPR 结构-活性关系QSAR 方法: 1、量子化学: Gaussian 从头算、半经验方法 密度泛函 分子反应动力学、带结构 2、分子动力学: CHARMM 蛋白质模拟 量子/经典混杂方法 3、分子对接: DOCK 药物设计

生物信息学Bioinformatics ? 数据挖掘data mining

? 机器学习machine learning/artificial intelligence

– 算法:决策树Decision tree, 随机森林Random forests, 关联式规则 Association rule, 人工神经网络Artificial neural networks, 遗传编程 Genetic programming, 诱导逻辑编程Inductive logic programming, 支持 向量机Support vector machines, 聚类Clustering, 贝叶斯网络Bayesian networks,系综学习Ensemble learning, …

– 应用:模式识别pattern recognition ? 分类Classification, 回归Regression, … ? 可视化visualization

方法Methods

? 信息Information

databases, data mining, web technologies, online query, sequencing, alignment, discovery, judge, ? 理解Understanding

image processing, visualization, statistics, data fitting, modeling,

? 预测Prediction

interaction, energy terms, scoring function, simulation, structure, superposition

第二讲:经典力学

一、与研究对象如何关联? 二、现有的方法合理吗?

三、你自己关心的问题如何描述?