基于图像和基因数据整合分析的大脑功能特异性基因特征识别 下载本文

内容发布更新时间 : 2025/1/3 18:00:04星期一 下面是文章的全部内容请认真阅读。

龙源期刊网 http://www.qikan.com.cn

基于图像和基因数据整合分析的大脑功能特异性基因特征识别

作者:王天杰

来源:《电脑知识与技术》2018年第28期

摘要:在脑科学领域,包含基因和多类图像数据的多模态数据的结合分析在揭示大脑的功能和机理的过程中越来越发挥着重要的作用。本文通过运用统计学中的偏最小二乘回归方法,结合基因数据和两类图像数据,对大脑的功能发育进行了相关分析,并查找文献进行了结果的比较,分析了与大脑功能发育相关的基因,并对功能网络进行了相关分析,得到了可靠的结果。

关键词:偏最小二乘回归(PLS) 脑图像 基因 网络

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2018)28-0200-06 1 绪论

人体各个器官中都有人体全部的基因,但是不同器官中基因的表达不同,而且不同的表达与器官的不同功能有关,基因突变会导致基因表达的变化,进而导致相关器官的功能异常。本研究的目的是研究人的不同年龄阶段以及不同脑区的大脑发育与人的全基因表达之间的关系,揭示显著表达的基因在该年龄段或该脑区大脑发育中的作用,即找到与大脑发育显著相关的基因,并认为这些基因的突变更有可能在疾病中扮演重要角色,进而发现如阿兹海默症,精神分裂症,多动症等大脑相关疾病的致病基因与这些基因的高度相关性,为致病基因的发现和疾病的治疗提供参考。为了达到这一目的,本研究需要的数据有涵盖多个年龄段的大脑的结构数据以及人体所有基因在相应年龄段大脑中的表达数据,结构数据主要是大脑皮层的生物数据,如皮层厚度,脑区体积等。

fMRI 基于血氧水平依赖(Blood Oxygen Level Dependent, BOLD)效应,通过测量局部脑区中脱氧血红蛋白浓度的改变来间接表明大脑神经元的功能活动,主要分为任务态(Task-related)和静息态(Resting-state)[1]。任务态fMRI通过事先设定好的特定任务刺激被试然后检测大脑的反应,但对于一些认知受损或认知尚未发育完成的被试来说完成任务有一定困难。而rs-fMRI 不需要执行特殊的任务,只需被试闭上眼睛,大脑清醒但不刻意做任何系统思考,克服了上述缺点[11]。 1.1 布罗德曼分区系统

龙源期刊网 http://www.qikan.com.cn

布罗德曼分区最早由德国神经科医生科比尼安·布洛德曼(Korbinian Brodmann)提出。他的分区系统包括每个半球的52个区域。其中一些区域今天已经被细分,例如23区被分为23a和23b区等。

1.2 Destrieux分区系统

Destrieux分区系统是基于脑沟深度的在freesurfer中广泛应用的分割方案。这种划分方案能够自动而精确的定义脑沟和脑回。这种划分方案把大脑的每个半球划分为74个脑区,即共148个脑区。

图1 结构分区模板Destrieux 2 方法 2.1 脑图像数据

本研究所使用的脑图像数据是人脑连接组计划(HCP)的WU-Minn HCP Lifespan Pilot Data数据集中的从不同年龄段的人采集的结构磁共振数据(structure MRI)和静息态功能核磁共振影像数据(rfMRI)[10]。探索人脑是21世纪伟大的科学挑战之一。 人类连接体项目(HCP)正在通过阐明脑功能和行为的神经通路来解决这一挑战的一个关键方面。 解密这个令人惊讶的复杂接线图将揭示什么使我们成为独特的人类,什么使每个人与所有其他人不同。HCP项目由华盛顿大学,明尼苏达大学和牛津大学(WU-Minn HCP联盟)领导,联盟全面使用最先进的无创神经影像学方法,将目标总数1200名健康成年人的人脑电路进行全面绘制。 它将产生并贡献关于脑连通性,大脑连通性与行为的关系,以及遗传和环境因素对脑电路和行为的影响的宝贵信息[2]。该项目对于其数据有专门的处理流程,经数据预处理后用于分析。本数据处理的先决条件是:1,64位Linux操作系统;2)安装FSL (FMRIB Software Library)v5.0.6;3)安装FreeSurfer version 5.3.0-HCP;4)安装Connectome Workbench version 1.0;5)安装HCP version of gradunwarp version 1.0.2。6)安装HCP-pipelines。安装完成后,设置好工作路径和环境变量,然后开始处理数据。

结构预处理:Prefreesurfer:为每个人生成自己的未失真的本地结构体积空间,对齐T1w和T2w图像,进行偏置场矫正,把每个人自己的本地结构体积空间融合到标准体积空间中。本地结构体积空间有每个人大脑各个结构的体积和面积等数据,是对每个人的大脑最逼真的体现,而标准体积空间是为了同时研究不同人的大脑,使他们具有可比性,把他们都对齐到标准体积空间中。该部分的第一步是MR梯度非线性引起的畸变的校正。在结构处理中使用的所有图像(T1w,T2w和场图幅度和相位)必须校正梯度非线性失真。为了校正失真,由每个梯度线圈产生的磁场由球面谐波膨胀(特定于3T Connectome扫描仪中的SC72梯度特性)建模[8]。 然后,使用FreeSurfer(Jovicich等人,2006)中提供的gradient_nonlin_unwarp软件包的定制版本完成校正。Freesurfer:这一部分基于FreeSurfer version 5.2,且有许多改进之处。这

龙源期刊网 http://www.qikan.com.cn

一部分的目标是把整个大脑划分为已知的结构,重建大脑白质/灰质分界面以及软膜表面(隔离大脑灰质与脑脊液的膜),并进行freesurfer的折叠式表面配准。Postfreesurfer:生成所有的体积和表面文件,以便在connectome workbench中可视化观察。下采样融合后的表面以进行连接分析。HCP的数据中有三种表面,每个人的本地表面(~136k个顶点),高分辨率的Conte69标准表面(~164k个顶点),以及低分辨率的Conte69标准表面(~32k个顶点,适用于低分辨率数据如fMRI或弥散张量数据的跨目标分析)。

在结构预处理后,得到了每个人全脑的结构数据,为了本研究的目的,从中选出四项,即每个脑区的厚度,表面积,体积,曲度,进行后续的分析。基因数据只有16个脑区,每个脑区的左右半球的基因表达值取均值,为了保持图像数据与基因数据的一致,在进行脑区匹配后,对于一个脑区的基因表达值,在图像数据中,左右脑同一脑区的体积相加,表面积相加,厚度和曲度取均值。

功能预处理: 功能预处理在结构预处理后进行[13]。

fMRIVolume:去除空间失真,重新调整体积以弥补头部动作带来的误差,将fMRI数据与结构数据融合,减少偏置场误差,将4D图像归一化为全局平均值,并用最终的脑表面来掩盖数据。这一部分的结果输出可以用来进行基于整个大脑的fMRI数据分析。fMRIVolume预处理部分在很多方面像PreFreeSurfer预处理部分,它们解决类似的问题[6]。 需要在完成HCP结构预处理(PreFreeSurfer,FreeSurfer和PostFreeSurfer)的基础上进行。与PreFreeSurfer预处理部分一样,第一步是使用与PreFreeSurfer部分相同的方法校正梯度非线性引起的失真。接下来是重新对准时间序列,纠正接受扫描的人的头部动作引起的误差。fMRIVolume预处理部分的最后一步是把所有的融合变换和失真矫正步骤联系起来,形成单一的非线性变换,以应用在单个的重采样步骤中。

fMRISurface:这部分在fMRIVolume的基础上进行,其任务是把每个人的时间序列数据从各自的大脑转换到标准空间中。这部分的输出结果可以用来进行静息态或任务态的fMRI分析。第一步是一种新颖的部分体积加权带状约束体积对表面映射算法,其中白质/灰质交界面和软膜表面用于定义哪些fMRI体素在灰质带内。为了获得最大的准确性,在本步骤中使用本地网格表面(在MNI体积空间中),因为它们没有被重新采样,因此能够最精确地重现这个大脑中的组织轮廓。一些体素将部分在灰质色带内,部分在其外部。分配给每个表面顶点的强度值是完全或部分在灰质带内的体素的加权平均值,部分体素根据其在色带内的部分体积进行加权[9]。在每个顶点,算法找到包含白质/灰质分界面和软膜表面包含该顶点的三角形(两个表面的顶点必须具有对应关系),并将这些三角形与通过连接两个表面对应三角形的边形成的四边形相连接,构建多面体。然后,它在每个体素中创建点的网格,并测试每一个点,看它是否在多面体内。如果多面体是扭曲的而导致测试结果模糊,算法判定该点是半在内的。用于体素的权重是内部网格点的数量,加上半在多面体内网格点数量的一半。每个个体受试者的时间序列被采样到一组左右半球表面顶点的标准集,以及皮质下灰质体素的标准集中,形成标准的CIFTI灰度空间。两个半球表面的时间序列以及每个皮质下结构的时间序列被组合在尺度为灰