• 全国 [切换]
  • 二维码
    速企网

    手机WAP版

    手机也能找商机,信息同步6大终端平台!

    微信小程序

    微信公众号

    当前位置: 首页 » 行业新闻 » 热点新闻 » 正文

    WGCNA(一文完整流程:文献、步骤、理论)

    放大字体  缩小字体 发布日期:2025-02-05 04:42:57   浏览次数:1  发布人:7419****  IP:124.223.189***  评论:0
    导读

    一、文献WGCNA(Weighted Gene Co-expression Network Analysis,加权基因共表达网络分析)是一种用于挖掘高维基因表达数据的系统生物学方法。它主要用于构建基因共表达网络,并识别与特定表型或生物学过程相关的基因模块和关键基因(Hub基因),能帮助研究者从全局视角探索基因间的相互作用及其潜在功能。2008年,Peter Langfelder 和 Steve H

    一、文献

    WGCNA(Weighted Gene Co-expression Network Analysis,加权基因共表达网络分析)是一种用于挖掘高维基因表达数据的系统生物学方法。它主要用于构建基因共表达网络,并识别与特定表型或生物学过程相关的基因模块和关键基因(Hub基因),能帮助研究者从全局视角探索基因间的相互作用及其潜在功能




    2008年,Peter Langfelder 和 Steve Horvath 发布了WGCNA分析的R包(WGCNA)。其成为基因共表达网络分析的重要工具。其发布使生物学家和计算生物学家能够更高效地构建和分析基因共表达网络,进而深入理解基因功能和疾病机制。


    二、WGCNA分析步骤




    7大步骤


    三、WGCNA分析理论(理念和函数)

    1、相关性网络

    相关性网络是基于定量测量之间的相关性构建的,比如 n 个基因在m个样本中的表达量矩阵可以通过n × m 矩阵 X 来描述,其中行索引对应于基因( i = 1, . . ., n ) 和列索引 ( j= 1, ..., m ) 对应于样本:









    实验样本常常会有其他的特征,比如一些性状(株高、千粒重等)或者生长时期和疾病类型等。样本的某个性状向量可以用 T 表示




    某个基因 i  与 样本特征 T 的相关性可以表示如上所示




    相关性计算需要评估其显著性 p。GS定义为Gene Significance, 此外基因显著性测量也可以通过 p 值的负对数来定义

    2、构建基因共表达网络




    基因共表达网络中节点为Gene,边为相关性。n个基因的相关性矩阵C(n × n),可以对共表达相似性s ij 进行硬阈值化筛选,其中τ是硬阈值参数。

    如果两个基因的表达谱之间的绝对相关性超过(硬)阈值τ,则两个基因被连接。通过这种方式构建的网络称为未加权网络。虽然未加权网络被广泛使用,但它们不能反映底层共表达信息的连续性,因此可能导致信息丢失。相反,加权网络允许邻接取 0 到 1 之间的连续值




    加权网络可以通过将共表达相似度做幂运算来定义

    其中β≥ 1。加权 a ij 与共表达相似性 s ij 在对数尺度上的成正比,log ( a ij ) = β × log ( s ij)。相关性矩阵使用阈值将其转换为邻接矩阵 A = [a ij ],用于构建加权网络。

    实验表明,基因调控网络、生物代谢网络等天然生物网络常表现出无标度拓扑(Scale-Free Topology)结构。因此,WGCNA构建的基因共表达网络应符合无标度拓扑,以保证结果的可靠性和解释性。

    4、识别基因模块

    1)、模块是通过基因表达的相似性和网络结构聚类得到的基因子集,表现为共表达模式高度一致的基因簇。识别模块的步骤包括:

    ① 计算拓扑重叠矩阵(TOM):通过拓扑重叠度(TOM)量化基因之间的连接强度,反映它们的共表达模式是否相似。

    ② 层次聚类分析:基于TOM矩阵对基因进行层次聚类,将表达模式相似的基因分为多个簇。

    ③ 动态剪枝法:通过动态剪枝算法进一步细化模块划分,确保模块内部基因表达更为一致。


    2)、模块中还有一些关键概念:

    ① 模块特征基因(Module eigengene, E):模块的第一主成分,代表模块中基因的表达模式,类似于PCA中的PC1。

    ② 枢纽基因(Hub gene):在模块内高度连接并与模块特征基因相关的基因。

    ③ 模块显著性(Module significance):模块内所有基因的基因显著性(GS)的平均值。


    四、运行代码(下次说)


    生物信息学领域非常广泛,难以一次说尽。我们下次继续更新,一起深入学习生物信息学的内容!

    喜欢的宝子们点个赞吧~码字不易,且行且珍惜~

     
    (文/匿名(若涉版权问题请联系我们核实发布者) / 非法信息举报 / 删稿)
    打赏
    免责声明
    • 
    本文为昵称为 7419**** 发布的作品,本文仅代表发布者个人观点,本站未对其内容进行核实,请读者仅做参考,如若文中涉及有违公德、触犯法律的内容,一经发现,立即删除,发布者需自行承担相应责任。涉及到版权或其他问题,请及时联系我们154208694@qq.com删除,我们积极做(权利人与发布者之间的调停者)中立处理。郑重说明:不 违规举报 视为放弃权利,本站不承担任何责任!
    有个别老鼠屎以营利为目的遇到侵权情况但不联系本站或自己发布违规信息然后直接向本站索取高额赔偿等情况,本站一概以诈骗报警处理,曾经有1例诈骗分子已经绳之以法,本站本着公平公正的原则,若遇 违规举报 我们100%在3个工作日内处理!
    0相关评论
     

    (c)2008-现在 sud.com.cn All Rights Reserved.