Overview

Overview

Knockoff pipeline 概览

Knockoff pipeline 提供多种统计方法,使用knockoff统计量进行变量选择和遗传分析:

  flowchart TD
    A[输入数据] --> B{数据类型}
    
    B -->|个体水平基因型数据| C[个体统计 pipeline]
    B -->|GWAS汇总统计数据| D[汇总统计 pipeline]
    
    C --> E{样本类型}
    E -->|独立同分布样本| F[基于GLM的方法]
    E -->|相关样本| G[基于GLMM的方法]
    
    F --> H{分析水平}
    H -->|基于SNP| I[KnockoffScreen - 基于SNP]
    H -->|基于窗口| J[KnockoffScreen - 基于窗口]
    H -->|基于基因| K[GeneScan3DKnock]
    
    G --> L[计算GRM矩阵]
    L --> M[拟合GLMM模型]
    M --> N[BIGKnock - 基于基因]
    
    D --> O{分析模式}
    O -->|变量选择| P[GhostKnockoff]
    O -->|局部遗传相关性| Q[LAVA-Knock]
    
    I --> R[SNP水平变量选择]
    J --> S[窗口水平变量选择]
    K --> T[基因水平变量选择]
    N --> U[基因水平变量选择]
    
    P --> V[构建Knockoff Z分数]
    V --> W[FDR控制的变量选择]
    
    Q --> X[双变量局部相关性]
    X --> Y[多性状分析]
    Y --> Z[多效性位点探索]
    
    style A fill:#e1f5fe
    style R fill:#c8e6c9
    style S fill:#c8e6c9
    style T fill:#c8e6c9
    style U fill:#c8e6c9
    style W fill:#ffecb3
    style Z fill:#f8bbd9
    
    classDef method fill:#fff3e0,stroke:#ff9800,stroke-width:2px
    classDef result fill:#e8f5e8,stroke:#4caf50,stroke-width:2px
    
    class I,J,K,L,P,Q method
    class R,S,T,U,W,Z result

主要方法

个体水平数据方法

  • KnockoffScreen:支持基于SNP和基于窗口的分析,针对独立同分布样本使用GLM
  • GeneScan3DKnock:针对独立同分布样本的基于基因的分析,使用GLM
  • BIGKnock:针对相关样本的基于基因的分析,使用GLMM,需要计算GRM矩阵

汇总统计方法

  • GhostKnockoff:从GWAS汇总统计数据构建knockoff Z分数,用于变量选择
  • LAVA-Knock:在GhostKnockoff基础上扩展,用于局部遗传相关性分析和多效性位点探索