跳转至

糖蛋白组学分析


一句话说明

糖蛋白组学研究蛋白质上挂着的"糖链"——这些糖链就像蛋白质穿的"糖衣外套",影响蛋白质的折叠、稳定性和细胞间识别。糖基化异常与癌症、先天性疾病密切相关。


核心知识点

要点1:糖基化类型

  • N-糖基化:糖链连接到天冬酰胺(Asn/N)上,识别序列是N-X-S/T(X不是Pro)
  • 所有N-糖基化都共享一个核心五糖结构(Man3GlcNAc2)
  • 分为高甘露糖型、复杂型、杂合型
  • O-糖基化:糖链连接到丝氨酸(Ser)或苏氨酸(Thr)上
  • 没有固定的识别序列,位点预测困难
  • 粘蛋白(Mucin)是典型的O-糖基化蛋白
  • 糖链组成:常见单糖有己糖(Hex)、N-乙酰己糖胺(HexNAc)、岩藻糖(Fuc)、唾液酸(NeuAc)

要点2:糖蛋白富集方法

  • 凝集素亲和色谱(Lectin):用不同凝集素捕获不同类型糖链
  • ConA:捕获高甘露糖型N-糖
  • WGA:捕获含GlcNAc的糖蛋白
  • 亲水相互作用色谱(HILIC):利用糖链的亲水性富集
  • PNGase F酶切:特异性切除N-糖链,释放去糖基化肽段
  • 切割后Asn变为Asp(+0.984 Da),可用于定位N-糖基化位点
  • 化学方法:肼法、氧化-亲和捕获

要点3:糖链结构解析

  • 糖链组成分析:通过精确质量确定单糖组成(如Hex5HexNAc4Fuc1NeuAc1)
  • 糖链结构分析:需要特殊碎裂方式
  • HCD碎裂:主要产生糖苷键断裂的碎片(Y/B型离子)
  • EThcD碎裂:同时获得糖链和肽段骨架碎裂信息
  • 阶梯式碰撞能量(SCE):在多个碰撞能量下采集,信息更全
  • GlycoWorkbench:糖链碎裂图谱注释工具

要点4:数据分析工具

  • Byonic:商业软件,糖肽鉴定的"金标准"
  • pGlyco 3:国产开源工具,性能优秀
  • MSFragger-Glyco:FragPipe中的糖肽搜索模块
  • GlyConnect/GlyTouCan:糖链结构数据库

实战代码

# === 使用pGlyco 3进行糖蛋白组学分析 ===
# pGlyco是中科院计算所开发的糖肽鉴定引擎
# 下载: https://github.com/pFindStudio/pGlyco3

# 运行pGlyco 3
pGlyco3 \
  --input sample.mgf \              # 输入MS/MS谱图文件
  --fasta human_uniprot.fasta \      # 蛋白序列库
  --glycan_db N-glycan.gdb \         # N-糖链数据库
  --enzyme Trypsin \                 # 酶切方式
  --missed_cleavage 2 \              # 允许2个漏切
  --ms1_tol 10ppm \                  # 母离子容忍度
  --ms2_tol 20ppm \                  # 碎片离子容忍度
  --output results/                  # 输出目录
# === 糖蛋白组学结果分析 ===
import pandas as pd
import matplotlib.pyplot as plt
from collections import Counter

# 1. 读取糖肽鉴定结果
glyco_results = pd.read_csv("glycopeptide_results.csv")
print(f"鉴定糖肽数: {len(glyco_results)}")
print(f"糖基化位点数: {glyco_results['Site'].nunique()}")

# 2. 统计糖链类型分布
def classify_glycan(composition):
    """根据糖链组成分类为高甘露糖/复杂/杂合型"""
    if "NeuAc" in composition or "Fuc" in composition:
        return "Complex"        # 含唾液酸或岩藻糖 → 复杂型
    hex_count = int(composition.split("Hex")[1].split("H")[0]) if "Hex" in composition else 0
    hexnac_count = int(composition.split("HexNAc")[1].split(" ")[0]) if "HexNAc" in composition else 0
    if hexnac_count <= 2:
        return "High-Mannose"   # HexNAc≤2 → 高甘露糖型
    return "Hybrid"             # 其他 → 杂合型

# 3. N-糖基化位点motif验证
def check_n_glycan_motif(peptide, site_pos):
    """验证N-糖基化位点是否符合N-X-S/T motif"""
    if site_pos + 2 < len(peptide):
        aa_plus2 = peptide[site_pos + 2]  # 第+2位氨基酸
        aa_plus1 = peptide[site_pos + 1]  # 第+1位氨基酸
        if aa_plus1 != "P" and aa_plus2 in ["S", "T"]:  # X≠Pro, 第三位是S或T
            return True
    return False

# 4. 绘制糖链类型分布饼图
glycan_types = glyco_results["GlycanType"].value_counts()
plt.figure(figsize=(8, 8))
plt.pie(glycan_types, labels=glycan_types.index, autopct='%1.1f%%')
plt.title("N-Glycan Type Distribution")
plt.savefig("glycan_types.png", dpi=150)

面试常问点

Q1: N-糖基化和O-糖基化的主要区别?

参考答案:三个核心区别:一是连接位点不同,N-糖连在Asn上(有N-X-S/T识别序列),O-糖连在Ser/Thr上(没有固定序列);二是合成位置不同,N-糖基化从内质网开始,O-糖基化在高尔基体进行;三是分析难度不同,N-糖有PNGase F可以特异性切下来,O-糖没有通用的酶切方法,分析更困难。

Q2: PNGase F酶切为什么能定位N-糖基化位点?

参考答案:PNGase F切除N-糖链时会把天冬酰胺(Asn, +114)脱酰胺变成天冬氨酸(Asp, +115),质量增加0.984 Da。在质谱中检测到这个+0.984的质量偏移,就能精确定位哪个Asn是糖基化位点。为了避免自发脱酰胺造成假阳性,可以用H₂¹⁸O中做PNGase F酶切,产生+2.988的特征质量偏移。


速查卡片

问题一句话答案
N-糖基化识别序列?N-X-S/T(X不是Pro)
N-糖核心结构?Man3GlcNAc2(核心五糖)
PNGase F做什么?特异性切除N-糖链,Asn→Asp(+0.984 Da)
糖肽鉴定工具推荐?Byonic(商业)、pGlyco 3(开源)、MSFragger-Glyco
EThcD碎裂的优势?同时获得糖链碎片和肽段骨架碎片
O-糖分析难在哪?没有固定识别序列,没有通用酶切方法