糖蛋白组学分析¶

一句话说明¶

糖蛋白组学研究蛋白质上挂着的"糖链"——这些糖链就像蛋白质穿的"糖衣外套"，影响蛋白质的折叠、稳定性和细胞间识别。糖基化异常与癌症、先天性疾病密切相关。

核心知识点¶

要点1：糖基化类型¶

N-糖基化：糖链连接到天冬酰胺（Asn/N）上，识别序列是N-X-S/T（X不是Pro）
所有N-糖基化都共享一个核心五糖结构（Man3GlcNAc2）
分为高甘露糖型、复杂型、杂合型
O-糖基化：糖链连接到丝氨酸（Ser）或苏氨酸（Thr）上
没有固定的识别序列，位点预测困难
粘蛋白（Mucin）是典型的O-糖基化蛋白
糖链组成：常见单糖有己糖（Hex）、N-乙酰己糖胺（HexNAc）、岩藻糖（Fuc）、唾液酸（NeuAc）

要点2：糖蛋白富集方法¶

凝集素亲和色谱（Lectin）：用不同凝集素捕获不同类型糖链
ConA：捕获高甘露糖型N-糖
WGA：捕获含GlcNAc的糖蛋白
亲水相互作用色谱（HILIC）：利用糖链的亲水性富集
PNGase F酶切：特异性切除N-糖链，释放去糖基化肽段
切割后Asn变为Asp（+0.984 Da），可用于定位N-糖基化位点
化学方法：肼法、氧化-亲和捕获

要点3：糖链结构解析¶

糖链组成分析：通过精确质量确定单糖组成（如Hex5HexNAc4Fuc1NeuAc1）
糖链结构分析：需要特殊碎裂方式
HCD碎裂：主要产生糖苷键断裂的碎片（Y/B型离子）
EThcD碎裂：同时获得糖链和肽段骨架碎裂信息
阶梯式碰撞能量（SCE）：在多个碰撞能量下采集，信息更全
GlycoWorkbench：糖链碎裂图谱注释工具

要点4：数据分析工具¶

Byonic：商业软件，糖肽鉴定的"金标准"
pGlyco 3：国产开源工具，性能优秀
MSFragger-Glyco：FragPipe中的糖肽搜索模块
GlyConnect/GlyTouCan：糖链结构数据库

实战代码¶

# === 使用pGlyco 3进行糖蛋白组学分析 ===
# pGlyco是中科院计算所开发的糖肽鉴定引擎
# 下载: https://github.com/pFindStudio/pGlyco3

# 运行pGlyco 3
pGlyco3 \
  --input sample.mgf \              # 输入MS/MS谱图文件
  --fasta human_uniprot.fasta \      # 蛋白序列库
  --glycan_db N-glycan.gdb \         # N-糖链数据库
  --enzyme Trypsin \                 # 酶切方式
  --missed_cleavage 2 \              # 允许2个漏切
  --ms1_tol 10ppm \                  # 母离子容忍度
  --ms2_tol 20ppm \                  # 碎片离子容忍度
  --output results/                  # 输出目录

# === 糖蛋白组学结果分析 ===
import pandas as pd
import matplotlib.pyplot as plt
from collections import Counter

# 1. 读取糖肽鉴定结果
glyco_results = pd.read_csv("glycopeptide_results.csv")
print(f"鉴定糖肽数: {len(glyco_results)}")
print(f"糖基化位点数: {glyco_results['Site'].nunique()}")

# 2. 统计糖链类型分布
def classify_glycan(composition):
    """根据糖链组成分类为高甘露糖/复杂/杂合型"""
    if "NeuAc" in composition or "Fuc" in composition:
        return "Complex"        # 含唾液酸或岩藻糖 → 复杂型
    hex_count = int(composition.split("Hex")[1].split("H")[0]) if "Hex" in composition else 0
    hexnac_count = int(composition.split("HexNAc")[1].split(" ")[0]) if "HexNAc" in composition else 0
    if hexnac_count <= 2:
        return "High-Mannose"   # HexNAc≤2 → 高甘露糖型
    return "Hybrid"             # 其他 → 杂合型

# 3. N-糖基化位点motif验证
def check_n_glycan_motif(peptide, site_pos):
    """验证N-糖基化位点是否符合N-X-S/T motif"""
    if site_pos + 2 < len(peptide):
        aa_plus2 = peptide[site_pos + 2]  # 第+2位氨基酸
        aa_plus1 = peptide[site_pos + 1]  # 第+1位氨基酸
        if aa_plus1 != "P" and aa_plus2 in ["S", "T"]:  # X≠Pro, 第三位是S或T
            return True
    return False

# 4. 绘制糖链类型分布饼图
glycan_types = glyco_results["GlycanType"].value_counts()
plt.figure(figsize=(8, 8))
plt.pie(glycan_types, labels=glycan_types.index, autopct='%1.1f%%')
plt.title("N-Glycan Type Distribution")
plt.savefig("glycan_types.png", dpi=150)

面试常问点¶

Q1: N-糖基化和O-糖基化的主要区别？¶

参考答案：三个核心区别：一是连接位点不同，N-糖连在Asn上（有N-X-S/T识别序列），O-糖连在Ser/Thr上（没有固定序列）；二是合成位置不同，N-糖基化从内质网开始，O-糖基化在高尔基体进行；三是分析难度不同，N-糖有PNGase F可以特异性切下来，O-糖没有通用的酶切方法，分析更困难。

Q2: PNGase F酶切为什么能定位N-糖基化位点？¶

参考答案：PNGase F切除N-糖链时会把天冬酰胺（Asn, +114）脱酰胺变成天冬氨酸（Asp, +115），质量增加0.984 Da。在质谱中检测到这个+0.984的质量偏移，就能精确定位哪个Asn是糖基化位点。为了避免自发脱酰胺造成假阳性，可以用H₂¹⁸O中做PNGase F酶切，产生+2.988的特征质量偏移。

速查卡片¶

问题	一句话答案
N-糖基化识别序列？	N-X-S/T（X不是Pro）
N-糖核心结构？	Man3GlcNAc2（核心五糖）
PNGase F做什么？	特异性切除N-糖链，Asn→Asp(+0.984 Da)
糖肽鉴定工具推荐？	Byonic（商业）、pGlyco 3（开源）、MSFragger-Glyco
EThcD碎裂的优势？	同时获得糖链碎片和肽段骨架碎片
O-糖分析难在哪？	没有固定识别序列，没有通用酶切方法

糖蛋白组学分析¶

一句话说明¶

核心知识点¶

要点1：糖基化类型¶

要点2：糖蛋白富集方法¶

要点3：糖链结构解析¶

要点4：数据分析工具¶

实战代码¶

面试常问点¶

Q1: N-糖基化和O-糖基化的主要区别？¶

Q2: PNGase F酶切为什么能定位N-糖基化位点？¶

速查卡片¶

📚 相关文章推荐