糖蛋白组学分析¶
一句话说明¶
糖蛋白组学研究蛋白质上挂着的"糖链"——这些糖链就像蛋白质穿的"糖衣外套",影响蛋白质的折叠、稳定性和细胞间识别。糖基化异常与癌症、先天性疾病密切相关。
核心知识点¶
要点1:糖基化类型¶
- N-糖基化:糖链连接到天冬酰胺(Asn/N)上,识别序列是N-X-S/T(X不是Pro)
- 所有N-糖基化都共享一个核心五糖结构(Man3GlcNAc2)
- 分为高甘露糖型、复杂型、杂合型
- O-糖基化:糖链连接到丝氨酸(Ser)或苏氨酸(Thr)上
- 没有固定的识别序列,位点预测困难
- 粘蛋白(Mucin)是典型的O-糖基化蛋白
- 糖链组成:常见单糖有己糖(Hex)、N-乙酰己糖胺(HexNAc)、岩藻糖(Fuc)、唾液酸(NeuAc)
要点2:糖蛋白富集方法¶
- 凝集素亲和色谱(Lectin):用不同凝集素捕获不同类型糖链
- ConA:捕获高甘露糖型N-糖
- WGA:捕获含GlcNAc的糖蛋白
- 亲水相互作用色谱(HILIC):利用糖链的亲水性富集
- PNGase F酶切:特异性切除N-糖链,释放去糖基化肽段
- 切割后Asn变为Asp(+0.984 Da),可用于定位N-糖基化位点
- 化学方法:肼法、氧化-亲和捕获
要点3:糖链结构解析¶
- 糖链组成分析:通过精确质量确定单糖组成(如Hex5HexNAc4Fuc1NeuAc1)
- 糖链结构分析:需要特殊碎裂方式
- HCD碎裂:主要产生糖苷键断裂的碎片(Y/B型离子)
- EThcD碎裂:同时获得糖链和肽段骨架碎裂信息
- 阶梯式碰撞能量(SCE):在多个碰撞能量下采集,信息更全
- GlycoWorkbench:糖链碎裂图谱注释工具
要点4:数据分析工具¶
- Byonic:商业软件,糖肽鉴定的"金标准"
- pGlyco 3:国产开源工具,性能优秀
- MSFragger-Glyco:FragPipe中的糖肽搜索模块
- GlyConnect/GlyTouCan:糖链结构数据库
实战代码¶
# === 使用pGlyco 3进行糖蛋白组学分析 ===
# pGlyco是中科院计算所开发的糖肽鉴定引擎
# 下载: https://github.com/pFindStudio/pGlyco3
# 运行pGlyco 3
pGlyco3 \
--input sample.mgf \ # 输入MS/MS谱图文件
--fasta human_uniprot.fasta \ # 蛋白序列库
--glycan_db N-glycan.gdb \ # N-糖链数据库
--enzyme Trypsin \ # 酶切方式
--missed_cleavage 2 \ # 允许2个漏切
--ms1_tol 10ppm \ # 母离子容忍度
--ms2_tol 20ppm \ # 碎片离子容忍度
--output results/ # 输出目录
# === 糖蛋白组学结果分析 ===
import pandas as pd
import matplotlib.pyplot as plt
from collections import Counter
# 1. 读取糖肽鉴定结果
glyco_results = pd.read_csv("glycopeptide_results.csv")
print(f"鉴定糖肽数: {len(glyco_results)}")
print(f"糖基化位点数: {glyco_results['Site'].nunique()}")
# 2. 统计糖链类型分布
def classify_glycan(composition):
"""根据糖链组成分类为高甘露糖/复杂/杂合型"""
if "NeuAc" in composition or "Fuc" in composition:
return "Complex" # 含唾液酸或岩藻糖 → 复杂型
hex_count = int(composition.split("Hex")[1].split("H")[0]) if "Hex" in composition else 0
hexnac_count = int(composition.split("HexNAc")[1].split(" ")[0]) if "HexNAc" in composition else 0
if hexnac_count <= 2:
return "High-Mannose" # HexNAc≤2 → 高甘露糖型
return "Hybrid" # 其他 → 杂合型
# 3. N-糖基化位点motif验证
def check_n_glycan_motif(peptide, site_pos):
"""验证N-糖基化位点是否符合N-X-S/T motif"""
if site_pos + 2 < len(peptide):
aa_plus2 = peptide[site_pos + 2] # 第+2位氨基酸
aa_plus1 = peptide[site_pos + 1] # 第+1位氨基酸
if aa_plus1 != "P" and aa_plus2 in ["S", "T"]: # X≠Pro, 第三位是S或T
return True
return False
# 4. 绘制糖链类型分布饼图
glycan_types = glyco_results["GlycanType"].value_counts()
plt.figure(figsize=(8, 8))
plt.pie(glycan_types, labels=glycan_types.index, autopct='%1.1f%%')
plt.title("N-Glycan Type Distribution")
plt.savefig("glycan_types.png", dpi=150)
面试常问点¶
Q1: N-糖基化和O-糖基化的主要区别?¶
参考答案:三个核心区别:一是连接位点不同,N-糖连在Asn上(有N-X-S/T识别序列),O-糖连在Ser/Thr上(没有固定序列);二是合成位置不同,N-糖基化从内质网开始,O-糖基化在高尔基体进行;三是分析难度不同,N-糖有PNGase F可以特异性切下来,O-糖没有通用的酶切方法,分析更困难。
Q2: PNGase F酶切为什么能定位N-糖基化位点?¶
参考答案:PNGase F切除N-糖链时会把天冬酰胺(Asn, +114)脱酰胺变成天冬氨酸(Asp, +115),质量增加0.984 Da。在质谱中检测到这个+0.984的质量偏移,就能精确定位哪个Asn是糖基化位点。为了避免自发脱酰胺造成假阳性,可以用H₂¹⁸O中做PNGase F酶切,产生+2.988的特征质量偏移。
速查卡片¶
| 问题 | 一句话答案 |
|---|---|
| N-糖基化识别序列? | N-X-S/T(X不是Pro) |
| N-糖核心结构? | Man3GlcNAc2(核心五糖) |
| PNGase F做什么? | 特异性切除N-糖链,Asn→Asp(+0.984 Da) |
| 糖肽鉴定工具推荐? | Byonic(商业)、pGlyco 3(开源)、MSFragger-Glyco |
| EThcD碎裂的优势? | 同时获得糖链碎片和肽段骨架碎片 |
| O-糖分析难在哪? | 没有固定识别序列,没有通用酶切方法 |