66. AI Ethics与负责任的AI使用¶

一句话说明： 了解AI伦理的核心问题（偏见、隐私、可解释性），学会在生信研究和求职中负责任地使用AI。

一、AI伦理核心问题¶

白话解释： AI伦理就是思考"AI这么强大，我们该怎么用才对得起良心"。就像核能可以发电也可以造原子弹，AI也要想清楚边界在哪里。

五大核心问题¶

1. 偏见（Bias）¶

白话： AI学到了训练数据里的偏见。如果训练数据里男医生多、女护士多，AI就会"觉得"医生=男、护士=女。

真实案例：
- 亚马逊AI招聘系统歧视女性（训练数据来自过去10年的简历，男性主导）
- 医疗AI对深色皮肤患者诊断准确率低（训练数据中白人图像占多数）
- 犯罪预测AI对少数族裔判高风险（历史逮捕数据本身有种族偏见）

偏见类型：

偏见类型	白话解释	例子
样本偏见	训练数据不均衡	数据库90%是欧美白人基因组
标注偏见	标注人员带有主观倾向	不同医生对同一张CT的标注不同
确认偏见	AI强化了已有偏见	推荐系统只推相似内容，形成信息茧房
历史偏见	数据反映了历史不公	过去的贷款审批数据歧视某些群体

2. 公平性（Fairness）¶

白话： AI对所有人一视同仁吗？不同性别、种族、年龄的人得到的结果应该是公平的。

# 公平性检测：比较不同群体的预测结果
from sklearn.metrics import confusion_matrix

# 分别计算男/女群体的假阳性率（FPR）
def demographic_parity(y_true, y_pred, sensitive_attr):
    """检查不同群体的正预测率是否接近（人口统计均等）"""
    groups = set(sensitive_attr)                      # 获取所有群体
    rates = {}
    for g in groups:
        mask = [s == g for s in sensitive_attr]        # 筛选该群体
        y_g = [y for y, m in zip(y_pred, mask) if m]  # 该群体的预测结果
        rates[g] = sum(y_g) / len(y_g)                # 正预测率
    return rates  # 理想情况下各群体比率应接近

3. 透明度（Transparency）¶

白话： AI是怎么做出这个决定的？能不能解释清楚？如果AI说你得了癌症但说不出为什么，你信吗？

黑箱问题： 深度学习模型内部有数百万参数，人类无法理解每个决策的原因
要求： 高风险场景（医疗、司法、金融）必须提供解释

4. 隐私（Privacy）¶

白话： 训练AI用的数据里有没有个人隐私？你的基因数据、病历数据被拿去训练AI了吗？

基因数据：属于最敏感的个人信息，一旦泄露终身无法更改
医疗记录：受HIPAA（美国）、GDPR（欧洲）等法规严格保护
差分隐私：一种数学方法，在数据中加入随机噪声，保护个人信息同时保留统计特征

5. 可解释性（Explainability）¶

白话： 让AI"说人话"，解释它为什么做出这个预测。

# SHAP值解释模型预测（白话：告诉你每个特征贡献了多少）
import shap

# 训练好模型后
explainer = shap.TreeExplainer(model)    # 创建解释器
shap_values = explainer.shap_values(X_test)  # 计算SHAP值

# 可视化：哪个特征对预测影响最大
shap.summary_plot(shap_values, X_test)   # 全局特征重要性图
shap.force_plot(                          # 单个样本的解释
    explainer.expected_value,
    shap_values[0],                       # 第一个样本的SHAP值
    X_test.iloc[0]                        # 第一个样本的特征值
)

二、生物医学AI的特殊伦理¶

生物医学领域的AI应用面临比一般AI更严格的伦理要求。

1. 诊断AI的误诊责任¶

问题：AI诊断说没事，结果病人真的有病。谁负责？
- AI开发公司？（提供了工具）
- 医生？（最终决策者）
- 医院？（使用了AI系统）

现状：
- 多数国家法规要求AI只能作为"辅助诊断"，最终决策权在医生
- FDA对医疗AI实施分级审批（Class I/II/III），高风险需临床试验
- 2024年后，越来越多国家要求医疗AI通过上市前审批（premarket review）

2. 基因数据隐私¶

特殊性：
- 基因数据是终身不变的（不像密码可以改）
- 基因数据不仅涉及本人，还涉及血亲隐私
- 基因歧视风险：保险公司/雇主可能基于基因信息歧视

保护措施：
- GINA法案（美国）：禁止基于基因信息的就业和健康保险歧视
- GDPR（欧盟）：基因数据属于特殊类别个人数据，需要明确同意
- 中国《生物安全法》+《个人信息保护法》：人类遗传资源需审批

3. AI辅助药物开发的监管¶

现状（2025年）：
- AI可以加速药物筛选（从数百万化合物中找候选药物）
- 但AI发现的候选药仍需通过完整的临床试验流程（Phase I/II/III）
- FDA在2023年发布了AI/ML在药物开发中的指南草案
- AI生成的分子不能跳过安全性验证

4. AI在基因编辑中的伦理¶

争议点：
- AI可以预测CRISPR编辑的脱靶效应（off-target）
- 但AI辅助的基因编辑是否能用于人类胚胎？
- 贺建奎事件（2018）后，各国严格限制人类胚胎基因编辑

三、负责任的AI使用指南¶

1. 数据偏见检测¶

# 检查数据集是否均衡
import pandas as pd

def check_data_balance(df, target_col, sensitive_cols):
    """检查数据集在敏感属性上是否均衡"""
    print(f"总样本数：{len(df)}")
    print(f"\n目标变量分布：")
    print(df[target_col].value_counts(normalize=True))   # 目标变量比例

    for col in sensitive_cols:
        print(f"\n{col} 分布：")
        print(df[col].value_counts(normalize=True))       # 敏感属性比例

        # 交叉分析：不同群体的目标变量分布
        print(f"\n{col} × {target_col} 交叉表：")
        ct = pd.crosstab(df[col], df[target_col], normalize="index")  # 按行归一化
        print(ct)

# 使用示例
check_data_balance(df, target_col="disease", sensitive_cols=["gender", "ethnicity"])

2. 模型可解释性工具¶

工具	白话解释	适用模型
SHAP	算出每个特征对每个预测的贡献值	几乎所有模型
LIME	用简单模型局部模拟复杂模型的行为	任何黑箱模型
特征重要性	直接看哪个特征权重最大	树模型（随机森林/XGBoost）
注意力可视化	看模型关注了输入的哪些部分	Transformer/注意力模型
偏依赖图(PDP)	看单个特征变化时预测怎么变	任何模型

# LIME 解释器示例
from lime.lime_tabular import LimeTabularExplainer

explainer = LimeTabularExplainer(
    X_train.values,                    # 训练数据
    feature_names=X_train.columns,     # 特征名
    class_names=["健康", "患病"],       # 类别名
    mode="classification"              # 分类任务
)

# 解释单个预测
exp = explainer.explain_instance(
    X_test.iloc[0].values,             # 待解释的样本
    model.predict_proba,               # 模型预测函数
    num_features=10                    # 显示前10个重要特征
)
exp.show_in_notebook()                 # 在Jupyter中显示

3. 公平性评估¶

# 使用fairlearn库进行公平性评估
# pip install fairlearn
from fairlearn.metrics import MetricFrame
from sklearn.metrics import accuracy_score, recall_score

# 按敏感属性分组计算指标
metric_frame = MetricFrame(
    metrics={
        "accuracy": accuracy_score,     # 准确率
        "recall": recall_score          # 召回率
    },
    y_true=y_test,                      # 真实标签
    y_pred=y_pred,                      # 预测标签
    sensitive_features=df_test["gender"] # 敏感属性
)

print("各组指标：")
print(metric_frame.by_group)            # 分组查看
print(f"\n组间差异：")
print(metric_frame.difference())        # 最大差异

4. AI输出验证¶

使用AI输出前的验证清单：
1. 交叉验证：不要只信一个AI的结果，用多种方法验证
2. 文献对照：AI的发现是否与已有文献一致？如果不一致，为什么？
3. 生物学常识：AI的结果在生物学上是否说得通？
4. 统计显著性：p值/FDR是否达标？效应量是否有意义？
5. 可视化检查：画图看看数据和结果，肉眼检查异常

四、学术诚信与AI¶

1. AI在论文写作中的使用边界¶

行为	是否允许	说明
用AI润色英文语法	通常允许	类似使用Grammarly，需声明
用AI生成论文初稿	有争议	多数期刊要求声明AI参与，且作者承担内容责任
用AI翻译论文	通常允许	需人工校对，确保专业术语准确
用AI编造数据	严格禁止	学术造假，可能被撤稿、处分
用AI生成参考文献	禁止	AI会"编造"不存在的文献（幻觉问题）

2. AI在代码生成中的边界¶

允许：
- 用AI辅助写代码，自己理解并审查每一行
- 用AI解释别人的代码
- 用AI帮忙调试Bug

灰色地带：
- 课程作业中使用AI（取决于课程政策）
- 用AI生成的代码直接提交（是否声明？）

禁止：
- 直接提交AI代码声称是自己写的（知识产权问题）
- 用AI绕过代码检查/抄袭检测

3. AI在数据分析中的边界¶

允许：
- 用AI辅助选择统计方法
- 用AI编写分析脚本，自己验证结果
- 用AI解释统计结果

危险行为：
- 让AI反复分析直到得到"显著"结果（p-hacking）
- 不理解分析方法就直接用AI的结果
- 不验证AI的分析代码是否正确

4. 各期刊AI使用政策（2025年现状）¶

Nature / Science：
- 要求作者声明是否使用了AI工具
- AI不能作为论文共同作者
- 作者对AI生成的内容承担全部责任

中国科技期刊：
- 中国科协2023年发布《关于在学术论文署名中规范使用AI的指导意见》
- AI工具应在方法部分说明使用方式
- AI不列为作者

五、各国AI法规概览¶

1. EU AI Act（欧盟人工智能法案）¶

白话： 全球第一部全面的AI法律（2024年正式通过，2025-2026年分阶段生效）。

核心思路：按风险等级分类管理

不可接受风险（禁止）：
  - 社会评分系统（中国式社会信用）
  - 实时远程生物识别（公共场所人脸识别）
  - 操纵人类行为的AI（利用弱势群体的AI）
  - 基于敏感特征的分类系统

高风险（严格监管）：
  - 医疗诊断AI
  - 招聘筛选AI
  - 信用评估AI
  - 关键基础设施AI
  → 要求：透明度报告、人工监督、数据质量、准确性评估

有限风险（透明度义务）：
  - 聊天机器人：必须告知用户在和AI对话
  - Deepfake：必须标注是AI生成的内容

最小风险（无特殊要求）：
  - AI邮件过滤、游戏AI等

处罚： 违规最高罚款3500万欧元或全球营业额7%（取较高者）

2. 中国AI管理法规¶

主要法规：
1.《生成式人工智能服务管理暂行办法》（2023年8月生效）
   - 适用范围：面向中国境内公众提供生成式AI服务
   - 核心要求：
     * 训练数据合法
     * 不得生成违法内容
     * 向用户标识AI生成内容
     * 保护个人信息

2.《互联网信息服务深度合成管理规定》（2023年1月生效）
   - 针对Deepfake等深度合成技术
   - 要求添加标识

3.《科技伦理审查办法（试行）》（2023年12月生效）
   - 涉及人的科技活动需伦理审查
   - AI相关研究纳入审查范围

4.《网络安全法》+《数据安全法》+《个人信息保护法》
   - AI开发中的数据合规基础法律

3. 其他国家/地区¶

国家/地区	主要法规/举措	特点
美国	行政命令 + 行业自律	无统一联邦法律，各州/行业分散监管
英国	亲创新框架	不立法，由各行业监管机构自行制定AI规则
日本	AI治理指南	以企业自律为主，对AI训练数据版权友好
加拿大	AIDA法案	立法中，关注高影响AI系统
新加坡	AI治理框架	自愿遵循的治理框架，强调可信AI

六、面试怎么答¶

Q1：你怎么理解AI伦理？在生信中有哪些相关问题？¶

答： AI伦理关注AI系统的公平性、透明度、隐私保护和可解释性。在生信中，核心伦理问题包括： 1. 数据偏见：公共基因组数据库以欧美白人为主（如GWAS Catalog中超过80%的样本是欧洲裔），基于此训练的模型对亚洲人群可能准确率下降 2. 隐私保护：基因数据是终身不变的敏感信息，需要去标识化处理，且不能仅靠匿名化（基因数据有重识别风险） 3. 可解释性：如果用随机森林预测疾病风险，必须能解释哪些特征驱动了预测（用SHAP值），不能只给一个概率

Q2：SHAP和LIME有什么区别？你在项目中怎么用的？¶

答：两者都是模型解释工具，区别在于： - SHAP基于博弈论（Shapley值），计算每个特征的贡献，全局和局部都能解释，理论基础更扎实 - LIME通过在目标样本附近采样并拟合简单线性模型来解释，更直觉但结果不稳定

在宏基因组示例项目中，我用SHAP解释随机森林的预测结果，发现BMI和FPG（空腹血糖）是最重要的预测特征，这与临床知识一致，增强了模型的可信度。

Q3：如何检测和缓解数据偏见？¶

答：检测：先做数据探索性分析，查看各组（性别、年龄、种族等）样本数量是否均衡，用交叉表分析不同子群体中目标变量的分布。用fairlearn等工具计算各组的模型表现差异。

缓解方法： - 数据层面：过采样少数群体（SMOTE）、欠采样多数群体、收集更多少数群体数据 - 算法层面：训练时加入公平性约束、使用公平性感知的算法 - 后处理：调整不同群体的分类阈值

Q4：论文中使用AI需要注意什么？¶

答：主要注意三点： 1. 声明使用：在Methods部分说明使用了哪些AI工具、用于什么目的（Nature/Science等主流期刊已明确要求） 2. 验证内容：AI生成的文字和代码必须人工审核，特别是参考文献（AI会编造）和数据分析结果 3. 承担责任：AI不能作为论文作者，所有内容的准确性和原创性由人类作者负责

Q5：你了解哪些AI相关法规？¶

答：最重要的是欧盟的EU AI Act（2024年通过），它按风险等级将AI分为四类，高风险AI（如医疗诊断）需要透明度报告和准确性评估。中国有《生成式人工智能服务管理暂行办法》（2023年），要求AI服务合法合规、标识AI内容、保护个人信息。在生信领域，还需遵守《个人信息保护法》和《生物安全法》中关于人类遗传资源的规定。

七、速查表¶

AI伦理核心概念速查¶

概念	英文	白话解释
偏见	Bias	AI学到了数据里的不公平
公平性	Fairness	不同群体得到平等对待
透明度	Transparency	能解释AI怎么做的决定
可解释性	Explainability	用人话说清AI的推理过程
隐私	Privacy	保护训练数据中的个人信息
问责	Accountability	出了问题谁负责
知情同意	Informed Consent	数据主体知道并同意数据用途
差分隐私	Differential Privacy	加噪声保护隐私的数学方法

可解释性工具速查¶

工具	安装	一行代码
SHAP	`pip install shap`	`shap.summary_plot(shap_values, X)`
LIME	`pip install lime`	`exp = explainer.explain_instance(x, model.predict_proba)`
fairlearn	`pip install fairlearn`	`MetricFrame(metrics, y_true, y_pred, sensitive_features)`

AI法规速查¶

法规	地区	生效时间	核心特点
EU AI Act	欧盟	2024通过，2025-2026生效	风险分级管理
生成式AI暂行办法	中国	2023年8月	服务合规+内容标识
AI行政命令	美国	2023年10月	行业自律+标准制定
GDPR	欧盟	2018年	数据隐私保护（含AI决策权）
个人信息保护法	中国	2021年11月	个人数据处理规范

八、延伸资源¶

SHAP官方文档：https://shap.readthedocs.io/
LIME GitHub：https://github.com/marcotcr/lime
Fairlearn文档：https://fairlearn.org/
EU AI Act全文：https://artificialintelligenceact.eu/the-act/
中国生成式AI暂行办法：搜索"生成式人工智能服务管理暂行办法"全文
Nature AI使用政策：https://www.nature.com/nature-portfolio/editorial-policies/ai
《Weapons of Math Destruction》：算法霸权，关于AI偏见的经典书籍
Google AI Principles：https://ai.google/responsibility/principles/