人工智能模型在黑色和女性患者中漏诊疾病
Hacker News 摘要原标题:AI models miss disease in Black and female patients
一项新研究发现,常用于检测胸部X光片的人工智能(AI)模型在检测黑色女性患者疾病时的准确率低于其他人群。这项研究发表在《科学进展》中,强调了对人工智能工具进行偏见监测的必要性。研究人员使用了来自波士顿近40万张胸部X光片的数据集以及相应的放射科医生报告,评估了名为CheXzero的AI模型。虽然CheXzero在分析X光片的疾病时与放射科医生的准确度相当,但在检测黑患者和女性时,模型漏掉病例的情况显著增加,特别是在40岁以下的患者中。
研究结果显示,黑色女性患者在遇到心脏扩大等疾病时,AI模型未能检测出病症的概率高达50%。此外,这种偏差在使用其他区域的胸部X光数据集进行测试时同样存在。研究团队通过测试CheXzero模型是否能精确识别患者的性别、年龄和种族,发现该模型能够以近80%的准确率预测种族,而三名经验丰富的放射科医生的准确率仅为50%。这表明,AI模型可能在分析X光片时存在一种“快捷方式”的偏见,即将某些特征与特定疾病关联,而不是全面评估病症。
为了减少这种偏见,研究人员尝试让CheXzero同时接收患者的种族、性别或年龄信息。结果显示,模型漏诊的比例有所降低,但这种改善因疾病类型而异。研究团队认为,原始数据集中的样本分布不均——如男性患者、40岁至80岁的人数较多以及白人患者占比更高——可能是导致模型偏见的根源。因此,他们呼吁使用更大且更具多样性的数据集来训练AI。
有专家指出,尽管减少偏见面临挑战,确保人类医生在使用AI过程中参与决策,仍然是必要的。他们主张先在小规模上识别和纠正AI模型的缺陷。
原文:https://www.science.org/content/article/ai-models-miss-disease-black-female-patients