接着,孙老师深入浅出地剖析了AlphaFold系列模型的技术细节。他指出,AlphaFold2通过端到端学习和注意力机制,直接预测蛋白质三维结构,避免传统物理模型的能量优化难题;而AlphaFold3则创新性地引入扩散模型架构,支持多序列输入,可预测蛋白质复合物及小分子结合结构,为药物研发提供关键支撑。
他还分享了蛋白质设计领域的最新进展。David Baker团队通过逆向思维,从目标结构反推序列,提出Alphafold diffusion模型,将设计成功率从千分之一提升至30%,推动蛋白质设计从“微调”迈向“从头设计”新阶段。
在互动提问环节,同学们围绕数据质量、模型解释性、柔性对接等难题踊跃提问。孙老师回应到,在数据清洗方面,可通过模型筛选和人工复核提升数据质量;针对蛋白质动态结构预测,他认为可借鉴冷冻电镜密度云特征,结合分子动力学模拟探索动态性质。谈及“DNA 语义大模型”前景时,他直言,若模型规模扩大无法显著降低预测困惑度,则可能偏离科学规律本身,需警惕“为大而大”的研究陷阱。
LISTENING
孙思琦老师在本次学术下午茶中不仅梳理了AI在蛋白质研究中的技术脉络,更展现了跨学科研究的魅力与挑战。正如孙老师在结语中所说:“科学突破往往诞生于学科交叉的‘无人区’,期待更多研究者以好奇心为引,在AI与生命科学的交叉领域开拓新可能。”随着人工智能与基础科学的深度融合,一个“AI驱动科学发现”的全新时代正加速到来,而这场充满思辨与创新的学术讨论,正是探索未来的起点。
图文丨王霏、张思源
排版丨张思源
审核丨薛磊 蒋益明