蛋白质功能注释是理解生命活动、疾病机制和药物研发的核心。然而随着测序技术的爆发受限于高昂的实验成本只有不到 0.1% 的已知序列得到了功能验证。近年来人工智能AI的飞速发展为弥合这一“功能鸿沟”提供了强大动力。近日中南大学计算机学院李敏教授团队在国际期刊 Advanced Science 上发表了题为Artificial Intelligence Powers Protein Functional Annotation的综述论文。该文系统梳理了 AI 在基因本体GO和酶学委员会EC两大功能注释系统中的最新进展深度剖析了建模范式并为该领域的未来发展提供了方向。面对日益复杂的算法模型作者通过对数据模态和模型架构的深度剖析将现有方法划分为“六大建模范式”的系统性框架为理解 AI 在该领域的作用机理提供了统一视角序列驱动范式 (Sequence-based)、结构驱动范式 (Structure-based)、网络驱动范式 (Network-based)、本体驱动范式 (Ontology-based)、多模态融合范式 (Multimodal integration)、大语言模型范式 (LLM-based)。在此基础上文章针对GO和EC这两个互补的功能注释体系进行了全方位的介绍与比较从代表性算法的演进到针对不同应用场景如长尾分布、跨物种预测的性能评估从评价指标的选取到应对特定挑战的策略对比。这种全景式的评述不仅帮助研究者快速锁定合适的工具更深刻揭示了不同注释任务背后的技术难点。最后尽管AI已在蛋白质领域取得里程碑式成就但依然面临诸多挑战。作者从三方面指出未来面临的机遇与发展趋势包括“统一高效的生物数据表征建模”、“复杂生物环境建模”以及“领域专家大模型智能体 (LLM Agents) 开发”三个方向旨在全方位、高精度以及自动化加速蛋白质未知功能探索过程。1.功能注释示意图2.未来挑战示意图本文通讯作者为中南大学李敏教授第一作者为中南大学王文康博士。原文链接https://advanced.onlinelibrary.wiley.com/doi/10.1002/advs.202524373制版人十一 来源BioARt最全1000植物核基因组数据库IMP (点击图片直达)高颜值免费 SCI 在线绘图(点击图片直达)往期精品(点击图片直达文字对应教程)LinuxPythonR绘图NGS基础GEO高级生信自学生信书籍系列教程心得体会转录组经典宏基因组蛋白质组单细胞系列测序发展史免费在线画图色彩搭配图形排版图形解读ChIP-seqTCGAGSEAWGCNA海哥组学傻瓜系列文章写作CytoscapeExcelPPT机器学习公众号投稿联系陈同 chentong_biology163.com