尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

AI如何影响生物信息学的职业生涯?

AI如何影响生物信息学的职业生涯?
📅 发布时间:2026/6/23 18:48:20

分享一篇2025年10月13日来自Nature的职业专栏文章,题为《“我是否多余了?”——人工智能如何改变我在生物信息学的职业生涯》,作者是Lei Zhu。文章探讨了人工智能工具在生物信息学领域的崛起如何重塑研究者的角色,尤其是从“代码编写者”转变为“AI监督者”的过程。


当我在研究生阶段开始时,我首先需要做的就是选择一个研究方向。我加入的实验室主要专注于两个领域:功能实验和生物信息学。那是十多年前的事了,当时典型的流程是:生物信息学研究人员分析大型数据集,识别与特定表型或疾病相关的基因,然后将结果交给功能实验团队进行验证。

那时,生物信息学还是一个新兴且有前景的领域,我毫不犹豫地选择了这个方向。但我没有编程背景,因此起步非常艰难。我开始自学编程语言——先是Perl,然后是R和Python。

回顾过去,我对这个选择感到非常满意。那是一个令人兴奋的时代,转录组学、基因组学以及后来的单细胞生物学等高通量技术的快速发展,让我有大量数据可以分析。通过自己编写的代码解决生物学问题,让我获得了强烈的成就感。

后来,人工智能(AI)工具出现了,包括ChatGPT、Manus和Grok等。它们生成功能性代码的能力一度让我感到威胁,担心自己会因此变得“多余”。起初我并不太在意,因为AI生成的代码常常包含错误,只有在测试阶段才会暴露出来,需要人工调试。然而,新的“代理式”(agentic)操作模式可能是真正的游戏规则改变者。这些工具(如Manus)可以先生成代码,然后在云端直接运行,形成一个无缝的闭环:从我提出问题,到AI编写并执行代码,再到我收到结果。那一刻,我开始担忧:在这个AI时代,我还有必要存在吗?

如今的AI工具可以高效地编写用于生物学分析的代码。我只需上传数据并提供简单的提示,例如:“假设你是一位生物信息学专家,请根据你对上述数据集的理解,创建十个不同的可视化图表,并逐一展示,附上简短说明。”AI就能给出我需要的答案,有时甚至超出我的预期。那么,在这个过程中,我的角色到底是什么?

我在一次肺癌研究中找到了答案。我们有数百个肿瘤组织的基因表达数据,我让AI来设置分析流程。它完成得非常快,甚至生成了一份整洁的报告。初步结果看起来非常好——几乎太好了。AI识别出某个特定时间点前后基因表达水平存在统计学上的显著差异。但当我深入调查后发现,研究中途实验室更换了数据采集方式,AI捕捉到的其实是这个技术变化,而不是生物学意义上的差异。那个看似突破性的发现,其实只是一个“假象”。当我调整了这个变化后,差异变得不那么显著,但更贴近真实的生物学情况。

我意识到,我的角色已经从“写代码的人”转变为“监督AI的人”。现在更重要的是:提出清晰的问题、发现计算机无法察觉的问题,并对最终的结果负责。


给AI监督者的十条建议

人们常告诉我,可以通过“在提示中加入更多背景信息”让AI变得更聪明,但我的经验是,无论我提供多么详细的提示,AI总能找到误解的方式。过去几年里,我总结出了一些方法来反复验证AI的工作:

  1. 1. 建立验证集:保留一个你非常了解的小数据集(例如已发表或人工验证过的数据)作为阳性对照。在将新的AI分析流程应用于实际数据前,先用这个数据集测试。如果AI结果异常或不一致,你就能立刻发现问题。
  2. 2. 打乱数据:AI模型容易过拟合数据或被技术假象误导,就像我肺癌研究中的经历一样。为了验证某个发现是否具有生物学意义,可以打乱样本标签、轻微扰动数值或加入噪声。如果“显著模式”仍然存在,那它很可能是假象,而非真实信号。
  3. 3. 子集分析:如果数据集足够大,我会让AI对随机子集进行相同分析。如果结果在不同子集中一致,可信度更高;如果结果差异很大,可能说明发现不够稳健。
  4. 4. 检查假设:许多AI模型在分析数据时会默认某些统计假设(如数据服从正态分布、随时间线性变化、无混杂变量等)。这些假设往往不会被明确指出,但会显著影响分析结果。因此,我总是检查AI是否正确应用了统计方法。例如,如果它对非正态分布的数据使用了t检验,我会用Wilcoxon检验等非参数方法重新验证。
  5. 5. 重复简化提示:我发现,有时在提示中提供较少背景信息反而能得到更可靠的结果。如果我使用了非常详细的提示(例如指定了数据库和算法),我通常会用更简单的提示重复分析,看看是否得到相同结果。这有助于避免AI对提示词本身的“过拟合”。
  6. 6. 建立共识:市场上有许多AI工具,最好用多个工具运行相同分析。我使用一个名为ChatAlL的网络工具,可以同时将提示输入多个AI模型。如果不同工具结果一致,研究结论的可信度就更高。
  7. 7. 咨询专家:虽然AI能快速生成答案,但它并非全知全能,尤其是在面对复杂生物学问题时。因此,我通常会将AI的结果请教领域内的同事,确保其符合当前生物学知识和实际应用背景。
  8. 8. 记录与复现:保留提示词、参数设置和中间结果,确保分析过程可追溯、可复现。
  9. 9. 保持批判性思维:AI不是科学家,它是工具。科学判断必须来自人类。
  10. 10. 持续学习:AI在进步,科学家也必须不断进步,才能与技术同步。

结语:AI重新定义了我的角色

与其说生成式AI削弱了我的作用,不如说它重新定义了我的角色。它促使我成为一名更严谨的科学家。无论好坏,AI似乎都已经扎根于科研之中。我强烈建议大家拥抱这项技术——不是用它来取代你的专业知识,而是用它来放大你的能力。

DOI: https://doi.org/10.1038/d41586-025-03135-z

全基因组选择&智能设计育种全面升级

中国农业科学院领军人才《数量遗传学》高端视频课程|金秋限时特惠





本文来自博客园,作者:生物信息与育种,转载请注明原文链接:https://www.cnblogs.com/miyuanbiotech/p/19167297。若要及时了解动态信息,请关注同名微信公众号:生物信息与育种。

相关新闻

  • 如何整合多组学数据并利用机器学习算法进行基因组预测?
  • 2025 年 10 月门窗十大品牌榜单揭晓,专业制造与耐用售后口碑之选
  • [ICML2023]CLIPood Generalizing CLIP to Out-of-Distributions

最新新闻

  • Vue 3国际化实战:vue-i18n核心原理与工程化落地
  • Java FutureTask 深度解析:状态机、超时控制与线程中断原理
  • Qwen3.5+llama.cpp实测:216G显存跑262K上下文与120 tokens/s推理
  • RTA广告技术解析:从实时API原理到电商金融实战部署
  • Prisma + PostgreSQL 生产级落地指南:从连接配置到向量搜索
  • FEC以太网控制器:缓冲区描述符机制与嵌入式网络驱动开发实战

日新闻

  • Arduino-ESP32项目深度解析:解锁隐藏芯片支持与架构演进
  • 2026年 系统窗厂家/品牌推荐榜单:隔音系统窗+高端系统门窗的核心优势与选购指南 - 品牌发掘
  • NVBench:首个双语非言语发声语音合成评测基准详解与实践

周新闻

  • Visual C++运行库修复终极指南:5分钟快速解决Windows软件启动错误
  • 手把手教你构建统计局地区经济数据爬虫:从环境搭建到数据持久化全指南
  • 2026多Agent深度解析:用AI团队替代单一模型,四种架构实战落地

月新闻

  • 【总结】入门篇:50句话让你记住架构核心概念
  • WeChatMsg技术方案解析:实现Mac微信数据自主管理的完整解决方案
  • WeChatMsg:革新性微信数据备份方案,打造你的专属数字记忆库

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号