当前位置: 首页 > news >正文

从前做NLP要8天,现在写几个Prompt20分钟搞定

文章目录

    • 前言
    • 先看效果:五个任务,一杯咖啡的时间
    • 背景:这条路为什么被掀翻了
    • 核心原理:Prompt为什么有效
    • 技术栈:简单到不好意思说
    • 实战:五个任务,五段Prompt
      • 任务一:情感分析
      • 任务二:愤怒检测
      • 任务三:信息提取(结构化输出)
      • 任务四:多维度一次性提取
      • 任务五:主题推断
    • 批量处理:一条是Demo,一万条才是生产
    • 三个Prompt写法的铁律
      • 铁律一:用分隔符隔开指令和数据
      • 铁律二:明确指定输出格式
      • 铁律三:限制输出范围
    • 什么时候别用Prompt方案
      • 场景一:需要极高精度
      • 场景二:需要离线部署
      • 场景三:数据敏感不能上云
      • 场景四:成本考量
    • 写在最后

P.S. 目前国内还是很缺AI人才的,希望更多人能真正加入到AI行业,共同促进行业进步,增强我国的AI竞争力。想要系统学习AI知识的朋友可以看看我精心打磨的教程 http://blog.csdn.net/jiangjunshow,教程通俗易懂,高中生都能看懂,还有各种段子风趣幽默,从深度学习基础原理到各领域实战应用都有讲解,我22年的AI积累全在里面了。注意,教程仅限真正想入门AI的朋友,否则看看零散的博文就够了。

前言

上周产品经理跟我说:"哥,评论区要上个情感分析,再抽个品牌名,再搞个愤怒检测,再来个主题归纳……下周上线哈。“我当场给他表演了一个"职业性微笑”——嘴角在上扬,眼神已经死了。

搁以前,这种需求我得先打开招聘网站看看算法工程师月薪多少,然后发现招不起,最后自己硬着头皮上。收集数据三天,标注数据三天,选模型一天,训练两天,调参两天,部署一天——整整八天!八天是什么概念?足够我看完《甄嬛传》两遍,还能学会跳惊鸿舞。

但上周那个需求,我二十分钟搞定了。产品经理以为我找了外包,其实我就写了几个Prompt。他看我的眼神,就像看一个会变魔术的骗子。

先看效果:五个任务,一杯咖啡的时间

给你们看看效果。我拿了条评论,跑了五个NLP任务。原始评论如下:

“我需要一盏漂亮的卧室灯,这款灯具有额外的储物功能,价格也不算太高。我很快就收到了它。在运输过程中,我们的灯绳断了,但是公司很乐意寄送了一个新的。几天后就收到了。这款灯很容易组装。我发现少了一个零件,于是联系了他们的客服,他们很快就给我寄来了缺失的零件!在我看来,Lumina是一家非常关心顾客和产品的优秀公司!”

五个Prompt,五个结果,全部秒回。情感分析?正面。愤怒检测?否。信息提取?JSON直接能用。多维度提取?一次调用四个维度全出来。主题归纳?五个关键词,干净利落。

整个过程零训练,零标注,零GPU。我的显卡风扇都没转一下,感觉受到了侮辱。

背景:这条路为什么被掀翻了

过去几年,做NLP就一条路:收集数据→标注→选模型→训练→调参→部署。每个任务一个独立模型,情感分析一个,实体提取一个,文本摘要又一个。搞完这一套,你的青春也结束了。

但现在,大语言模型把这条路掀翻了。原因很简单:LLM在预训练阶段已经"见过"了几乎所有互联网文本。你不需要再教它"什么是情感",你只需要用Prompt把它已经会的知识唤醒。

这就像——你不需要重新造一个计算器,你只需要知道哪个按钮是开根号。你不需要重新培养一个大学生,你只需要叫醒那个已经在图书馆睡了二十年的学霸。

核心原理:Prompt为什么有效

很多人写Prompt凭感觉,但我建议先理解背后的逻辑。Prompt本质上是在激活LLM内部的特定知识回路。你写"判断这段评论的情感",LLM内部就会激活语言理解模块、情感识别模块、格式生成模块。

好的Prompt等于精准定位加清晰指令加明确格式。就像你给外卖员发地址:不说"大概在东边",而是说"小区三号楼二单元,进门左转,电梯上五楼,敲门别按门铃因为门铃坏了"。越具体,越不会出错。

为什么LLM能做这么多任务?因为BERT训练时只学习"做完形填空"这一个任务,而GPT训练时学习"预测下一个词",然后发现——预测得足够准之后,它自然就学会了翻译、摘要、问答、情感分析……所有任务。这就是"涌现能力":当模型大到一定程度,它突然就能做你没专门训练过的事情。就像你吃胖到一定程度,突然发现自己会游泳了——虽然没人教过你。

技术栈:简单到不好意思说

整个项目只有两个依赖:openai和dotenv。代码加起来不到五十行。我都不好意思说这是个"项目",感觉就像用两根筷子搭了个埃菲尔铁塔,然后告诉别人这是建筑学奇迹。

最骚的是,所有兼容OpenAI接口的LLM都适用这套代码。换一个baseURL,换一套模型,一行代码都不用改。以前换模型叫"迁移学习",现在叫"改个网址"。技术进步的尽头,原来是Ctrl+C Ctrl+V。

npm install openai dotenv

目录结构就四个文件,核心代码不到五十行,覆盖了五个NLP任务。技术栈不重要,DeepSeek、OpenAI、Claude、千问,随便哪个兼容OpenAI接口的服务都行。

实战:五个任务,五段Prompt

任务一:情感分析

核心技巧就六个字:“用一个单词回答”。就这六个字,值我少写三百字的正则表达式。不加这句,LLM能给你输出一篇《论该产品评论的情感倾向及其对消费者行为的影响》——我要这玩意儿干啥?我要的是"正面"两个字,好让数据库直接存进去!

constprompt=`以下用三个反引号分隔的产品评论的情感是什么? 用一个单词回答:正面 或 负面 或 中性 评论文本:\`\`\`${review}\`\`\``;

任务二:愤怒检测

我就问:“愤怒吗?是或否。“简单到令人发指。Prompt越简单,LLM越稳定。这道理就跟谈恋爱一样——你问"你今天是不是生气了”,比问"请从原生家庭、工作压力、情感需求三个维度分析你当下的情绪波动”,得到的答案靠谱一百倍。

constprompt=`以下用三个反引号分隔的产品评论是否表达了愤怒? 给出是或否的答案。 评论文本:\`\`\`${review}\`\`\``;

任务三:信息提取(结构化输出)

这是最爽的。我让LLM从评论里抽商品名和品牌,格式化成JSON。下游代码直接JSON.parse()就能用。我还加了兜底:“找不到就写未知”。不然LLM找不到品牌的时候,可能给你编一个——比如评论里明明没提品牌,他给你输出个"苹果",因为苹果在他脑子里太深刻了,跟刻进DNA似的。

constprompt=`从评论文本中识别以下项目: - 评论者购买的商品 - 制造该物品的公司 评论文本用三个反引号分隔。 将响应格式化为以"product"和"brand"为键的JSON对象。 如果信息不存在,请使用"未知"作为值。 评论文本:\`\`\`${review}\`\`\``;

任务四:多维度一次性提取

以前要三个模型,现在一个Prompt搞定。情绪、愤怒、商品、品牌,一次API调用全出来。anger字段我还特意要求布尔值,不是字符串。为啥?因为后端哥们跟我说:“哥,你上次给我字符串’false’,我if判断了一下午,头发都掉了三根。”

constprompt=`从评论文本中识别以下项目: - 情绪(正面或负面) - 是否表达了愤怒?(是或否) - 评论者购买的商品 - 制造该物品的公司 评论用三个反引号分隔。 将响应格式化为JSON对象,以"sentiment"、"anger"、"product"、"brand"为键。 如果信息不存在,请使用"未知"作为值。 让你的回复尽可能简短。 将anger值格式化为布尔值。 评论文本:\`\`\`${review}\`\`\``;

任务五:主题推断

我限定"五个主题,一到两个中文词"。不加限制,LLM能给你输出二十个主题,每个还是一句话。就像你问朋友"晚饭吃啥",他说"火锅、烧烤、日料、法餐、家常菜、外卖、自己做、不吃减肥、随便、你定"——说了等于没说,听了等于没听。

constprompt=`确定以下给定文本中讨论的五个主题。 每个主题用一到两个中文单词概括。 输出时用逗号分隔。 给定文本:${story}`;

批量处理:一条是Demo,一万条才是生产

我写了段代码批量跑,同一个评论,改Prompt的聚焦点——“聚焦在产品运输上”、“聚焦在价格和质量上”——就能生成完全不同视角的摘要。一个模型,N种切面。这就像同一把菜刀,既能切片又能切丝还能拍蒜——虽然拍蒜可能会把刀拍断,但那是另一个故事了。

import{getCompletion}from"./completion.mjs";constreviews=[`这个熊猫公仔是我给女儿的生日礼物...`,`这款卧室灯有额外的存储空间...`,`电动牙刷的电池续航令人印象深刻...`,`11月以$49的优惠价买的搅拌机...`];for(letreviewofreviews){constprompt=`...`;console.log(awaitgetCompletion(prompt));}

三个Prompt写法的铁律

铁律一:用分隔符隔开指令和数据

反引号把评论包起来,不然LLM会把你的指令当成评论分析。就像你跟你媳妇说"帮我拿一下那个红色的包",结果她以为你在描述包的颜色,而不是在发指令。边界感,很重要,无论是对LLM还是对婚姻。

铁律二:明确指定输出格式

你要JSON就写JSON,要布尔值就写布尔值。别含糊。含糊的Prompt就像含糊的需求——“做个好看的页面”,最后能收到十八个版本,个个不一样,个个不好看。

铁律三:限制输出范围

最多多少字,最多几个项目。不加限制,LLM会交一份毕业论文。这跟不给deadline的需求一样,程序员能给你拖到地老天荒,最后交上来的东西还跑不通。

什么时候别用Prompt方案

当然,Prompt不是万能药。这几个场景,乖乖回去调BERT。

场景一:需要极高精度

LLM情感分析精度大概85%到95%,大多数场景够用。但如果你的业务要求99%以上,比如金融风控、医疗诊断,LLM还是差点意思。毕竟你不敢让LLM帮你做心脏手术,对吧?虽然它可能真的会做,但我不敢躺上去。

场景二:需要离线部署

LLM API要联网,延迟200到500毫秒。如果你要毫秒级响应,比如实时风控,或者完全离线运行,比如嵌入式设备,传统模型更合适。你总不能让一个智能冰箱在断网的时候变成普通冰箱,那它存在的意义就只剩占地方了。

场景三:数据敏感不能上云

金融、医疗、政务,数据不能发到第三方API。不然法务部会请你喝茶——而且是不加糖不加奶、温度刚好烫嘴的那种。

场景四:成本考量

一条LLM API调用成本约0.001到0.01元,看着不多。但一天处理一千万条评论,成本就是1到10万元一天。对比之下,训练好的BERT推理成本接近零。Prompt是瑞士军刀,BERT是数控机床——切菜用军刀,造火箭用机床,各司其职,各安其位。

写在最后

所以朋友们,下次产品经理再提NLP需求,别急着打开招聘网站。先写个Prompt跑一下。大概率你会发现,以前花一周做的事,现在一杯咖啡的功夫就搞定了。而且这杯咖啡,还是公司免费提供的。

最后送大家一句话:BERT没有死,只是Prompt让它提前退休了。就像智能手机没有消灭相机,只是让卡片机变成了情怀。技术永远在迭代,但我们的头发,能少掉一根是一根。毕竟,植发很贵的。

P.S. 目前国内还是很缺AI人才的,希望更多人能真正加入到AI行业,共同促进行业进步,增强我国的AI竞争力。想要系统学习AI知识的朋友可以看看我精心打磨的教程 http://blog.csdn.net/jiangjunshow,教程通俗易懂,高中生都能看懂,还有各种段子风趣幽默,从深度学习基础原理到各领域实战应用都有讲解,我22年的AI积累全在里面了。注意,教程仅限真正想入门AI的朋友,否则看看零散的博文就够了。

http://www.rkmt.cn/news/1482971.html

相关文章:

  • 万亿级数据迁移实战与生产事故复盘
  • 终极指南:如何在Windows 11上完美运行经典DirectX游戏
  • Notepad-- 终极使用指南:跨平台文本编辑器的完整掌握手册
  • 2026年上海附近上门名酒回收机构排行及选择指南:上海五粮液回收/上海名酒回收电话/上海礼品回收/上海红酒回收/选择指南 - 优质品牌商家
  • 【LeetCode刷题日记】93.复原IP地址
  • CSDN爆款内容生成器背后的黑箱被拆解了:基于LSTM+时序聚类的选题生命周期预测模型(附训练数据集脱敏样本)
  • Python 爬虫项目 asyncio 协程异步抓取多页面公开资讯
  • 2026年室内装饰施工推荐,靠谱的品牌有哪些? - myqiye
  • 踩坑实录:多仓工程下AI Agent的七大治理原则
  • 成都涡轮快速门技术细节拆解与靠谱厂家判定逻辑:成都工业快速门、成都快速卷帘门、成都快速堆积门、成都快速提升门、成都快速门安装选择指南 - 优质品牌商家
  • 终极指南:如何在Linux上完美驱动Realtek WiFi 7网卡
  • 【飞机】飞机俯仰控制系统仿真【含Matlab源码 15598期】
  • AI编程15-重构与AI辅助代码改进:让AI帮你还技术债,代码可维护性提升200%
  • ComfyUI MixLab:革命性AI创作工作流转换器的创新突破
  • 2026 成都防水补漏服务商口碑测评榜单|全屋渗漏维修机构优选指南(6 月最新) - 宅安选房屋修缮
  • 2026 年机器人咖啡行业代表性企业盘点:技术与场景双驱动的行业标杆 - 中媒介
  • 国内十大品牌声誉优化机构 2026 年 6 月实测报告:全方面能力测评 + 权威推荐榜单 - 玖叁鹿
  • 2026年财产分割律师推荐,宁波江北这家靠谱 - mypinpai
  • Python 爬虫项目 Scrapy 爬虫数据直连 MySQL 入库实战
  • CSDN AI数字营销开通即开票?不看这篇,90%企业多缴税、晚报销、无法抵扣!
  • 2026东莞搬家公司推荐:精密仪器搬迁避坑指南 - 从来都是英雄出少年
  • Claude动态工作流:一人顶百人,AI流水线彻底解放双手
  • 2026 年 6 月国内小红书舆情处理公司精选 TOP10:全方面测评 + 企业危机应对首选推荐 - 玖叁鹿
  • 2026年手提袋小批量厂家费用多少,正诚品印刷性价比高吗? - mypinpai
  • 长三角拉布灯箱厂家实力排行:工艺与服务对标 - 奔跑123
  • 2026年实测10款降AI率软件推荐:免费与付费全对比,毕业论文淡化AIGC痕迹必看
  • 颠覆性视角:FutureRestore-GUI如何重新定义iOS设备固件恢复的全新范式
  • YOLOv12涨点改进| CVPR 2026 |独家创新、Conv卷积改进篇 | 引入ConvLoRA卷积模块,自动选择和优化关键层,保持高精度和高效推理速度,含A2C2f二次创新改进点,高效发论文
  • STM32F407上EC11旋转编码器的轮询+中断双模驱动代码包(含去抖与方向识别)
  • YOLOv12创新改进 | TIP一区 2025 | 涨点卷积改进篇 | 引入SFMB空间和频率增强 Mamba模块, 通过空间多尺度、通道增强和频域建模的互补机制,助力YOLOv12高效涨点