当前位置：首页 > news >正文

从前做NLP要8天，现在写几个Prompt20分钟搞定

news 2026/6/8 0:19:17

文章目录

- 前言
- 先看效果：五个任务，一杯咖啡的时间
- 背景：这条路为什么被掀翻了
- 核心原理：Prompt为什么有效
- 技术栈：简单到不好意思说
- 实战：五个任务，五段Prompt
- - 任务一：情感分析
  - 任务二：愤怒检测
  - 任务三：信息提取（结构化输出）
  - 任务四：多维度一次性提取
  - 任务五：主题推断
- 批量处理：一条是Demo，一万条才是生产
- 三个Prompt写法的铁律
- - 铁律一：用分隔符隔开指令和数据
  - 铁律二：明确指定输出格式
  - 铁律三：限制输出范围
- 什么时候别用Prompt方案
- - 场景一：需要极高精度
  - 场景二：需要离线部署
  - 场景三：数据敏感不能上云
  - 场景四：成本考量
- 写在最后

P.S. 目前国内还是很缺AI人才的，希望更多人能真正加入到AI行业，共同促进行业进步，增强我国的AI竞争力。想要系统学习AI知识的朋友可以看看我精心打磨的教程 http://blog.csdn.net/jiangjunshow，教程通俗易懂，高中生都能看懂，还有各种段子风趣幽默，从深度学习基础原理到各领域实战应用都有讲解，我22年的AI积累全在里面了。注意，教程仅限真正想入门AI的朋友，否则看看零散的博文就够了。

前言

上周产品经理跟我说："哥，评论区要上个情感分析，再抽个品牌名，再搞个愤怒检测，再来个主题归纳……下周上线哈。“我当场给他表演了一个"职业性微笑”——嘴角在上扬，眼神已经死了。

搁以前，这种需求我得先打开招聘网站看看算法工程师月薪多少，然后发现招不起，最后自己硬着头皮上。收集数据三天，标注数据三天，选模型一天，训练两天，调参两天，部署一天——整整八天！八天是什么概念？足够我看完《甄嬛传》两遍，还能学会跳惊鸿舞。

但上周那个需求，我二十分钟搞定了。产品经理以为我找了外包，其实我就写了几个Prompt。他看我的眼神，就像看一个会变魔术的骗子。

先看效果：五个任务，一杯咖啡的时间

给你们看看效果。我拿了条评论，跑了五个NLP任务。原始评论如下：

“我需要一盏漂亮的卧室灯，这款灯具有额外的储物功能，价格也不算太高。我很快就收到了它。在运输过程中，我们的灯绳断了，但是公司很乐意寄送了一个新的。几天后就收到了。这款灯很容易组装。我发现少了一个零件，于是联系了他们的客服，他们很快就给我寄来了缺失的零件！在我看来，Lumina是一家非常关心顾客和产品的优秀公司！”

五个Prompt，五个结果，全部秒回。情感分析？正面。愤怒检测？否。信息提取？JSON直接能用。多维度提取？一次调用四个维度全出来。主题归纳？五个关键词，干净利落。

整个过程零训练，零标注，零GPU。我的显卡风扇都没转一下，感觉受到了侮辱。

背景：这条路为什么被掀翻了

过去几年，做NLP就一条路：收集数据→标注→选模型→训练→调参→部署。每个任务一个独立模型，情感分析一个，实体提取一个，文本摘要又一个。搞完这一套，你的青春也结束了。

但现在，大语言模型把这条路掀翻了。原因很简单：LLM在预训练阶段已经"见过"了几乎所有互联网文本。你不需要再教它"什么是情感"，你只需要用Prompt把它已经会的知识唤醒。

这就像——你不需要重新造一个计算器，你只需要知道哪个按钮是开根号。你不需要重新培养一个大学生，你只需要叫醒那个已经在图书馆睡了二十年的学霸。

核心原理：Prompt为什么有效

很多人写Prompt凭感觉，但我建议先理解背后的逻辑。Prompt本质上是在激活LLM内部的特定知识回路。你写"判断这段评论的情感"，LLM内部就会激活语言理解模块、情感识别模块、格式生成模块。

好的Prompt等于精准定位加清晰指令加明确格式。就像你给外卖员发地址：不说"大概在东边"，而是说"小区三号楼二单元，进门左转，电梯上五楼，敲门别按门铃因为门铃坏了"。越具体，越不会出错。

为什么LLM能做这么多任务？因为BERT训练时只学习"做完形填空"这一个任务，而GPT训练时学习"预测下一个词"，然后发现——预测得足够准之后，它自然就学会了翻译、摘要、问答、情感分析……所有任务。这就是"涌现能力"：当模型大到一定程度，它突然就能做你没专门训练过的事情。就像你吃胖到一定程度，突然发现自己会游泳了——虽然没人教过你。

技术栈：简单到不好意思说

整个项目只有两个依赖：openai和dotenv。代码加起来不到五十行。我都不好意思说这是个"项目"，感觉就像用两根筷子搭了个埃菲尔铁塔，然后告诉别人这是建筑学奇迹。

最骚的是，所有兼容OpenAI接口的LLM都适用这套代码。换一个baseURL，换一套模型，一行代码都不用改。以前换模型叫"迁移学习"，现在叫"改个网址"。技术进步的尽头，原来是Ctrl+C Ctrl+V。

npm install openai dotenv

目录结构就四个文件，核心代码不到五十行，覆盖了五个NLP任务。技术栈不重要，DeepSeek、OpenAI、Claude、千问，随便哪个兼容OpenAI接口的服务都行。

实战：五个任务，五段Prompt

任务一：情感分析

核心技巧就六个字：“用一个单词回答”。就这六个字，值我少写三百字的正则表达式。不加这句，LLM能给你输出一篇《论该产品评论的情感倾向及其对消费者行为的影响》——我要这玩意儿干啥？我要的是"正面"两个字，好让数据库直接存进去！

constprompt=`以下用三个反引号分隔的产品评论的情感是什么？ 用一个单词回答：正面 或 负面 或 中性 评论文本：\`\`\`${review}\`\`\``;

任务二：愤怒检测

我就问：“愤怒吗？是或否。“简单到令人发指。Prompt越简单，LLM越稳定。这道理就跟谈恋爱一样——你问"你今天是不是生气了”，比问"请从原生家庭、工作压力、情感需求三个维度分析你当下的情绪波动”，得到的答案靠谱一百倍。

constprompt=`以下用三个反引号分隔的产品评论是否表达了愤怒？ 给出是或否的答案。 评论文本：\`\`\`${review}\`\`\``;

任务三：信息提取（结构化输出）

这是最爽的。我让LLM从评论里抽商品名和品牌，格式化成JSON。下游代码直接JSON.parse()就能用。我还加了兜底：“找不到就写未知”。不然LLM找不到品牌的时候，可能给你编一个——比如评论里明明没提品牌，他给你输出个"苹果"，因为苹果在他脑子里太深刻了，跟刻进DNA似的。

constprompt=`从评论文本中识别以下项目： - 评论者购买的商品 - 制造该物品的公司 评论文本用三个反引号分隔。 将响应格式化为以"product"和"brand"为键的JSON对象。 如果信息不存在，请使用"未知"作为值。 评论文本：\`\`\`${review}\`\`\``;

任务四：多维度一次性提取

以前要三个模型，现在一个Prompt搞定。情绪、愤怒、商品、品牌，一次API调用全出来。anger字段我还特意要求布尔值，不是字符串。为啥？因为后端哥们跟我说：“哥，你上次给我字符串’false’，我if判断了一下午，头发都掉了三根。”

constprompt=`从评论文本中识别以下项目： - 情绪（正面或负面） - 是否表达了愤怒？（是或否） - 评论者购买的商品 - 制造该物品的公司 评论用三个反引号分隔。 将响应格式化为JSON对象，以"sentiment"、"anger"、"product"、"brand"为键。 如果信息不存在，请使用"未知"作为值。 让你的回复尽可能简短。 将anger值格式化为布尔值。 评论文本：\`\`\`${review}\`\`\``;

任务五：主题推断

我限定"五个主题，一到两个中文词"。不加限制，LLM能给你输出二十个主题，每个还是一句话。就像你问朋友"晚饭吃啥"，他说"火锅、烧烤、日料、法餐、家常菜、外卖、自己做、不吃减肥、随便、你定"——说了等于没说，听了等于没听。

constprompt=`确定以下给定文本中讨论的五个主题。 每个主题用一到两个中文单词概括。 输出时用逗号分隔。 给定文本：${story}`;

批量处理：一条是Demo，一万条才是生产

我写了段代码批量跑，同一个评论，改Prompt的聚焦点——“聚焦在产品运输上”、“聚焦在价格和质量上”——就能生成完全不同视角的摘要。一个模型，N种切面。这就像同一把菜刀，既能切片又能切丝还能拍蒜——虽然拍蒜可能会把刀拍断，但那是另一个故事了。

import{getCompletion}from"./completion.mjs";constreviews=[`这个熊猫公仔是我给女儿的生日礼物...`,`这款卧室灯有额外的存储空间...`,`电动牙刷的电池续航令人印象深刻...`,`11月以$49的优惠价买的搅拌机...`];for(letreviewofreviews){constprompt=`...`;console.log(awaitgetCompletion(prompt));}