当前位置: 首页 > news >正文

LLM-提示词(二)

什么是token? 大模型中token是指一段文本被分词后的处理单元,以汉字为例,分词后有可能是一个汉字,也可能是两个汉字,例如:我们是中国人,就会被分为“我们”“是”“中国”“人”,不同的模型token的长度是不一样的,但这里的token指的是模型单次输入输出的总和。


tiktoken是openai开源的分词器 ,之前我们说大模型是反复预测下一个词,其实更准确的说是预测下一个token,进行分词有助于大模型更好进行理解用户所要表达的意思,还有一些促使大模型进行准确输出的技巧,例如在openai中使用chatgpt,可以利用系统消息对用户消息进行分类,从而可以得出更具体正确的回答,这样做还有一个好处是可以确保用户负责任的使用系统,而不是以某种方式滥用系统,例如暴力,色情,诈骗等等。


在使用大模型的时候,用户可能会通过输入来试图操控系统,以绕过开发者设定的约束条件,这就是我们说的提示词注入,为了防止出现提示词注入,一般有两种处理方式,一种使用明确的分隔符对系统指令和用户消息进行区分,另一种是进行监督分类,就让我们上边所说的,利用系统指令对用户输入进行分类。


思维链推理:要求模型按照指定步骤逐步推理的过程,即我们的提示词可以写成步骤的方式,这有助于大模型可以更精准的理解用户的意图,从而做出更为恰当的回答。


链式提示词:当我们面对更为复杂的任务时,我们可以将任务拆解成一个一个小的任务,并将这些小任务连接起来构成一个工作流,它与思维链推理模式的区别就在于,它没有将所有的推理步骤同时提交给大模型,而是告诉大模型在什么状态下该干什么事,这样做的好处是缩小了任务指定阶段处理的数据量,节省了运行成本,同时还可以在特定步骤调用相应的工具。


我们构建好完整的prompt提示词工程后,一般可以通过制定一个评估标准,然后使用一个大模型对另一个大模型的输出进行持续评估记录,这有助于我们不断对应用进行持续监控优化,这种方式相比传统的模型训练优化要快捷有效的多。

http://www.rkmt.cn/news/30799.html

相关文章:

  • Windows下编译ffmpeg(MinGW+MSYS2)参考链接
  • 2025 年 10 月贵州旅游旅行社最新推荐,聚焦高端定制需求与全案交付能力
  • 2025 年 10 月贵州旅游旅行社最新推荐,实力品牌深度解析采购无忧之选!
  • 存储系统
  • 102302122许志安作业1
  • ARC201B Binary Knapsack
  • LDC
  • 完整教程:由JoyAgent观察AI Agent 发展
  • Spark计算引擎
  • 173天隧道技术篇防火墙组策略ICMPDNSSMB协议出网判断C2上线解决方案
  • 实用指南:3DGS 如何理解它?
  • 面试总被追问k8s调度器工作原理, 收藏 == 学废
  • 题解:十二重计数法
  • 2025 年 10 月厨房排烟、厨房排烟罩、厨房排烟系统厂家最新推荐,资质、案例、售后三维测评与选购指南
  • # Ubuntu 根目录空间扩展操作手册(基于 RAID 关联磁盘 /dev/sdb2)
  • Perplexity Comet AI浏览器「等待网络链接」解决方案
  • 新地球
  • 实用指南:Android 常见界面布局详解
  • 2025 年 10 月食堂厨房设备厂家最新推荐,聚焦资质、案例、售后的食堂场景深度解读
  • 基于深度学习神经网络协同过滤模型(NCF)的视频推荐体系
  • 给安卓设置背景色的时候保持默认按钮样式(关于使用setBackgroundColor导致丢失默认按钮样式的问题)
  • 分片上传与断点续传实现详解
  • Kanass入门到实战(6) - 如何进行缺陷管理 - 指南
  • 数据处理方法汇总
  • 2025 年 10 月展示柜厂家最新推荐,技术实力与市场口碑深度解析!
  • 2025年10月益生菌品牌推荐榜:全维度对比与榜单解读
  • 2025年10月美容仪品牌推荐:无创无痛对比评测榜
  • 2025年10月中国遗产继承律师推荐榜:五强对比全解析
  • php特性
  • 2025年10月深圳近视手术医生推荐榜:五强对比与口碑评价