当前位置: 首页 > news >正文

大模型算法学习2026.6.1

主播是双非本211硕研0,计科本软工硕,之前了解过简单的机器学习和深度学习,目前打算冲大模型算法,同时准备agent应用开发作为planB。暂时打算是学cs224n、cs336和之前准备复试买的一个深度学习课,学完后做2个项目投小厂的算法实习,以后会不定期更新学习内容。

----------------------------------------------------------分割线--------------------------------------------------------------

Softmax函数作用:Softmax属于激活函数(activation function),Softmax函数的核心作用是将一组任意实数转换为总和为1、取值在0到1之间的概率分布,它通过指数运算放大数值间的差距,让较大数值对应的概率更突出、较小数值对应的概率被压缩,从而清晰呈现每个类别的置信度;该函数广泛用于深度学习的分类任务,在Transformer架构(含大语言模型)中,注意力机制权重计算和模型输出层预测下一个词的概率时都依赖Softmax,是连接模型原始分数与概率决策的关键函数。

分布语义学:一个单词的含义由经常出现在它附近的单词给出。

数据用100维、300维来表示是什么意思?

用100维、300维表示数据就是把一个原本复杂的事物(比如一个词、一张图、一个人)抽象成由100个或300个数字组成的列表(数学上叫“向量”),每一个数字都代表这个事物的某个潜在特征或属性,而这些特征通常是计算机从大量数据中自动学习出来的,不是我们人为定义的。比如,假设用300维的稠密向量表示“苹果”,第38维表示“水果”,第102维表示“手机”。当然维度越高表达能力越强,但计算成本和数据需求也越大。

word2vec:

word2vec 是一种用于从大规模无标注文本语料中学习词向量(Word Embedding)的浅层神经网络模型。由 Mikolov 等人在 Google 于 2013 年提出。其核心思想是分布式假设(Distributional Hypothesis):语义相似的词具有相似的上下文分布。通过预测目标词与其上下文词之间的共现关系,模型将每个词映射到一个低维、稠密的实值向量空间中,使得语义或语法相近的词在向量空间中距离较近。

http://www.rkmt.cn/news/1471050.html

相关文章:

  • Anthropic发布Opus 4.8,首次超越OpenAI
  • 《和死对头成亲后》小说|下载|txt
  • Altium Designer新手避坑:从PCB设计到Gerber文件导出的完整流程与常见错误排查
  • C# 索引器 this[]
  • 随着树木和非树木植被覆盖的扩大,全球人口暴露于城市绿地的不平等加剧
  • 从‘边缘’到‘语义’:手把手教你用TensorBoard逐层可视化ResNet的‘认知’过程(PyTorch版)
  • 保姆级教程:用ROS1在局域网内搞定两台机器人的主从通信(含rqt_graph可视化验证)
  • SpringBoot项目升级Swagger3.0后,swagger-ui.html 404?别慌,一个注解和依赖就搞定
  • HoRain云--Claude Code 开发配置
  • Meta:智能体自主发现高效混合架构
  • 告别打印插件!纯前端JS调用斑马打印机打印二维码的保姆级教程(附ZPL指令详解)
  • 安徽广告道闸服务商大揭秘,2026年05月口碑之选在此,升降柱/导轨伸缩门/电动悬浮门,广告道闸集成服务商选哪家 - 品牌推荐师
  • 别再硬写样式了!用uni-app的midButton属性5分钟搞定中间凸起TabBar(H5/小程序通用)
  • 3D高斯泼溅技术与GaussianSwap人脸交换系统解析
  • Vivado秒表进阶玩法:如何给你的FPGA计时器增加小数点显示和时分秒格式切换?
  • 网络排障不求人:手把手教你配置中兴ZXR10-3928A的端口镜像(附完整命令)
  • 2026年美国留学中介哪家好,机构排名推荐与选机构避坑全流程指南 - 环球新视野
  • 如何快速搭建虚拟显示器:Parsec VDD新手完整指南
  • 终端环境下 AI 图像识别与生成实战:从手绘草稿到精美插画的完整方案
  • 2026年驻马店青少年教育学校评测:青少年教育基地、青少年行为矫正基地、青春期休学孩子矫正学校、休学孩子疗愈基地选择指南 - 优质品牌商家
  • 2026年知名的人形机器人/机器人/送餐机器人/迎宾机器人高口碑品牌推荐 - 行业平台推荐
  • 2026年q2国内玻璃酒瓶生产厂家综合实力排行:化妆品玻璃瓶/橄榄油玻璃瓶/红酒瓶/膏霜玻璃瓶/实力盘点 - 优质品牌商家
  • 2026年质量好的PP-WAX/PVC专用蜡/EBS/FT-WAX精选推荐公司 - 品牌宣传支持者
  • 从 `ffmpeg -buildconf` 输出里,我们能解读出什么?一份FFmpeg编译配置的深度解析
  • 从V-REP 3.5到CoppeliaSim 4.9:机器人仿真软件版本变迁与老项目兼容性指南
  • 2026年专业电能质量静止无功发生器厂家top10盘点:成都电能质量静止无功发生器/实力盘点 - 优质品牌商家
  • 2026年6月煤矿安全设备厂家推荐,矿用自动洒水降尘装置用热释红外传感器,煤矿安全设备实力厂家口碑推荐 - 品牌推荐师
  • 别再手动传文件了!用Colab直接运行GitHub项目,5分钟搞定环境配置
  • PHPPHP与消息队列RabbitMQ集成
  • 2026年Q2重庆黄金回收店核心技术与服务全景解析 - 优质品牌商家