当前位置：首页 > news >正文

026、模型量化基础：浮点与整数量化

news 2026/5/29 2:20:02

026 模型量化基础：浮点与整数量化

一次让我通宵的部署事故

去年做的一个智能门锁项目，MCU是Cortex-M4内核，128KB SRAM，1MB Flash。模型在PC上跑FP32精度，识别准确率97.3%，完美。烧到板子上，内存直接爆了——模型权重占掉600多KB，Flash也塞不下。当时心想，这不就是典型的“PC上跑得欢，嵌入式就翻车”吗？

后来用TFLite Micro做量化，模型压缩到原来的四分之一，内存占用降到80KB，推理速度反而快了3倍。但代价是什么？准确率掉到了94.1%。客户说“门锁识别不准，你赔我误报费”。这就是量化的真实世界——没有免费的午餐，只有权衡的艺术。

浮点数在MCU上的奢侈

先看一个残酷的事实：Cortex-M0/M3/M4都没有硬件FPU（浮点运算单元），M4F才有。没有FPU的芯片，跑一次浮点乘法要调用软件库，几十个指令周期。而整数乘法，一个周期搞定。

FP32（单精度浮点）占用4字节，范围约±3.4×10³⁸，精度7位有效数字。但在嵌入式场景，我们真的需要这么宽的动态范围吗？传感器数据通常是12位ADC，范围0-4095；权重经过训练后，分布往往在[-1, 1]之间。用32位去表示一个只需要8位精度的数，就像用卡车运一颗鸡蛋。

量化的核心思想：用更少的比特数去近似表示浮点数，同时尽量保留原始信息。最常见的方案是INT8量化——把FP32映射到[-128, 127]的整数范围。

量化参数：scale和zero_point

http://www.rkmt.cn/news/1418181.html

相关文章：

告别臃肿GUI：用feh在Linux终端高效管理图片的5个实用技巧

技术项目避坑指南：如何识别并避免需求、方案与团队的错配

but this cluster currently has 8000/8000 maxinum shards open:es shard满

Unity数智人项目实战：手把手教你用C++源码实现AI语音交互（IL2CPP后端配置）

从光学干涉到代码：用OpenCV理解MTF算法背后的物理原理（保姆级图解）

027、模型剪枝：结构化与非结构化剪枝

别再折腾了！用Ubuntu 20.04的‘附加驱动’工具一键安装NVIDIA显卡驱动

不止于建模：用同元软控MWORKS.Syslab做数据分析和机器学习，一个被低估的科学计算环境

通过Python快速为你的安卓项目接入Taotoken多模型服务

通知文件加Logo抬头怎么才是透明底？logo抠图去底色秒出

别再傻傻分不清了！Linux系统里lib、lib64、lib32文件夹到底有啥用？

CANN runtime 内存池——高效显存管理策略

MyBatis-Plus 进阶实战｜告别只会CRUD！搞定企业级高频场景

Cursor AI Pro破解工具：智能解锁神器，告别试用限制的终极解决方案

基于Arduino与3D打印的BB-8球形机器人制作全攻略

徐州地铁旁高端写字楼

告别卡顿！在AMD笔记本（如R7 6800H）上用VMware流畅运行macOS开发环境的完整配置流程

食品包装AI质检时代来了，标签审核效率提升千倍

订单超时库存不释放？手把手教你用RabbitMQ死信队列实现自动解锁（SpringBoot实战）

保姆级教程：在Ubuntu Server 22.04上搞定图形桌面和VNC远程连接（含RealVNC账号注册避坑）

别再被Finder骗了！Mac里多出来的那个‘Macintosh HD’到底是什么？APFS卷组与firmlink机制全解析

3D打印热床附着力与高温PI胶带应用技术指南

用Python玩转强化学习：从‘赌徒问题’实战理解MDP的策略迭代与价值迭代

避坑指南：macOS重装/降级时，磁盘工具抹掉选项怎么选？APFS还是Mac OS扩展？

一文读懂AI人工智能：从概念到范式，小白也能秒懂

pdfClaw免登录在线PDF转Word

丰城高端全屋定制商家如何选择？

基于Arduino与MAX7219的复古LED点阵时钟DIY：从硬件选型到外壳制作

鼎讯信通 RM‑1000 高性能无线电综合测试仪：铁路通信电台检测优选

家常饮用养生酒，六味地黄酒暖心相伴