尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

信息论基础 | 第五章 编码理论

信息论基础 | 第五章 编码理论
📅 发布时间:2026/6/20 1:08:29

2025-11-10 11:02:47 星期一

5.1 关于编码的例子

首先给出定义
定义 关于随机变量 \(X\) 的信源编码 \(C\) 是从 \(X\) 的取值空间 \(\mathcal{X}\) 到 \(\mathcal{D}^*\) 的一个映射,其中 \(\mathcal{D}^*\) 表示 \(D\) 元字母表 \(D\) 上有限长度的字符串构成的集合。用 \(C(x)\) 表示 \(x\) 的码字并用 \(l(x)\) 表示 \(C(x)\) 的长度。

例题 \(C(\text{红})=00\),\(C(\text{蓝})=11\) 是 \(\mathcal{X}=\{\text{红}, \text{蓝}\}\) 关于字母表 \(D=\{0,1\}\) 的一个信源编码。

定义 设随机变量 \(X\) 的概率密度函数为 \(p(x)\),定义信源编码 \(C(x)\) 的期望长度 \(L(C)\) (expected length) 为

\[L(C)=\sum_{x\in\mathcal{X}} p(x) l(x) \]

其中 \(l(x)\) 表示对应于 \(x\) 的码字长度。

不失一般性,可假定 \(D\) 元字母表为 \(D=\{0,1,\cdots,D-1\}\)。

下面我们逐步对编码的定义条件作进一步的限制。

定义 如果编码将 \(X\) 的取值空间中的每个元素映射成 \(\mathcal{D}^*\) 中不同的字符串,即

\[x_1 \neq x_2 \Rightarrow C(x_1) \neq C(x_2) \]

则称这个编码是非奇异的(nonsingular)。

注:上面的所谓非奇异,用数学的话术就是"单射"。并且非奇异不能保证可译性。

为此我们引入:
定义 编码 \(C\) 的扩展 (extension) \(C^*\) 是从 \(\mathcal{X}\) 上的有限长字符串到 \(\mathcal{D}\) 上的有限长字符串的映射,定义为

\[C(x_1,x_2,\cdots,x_n) = C(x_1)C(x_2)\cdots C(x_n) \tag{5-5} \]

其中 \(C(x_1)C(x_2)\cdots C(x_n)\) 表示相应码字的串联。

例 5.1.4 若 \(C(x_1)=00\), \(C(x_2)=11\),则 \(C(x_1,x_2)=0011\)。

定义 如果一个编码的扩展编码是非奇异的,则称该编码是唯一可译的 (uniquely decodable)。

换言之,惟一可译码的任一编码字符串只来源于惟一可能的信源字符串。尽管如此,仍然可能需要通过整个编码字符串,才能最终确定信源字符串。甚至有时对于确定字符串中的第一个字符,我们也必须这样。

定义 若码中无任何码字是其他码字的前缀,则称该编码为前缀码 (prefix code) 或即时码 (instantaneous code)。

例子:考虑A=0 B=10 C=110 D=1110, 在这个编码里面,没有任何码字是其他码字的前缀,这就是前缀码
image

关系:非奇异不一定唯一可译,唯一可译但不一定是即时码


5.2 Kraft不等式

定理 5.2.1(Kraft不等式,前缀码存在定理):对于 \(D\) 元字母表,存在码字长度为 \(l_1, l_2, \ldots, l_m\) 的前缀码的充要条件是这些码字长度满足 Kraft 不等式:

\[\sum_{k=1}^m D^{-l_k} \leq 1 \]

证明:
必要性。我们构建一个D叉树,设码字的最大长度为 \(l_{\text{max}}\),那么作为D叉树而言,树的最底层最多有 \(D^{l_{\text{max}}}\) 个元素。现在选取码长为 \(l_i\) 的码字,由于是前缀码,不能是别的码字的"前缀",所以该码字的节点以后就没有分叉了,该码字独占了子树,若没有独占,那么该子树延伸到最底层的时候,应该有 \(D^{l_{\text{max}}-l_i\) 个元素,那么我们对 \(i\) 求和,就得到了 \(\sum_i D^{l_{\text{max}}-l_i} \le D^{l_{\text{max}}}\),同时除掉 \(D^{l_{\text{max}}}\) 就得到了该不等式。

充分性。首先我们将码字长度按照从小到大排序,从一个空的D叉树开始,第一个深度为 \(l_1\) 的节点记为第一个码字1(由必要性部分的证明,这样会去掉最底层的 \(D^{l_{\text{max}}}-D^{l_1}\) 个节点),在剩余的节点中,寻找第一个深度为 \(l_2\) 的节点,记为第二个码字2,这样会去掉最底层的 \(D^{l_{\text{max}}}-D^{l_2}\) 个节点,以此类推。

这个算法可以进行下去的原因就在于Kraft不等式。我们从归纳法的角度考虑,在我们准备分配第 \(k\) 个码字的时候,我们已经分好了前面 \(k-1\) 个码字,此时我们已经在底层 \(D^{l_{\text{max}}}\) 个节点里面去掉了 \(\sum_{i=1}^{k-1} D^{l_{\text{max}} - l_i}\) 个节点,由Kraft不等式,\(\sum_{i=1}^{m} D^{-l_i} \leq 1\),对于前面 \(k-1\) 个码字而言,显然 \(\sum_{i=1}^{k-1} D^{-l_i} < \sum_{i=1}^{m} D^{-l_i} \leq 1\),同时乘 \(D^{l_{\text{max}}}\),\(\sum_{i=1}^{k-1} D^{l_{\text{max}} - l_i} < D^{l_{\text{max}}}\),这个不等式告诉我们,即使我们移除了前 \((k-1)\) 个码字的所有后代,底层仍然有节点剩余。既然底层还有节点剩余,那么在树的第 \(l_k\) 层,必然存在节点,其通往底层的整条路径都还没有被之前的码字阻断。

综上,前缀码的存在性就证明了。

例题:现有码字 00, 01, 11, 100, 10100, 10101, 10110, 10111,验证 Kraft 不等式。

解:这些码字对应的码长分别为:

  • 00, 01, 11:长度 2
  • 100:长度 3
  • 10100, 10101, 10110, 10111:长度 5

使用二进制字母表 (\(D=2\)),计算 Kraft 和:

\[\sum D^{-l_i} = 3 \times 2^{-2} + 1 \times 2^{-3} + 4 \times 2^{-5} = \frac{3}{4} + \frac{1}{8} + \frac{4}{32} = 0.75 + 0.125 + 0.125 = 1 \]

由于 Kraft 和等于 1,满足 Kraft 不等式,因此存在具有这些码长的前缀码。

相关新闻

  • 2025 年 11 月桥架厂家推荐排行榜,电缆桥架,梯级式桥架,快速连接桥架,托盘式桥架,不锈钢桥架,深联桥架公司推荐
  • 十类图片深度学习提升准确率(0.9317) - 实践
  • conda相关命令

最新新闻

  • Linux Wi-Fi实战指南:88x2bu Wi-Fi 热点实战调试
  • Python毕业设计-基于 Django 框架的高校县志文献捐赠与借阅系统设计与实现 面向青岛滨海学院的县志资料信息管理系统的设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等)
  • 如何通过Space Thumbnails在Windows资源管理器中实现3D模型可视化预览
  • OpenClaw+飞书AI工作流:声明式Skill编排与企业级落地实践
  • 深入解析LPC2387:ARM7架构、双AHB总线与外设协同设计实战
  • 汽车照明驱动芯片MC17XSF500:通信保护与故障诊断机制深度解析

日新闻

  • 信任的进化:技术实现详解——如何用JavaScript构建博弈论模拟器
  • Terrakube自定义工作流:如何集成OPA、Infracost等工具扩展IaC能力
  • grunt-concurrent快速入门:5分钟学会并行运行Grunt任务

周新闻

  • 3步解锁iOS设备:applera1n激活锁绕过完全指南
  • 39 2026 人工智能证书终极盘点,普通人选 AI 证书可以从这些方向入手
  • Redis 暴露公网有多危险?从端口检查到补救步骤

月新闻

  • 【总结】入门篇:50句话让你记住架构核心概念
  • WeChatMsg技术方案解析:实现Mac微信数据自主管理的完整解决方案
  • WeChatMsg:革新性微信数据备份方案,打造你的专属数字记忆库

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号