尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

拼音词典的野路子

拼音词典的野路子
📅 发布时间:2026/6/21 7:07:59

比如 王二姐 的 拼音是 wangerjie ,查词典时用下列字符串都要能找到:werj wangerj werjie

我们可以建个这样的目录树:wang/er/jie,然后用shell提供的glob去找 w*/er/j* 下的 所有文件,其中一个叫 王二姐 。

当然是开玩笑。首先每个目录/文件占了4KB,其次问了半天AI有无高效GLOB算法,它总免不了

for s in strings

fd is a 用Rust写的 program to find entries in your filesystem. It is a simple, fast and user-friendly alternative to find. 〔github〕

Regular expression (default) and glob-based patterns.
Very fast due to parallelized directory traversal.

Let's search my home folder for files that end in [0-9].jpg. It contains ~750,000 subdirectories and about a 4 million files. 

find耗时约20秒;fd约0.9秒。


 

我觉得vector<string>还是不快。

这样呢?每个音节定长6个字母,如"chuang", "wang--", "er----", "w?????" AI写不出针对这个的二分搜索。

我记得我以前用整数来表示音节,用了点位操作。这个感觉没啥意思,比较low.

华容道程序改用块的类型来判断重复局面后速度一下子快很多,比低层换map, hash等高档。

推箱子我想不出启发函数,不过好像也没人想了出来。


 

好像#include <regex>后,程序的编译速度就慢了很多,用上预编译头文件效果也不明显。

/usr/include/c++/12/tr1/regex 2727行

/usr/lib/llvm-14/include/c++/v1/regex 6833

但clang++比g++编译起来快一点点。

有些单头文件项目有点鸵鸟(头文件很长)。可能把#include <regex>的放在一个源文件里,定型后每次link它的.o才是最快的方式。


问AI RE2是Google开源的正则表达式库。在都编译了正则表达式的情况下,比C++ 11的regex快么?快多少?有实测数据么?

节选它的回答:

  • 根据参考信息,在都编译了正则表达式的情况下,RE2 通常比 C++11 的 std::regex 更快,但具体的性能提升幅度取决于具体的正则表达式模式和使用场景。‌
  • RE2采用确定性有限自动机(DFA)实现,避免了传统回溯引擎(如 PCRE、Python 的 re 模块)在复杂模式下可能出现的性能灾难(如指数级时间复杂度的“回溯爆炸”)。‌其最显著的特性是保证匹配时间‌线性‌于输入字符串的长度。‌
  • C++11 的 std::regex 是一个功能完整的正则表达式引擎,支持复杂的特性(如回溯、环视等),但这也意味着其实现更复杂,性能开销相对较大。‌虽然 std::regex 在编译后可以重复使用,但其底层实现(通常是基于 NFA 的)在处理某些复杂模式时,性能可能不如 RE2 稳定。‌
  • 对于动态正则表达式(如 std::regex),每次构造对象时都需要解析和编译模式字符串,这会产生显著的延迟。在 less_slow.cpp 的基准测试中,std::regex 的编译开销约为 ‌2000 纳秒‌。‌
  • 在长文本匹配场景下,std::regex 的单次匹配耗时约为 ‌22 微秒‌。‌
  • 如果您需要处理大量数据或对性能有严格要求,RE2 是一个值得考虑的选择。

 

相关新闻

  • 网络分析模型九
  • 抖音视频批量提取工具(增加新功能 ,新功能介绍),通过关键词搜索进行视频提取下载软件
  • 2025-11-18 vue3+ts项目报错:TypeError: Failed to fetch dynamically imported==》script没有指定使用lang=ts

最新新闻

  • 跨平台游戏串流方案选择与配置实战:打造你的专属游戏云
  • Fate/Grand Automata完整实战指南:高效配置F/GO安卓自动化战斗工具
  • Gemini 3.1 Pro国内合规落地:API直连+本地编排实战指南
  • 2026年抗抑菌剂/消毒产品检测机构推荐:广州市微生物研究所集团专业服务 - 品牌推荐官
  • 2025年厨房家居用品实力厂家推荐:青岛乐博智家密封罐/果盘/冷萃壶全系供应 - 品牌推荐官
  • CentOS 8 LAMP环境搭建与三重加固实战指南

日新闻

  • Visual C++运行库修复终极指南:5分钟快速解决Windows软件启动错误
  • 手把手教你构建统计局地区经济数据爬虫:从环境搭建到数据持久化全指南
  • 2026多Agent深度解析:用AI团队替代单一模型,四种架构实战落地

周新闻

  • Visual C++运行库修复终极指南:5分钟快速解决Windows软件启动错误
  • 手把手教你构建统计局地区经济数据爬虫:从环境搭建到数据持久化全指南
  • 2026多Agent深度解析:用AI团队替代单一模型,四种架构实战落地

月新闻

  • 【总结】入门篇:50句话让你记住架构核心概念
  • WeChatMsg技术方案解析:实现Mac微信数据自主管理的完整解决方案
  • WeChatMsg:革新性微信数据备份方案,打造你的专属数字记忆库

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号