当前位置: 首页 > news >正文

【Doris从零到一】(一)Apache Doris 概述

Apache Doris 是一款基于 MPP 架构的高性能、实时分析型数据库,以高效、简单、统一著称:在亚秒级时间内返回海量数据查询结果,一套系统同时支持高并发点查询和高吞吐复杂分析。

一、核心优势

查询延迟:< 1 秒(亚秒级响应)
写入延迟:秒级(实时数据入库)
并发能力:10,000+ QPS
存储规模:PB 级 / 单集群数百台机器
SQL 接口:MySQL 协议兼容层,ANSI SQL 语法

二、典型使用场景

Apache Doris 广泛应用于以下三大类场景:

1、实时数据分析

企业内外部实时报表、仪表盘、用户行为分析、AB 实验平台、日志检索分析。
代表案例:

实时大屏看板:双十一订单量实时监控,秒级更新
用户画像分析:人群圈选与精准营销
日志检索分析:问题定位与性能优化

2、湖仓融合分析

统一数仓构建、数据湖联邦查询加速、混合负载分析。

3、混合检索分析(AI 数据栈)

在大模型时代,Apache Doris 深度融合文本搜索、向量搜索、AI 函数能力,构建从数据存储、检索到分析的完整 AI 数据栈。

场景说明
Agent Facing AnalyticsAI Agent 毫秒级实时决策(反欺诈检测、智能推荐)
混合检索与分析同时执行向量相似度搜索 + 关键词过滤 + 聚合分析,一条 SQL
RAG 应用企业知识库问答、智能客服、文档助手
语义搜索跨语言检索、同义词识别、意图理解
AI 可观测性模型训练监控、推理追踪、日志分析

Apache Doris 在单条 SQL 中融合结构化分析 + 全文检索 + 向量搜索能力,一套系统同时支持向量相似度搜索、关键词过滤和聚合分析,无需数据迁移和异构系统集成。结合 VARIANT 类型原生支持动态 JSON 结构和 Light Schema Change 秒级变更字段能力,为 RAG 应用、语义搜索、企业知识库等 AI 场景提供高效的数据支撑。

SELECT*FROMproductsWHEREmatch(query_vector,'summer breathable shoes')-- Vector similarity searchANDbodyMATCH'breathable lightweight'-- Full-text keyword searchANDcategory_id=1-- Structured filteringGROUPBYbrandORDERBYsales_countDESC;

三、系统架构

Apache Doris 高度兼容 MySQL 协议,支持标准 SQL,可通过各类客户端工具访问,与 BI 工具无缝集成。部署 Apache Doris 时,可以根据业务需求选择存算一体架构或存算分离架构。

1、存算一体架构

精简架构,包含两类进程:

Frontend (FE):接收请求、查询解析、元数据管理、节点管理
Backend (BE):数据存储、查询执行(多副本存储)

生产环境部署多个 FE 节点实现高可用,FE 节点分为 Master、Follower、Observer 三种角色。

2、存算分离架构(共享存储)

存储和计算分离,独立扩展存储容量和计算资源:

计算层:多个计算组,每组可作为独立租户
存储层:S3/HDFS/OSS 等共享存储

四、生态集成

Apache Doris 与主流数据生态深度集成。

http://www.rkmt.cn/news/1397538.html

相关文章:

  • Kubernetes服务网格:Istio的高级配置与最佳实践
  • STM32H745/55/47/57 内存RAM/SRAM 分布及特点
  • 用ESP8266和点灯App做个智能开关,5分钟搞定小爱同学语音控制(附完整代码)
  • 别再只会算平均效应了!用Python+DoWhy实战反事实推理,看看‘如果当初’会怎样
  • 从‘发热怪’到‘静音王’:手把手教你用磁珠曲线,搞定开关电源的EMI超标难题
  • 三菱FX5U PLC与上位机通信新选择:SLMP协议 vs MX Component插件,到底该怎么选?
  • 从零到一:基于STC89C52与HX711的高精度电子秤DIY全解析
  • 2026年5月专业的一建噪声防护课培训公司推荐厂家推荐榜,面授精讲、线上录播、一对一私教、考前密训、企业定制五种班型厂家选择指南 - 海棠依旧大
  • 从房价预测到猫图识别:用Python手把手复现吴恩达第二周逻辑回归实战
  • 2026年亚马逊还能做吗? - 易派
  • 2026年 东莞/广州溶剂厂家推荐榜:天那水、白电油、稀释剂、石脑油等工业溶剂源头厂商实力口碑精选 - 品牌企业推荐师(官方)
  • 基于 PLC 的磨线机和剥线机控制系统的设计与实现(设计源文件+万字报告+讲解)(支持资料、图片参考_降重降ai)_文章底部可以扫码
  • 【Agent 学习日记】我们来说说 Agent 的基础框架是什么?
  • 单例模式两种实现方法
  • MySQL 运维实战系列(七)mysql 主从配置
  • 超高速磨削试验台数字化设计与仿真分析【附仿真】
  • CANN 学习路线 - CANN学习路径规划与资源推荐
  • 从Wi-Fi到汽车:聊聊FMCW雷达技术怎么悄悄改变了我们的生活
  • ABAP:对外发布Web Service
  • 2026年食品级碳酸氢铵厂家名录:工业碳铵生产企业/工业级碳酸氢铵生产企业/工业级碳铵生产企业/食品碳酸氢铵生产企业/选择指南 - 优质品牌商家
  • 【图像检测】基于霍夫变换实现道路检测附Matlab代码
  • Cortex-R52启动地址限制与MPU配置解析
  • 小红书与中科院突破:反向学习法实现AI数学推理能力提升11.5分
  • Agent 性能优化实战:延迟、Token、并发三个维度怎么调
  • LFGB和FDA对食品接触材料的要求有何不同?
  • 从酒鬼掉崖到推荐系统:用Python模拟Random Walk算法,理解PageRank的数学基础
  • 端侧推理配方:鸿蒙系统上的模型部署与优化
  • 从RealSense D435i到BundleFusion:手把手构建离线三维重建数据流水线
  • 消息发送失败处理与 DLQ 补偿流程
  • 面向对象设计原则(一)