首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >EdgeOne Web 防护×AI 升级:让 AI 既参与攻击识别,也参与误报纠错

EdgeOne Web 防护×AI 升级:让 AI 既参与攻击识别,也参与误报纠错

原创
作者头像
EdgeOne 小助手
发布2026-06-11 15:42:28
发布2026-06-11 15:42:28
150
举报

一、AI 业务正在改变 Web 防护的精度边界

随着大模型对话、AI 编程助手、AI 客服、AI 搜索等应用大规模上线,用户与系统之间的交互内容越来越接近"代码"——一句正常的请求可能包含 SQL 语法、HTML 片段、命令行结构。传统 Web 防护引擎在面对这类请求时,很容易误判为攻击载荷。

两个真实场景:

场景一:AI 对话接口的误拦

某 AI 大模型平台的对话窗口里,终端用户输入了一段 SQL语句,希望 AI 帮忙优化查询性能。这段请求在到达 AI 推理服务之前,先经过了部署在业务入口的 Web 防护引擎—从语法层面看,输入框里的内容确实是一段可执行的 SQL,命中了规则引擎里的 SQL 注入特征,请求被直接拦截。AI 后端从未收到这条对话,用户在前端看到的是一次失败的请求。

Web 防护并没有判断错;它只是无法判断"这句 SQL 在当前业务上下文中究竟是用户想让 AI 帮忙优化的素材,还是针对该 AI 平台自身数据库的注入攻击"。

场景二:零售采购订单的误拦

一家服装零售企业的供应商在采购系统中提交订单,字段中含 “order by 5-12”——表达"5月12日交货"。这段文本同时匹配 SQL 注入的特征模式(ORDER BY 后跟算术表达式),被规则引擎判定为攻击。

这类误判不是 Bug,是 Web 防护行业当前架构下的结构性代价

为了拦住越来越复杂的攻击变体,安全引擎引入了语义分析能力。语义引擎泛化能力的提升,伴随着误报率的同步上升。业内对这套架构的实测显示,部分场景下误报率可逼近甚至超过 25%——意味着每四个正常请求中就有一个被误拦。

二、EdgeOne 的做法:让 AI 在两个层面同时参与

EdgeOne 的方案是三层架构:规则引擎 + 自研语义引擎 + 旁路 AI 分析引擎。

第一层:规则引擎独立运行——已知攻击的精准消化

规则引擎是基础层。对已知 CVE 和固定特征攻击,正则匹配是最快最准的手段。

为什么不能跟语义引擎合并? 把规则匹配和语义分析放在一个模型里同时学,结果是规则匹配的精准度被语义引擎的泛化能力拉低。规则引擎独立运行的工程价值是:把绝大多数已知攻击在第一层就消化掉,让进入语义引擎的流量是"必须靠理解才能判断的部分"——语义引擎在更小的样本空间里工作,精度才能拉满。

第二层:自研语义引擎,按攻击类型独立建模

EdgeOne 采用自研语法级安全检测引擎,核心由 Bison/Flex 语法分析器与自定义语义评分函数组成。Hyperscan 做入口预过滤,Bison/Flex 按攻击类型独立语法文法做解析(SQLi 基于 MySQL 方言子集,XSS 围绕浏览器执行上下文多层解析)。不构建完整 AST,边解析边在 semantic action 中累计安全信号,输出结构化 RiskScore。对 SQL 注入、XSS、命令注入分别独立建模——不用一个通用模型一锅端。

为什么必须独立建模? SQL 注入和 XSS 在语法层面本质不同:

● SQL 注入关注的是数据库语句的可执行性——引号闭合、UNION 拼接、注释截断、ORDER BY 后的算术结构等

● XSS 关注的是脚本在浏览器的执行链条——标签嵌套、属性注入、事件触发、编码绕过等

● 命令注入又有自己的特征空间——管道、反引号、子shell

用同一个模型同时学这三件事,结果就是三件事都学得不够透。 通用模型必然在每一类上做妥协,每一类攻击的判别精度都做不到极致。EdgeOne 选择对每一类攻击单独建模、单独训练、单独调优——工程更重,但每一类的精度都能拉到上限。

测评数据(内部测评集):

● 单独语义引擎:拦截率超过 80%,误报率不到 0.1%,旁路 AI 分析引擎上线后,目标将线上误拦截率压至 0.01% 以下

● 规则 + 语义 + 少量加白的综合方案:召回率超过 95%

● 语义引擎能识别规则引擎覆盖不到的48种攻击变体——MSSQL 方言、PG_SLEEP、UNION 变形等。

当前进度

● SQL 注入:已上线运行

● XSS 跨站脚本:Q3 内上线

● 命令注入:Q3 内上线

● 三大主流 Web 攻击类型全覆盖:Q3 内上线

第三层:旁路 AI 分析引擎——误报纠错与策略自生成

模型再准,也覆盖不了所有客户的业务上下文。语义引擎在训练阶段没见过 “order by 5-12 表达 5月12日交货” 这种业务表达,也没见过用户在 AI 对话接口里随口让 AI 写 SQL 的语境——这些"看起来像攻击但意图完全正常"的请求,会一直留在残留误报里。

EdgeOne 的解法是在前两层引擎之外加一层旁路 AI 分析引擎——不直接拦截流量,对线上实时请求做聚合分析,自动识别两类异常:

大范围误拦:多个正常请求被语义引擎误判为攻击

定向攻击透传:某种特定攻击手法绕过了语义引擎

发现异常后,AI 分析引擎自动生成修正策略下发回前两层引擎。

这一层的每一个设计都对应一个具体的工程约束

旁路而不是串行运行——如果 AI 分析串行在请求链路上,每个请求都要等推理结束才能响应,业务延迟会无法接受。旁路意味着 AI 分析跟实时拦截是两条独立路径,互不阻塞。

聚合分析而不是单点判断——单条请求看不出是误拦还是攻击。order by 5-12 这条字符串孤立来看像 SQL 注入;只有把同业务接口、同时间窗口下的请求一起看,才能从"单条像攻击"变成"一群正常用户的相似行为"。

路径级而不是全局加白——给某个业务接口加白等于全局放行,攻击者会立刻找到这个口子去打。把策略限定在具体接口下,这个加白只对该接口的语境生效,其他接口的防护一点不动。

即生即消而不是永久策略——业务场景在变。一周前正常的某个用户行为,可能因为业务调整就消失了,固化的策略会变成新的误拦源,甚至可能被攻击者反向利用。AI 分析引擎只在异常场景持续期间维持策略,场景一消失策略立刻撤回。举个反例:某接口因为一次产品功能上线临时加白,三个月后产品下线了,加白策略却还在。攻击者通过历史接口探测发现这个口子,从这条"僵尸通道"打进来。即生即消意味着策略和业务场景绑定:场景消失,策略 24 小时内自动撤回,不留尾巴。

这一层解决的是模型能力之外的问题——模型在训练阶段无法穷举所有客户的真实业务上下文,但聚合后的线上流量里有上下文可读。过去依赖客户安全团队人工处理的误报运维,被自动化了。

该能力全量上线后,目标将线上实际误报率压至万分位以下。

三、回到开头那两个场景

AI 对话接口:接入后,AI 分析引擎从聚合的请求里识别出该接口的语义模式属于正常对话——前后没有引号闭合、没有恶意载荷拼接,自动生成针对该接口的加白策略。其他业务接口的 SQL 注入防护完全不受影响。

零售采购订单:语义引擎结合上下文判断 “order by 5-12” 是日期表达而非 SQL 注入语法,直接放过。

这类场景的共同点:用户输入里含可执行语句的结构,但意图完全正常——是面向 C 端用户、用户输入不可预测的业务最常见的误报场景。

四、谁最需要这次升级

AI 对话与 AI 助手平台——用户与 AI 交互时大量包含可执行语句结构,是最容易触发语义引擎误报的场景。AI 分析引擎根据聚合上下文自动修正。

即时零售 / 电商平台——每个误拦都是一个真实用户无法下单。路径级加白让业务关键路径的误拦自动消除。

Web3 / 区块链平台——用户交互频繁且不可预测,传统全局加白风险高。AI 分析引擎的策略精确到路径和场景。

游戏官网 / 社区——用户在论坛、评论区输入大量含 SQL 关键字、HTML 标签的内容。AI 分析引擎自动处理,不需要人工维护加白规则。

五、下一步

想了解 Web 防护 AI 能力是否适合你的场景?

和方案专家聊聊

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、AI 业务正在改变 Web 防护的精度边界
  • 二、EdgeOne 的做法:让 AI 在两个层面同时参与
    • 第一层:规则引擎独立运行——已知攻击的精准消化
    • 第二层:自研语义引擎,按攻击类型独立建模
    • 第三层:旁路 AI 分析引擎——误报纠错与策略自生成
  • 三、回到开头那两个场景
  • 四、谁最需要这次升级
    • 五、下一步
相关产品与服务
边缘安全加速平台 EO
边缘安全加速平台 EO (TencentCloud EdgeOne)基于腾讯云遍布全球的边缘节点,提供域名解析、动静态智能加速、TCP/UDP 四层加速、DDoS/CC/Web/Bot 防护、Pages、边缘函数计算等边缘一体化服务,可帮助客户更快速、更安全、更灵活地响应用户请求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档