腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
视频
用户
沙龙
专栏
专区
综合排序
丨
最热优先
丨
最新优先
时间不限
CANN
编译器深度解析(一):从 ONNX 到
CANN
IR 的图优化全流程
CANN
编译器深度解析(一):从 ONNX 到
CANN
IR 的图优化全流程 相关资源链接
cann
组织链接:
cann
组织 ops-nn仓库链接:ops-nn仓库 当你运行: atc --model =resnet50.onnx --output=resnet50_
cann
几秒后,一个高性能 .om 文件诞生。 相关资源链接
cann
组织链接:
cann
组织 ops-nn仓库链接:ops-nn仓库
晚霞的不甘
2026-02-09
250
0
标签:
内存
优化
编译
编译器
模型
OrangePi 安装
CANN
套件及体验 AI 应用
CANN
环境安装(桌面端跳过)
CANN
环境存在于下载页面的官方工具中,点击下载即可进入下载页面。
CANN
安装包就在倒数第二项,下载后传到开发板上。 给
CANN
安装包赋予运行权限并运行即可。 chmod +x Ascend-
cann
-toolkit_7.0.0_linux-aarch64.run . /Ascend-
cann
-toolkit_7.0.0_linux-aarch64.run 注意 OpenGauss 与 Ubuntu 桌面端的系统都是已经安装过
CANN
的,只有 minimal 是需要安装的 通过这些 Demo,您可以体验到
CANN
平台在 AI 应用中的强大功能。希望宝子们能通过这些示例快速上手并应用于实际项目中。
繁依Fanyi
2024-06-06
596
0
标签:
文字识别
防火墙
脚本
权限
语音
CANN
:迈向 AI 原生计算的新范式
相关资源链接
cann
组织链接:
cann
组织 ops-nn仓库链接:ops-nn仓库 一、为什么需要“AI 原生”架构? 二、
CANN
的“垂直整合”四层模型
CANN
并非单一组件,而是一个端到端协同系统,可划分为四个紧密耦合的层级: 1. 三、典型案例:Transformer 的
CANN
优化路径 以标准 Transformer Encoder 为例,看
CANN
如何层层优化: 组件 传统执行方式
CANN
优化方式 LayerNorm 四、
CANN
不只是加速器,更是“AI 操作系统” 更深远的意义在于:
CANN
正在演变为AI 时代的操作系统抽象层。 而
CANN
,正在这条路上坚定前行。 相关资源链接
cann
组织链接:
cann
组织 ops-nn仓库链接:ops-nn仓库
晚霞的不甘
2026-02-09
273
0
标签:
内存
硬件
优化
架构
模型
CANN
实战:构建高并发智能视频分析系统
相关资源链接
cann
组织链接:
cann
组织 ops-nn仓库链接:ops-nn仓库 一、系统架构概览 [RTSP 视频流] ↓ [FFmpeg 解码] → [帧队列] ↓ [
CANN
预处理引擎] → [归一化 + Resize + HWC→CHW] ↓ [
CANN
推理引擎] → [YOLOv8 + OSNet + ST-GCN] ↓ [ 二、关键挑战与
CANN
应对策略 挑战
CANN
解决方案 多路解码 CPU 占用高 使用硬件编解码器(VDEC),释放 CPU 预处理成为瓶颈
CANN
提供 DVPP(Device Vision ("yolov8", "yolov8_
cann
.om") pipe.add_model("osnet", "osnet_
cann
.om") pipe.add_model("stgcn", "stgcn_
cann
.om 相关资源链接
cann
组织链接:
cann
组织 ops-nn仓库链接:ops-nn仓库
晚霞的不甘
2026-02-09
316
0
标签:
模型
内存
系统
视频分析
高并发
从
CANN
到Canvas:AI绘画加速实战与源码解析
目录标题 引言 一、
CANN
在AIGC领域的技术价值 二、AI绘画加速系统架构设计 核心模块功能说明: 三、
CANN
优化关键代码实现 3.1 模型加载与
CANN
优化 3.2 扩散模型
CANN
优化实现 3.3
cann
组织链接 ops-nn仓库链接 一、
CANN
在AIGC领域的技术价值 在AIGC应用井喷的当下,模型推理速度已成为用户体验的关键瓶颈。 优化 扩散模型:核心生成模块,50步采样+
CANN
算子融合优化 图像解码器:将隐空间特征解码为RGB图像,VAE模型+
CANN
内存复用 三、
CANN
优化关键代码实现 3.1 模型加载与
CANN
优化 import 优化推理 start_time = time.time()
cann
_output =
cann
_model.generate(**case)
cann
_time 工具包 wget https://mirrors.huaweicloud.com/ascend/
cann
/7.0.0/... tar -xzf
cann
*.tar.gz cd
cann
&& .
用户12298955
2026-05-06
128
0
标签:
源码
AI绘画
canvas
模型
优化
守护智能边界:
CANN
的 AI 安全机制深度解析
守护智能边界:
CANN
的 AI 安全机制深度解析 当一个 AI 模型被部署到边缘设备或第三方服务器时,它就不再“安全”。 相关资源链接
cann
组织链接:
cann
组织 ops-nn仓库链接:ops-nn仓库 一、安全架构全景图
CANN
的安全能力可划分为四个层级: [应用层] → 模型加密 + API 访问控制 模型加密与授权加载
CANN
支持对编译后的 .om 模型文件进行 AES-256 加密,并绑定设备指纹或授权证书。 定期轮换密钥 通过
CANN
的密钥管理服务(KMS)集成,实现自动化轮换。
CANN
通过硬件可信根 + 软件纵深防御,为 AI 应用构筑了一道看不见却坚不可摧的防线。 相关资源链接
cann
组织链接:
cann
组织 ops-nn仓库链接:ops-nn仓库
晚霞的不甘
2026-02-09
305
0
标签:
模型
内存
硬件
安全
加密
为更好与英伟达CUDA竞争,华为
CANN
全面开源
8月5日,在北京召开的昇腾计算产业发展峰会上,华为轮值董事长徐直军宣布,华为
CANN
Mind系列应用套件及工具链全面开源,支持用户自主的深度挖潜和自定义开发,加速广大开发者的创新步伐,让昇腾更好用、更易用
CANN
全称为“Compute Architecture for Neural Networks”,是华为主导的神经网络异构计算架构,它是把上层AI训练框架(如PyTorch、TensorFlow、MindSpore 但是,
CANN
并未得到行业的广泛的支持,远不及英伟达的CUDA。此番华为开源
CANN
,将有助于加速开发者创新并改善昇腾AI芯片的可用性。 华为表示,来自AI领军企业、伙伴、高校与科研机构的代表共同探讨了如何更好地构建开源开放的昇腾生态,共同发起了《
CANN
开源开放生态共建倡议》,以凝聚产业力量,共探AI边界,共建昇腾生态。 华为此次将
CANN
开源,有望加速推动其昇腾AI芯片的市场采用率。不过
CANN
要追上已有18年历史、并持续更新至今的英伟达CUDA,可能仍需很长的时间。 编辑:芯智讯-浪客剑
芯智讯
2026-03-20
650
0
标签:
开发者
芯片
开源
cuda
华为
CANN
实战:自然语言处理(NLP)全链路加速指南
CANN
实战:自然语言处理(NLP)全链路加速指南 在 AI 应用中,如果说计算机视觉是“看懂世界”,那么自然语言处理(NLP)就是“理解人类”。 相关资源链接
cann
组织链接:
cann
组织 ops-nn仓库链接:ops-nn仓库 一、典型 NLP Pipeline 与瓶颈分析 标准 NLP 推理流程: [原始文本] ↓ [分词(Tokenizer
CANN
针对每一环节提供优化。 二、
CANN
的 NLP 专属优化技术 1. 四、性能对比:
CANN
vs 通用方案 模型 平台 延迟(ms) 吞吐(QPS) 显存(MB) XLM-RoBERTa
CANN
(FP16) 98 215 1,020 XLM-RoBERTa TensorRT 相关资源链接
cann
组织链接:
cann
组织 ops-nn仓库链接:ops-nn仓库
晚霞的不甘
2026-02-09
184
0
标签:
全链路加速
nlp
模型
内存
自然语言处理
CANN
能效分析:如何实现 10 TOPSW 的极致能效比
CANN
能效分析:如何实现 10 TOPS/W 的极致能效比 当一台边缘 AI 盒子部署在无风扇的配电柜中,或一辆无人配送车需连续运行 12 小时,性能不再是唯一目标——能效才是生存底线。
CANN
宣称在典型 CV 负载下可达 10+ TOPS/W(FP16),远超 GPU 的 2~4 TOPS/W。这背后,是一套从晶体管到算法的全栈能效优化体系。 相关资源链接
cann
组织链接:
cann
组织 ops-nn仓库链接:ops-nn仓库 一、能效比定义与行业基准 能效比(Energy Efficiency) = 有效算力(TOPS) / 功耗(W) ) 10.2 TOPS/W 工业边缘 Ascend 910B(
CANN
) 9.7 TOPS/W 云训练/推理 数据来源:MLPerf Inference v4.0 + 华为官方白皮书(2025)
CANN
通过专用架构、存储优化、动态调控与量化技术,将每瓦特电力转化为最大智能价值。 相关资源链接
cann
组织链接:
cann
组织 ops-nn仓库链接:ops-nn仓库
晚霞的不甘
2026-02-09
525
0
标签:
存储
架构
量化
模型
数据
CANN
技术全景图:构建自主可控的 AI 全栈底座
CANN
技术全景图:构建自主可控的 AI 全栈底座 在“算力自主”成为国家战略的今天,一个完整的 AI 软件栈必须回答三个问题: 能否高效利用国产芯片?(硬件亲和) 能否支撑前沿算法演进? 相关资源链接
cann
组织链接:
cann
组织 ops-nn仓库链接:ops-nn仓库 一、
CANN
全栈架构五层模型 每一层都承担关键职责,共同构成“训推一体、云边协同”的 AI 底座。 三、
CANN
的差异化优势 维度 通用 GPU 方案
CANN
方案 全栈可控 驱动/编译器闭源 从芯片到应用全自研 能效比 高性能但高功耗 同性能下功耗低 30~50% 边缘部署 依赖 Jetson 结语:全栈之力,方成自主之基
CANN
的意义,远不止于“一个推理引擎”。它代表了一种系统性思维——从晶体管到行业应用,每一层都为 AI 而生,每一环都可自主演进。 相关资源链接
cann
组织链接:
cann
组织 ops-nn仓库链接:ops-nn仓库
晚霞的不甘
2026-02-09
402
0
标签:
全栈
芯片
安全
框架
模型
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档