首页
学习
活动
专区
圈层
工具
发布
综合排序最热优先最新优先
时间不限
CANN 编译器深度解析(一):从 ONNX 到 CANN IR 的图优化全流程
CANN 编译器深度解析(一):从 ONNX 到 CANN IR 的图优化全流程 相关资源链接 cann组织链接:cann组织 ops-nn仓库链接:ops-nn仓库 当你运行: atc --model =resnet50.onnx --output=resnet50_cann 几秒后,一个高性能 .om 文件诞生。 相关资源链接 cann组织链接:cann组织 ops-nn仓库链接:ops-nn仓库
晚霞的不甘
2026-02-09
2500
标签:
OrangePi 安装 CANN 套件及体验 AI 应用
CANN 环境安装(桌面端跳过) CANN 环境存在于下载页面的官方工具中,点击下载即可进入下载页面。 CANN 安装包就在倒数第二项,下载后传到开发板上。 给 CANN 安装包赋予运行权限并运行即可。 chmod +x Ascend-cann-toolkit_7.0.0_linux-aarch64.run . /Ascend-cann-toolkit_7.0.0_linux-aarch64.run 注意 OpenGauss 与 Ubuntu 桌面端的系统都是已经安装过 CANN 的,只有 minimal 是需要安装的 通过这些 Demo,您可以体验到 CANN 平台在 AI 应用中的强大功能。希望宝子们能通过这些示例快速上手并应用于实际项目中。
繁依Fanyi
2024-06-06
5960
标签:
CANN:迈向 AI 原生计算的新范式
相关资源链接 cann组织链接:cann组织 ops-nn仓库链接:ops-nn仓库 一、为什么需要“AI 原生”架构? 二、CANN 的“垂直整合”四层模型 CANN 并非单一组件,而是一个端到端协同系统,可划分为四个紧密耦合的层级: 1. 三、典型案例:Transformer 的 CANN 优化路径 以标准 Transformer Encoder 为例,看 CANN 如何层层优化: 组件 传统执行方式 CANN 优化方式 LayerNorm 四、CANN 不只是加速器,更是“AI 操作系统” 更深远的意义在于:CANN 正在演变为AI 时代的操作系统抽象层。 而 CANN,正在这条路上坚定前行。 相关资源链接 cann组织链接:cann组织 ops-nn仓库链接:ops-nn仓库
晚霞的不甘
2026-02-09
2730
标签:
CANN 实战:构建高并发智能视频分析系统
相关资源链接 cann组织链接:cann组织 ops-nn仓库链接:ops-nn仓库 一、系统架构概览 [RTSP 视频流] ↓ [FFmpeg 解码] → [帧队列] ↓ [CANN 预处理引擎] → [归一化 + Resize + HWC→CHW] ↓ [CANN 推理引擎] → [YOLOv8 + OSNet + ST-GCN] ↓ [ 二、关键挑战与 CANN 应对策略 挑战 CANN 解决方案 多路解码 CPU 占用高 使用硬件编解码器(VDEC),释放 CPU 预处理成为瓶颈 CANN 提供 DVPP(Device Vision ("yolov8", "yolov8_cann.om") pipe.add_model("osnet", "osnet_cann.om") pipe.add_model("stgcn", "stgcn_cann.om 相关资源链接 cann组织链接:cann组织 ops-nn仓库链接:ops-nn仓库
晚霞的不甘
2026-02-09
3160
标签:
CANN到Canvas:AI绘画加速实战与源码解析
目录标题 引言 一、CANN在AIGC领域的技术价值 二、AI绘画加速系统架构设计 核心模块功能说明: 三、CANN优化关键代码实现 3.1 模型加载与CANN优化 3.2 扩散模型CANN优化实现 3.3 cann组织链接 ops-nn仓库链接 一、CANN在AIGC领域的技术价值 在AIGC应用井喷的当下,模型推理速度已成为用户体验的关键瓶颈。 优化 扩散模型:核心生成模块,50步采样+CANN算子融合优化 图像解码器:将隐空间特征解码为RGB图像,VAE模型+CANN内存复用 三、CANN优化关键代码实现 3.1 模型加载与CANN优化 import 优化推理 start_time = time.time() cann_output = cann_model.generate(**case) cann_time 工具包 wget https://mirrors.huaweicloud.com/ascend/cann/7.0.0/... tar -xzf cann*.tar.gz cd cann && .
用户12298955
2026-05-06
1280
标签:
守护智能边界:CANN 的 AI 安全机制深度解析
守护智能边界:CANN 的 AI 安全机制深度解析 当一个 AI 模型被部署到边缘设备或第三方服务器时,它就不再“安全”。 相关资源链接 cann组织链接:cann组织 ops-nn仓库链接:ops-nn仓库 一、安全架构全景图 CANN 的安全能力可划分为四个层级: [应用层] → 模型加密 + API 访问控制 模型加密与授权加载 CANN 支持对编译后的 .om 模型文件进行 AES-256 加密,并绑定设备指纹或授权证书。 定期轮换密钥 通过 CANN 的密钥管理服务(KMS)集成,实现自动化轮换。 CANN 通过硬件可信根 + 软件纵深防御,为 AI 应用构筑了一道看不见却坚不可摧的防线。 相关资源链接 cann组织链接:cann组织 ops-nn仓库链接:ops-nn仓库
晚霞的不甘
2026-02-09
3050
标签:
为更好与英伟达CUDA竞争,华为CANN全面开源
8月5日,在北京召开的昇腾计算产业发展峰会上,华为轮值董事长徐直军宣布,华为CANN Mind系列应用套件及工具链全面开源,支持用户自主的深度挖潜和自定义开发,加速广大开发者的创新步伐,让昇腾更好用、更易用 CANN全称为“Compute Architecture for Neural Networks”,是华为主导的神经网络异构计算架构,它是把上层AI训练框架(如PyTorch、TensorFlow、MindSpore 但是,CANN并未得到行业的广泛的支持,远不及英伟达的CUDA。此番华为开源CANN,将有助于加速开发者创新并改善昇腾AI芯片的可用性。 华为表示,来自AI领军企业、伙伴、高校与科研机构的代表共同探讨了如何更好地构建开源开放的昇腾生态,共同发起了《CANN开源开放生态共建倡议》,以凝聚产业力量,共探AI边界,共建昇腾生态。 华为此次将CANN 开源,有望加速推动其昇腾AI芯片的市场采用率。不过CANN 要追上已有18年历史、并持续更新至今的英伟达CUDA,可能仍需很长的时间。 编辑:芯智讯-浪客剑
芯智讯
2026-03-20
6500
标签:
CANN 实战:自然语言处理(NLP)全链路加速指南
CANN 实战:自然语言处理(NLP)全链路加速指南 在 AI 应用中,如果说计算机视觉是“看懂世界”,那么自然语言处理(NLP)就是“理解人类”。 相关资源链接 cann组织链接:cann组织 ops-nn仓库链接:ops-nn仓库 一、典型 NLP Pipeline 与瓶颈分析 标准 NLP 推理流程: [原始文本] ↓ [分词(Tokenizer CANN 针对每一环节提供优化。 二、CANN 的 NLP 专属优化技术 1. 四、性能对比:CANN vs 通用方案 模型 平台 延迟(ms) 吞吐(QPS) 显存(MB) XLM-RoBERTa CANN (FP16) 98 215 1,020 XLM-RoBERTa TensorRT 相关资源链接 cann组织链接:cann组织 ops-nn仓库链接:ops-nn仓库
晚霞的不甘
2026-02-09
1840
标签:
CANN 能效分析:如何实现 10 TOPSW 的极致能效比
CANN 能效分析:如何实现 10 TOPS/W 的极致能效比 当一台边缘 AI 盒子部署在无风扇的配电柜中,或一辆无人配送车需连续运行 12 小时,性能不再是唯一目标——能效才是生存底线。 CANN 宣称在典型 CV 负载下可达 10+ TOPS/W(FP16),远超 GPU 的 2~4 TOPS/W。这背后,是一套从晶体管到算法的全栈能效优化体系。 相关资源链接 cann组织链接:cann组织 ops-nn仓库链接:ops-nn仓库 一、能效比定义与行业基准 能效比(Energy Efficiency) = 有效算力(TOPS) / 功耗(W) ) 10.2 TOPS/W 工业边缘 Ascend 910B(CANN) 9.7 TOPS/W 云训练/推理 数据来源:MLPerf Inference v4.0 + 华为官方白皮书(2025) CANN 通过专用架构、存储优化、动态调控与量化技术,将每瓦特电力转化为最大智能价值。 相关资源链接 cann组织链接:cann组织 ops-nn仓库链接:ops-nn仓库
晚霞的不甘
2026-02-09
5250
标签:
CANN 技术全景图:构建自主可控的 AI 全栈底座
CANN 技术全景图:构建自主可控的 AI 全栈底座 在“算力自主”成为国家战略的今天,一个完整的 AI 软件栈必须回答三个问题: 能否高效利用国产芯片?(硬件亲和) 能否支撑前沿算法演进? 相关资源链接 cann组织链接:cann组织 ops-nn仓库链接:ops-nn仓库 一、CANN 全栈架构五层模型 每一层都承担关键职责,共同构成“训推一体、云边协同”的 AI 底座。 三、CANN 的差异化优势 维度 通用 GPU 方案 CANN 方案 全栈可控 驱动/编译器闭源 从芯片到应用全自研 能效比 高性能但高功耗 同性能下功耗低 30~50% 边缘部署 依赖 Jetson 结语:全栈之力,方成自主之基 CANN 的意义,远不止于“一个推理引擎”。它代表了一种系统性思维——从晶体管到行业应用,每一层都为 AI 而生,每一环都可自主演进。 相关资源链接 cann组织链接:cann组织 ops-nn仓库链接:ops-nn仓库
晚霞的不甘
2026-02-09
4020
标签:
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档