腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
视频
用户
沙龙
专栏
专区
综合排序
丨
最热优先
丨
最新优先
时间不限
OCR
material
:基于CNN的实现 blog: http://blog.xlvector.net/2016-05/mxnet-
ocr
-cnn/ I Am Robot: (Deep) Learning to Break github: https://github.com/tmbdev/clstm caffe-
ocr
:
OCR
with caffe deep learning framework github: https ://github.com/pannous/caffe-
ocr
Digit Recognition via CNN: digital meter numbers detection ? github(caffe): https://github.com/SHUCV/digit Attention-
OCR
: Visual Attention based
OCR
? github: https://github.com/da03/Attention-
OCR
umaru: An
OCR
-system based on torch using the technique
bear_fish
2018-09-19
15.1K
0
标签:
其他
OCR
识别
最近作者项目中用到了身份证识别跟营业执照的
OCR
识别,就研究了一下百度云跟腾讯云的
OCR
产品接口。 1.腾讯云
OCR
---- 收费:身份证
OCR
和营业执照
OCR
接口,每个接口每个月各有1000次的免费调用 接口说明: 身份证
OCR
接口 - https://cloud.tencent.com/document 2.百度
OCR
---- 通过以下步骤创建
OCR
应用,作者当时在这一步花了很长时间 ? ? 创建完之后就可以拿到appId,API Key,Secret Key,就可以调用百度提供的api了 收费:身份证
OCR
和营业执照
OCR
接口,每个接口每天各有500次的免费调用 接口说明: 身份证
OCR
营业执照
OCR
接口- https://cloud.baidu.com/doc/
OCR
/
OCR
-API.html#.E8.90.A5.E4.B8.9A.E6.89.A7.E7.85.A7.E8.AF.86
写代码的猿
2019-04-11
27.9K
0
标签:
文字识别
https
网络安全
api
html
OCR
大全
OCR
技术概述什么是
OCR
?
OCR
(OpticalCharacterRecognition,光学字符识别)是指将图像中的文字信息转换为计算机可编辑文本的技术。
OCR
技术发展历程展开代码语言:TXTAI代码解释1960s-1990s:传统
OCR
时代└──基于模板匹配、特征提取2000s-2010s:机器学习
OCR
└──基于SVM、随机森林等算法2015-至今: 深度学习
OCR
└──基于CNN、RNN、Transformer2023-至今:大模型
OCR
└──基于多模态大模型(GPT-4V、Qwen-VL)
OCR
技术分类一、传统
OCR
方法1.基本原理传统
OCR
通常包括以下步骤 OCROCR具体实现1.传统
OCR
实现我们设计的是基于Tesseract的传统
OCR
示例代码。 ('image.jpg')#身份证识别result=
ocr
.id_card_
ocr
('idcard.jpg')#车牌识别result=
ocr
.license_plate_
ocr
('plate.jpg')
懒洋洋
2026-03-05
637
0
标签:
文字识别
DeepSeek-
OCR
-2 开源
OCR
模型的技术
DeepSeek-
OCR
-2开源
OCR
模型的技术
OCR
应用的场景和类型很广,本次使用Qwen2的架构,解决看的全(扫码方式优化)、看的的准(内容识别、视觉标记、降低重复率),多裁剪策略提取核心信息。 4.2GOT-
OCR
2.0:学术界的统一模型特点详情定位统一端到端
OCR
-2.0模型架构生成式预训练(类似LLM)特点强调整体文档理解适用场景学术研究、复杂版式文档对比结论:GOT-
OCR
2.0与DeepSeek-
OCR
VL是"通用选手",
OCR
只是其能力之一;DeepSeek-
OCR
-2和HunyuanOCR是"
OCR
专家",在文档解析专项上更精专。 传统
OCR
-❌★☆☆☆☆极低简单文字识别五、选型建议:如何选择适合你的
OCR
方案5.1按应用场景选择场景推荐方案理由智能文档处理(IDP)HunyuanOCR/DeepSeek-
OCR
-2端到端,支持结构化输出移动端 ):DeepSeek-
OCR
-2的上下文压缩特性可以显著降低文档预处理成本六、总结与展望DeepSeek-
OCR
-2和HunyuanOCR的开源,标志着
OCR
技术进入了一个新的阶段——从传统的"字符识别
A小码哥
2026-02-07
811
0
标签:
ocr
OCR
Tool PRO Mac(
OCR
光学字符识别)
推荐这款
OCR
光学字符识别工具
OCR
Tool PRO,以卓越的准确性和速度从图像和 PDF 中提取文本。 抓取图像 + PDF + 抓取屏幕区域 + 从 iPhone/iPad 捕获图像 + 设置 +
OCR
+ 将文本复制到剪贴板 + 使用文本文件和 PDF 导出!
OCR
Tool PRO Mac图片
OCR
Tool PRO版软件功能
OCR
工具允许在选定区域中捕获具有任何文本的屏幕的一部分。它可以立即被识别并复制到剪贴板。
OCR
工具是一种简单、易于使用、超级高效且尊重您的隐私(不会从您的设备中获取数据)。 主要特点抓取屏幕区域以实现超高效的
OCR
多次抓取屏幕区域以快速工作从 iPhone/iPad 和扫描仪捕获图像以进行即时
OCR
并将结果复制到剪贴板。
Mac知识分享
2022-08-29
21K
0
标签:
文字识别
爬虫
iphone
ios
OCR
技术简介
OCR
的应用场景 根据识别场景,可大致将
OCR
分为识别特定场景的专用
OCR
和识别多种场景的通用
OCR
。比如现今方兴未艾的证件识别和车牌识别就是专用
OCR
的典型实例。
OCR
的技术路线 典型的
OCR
的技术路线如下图所示 其中影响识别准确率的技术瓶颈是文字检测和文本识别,而这两部分也是
OCR
技术的重中之重。 在传统
OCR
技术中,图像预处理通常是针对图像的成像问题进行修正。 [11] 端到端的
OCR
与检测-识别的多阶段
OCR
不同,深度学习使端到端的
OCR
成为可能,将文本的检测和识别统一到同一个工作流中。 [12] 总结 尽管基于深度学习的
OCR
表现相较于传统方法更为出色,但是深度学习技术仍需要在
OCR
领域进行特化,而其中的关键正式传统
OCR
方法的精髓。
SIGAI学习与实践平台
2018-09-26
19.3K
0
标签:
其他
OCR
技术综述
最近入坑研究
OCR
,看了比较多关于
OCR
的资料,对
OCR
的前世今生也有了一个比较清晰的了解。所以想写一篇关于
OCR
技术的综述,对
OCR
相关的知识点都好好总结一遍,以加深个人理解。 什么是
OCR
? 比如汉王
OCR
,百度
OCR
,阿里
OCR
等等,很多企业都有能力都是拿
OCR
技术开始挣钱了。 太多太多的应用了,
OCR
的应用在当今时代确实是百花齐放啊。
OCR
的分类 如果要给
OCR
进行分类,我觉得可以分为两类:手写体识别和印刷体识别。
OCR
流程 现在就来整理一下常见的
OCR
流程,为了方便描述,那就举文档中的字符识别为例子来展开说明吧。 针对传统
OCR
解决方案的不足,学界业界纷纷拥抱基于深度学习的
OCR
。 这些年深度学习的出现,让
OCR
技术焕发第二春。
朱晓霞
2018-04-18
17.1K
0
标签:
深度学习
文字识别
OCR
识别技术
前言一、
OCR
是什么?
OCR
是光学字符识别的缩写,通俗来讲就是计算机可以通过图像来识别和处理文字信息。二、
OCR
应用领域
OCR
识别API对接步骤1、接入前文档查看需要什么协议? args) throws Exception{ String host = "https://open.expauth.com"; String path = "/v2/
ocr
"cusNo":"MER20230227354812341234","subMerNo":"MER20230227354812341234","reqNo":"1654251116079"}三、好用的
OCR
API为了简化开发者的工作,许多云服务提供商提供了强大且易于集成的
OCR
API1.文字
OCR
文字识别场景服务商提供的
OCR
API可选择性比较多,开发者可以根据自己的需求选择适合自己的服务商。 总结
OCR
识别技术让信息处理变得更加便捷。目前
OCR
技术已经广泛应用于我们的生活和工作中。
用户5269549
2024-05-15
4.8K
0
标签:
通用文字识别
OCR
技术简介
OCR
的应用场景 根据识别场景,可大致将
OCR
分为识别特定场景的专用
OCR
和识别多种场景的通用
OCR
。比如现今方兴未艾的证件识别和车牌识别就是专用
OCR
的典型实例。
OCR
的技术路线 典型的
OCR
的技术路线如下图所示 ? 其中影响识别准确率的技术瓶颈是文字检测和文本识别,而这两部分也是
OCR
技术的重中之重。 Attention
OCR
的网络结构[11] 端到端的
OCR
与检测-识别的多阶段
OCR
不同,深度学习使端到端的
OCR
成为可能,将文本的检测和识别统一到同一个工作流中。 FOTS的总体结构[12] 总结 尽管基于深度学习的
OCR
表现相较于传统方法更为出色,但是深度学习技术仍需要在
OCR
领域进行特化,而其中的关键正式传统
OCR
方法的精髓。 因此我们仍需要从传统方法中汲取经验,使其与深度学习有机结合进一步提升
OCR
的性能表现。
SIGAI学习与实践平台
2018-10-18
9.3K
0
标签:
其他
树莓派Raspbian系统安装tesseract-
ocr
实现
OCR
第二步安装Leptonica sudo apt-get install libleptonica-dev 第三步安装tesseract sudo apt-get install tesseract-
ocr
git clone firc-dataset
2025-07-17
509
0
标签:
raspbian
tesseract
树莓派
系统
ocr
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档