产品展示

华为云产品中心

基于丰富的华为云基础服务,提供适用于各行业的、预集成的产品与能力的组合,以满足企业ICT业务上云的需求

服务咨询
文字识别 OCR

人工智能

  • 资源: 北京、上海、广州、贵阳、香港、曼谷、新加坡、利马、墨西哥城 …
  • 名称 文字识别 OCR
  • 配置
  • 渠道 华为云授权销售支持中心 · 呼和浩特市大旗网络有限公司
  • 数量 (库存:0)
  • 文字识别 OCR

什么是文字识别

文字识别(Optical Character Recognition,简称OCR)是指对图像文件的打印字符进行检测识别,将图像中的文字转换成可编辑的文本格式,以JSON格式返回识别结果。

OCR以开放API(Application Programming Interface,应用程序编程接口)的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将图片识别成文字,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率,API获取详情请参考《API参考》。

OCR还提供多种编程语言的SDK供您使用,SDK使用方法请参考《SDK参考》。华为云计算

使用前必读

用户需要具备编程能力,熟悉Java、Python、iOS、Android、Node.js编程语言。

OCR服务需要用户通过调用API接口,将图片或扫描件中的文字识别成可编辑的文本,然后返回JSON格式的识别结果,用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。

关于文字识别的相关声明请参见文字识别服务声明。

华为云服务器

OCR能力

  • 通用类 OCR

    通用类OCR(General OCR),支持表格、文档、网络图片等任意格式图片上文字信息的自动化识别,自适应分析各种版面和表格,快速实现各种文档电子化。

  • 证件类 OCR

    证件类OCR(Card OCR),支持身份证、驾驶证、行驶证、护照等证件图片上有效信息的自动识别和关键字段结构化提取。

  • 票据类 OCR

    票据类OCR(Receipt OCR),支持增值税发票、机动车销售发票、医疗发票等各种发票和表单图片上有效信息的自动识别和结构化提取。

  • 行业类 OCR

    行业类OCR(Domain OCR),支持物流面单、医疗化验单据等多种行业特定类型图片的结构化信息提取和识别,助力行业自动化效率提升。

  • 定制模板 OCR

    定制模板OCR(Custom OCR),支持用户自定义识别模板,指定需要识别的关键字段,实现用户特定格式图片的自动识别和结构化提取。华为云存储

首次使用OCR

如果您是首次使用OCR的用户,建议您学习并了解如下信息:

  • 功能介绍

    通过功能介绍章节的内容,了解OCR不同类别的文字识别功能,包括通用类文字识别、证件类文字识别、票据类文字识别。

  • 入门使用

    OCR以开放API的方式提供给用户,您可以参考《快速入门》学习并使用OCR服务。

  • 使用方式

    如果您是一个开发工程师,熟悉代码编写,想要直接调用OCR的API或SDK使用服务,您可以参考《API参考》或《SDK参考》获取详情。

  • 由浅入深学习

    您可以参考成长地图,由浅入深学习使用OCR。华为云服务器

约束与限制

受技术与成本多种因素制约,文字识别服务存在一些约束限制。其中系统级约束限制,是所有子服务的约束。除系统级约束限制外,各子服务还有独立的约束条件。

通用表格识别

  • 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。

  • 图像各边的像素大小在15px到8192px之间。

  • 图像中识别区域有效占比超过80%,保证整张表格及其边缘包含在图像内。

  • 支持图像任意角度的水平旋转。

  • 目前不支持复杂背景(如户外自然场景、防伪水印等)和表格线扭曲图像的文字识别。

  • 文字识别服务属于公有云服务,线上用户资源共享,不能保证每一个用户的并发能力,如果需要多并发请求,请提前联系我们。

通用文字识别

  • 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。

  • 图像各边的像素大小在15px到8192px之间。

  • 图像中识别区域有效占比超过80%,保证所有文字及其边缘包含在图像内。

  • 支持图像任意角度的水平旋转。

  • 目前不支持复杂背景(如户外自然场景、防伪水印等)和文字扭曲图像的文字识别。

  • 文字识别服务属于公有云服务,线上用户资源共享,不能保证每一个用户的并发能力,如果需要多并发请求,请提前联系我们。

网络图片识别

  • 支持中英文及部分中文繁体字。

  • 只支持识别JPG、JPEG、PNG、BMP、TIFF、GIF、WEBP格式图片。

  • 支持常见网络图片如:手机截图、电脑截图、电商产品图及广告设计图等互联网图片。

  • 图像各边的像素大小在15到8192px之间。

  • 图像中有效文字图片占比超过60%,避免有效文字图片占比过小。

  • 支持图像中有效文字图片的任意角度的水平旋转(需开启方向检测)。

  • 文字识别服务属于公有云服务,线上用户资源共享,不能保证每一个用户的并发能力,如果需要多并发请求,请提前联系我们。

智能分类识别

  • 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。

  • 图像各边的像素大小在15到8000px之间。

  • 支持图像中票证任意角度的水平旋转。

  • 文字识别服务属于公有云服务,线上用户资源共享,不能保证每一个用户的并发能力,如果需要多并发请求,请提前联系我们。

手写文字识别

  • 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。

  • 图像各边的像素大小在8到8192px之间。

  • 图像中识别区域有效占比超过80%,保证所有文字及其边缘包含在图像内。

  • 支持图像任意角度的水平旋转(需开启方向检测)。

  • 目前不支持复杂背景(如户外自然场景、防伪水印等)和表格线扭曲图像的文字识别。

  • 文字识别服务属于公有云服务,线上用户资源共享,不能保证每一个用户的并发能力,如果需要多并发请求,请提前联系我们。

身份证识别

  • 支持中华人民共和国居民身份证的识别。

  • 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。

  • 图像各边的像素大小在15到8000px之间。

  • 图像中身份证区域有效占比超过25%,保证整张身份证内容及其边缘包含在图像内。

  • 支持图像中身份证任意角度的水平旋转。

  • 支持少量扭曲,扭曲后图像中的身份证长宽比与实际身份证相差不超过10%。

  • 能处理反光、暗光等干扰的图片但影响识别精度。

  • 目前只支持识别单张身份证的正面或者反面。

  • 文字识别服务属于公有云服务,线上用户资源共享,不能保证每一个用户的并发能力,如果需要多并发请求,请提前联系我们。

驾驶证识别

  • 只支持中国大陆驾驶证的识别。

  • 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。

  • 图像各边的像素大小在100到8000px之间。

  • 图像中驾驶证区域有效占比超过50%,保证整张驾驶证内容及其边缘包含在图像内。

  • 支持图像中驾驶证任意角度的水平旋转。

  • 支持少量扭曲,扭曲后图像中的驾驶证长宽比与实际驾驶证相差不超过10%。

  • 能处理反光、暗光、防伪标识等干扰的图片但影响识别精度。

  • 文字识别服务属于公有云服务,线上用户资源共享,不能保证每一个用户的并发能力,如果需要多并发请求,请提前联系我们。


  • 网站应用
上一篇:自然语言处理基础2021-12-29
下一篇:图像识别 Image2021-12-28
立即注册   享受8折优惠
立即注册