原标题:国产化操作系统下的OCR技术
前两年自主可控平台的理念甚嚣尘上,后来又出现了安可联盟,现在终于定论了信创概念,众多工具软件、应用软件、数据库软件以及各类接口类程序都在慢慢接入国产化的操作系统,助力国内的IT环境的搭建与运维,现在终于有了比较好用的、可以在国产化操作系统平台下使用的OCR文档文字识别技术开发包了~
目前国产化操作系统下的OCR技术可以OCR识别简体中文、繁体中文以及中英文混排的文档图片,红-头文件PDF,OFD格式都可以识别;
OCR识别软件是开发工具包,支持接口挂接,方便用户集成到自身的业务系统中使用;有开发挂接的接口和Demo示例,也有开发调用挂接的各类语言调用示例;大体上用户是把这个OCR识别开发包SDK部署到一台国产操作系统的电脑上,专门做OCR识别处理工作,一天24小时不间断的进行OCR识别处理,输入JPG、PDF文件,输出TXT、双层PDF或者OFD文档结果格式的文件。
除了这种方式,还可以使用数据加密线的授权方式,进行单机授权使用,麒麟或者UOS的电脑连接好扫描仪接收文档的扫描件图片就可以进行单机OCR授权使用。
另外值得注意的是,这个OCR开发包支持双层PDF文件的OCR识别结果输出;也支持识别导入的图片PDF文件,所以功能很强大。也能够导出国产化操作系统下的专用格式.ofd文件。
这个软件的OCR字符识别效能是0.7毫秒~2秒,如果您的图片内容比较复杂,时间可能会长一些;
关于PDF文件的导入识别,因为程序要预先做PDF解析为图片的过程,时间上会长一些,PDF解析是需要时间的。如果识别几百页的PDF与识别三五页的PDF文件,那处理时间上会有很大的不同;(.ofd文件同样)
随着信 创的大环境下,接下来会铺开国产 化的应用,档案管理,档案数字化,就是其中一块必不可少的应用场景,同样OCR也是档案数字化不可缺少的工具模块。返回搜狐,查看更多
责任编辑:
最新评论