Mini Ocr 汉字显示字体识别软件 1.0

本软件是飞涛软件工作室开发的一款免费Ocr软件,主要用于识别图像文件之中,出现的汉字显示字体。Ocr的中文含意是光学字符识别。软件解压后,也不过三兆多,身材比较纤小,再加上本软件主要用于识别字体比较小的汉字,所以叫Mini Ocr。

Mini Ocr进行汉字识别的策略:

1) 采用复合特征的分类方法。

2) 字符集选择3755个一级汉字。

3) 字体选择最常用的宋体。

4) 字号选择从小五号到一号汉字,主要针对20个点之内的小字体。

5) 英汉混排时,汉语优先。

6) 汉字粘连时,进行动态优化切分。

7) 识别前,先进行页面切分,把页面分割成一个一个的文字段落,擦除图形块,保留文字块。按照文字块先后顺序进行识别,以期处理图文混排的页面时,能达到更好的识别效果,并排除图形的干扰,加快文字的识别速度。

下载:miniocr.zip

评论

Popular Posts

随身WiFi折腾指南: 解锁、刷机与DIY

Cromite - 极度注重隐私的Chromium浏览器

《赤い涙 》灼眼的夏娜剧场版插曲

求职面试时常被问到的65个问题与技巧性回答

伤不起的盖茨比——那些年,我们没逆袭到的女神

人类的十个有趣心理效应

电话销售技巧8:如何绕过前台

Alexa互联网信息公司中文官方网站

拒绝道德绑架,这才是真正的公益广告

感情的瓶颈期或者说磨合期该怎么度过?