尚书七号、汉王pdf OCR 8.1、汉王文本王和清华THOCR-XP都是国内比较优秀的文字识别软件,但他们到底谁更胜一筹呢?经过部分测试汉王PDF OCR确实强悍,如果图片够清晰识别率居然可达到100%,不信你就下来试试。
尚书七号
识别速度快,界面操作方便,有版面分析。 识别效果:对英文及符号识别的非常标准, 对汉字精度只能达到8成,很多单字都被拆分成几个无关字符。 值得一提的是,你可以直接拖动要识别的文件到软件界面进行文件载入操作,很方便! 汉王pdf OCR 8.1
它们是一个核心,界面相似识别结果的问题也相似: 识别效果:同样对英文及符号识别的非常标准, 汉字识别精度比尚书识别率要上一个台阶,提高到9成。 其他功能完全一样,只是界面置入了gif广告。 汉王文本王
与功能识别结果完全一样,界面优化了些,无广告。 特别的是,它一个主程序启动两个程序: 直接运行hwdoc.exe启动的是“汉王文本王(文豪7600)”, 这是个即扫即识别的程序; 若想启动文本王专业版还得运行hwdoc.exe这个程序, 不过多了个参数“ 1”(英文空格+1,不包含引号), 是这样加的:创建hwdoc.exe快捷方式, 打开此快捷方式的属性,在“目标”一栏路径的尾部增加“ 1”, 即可启动专业版。 清华THOCR-XP 识别速度快,有版面分析,校对交互不错。 识别效果:对汉字的识别率达到95成, 但是对英文及符号的识别就大大退步, 有很多丢字符和将英文字母识别为汉字的情况。 很无奈的是它不能直接拖动文件到软件界面进行文件载入, 而且在打开中只默认tif格式,如需载入jpg每次都要选择“文件类型”。 |