活用查找替换 修正OCR识别错误
朋友小A在整理一
份材料时,经常会用扫描仪将已有的纸质材料转换成电子文档,但是,用OCR软件识别出来的文字,总把“引”字识别成“弓1”或“弓i”、
“弓l”。他使用WPS文字中的替换功能,选使用通配符,用“引”替换“弓*”,结果是只替换了“弓”字,而后面的那个字母没有被替换掉
,因此向本“砖家”求教。
哈哈,找到本“砖家”就算找对人了。本“砖家”不客气地告诉他:用查找替换 功能来实现,方向是对了,但替换的技巧还没有掌握。
在小A的方法中,“查找”的对象是“弓*”,会让WPS 很为难,因为“*”作为通配符,一般是要放在查找内容的中间,也就是前后都要有内容。否则,因为“*”表示“有任意多个任意字符”,后 面又没有特定字符来限制,会导致系统不知你到底要找什么,结果就只查找到了“弓”(任意多也当然包括“0”个呀),当然替换掉的也只 是“弓”字,后面紧跟着的“i”、“l”、“1”等字符并不会被一直替换掉。
那么,应该怎么做呢?除了“ *”外,还有一个通配符“?”(半角问号),与“*”不同的是,一个“?”只代表一个字符,如果将查找内容设置为“弓?”,就能查找到“ 弓1”或“弓i”、“弓l”了。但是,这样还会导致另外一个问题,就是虽然OCR识别错误的“弓1”或“弓i”、“弓l”都被替换成“引”了 ,但是原本正确的“弓箭”和“惊弓之鸟”中的“弓之”等也被替换成了“引”,这可不行!
看着小A那惊讶 加佩服的眼神,我的虚荣心得到了极大的满足,没什么说的,把我的看家本领拿出一两件来教他吧。
在“查 找内容”中输入“弓[1il]”,在“替换为”中输入“引”,点一下“全部替换”,好了,“弓1”或“弓i”、“弓l”全部替换成“引”了, 而“惊弓之鸟”却并没有变成“惊引鸟”!
在这里,方括号的作用是“只要与其中任意一个字符匹配”,就 会被查找到,这样,既找到了所有要找的内容,又有效避免了“错杀一万”的问题。
哈哈,找到本“砖家”就算找对人了。本“砖家”不客气地告诉他:用查找替换 功能来实现,方向是对了,但替换的技巧还没有掌握。
在小A的方法中,“查找”的对象是“弓*”,会让WPS 很为难,因为“*”作为通配符,一般是要放在查找内容的中间,也就是前后都要有内容。否则,因为“*”表示“有任意多个任意字符”,后 面又没有特定字符来限制,会导致系统不知你到底要找什么,结果就只查找到了“弓”(任意多也当然包括“0”个呀),当然替换掉的也只 是“弓”字,后面紧跟着的“i”、“l”、“1”等字符并不会被一直替换掉。
那么,应该怎么做呢?除了“ *”外,还有一个通配符“?”(半角问号),与“*”不同的是,一个“?”只代表一个字符,如果将查找内容设置为“弓?”,就能查找到“ 弓1”或“弓i”、“弓l”了。但是,这样还会导致另外一个问题,就是虽然OCR识别错误的“弓1”或“弓i”、“弓l”都被替换成“引”了 ,但是原本正确的“弓箭”和“惊弓之鸟”中的“弓之”等也被替换成了“引”,这可不行!
看着小A那惊讶 加佩服的眼神,我的虚荣心得到了极大的满足,没什么说的,把我的看家本领拿出一两件来教他吧。
在“查 找内容”中输入“弓[1il]”,在“替换为”中输入“引”,点一下“全部替换”,好了,“弓1”或“弓i”、“弓l”全部替换成“引”了, 而“惊弓之鸟”却并没有变成“惊引鸟”!
在这里,方括号的作用是“只要与其中任意一个字符匹配”,就 会被查找到,这样,既找到了所有要找的内容,又有效避免了“错杀一万”的问题。
顶一下
(0)
0%
踩一下
(0)
0%
下一篇:微信与米聊性能对比测试报告
更多相关资讯
- 美图秀秀iPad版实现照片聚焦效果的方法(2012-01-04 )
- Q+应用丰富你的在线生活(2011-11-20 )
- 如何用迅雷快传分享资源到网络?(2011-10-26 )
- Opera11.51在Win8系统下的安装盒运行测试(2011-09-27 )
- 使用360“C盘搬家”功能把装载C盘的应用转到其他(2011-09-21 )
- MSNLite工作组分享功能使用介绍(2011-09-20 )
- 快压软件安全压缩技巧(2011-09-07 )
栏目导航
IT新闻
更多>>-
iPad2不值得购买的十大理由
花费 500-800美元去购买iPad 2是不明智的。其实,笔 ... [详细] - 移动应用发展2012年五大趋势预测
- 谷歌或发布Google-Music以和苹果竞争
- 中关村卖场业态调整:国美电子商务公司进驻
- 番茄花园推出番茄花园手机系统
- 新型网购模式正在英国兴起:教人们穿衣搭配
- Android手机耗电应用排行榜
Windows 7
更多>>-
Win7内置系统还原功能修复崩溃
不论是台式PC还是便携笔记本,最害怕的一件事情 ... [详细] - 分享Windows 7系统在桌面应用中的几个小技巧
- Win7小便笺帮你做备忘录
- Win7中如何在桌面显示“计算机”图标?
- 如何用Win7批量修改文件后缀名
- Win7下如何查看所有隐藏文件?
- win7系统无线上网炒股的方法
网络技术
更多>>-
上下楼邻居互通的无线组网方案
对于家庭无线组网方案的 一种扩展,我们不应局限于自己家庭的小小领域,我们可以邻里之间进行无线联网,那么应该如何操作呢?本文就介绍了在邻居上下楼的一种 无 ... [详细] - 服务器硬盘扩容方法建议
- 动态网络负载平衡集群实践方法
- 详解TCP端口:作用,漏洞和操作详析
- 详述网络冲突域、广播域的含义
- 什么叫虚拟主机及其挑选要点
- 大规模网站架构技术原理透析
网站运营
更多>>-
B2C表单和购物流程设计要点
表单设计的要点: 1. 概述 表单对客户来说是很烦人的,但它对在线处理很重要,让填写表单的过程简单、快速,才能让网站快速获取潜在的利益。 2. 访客的问题 你作为 ... [详细] - 网站运营数据分析的两点建议
- 网站建设之虚拟主机301重定向剖析
- 绝对不止两三招 电子商城吸引客户手段分析
- Tag–推送的基石及实现方式
- 某电子商务公司推广部内部工作细则
- 深入讲解几种主流的网站推广方式
