如何在ABBYY FineReader中创建正则表达式

2016-06-25

软件教程

来自：未知

　　ABBYY FineReader是一款OCR文字识别软件，在识别文本时，可通过创建自定义语言，识别包含很多非常用元素(如代码编号)的文本字符，今天就为大家列出了在ABBYY FineReader用于创建自定义语言词典的正则表达式具体方法。

　　注：

　　1、要将正则表达式符号作为正常字符使用，请在符号前添加反斜线。例如，[t-v]x+ 代表tx、txx、txx 等和ux、uxx等，而\[t-v\]x+则代表[t-v]x、[t-v]xx、[t-v]xxx等，更多关于ABBYY FineReader的内容可前往www.abbyychina.com了解更多详情。

　　2、要分组正则表达式元素，请使用括号。例如，(a|b)+|c代表c或任何类似abbbaaabbb、ababab的组合(任何长度非零、其中可能有按任意顺序排列的任意个数的a和b的单词)，而a|b+|c则代表a、c和b、bb、bbb等。

　　示例：

　　假设识别包含三列的表格：出生日期、姓名、电子邮件地址，在这种情况下，可以创建两种新语言、数据和地址，并为它们指定以下正则表达式：

　　日期的正则表达式：

　　表示日的数字可由一位数字(1、2 等)或两位数字(02、12)组成，但不能为零(00 或 0)，日的正则表达式应显示为：((|0)[1-9])|([1|2][0-9])|(30)|(31);

　　月的正则表达式应显示为：((|0)[1-9])|(10)|(11)|(12);

　　年的正则表达式应显示为：([19][0-9][0-9]|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])。

　　接下来，需要将所有这些组合起来并用句点隔开数字(如 1.03.1999)，句点也是正则表达式符号，所以必须在前面添加反斜线 (\)，因此，完整日期的正则表达式应显示为： ((|0)[1-9])|([1|2][0-9])|(30)|(31)\.((|0)[1-9])|(10)|(11)|(12)\.((19)[0-9][0-9])|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])

　　电子邮件地址的正则表达式：

　　[a-zA-Z0-9_\-\.]+\@[a-z0-9\.\-]+

　　以上就是用于创建自定义语言词典的正则表达式的具体方法了，希望同属上述内容的描述能够帮助大家对于ABBYY FineReader中关于自定义语言词典的正则表达式中正则表达式的创建以及运用，有一个更详细的认识和运用。
如果大家想了解更多软件教程最新资讯，请持续关注本站，本站小编将在第一时间为大家带来最好看、最有趣、最新鲜的软教资讯。更多精彩内容，尽在当客下载站。

QQ相册照片怎么恢复 QQ空间相册照片恢复教程

在线听音乐网站怎么下载音乐?怎么下载音乐?

如何在ABBYY FineReader中创建正则表达式

文章教程 分类

文章教程分类