我们知道用正则可以匹配的事物有很多,不论是生活上的,还是程序地址上的,都可以选择用正则来匹配。这里想讨论的是,正则对于中文字符的匹配,毕竟中文是我们每天随处可见的。这里我们先学正则的创建,然后讨论对于文字的匹配,最后为大家带来匹配中文字符的实例。
1.创建正则表达式
字面量创建方式
两个斜杆之间包起来的,都是用来描述规则的元字符
letreg1=/\d+/;
2.匹配所有统一表意文字
然而时光飞逝,Unicode 在2017年6月发布了10.0.0版本。在这20年间,Unicode 添加了许多汉字。比如 Unicode 8.0 添加的 109 号化学元素「鿏(⿰⻐麦)」,其码点是 9FCF,不在这个正则表达式范围中。而如果我们期望程序里的`/[\u4e00-\u9fa5]/`可以与时俱进匹配最新的 Unicode 标准,显然是不现实的事情。因此,我们需要换一个思路,写一个无需维护的正则表达式:
/\p{Unified_Ideograph}/u
3.中文正则实例
//包含中文正则 varcnPattern=/[\u4E00-\u9FA5]/; //输出true console.log(cnPattern.test("蔡宝坚"));
原文来自:https://www.py.cn
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容