php正则获取汉字,并将汉字结果返回来,在做采集数据时用到了正则获取
<?php
header('Content-type: text/html; charset=UTF-8');
$forasp="forasp.cn网站制作学习网正则获取中文php获取中文";
$cn = "/(cn|php)([x{4e00}-\x{9fa5}]*)/u";
preg_match_all($cn,$forasp,$return);
var_dump($return);
?>
array(3) {
[0]=>
array(3) {
[0]=>
string(23) "cn网站制作学习网"
[1]=>
string(20) "cn正则获取中文"
[2]=>
string(15) "php获取中文"
}
[1]=>
array(3) {
[0]=>
string(2) "cn"
[1]=>
string(2) "cn"
[2]=>
string(3) "php"
}
[2]=>
array(3) {
[0]=>
string(21) "网站制作学习网hidden_content$"
[1]=>
string(18) "正则获取中文"
[2]=>
string(12) "获取中文"
}
}
这样就把中文汉字匹配出来了,如果中间需要其他内容匹配则需要进行正则上的修改。
更多信息请查看IT技术专栏