php自定义中文字符串截取函数substr_for_gb2312及substr_for_utf8示例
来源: 阅读:947 次 日期:2016-08-18 15:22:14
温馨提示: 小编为您整理了“php自定义中文字符串截取函数substr_for_gb2312及substr_for_utf8示例”,方便广大网友查阅!

本文实例讲述了php自定义中文字符串截取函数substr_for_gb2312及substr_for_utf8用法。分享给大家供大家参考,具体如下:

/*

*gb2312中文字符串截取

 */

function substr_for_gb2312($str,$start,$len=null)

 {

  $totlelength = strlen($str);

  //特例情况

  if ($len == null) $len = $totlelength;

  if ($len ==0) return "";

  if ($len >= $totlelength && $start == 0 ) return $str;

  if ($start > $totlelength) return "";

  //分析$start

  if ($start < 0 ) //$start<0时,转化为$start>0时的定位.

  {

  if ( abs($start) >= $totlelength ) $start = 0;

  else $start = $totlelength - abs($start);

  }

  //确定起始位置,当起始位拆分某汉字时,返回值包含此汉字.

  if ($start > 0)

  {

  $i = $start-1;

  $flag = -1;

  while ($i >= 0)

  {

  if ( ord(substr($str,$i,1)) > 160)

  {

  $flag = -1*$flag;

  }

  else break;

  $i--;

  }

  if($flag==1)

  {

  $start = $start - 1;

  $len++;    //保证不位移.

  }

 }

 $str = substr($str,$start);//截除字符串$str的$start位前的字符

 $totlelength = strlen($str);

 //确定结束位置,当结束位拆分某汉字时,返回值不包含此汉字.

 if ($len<0) $len = $totlelength - abs($len);

 if ($len <= 0) return "";

 $i=min($len,$totlelength);

 $i--;

 $flag = -1;

 while ($i >= 0)

 {

  if (ord(substr($str,$i,1))>160)

  {

   $flag=-1*$flag;

  }

  else break;

  $i--;

 }

 if($flag == 1)

  $len=$len-1;

 $subit=substr($str,0,$len);

 return $subit;

 }

/******************************************************************

* PHP截取UTF-8字符串,解决半字符问题。

* 英文、数字(半角)为1字节(8位),中文(全角)为3字节

* @return 取出的字符串, 当$len小于等于0时, 会返回整个字符串

* @param $str 源字符串

* $len 左边的子串的长度

****************************************************************/

function substr_for_utf($str,$len)

{

for($i=0;$i<$len;$i++)

{

$temp_str=substr($str,0,1);

if(ord($temp_str) > 127)

{

$i++;

if($i<$len)

{

$new_str[]=substr($str,0,3);

$str=substr($str,3);

}

}

else

{

$new_str[]=substr($str,0,1);

$str=substr($str,1);

}

}

return join($new_str);

}

?>

/*带start位置的utf8截取函数*/

function utf8_substr($string, $start, $length) {

  preg_match_all ('/[/x00-/x7F]|[/xC2-/xDF][/x80-/xBF]|[/xE0-/xEF][/x80-/xBF][/x80-/xBF]|[/xF0-/xF4][/x80-/xBF][/x80-/xBF][/x80-/x

BF]/', $string, $rs);

  $out = '';

  $size = count ($rs[0]);

  $end = $start + $length;

  if ($end > $size ) {

    $end = $size;

  }

  for ($i = $start; $i < $end; $i++) {

    $out .= $rs[0][$i];

  }

  return $out;

}

希望本文所述对大家PHP程序设计有所帮助。

更多信息请查看网络编程
由于各方面情况的不断调整与变化, 提供的所有考试信息和咨询回复仅供参考,敬请考生以权威部门公布的正式信息和咨询为准!

2025国考·省考课程试听报名

  • 报班类型
  • 姓名
  • 手机号
  • 验证码
关于我们 | 联系我们 | 人才招聘 | 网站声明 | 网站帮助 | 非正式的简要咨询 | 简要咨询须知 | 加入群交流 | 手机站点 | 投诉建议
工业和信息化部备案号:滇ICP备2023014141号-1 云南省教育厅备案号:云教ICP备0901021 滇公网安备53010202001879号 人力资源服务许可证:(云)人服证字(2023)第0102001523号
云南网警备案专用图标
联系电话:0871-65099533/13759567129 获取招聘考试信息及咨询关注公众号:
咨询QQ:526150442(9:00—18:00)版权所有:
云南网警报警专用图标
Baidu
map