一聚教程网:一个值得你收藏的教程网站

最新下载

热门教程

php截取字符串长度函数详解

时间:2013-04-18 编辑:简简单单 来源:一聚教程网

常用的字符处理函数

 代码如下 复制代码

strstr(string,string) = strchr(,) //从前面第一次出现某个字符串的地方截取到最后
strrchr(string,string) //从某个字符串从最后出现的位置截取到结尾
strpos(string,string[,int]) //某个字符串第一次出现的位置
strrpos(string,string) //某个字符串最后一次出现的位置
substr(string,int[,int]) //从指定位置开始截取字符串,可以指定截取的长度。
strlen(string) //获取字符串的长度

假设

$str="这是1个字符串";
这个串中包含了一个半角字符,同样执行:

 代码如下 复制代码
if(strlen($str)>10) $str=substr($str,10);

由于原字符串$str的第10、11个字符构成了汉字“符”;
执行串分割后会将该汉字一分为二,这样被截取的串就会发现乱码现象

那我们可以先来计算字符串长度

 代码如下 复制代码

  header('Content-type: text/html; charset=utf-8');
  $str = "在士大夫了sdfsdfcxvzv一截";

  $pa = '/[x{4e00}-x{9fa5}]/siu';
  preg_match_all($pa, $str, $r);
 
  $count = count($r[0]);
  echo "当前的字符串中,共有 $count 个汉字";
 
  if($count>10)
  {
    //如果汉字数量大于10,你的代码
  }

?>

补充

PHP计算字符串长度,包括计算英文、GBK、UTF-8多种字符集下PHP如何计算字符串长度。英文字符串长度
strlen()是PHP自带的计算英文字符串的函数。

GBK字符串长度
中文字符计算为2个字符,英文字符计算为1个,可以统计中文字符串长度的函数。 function abslength($str){

 代码如下 复制代码
$len=strlen($str);
$i=0;
while($i<$len)
{
       if(preg_match("/^[".chr(0xa1)."-".chr(0xff)."]+$/",$str[$i]))
       {
         $i+=2;
       }
       else
       {
         $i+=1;
       }
}
return $i;
}

UTF8字符串长度
下面定义的strlen_utf8函数可以统计UTF-8字符串的长度,但不同的是,该函数并不考虑字节,这有些类似

Javascript 中字符串的length方法,一个字符全部按 1 个长度计算。

略字节的方案)

 代码如下 复制代码
function strlen_utf8($str) {
$i = 0;
$count = 0;
$len = strlen ($str);
while ($i < $len) {
$chr = ord ($str[$i]);
$count++;
$i++;
if($i >= $len) break;
if($chr & 0x80) {
$chr <<= 1;
while ($chr & 0x80) {
$i++;
$chr <<= 1;
}
}
}
return $count;
}
$str = "www.111com.net-PHP资讯";
echo strlen_utf8($str);
?>

这样就可以很准确的对你的中英文混合字体进行截取计算了,如例子

 代码如下 复制代码

支持gb2312,gbk,utf-8,big5 中文截取方法

/*  
 
* 中文截取,支持gb2312,gbk,utf-8,big5  
 
*  
 
* @param string $str 要截取的字串  
 
* @param int $start 截取起始位置  
 
* @param int $length 截取长度  
 
* @param string $charset utf-8|gb2312|gbk|big5 编码  
 
* @param $suffix 是否加尾缀  
 
*/
 
public function csubstr($str, $start=0, $length, $charset="utf-8", $suffix=true)  
 
{  
 
   if(function_exists("mb_substr"))  
 
   {  
 
       if(mb_strlen($str, $charset) <= $length) return $str;  
 
       $slice = mb_substr($str, $start, $length, $charset);  
 
   }  
 
   else
 
   {  
 
       $re['utf-8']   = "/[x01-x7f]|[xc2-xdf][x80-xbf]|[xe0-xef][x80-xbf]{2}|[xf0-xff]

[x80-xbf]{3}/";  
 
       $re['gb2312'] = "/[x01-x7f]|[xb0-xf7][xa0-xfe]/";  
 
       $re['gbk']          = "/[x01-x7f]|[x81-xfe][x40-xfe]/";  
 
       $re['big5']          = "/[x01-x7f]|[x81-xfe]([x40-x7e]|xa1-xfe])/";  
 
       preg_match_all($re[$charset], $str, $match);  
 
       if(count($match[0]) <= $length) return $str;  
 
       $slice = join("",array_slice($match[0], $start, $length));  
 
   }  
 
   if($suffix) return $slice."…";  
 
   return $slice;  
 
}

热门栏目