(^[\u4E00-\u9FFF]+$) /is'; preg_match_all($b1, $url, $mls); $count = count($mls[1]) ... 中国PHP开发者 php学习,php基础,php环境搭建,php教程,php入门,php源码,php进阶,php模板,smarty,mysql,javascript,ajax,html,css,apache,网站建设,资源下载,php视频教程,php电子书,php手册,php论坛,php人才,web2.0,web3.0,PHP,smaty,zend,cache,静态化,xhtml,css,div,模板,框架,mysql,pgsql - Discuz! Archiver" />

查看完整版本: 求助,关于用正则表达式采集汉字出错

eddle 2008-8-1 09:36

求助,关于用正则表达式采集汉字出错

刚学php,想写个采集器,在采集繁体汉字就出现问题
  
代码如下:
$b1 = '/class="style31">(^[\u4E00-\u9FFF]+$) <\/td>/is';
preg_match_all($b1, $url, $mls);
$count = count($mls[1]);
for($i=0;$i <$count;$i++) {      
  // 输出标题
echo $mls[1][$i]. "
" ;
  
$url 为网页地址  
  
页面反回
Warning: preg_match_all() [function.preg-match-all]: Compilationfailed: PCRE does not support \L, \l, \N, \U, or \u at offset 20 inF:\www\bet\updata.php on line 9
提示preg_match_all($b1, $url, $mls);出错

如果将表达式改为(.*$),采集成功,但采集到的是乱码,到底要怎样才能解决?

chris 2008-8-7 19:10

你用的什么编码??
页: [1]
查看完整版本: 求助,关于用正则表达式采集汉字出错