最新下载
热门教程
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
PHP file_get_contents采集程序开发教程详解
时间:2013-07-23 编辑:简简单单 来源:一聚教程网
file_get_contents() 远程文件获取函数,用来获取远程页面内容
preg_match_all()进行全局正则表达式匹配,匹配多次,用于匹配列表
preg_match ()进行正则表达式匹配,匹配一次,用于匹配终端
preg_replace ()进行正则表达式替换,用于过滤终端
具体步骤
Step 1 获取单页列表 和 单篇文章内容
在批量采集列表和内容之前,我们先将网站的单页列表和单篇文章的内容采集作为测试正则表达式对错。
列表页采集文章的链接地址:
代码如下 | 复制代码 |
//获取列表 |
单篇文章的采集:
代码如下 | 复制代码 |
$url = 'http://www.111com.net'; (.*)|iUs";$content_preg = "|(.*)|iUs"; preg_match($title_preg,$con,$title_arr); preg_match($content_preg,$con,$content_arr); ?> |
相关文章
- PHP导出数据超时的优化建议解读 10-31
- PHP之mysql位运算解析 10-31
- Laravel实现登录跳转功能解析 10-31
- php双向队列解读 10-31
- Laravel异常上下文解决教程 10-24
- php数组查询元素位置方法介绍 10-24