必威体育Betway必威体育官网
当前位置:首页 > IT技术

php数据采集 之 关于file_get_contents的使用

时间:2019-10-10 09:45:45来源:IT技术作者:seo实验室小编阅读:60次「手机版」
 

file_get_contents

 file_get_content函数的应用

注意: 开启 php.ini 配置 中 allow_url_fopen =On;

\

file_get_contents 中的一些参数:

 遇到 一些压缩后的网站   比如  :  http://www.sohu.com  ; 打开后  如图 

<?php
header('content-type:text/html; charset=UTF-8');
//使用file_get_contents()
$url="http://www.sohu.com";
$data=file_get_contents($url);  

解决办法

$data=file_get_contents("compress.zlib://".$url);
compress,是一个相当古老的 unix 档案压缩指令,压缩后的档案会加上一个 .Zlib 延伸档名以区别未压缩的档案   zlib是提供数据压缩用的函式库,

获取 采集中的相关类容 ; 

需要使用php正则; 

$url="http://www.sohu.com";
$data=file_get_contents("compress.zlib://".$url);
$preg='#<nav class="nav area">.*</nav>#isU';
preg_match($preg,$data,$result);
$preg2='#<a data-clev=".*" target="_blank" href=".*">.*</a>#isU';
preg_match_all($preg2,$result[0],$result2);
$preg3='#<strong>(.*)</strong>#isU';
foreach($result2[0] as $k=>$v){
  preg_match($preg3,$v,$result3);
 if(!empty($result3)){
        break;
 }
}
print_r($result3);

能得到相应的结果 !!! 

保存图片的话可以用  :file_put_contents('保存地址','图片路径')来存储;

  

相关阅读

php配置本地一个新的虚拟主机

php配置本地一个新的虚拟主机 找到Apache的配置文件 httpd-conf 打开该文件找到 Include conf/extra/httpd-vhosts.conf 去掉

Java开发者如何正确的使用String,StringBuffer,StringBu

通过前面的文章,我们知道String类最大的特点是不可变性,这意味着对String类的任何修改都会新生成一个字符串,比如你执行了String类的

JDBC的PreparedStatement启动事务使用批处理executeBa

转自:https://blog.csdn.net/xiong9999/article/details/53258698 JDBC使用MySQL处理大数据的时候,自然而然的想到要使用批处理, 普

加壳工具的使用

加壳工具的使用0x01 前言0x01 加壳简介0x02 ASPack加壳0x03 PE-Armor加壳0x01 前言 这是我对加壳工具的使用的学习记录。0x01 加

excel表格中指数函数如何使用

在编辑excel的时候,需要用到指数函数,那么指数函数是如何使用的呢?其实使用方法不难,下面就跟seo实验室小编一起看看excel表格中指

分享到:

栏目导航

推荐阅读

热门阅读