建站知识

Welcome to Beijing RuiHeng TianLong Technology Co., Ltd.

phpcms网站建设中采集的方法,怎么样做采集?

时间:  来源:网站建设公司  作者:网站制作公司  点击量:
php网站建设中,phpcms是比较主流的系统,拥有大部分使用者,但是采集功能是怎样的呢我们来具体讲解一下。
在网站建设行业中,不仅是北京网站建设市场,在国内来说phpcms 都算的上是主流的cms系统,我们今天来看下php网站建设中,phpcms 采集规则是怎样的.


  文章采集

  Phpcms v9默认内置有文章、图片、下载3个内容模型,先来看最普通的文章采集。以采集新浪互联网频道,国内滚动新闻栏目为例http://roll.tech.sina.com.cn/internet_chinalist/index_1.shtml

  1、进入后台,内容——内容发布管理——采集管理——添加采集点。(不同于Phpcms以往版本,采集管理在模块菜单内)



  2、网址规则。采集项目名随便填,采集页面编码默认GBK,具体采集页面的时候可以通过查看其网页源代码。


   网址采集,没有大的特色,通过查看所要采集页面的网址规则填写。分析目标页面得出是序列网址,且所要获取内容的网址都在<!-- 列表 begin -->和<!-- 列表 end -->两个标签之间。无其他干扰链接,所以就无需定义网址中必须包含和不得包含的字符了。如果目标网站配置了Base,那么也要配置好。



  网址采集配置结束,但是如果目标网站列表页用js实现上下页,或者所要获取网址深度超过2级,用此自带采集就很难实现了。

  3、内容规则。phpcms是用“[内容]”作为通配符,然后设置好开始结束的字符,再过滤不要的代码来实现内容的采集。分析目标页的title标签比较有规律,可以直接如图设置。


其实网上有大量的图文来讲解怎么做采集,我们所讲的是根据理解来得出的一些,希望您够理解。
本文TAG标签: 北京网站制作 php网站建设
返回关闭本页
上一篇:asp网站验证码错误,win+iis服务器设置session时间,asp网站制作验证码错误怎么样解决?    下一篇:北京网站建设-linux 环境下wdcp用Navicat for mysql连接数据库方法。
推荐阅读

Copyright © 2010-2021 北京瑞恒天龙科技有限公司  All Rights Reserved  |  北京网站建设知名服务商  |  北京网站制作 | 京ICP备11004170号-1   京公网安备110107000463号
地址:北京市海淀区永定路长银大厦B座  非工作时间:15810379666  服务热线:400-809-6709  版权所有 盗版必究!

在线咨询
关闭
电话咨询
网站制作电话
400-809-6709